1.一种多维多粒度级联森林的高原地区云雪分类方法,其特征在于包括如下步骤:
步骤一、多维多粒度级联森林模型结构的训练:设定多维多粒度扫描的维度与光谱数量相等,利用已标注的样本(Xi,Yi),通过不同粒度的窗口对该多维多粒度级联森林的多粒度扫描结构进行特征重表示,使用多维多粒度扫描的级联森林结构对重表示的特征进行学习,得到最优的级联森林参数,其中,Xi为一个n×n的图像块,Yi表示Xi对应的图像样本的分类,n满足10≤n≤50,i代表第i个样本,i=1,2,3,...,p,p为样本总数;
步骤二、卫星图片云分类:将卫星图片分成每个像素块大小为n×n×4的小块,作为多维多粒度级联森林的输入数据,得到整个多维多粒度级联森林的输出,根据最后一层级联森林输出的类概率向量的最大值判定云雪样本的种类。
2.根据权利要求1所述一种基于多维多粒度级联森林的云雪分类方法,其特征在于:所述多维多粒度级联森林模型的算法包括多维多粒度扫描部分、特征重表示部分和基于级联森林的训练部分;
所述多维多粒度扫描部分通过扫描得到图像的空间信息以及光谱信息维度上的信息提取;
特征重表示部分将多维多粒度扫描部分扫描得到的所有小样本用于一个普通随机森林和一个完全随机森林的预测,得到每个小样本所属的类概率向量拼接起来得到重新表示的特征。
基于级联森林的训练部分将重表示的特征作为级联森林的输入,每个级联森林中包含四个随机森林,其中两个为普通随机森林,两个为完全随机森林,基于随机森林理论进行对重表示的特征特征分类学习,得到每一层的级联森林的参数。
3.根据权利要求2所述的基于多维多粒度级联森林的高原地区云雪分类方法,其特征在于:用不同粒度的窗口获得重表示特征具体包括如下步骤:a、输入的卫星图片样本X经过不同粒度的窗口,利用窗口尺寸为a和b,步长为s进行扫描,经扫描后,每个样本会得到 个小样本,a,b满足a,b<n且a,b不相等;
b、多粒度扫描后的小样本分别经过一个随机森林和一个完全随机森林,每个随机森林中的每棵树会根据小样本所在的子空间中训练样本的类别占比生成一个类别的概率分布,即每个小样本会得到一个长度为4的类概率向量,将所有小样本得到的类概率向量进行拼接,得到一个长度为 的概率向量,以此类概率向量作为得到重表示特征;
c、级联森林中每一层均由四个随机森林组成,其中两个为普通随机森林,两个为完全随机森林,将所得到的的重表示特征作为级联森林的输入,并开始级联森林的训练与构造。
d、每一层级联森林的输出是四个随机森林对重表示特征预测的概率向量,级联森林第j层的输出Kj与第j-1层输出的向量拼接可作级联森林第j+1层的输入,其中第2层的输入为第1层级联森林预测得到的概率向量与重表示特征的拼接向量。级联森林阶段中每层的四个随机森林都采用了K折交叉验证的方法,级联森林中的每一层的构造利用交叉验证方法中的检验集对该层的性能进行评估,如果当前层对检验集的预测准确率相比上一层没有提升,则不再构造级联森林的下一层。
4.根据权利要求3所述一种基于多维多粒度级联森林的高原地区云雪分类方法,其特征在于:所述步骤c中级联森林的具体算法如下:首先,设定级联森林的每个随机森林中的决策树为1000个,随机森林中的每棵树会根据样本所在的子空间中训练样本的类别占比生成一个类别的概率分布,然后对随机森林内所有树的各类比例取平均,输出整个随机森林对各类的比例;
然后,将级联森林每层中的各个随机森林所输出的对各类的比例进行拼接,当前层得到的拼接后的概率向量与上一层的输出进行拼接,利用K折交叉验证算法,若当前层的验证准确率相比上一层有提升,则将当前层输出的类概率向量与上一层得到的向量进行拼接,作为级联森林下一层的输入,否则级联森林的构造结束。
5.根据权利要求1所述一种基于多维多粒度级联森林的高原地区云雪分类方法,其特征在于:所述云雪分类学习的具体步骤为:利用多维多粒度扫描,由单个原始样本产生多个实例,利用两个随机森林的预测所有实例的类概率,将所有实例的类概率向量进行拼接得到重表示特征,作为级联森林结构的输入,利用级联森林结构中每个随机森林的K折交叉验证算法对该重表示特征进行学习,得到级联森林的参数。
6.根据权利要求4或5所述一种基于多维多粒度级联森林的高原地区云雪分类方法,其特征在于:所述多维多粒度级联森林输出的云雪分类结果包括四种:无云无雪、仅有云、仅有雪和云雪混合,输出样本设定为对应的类别。