1.一种基于可见近红外光谱的果树品种鉴别方法,其特征在于:使用降噪自编码器代替传统的降维或特征波段选取进行光谱数据的特征提取,并结合随机森林对特征数据进行分类;最后对比在不同噪声下纯随机森林算法和结合堆栈压缩卷积降噪自编码器下随机森林算法的性能差异,进一步论述鲁棒性;利用可见近红外光谱对果树品种进行鉴别。
2.根据权利要求1所述的一种基于可见近红外光谱的果树品种鉴别方法,其特征在于:利用卷积降噪自编码器,在普通自编码器的基础之上,使用卷积层代替全连接层用作数据提取,同时在训练时使用dropout技术随机断开神经网络连接,同时引入L1范数惩罚项,使模型鲁棒性增强,简称CDAE,对光谱数据进行特征提取;训练好CDAE模型后,再将中间隐藏层的特征值导入随机森林分类器,简称RF,实现对果树品种的分类;由于每种原子都有自己的特征谱线,因此根据光谱来鉴别物质和确定其化学组成,而其中可见近红外波段主要是泛频峰,更能反应生化大分子特性。
3.根据权利要求1所述的一种基于可见近红外光谱的果树品种鉴别方法,其特征在于:使用一种卷积降噪自编码器进行数据提取,数据在卷积降噪自编码器中按照以下步骤进行处理:
步骤(1)编码器网络接受一个形状为:batchsize,2151,1的三维张量作为输入,由两个深度可分离卷积模块组成;
步骤(2)每个深度可分离卷积模块分为4层,数据先经过一维深度可分离卷积层进行数据蒸馏,其使用tanh函数作为激活函数,使用0.0001的L1范数进行正则化,同时填充到输入大小;
步骤(3)经过批处理标准化层进行批处理标准化,接着进入最大池化层进行三倍下采样操作,输出大小是模块输入前的三分之一,最后连接dropout层,让训练时25%的神经网络连接随机断开,即增强模型鲁棒性训练时25%的连接会被随机断开;两个模块输出空间的维度从上到下的过滤器个数和卷积窗口大小分别是32,5,64,5,数据长度呈现2151‑717‑
239变化,深度加深到64;
步骤(4)在编码器完成编码之后,中间由一个一维卷积层降低数据深度,最后得到:batchsize,239,1的中间隐层数据,完成降维操作,得到特征信息;
步骤(5)数据接入解码器,解码器和编码器的结构基本对称,每个模块中只是最大池化层换为了上采样层,对数据进行两次三倍上采样,数据维度由239‑717‑2151变化,最后连接一个一维卷积层将深度降到1,获得与输入数据维度大小相同的输出数据;
步骤(6)使用卷积降噪自编码器CDAE分类,在自编码器模型训练完成后,冻结编码器权重,并于中间隐层,数据降到batchsize,239,1后,切割最后一维,最终得到到二维数据batchsize,239;
步骤(7)将二维数据batchsize,239连接一个随机森林,随机森林分类器负责对特征值进行缩放和各种变换实现对果树叶子数据的分类,从而鉴定不同品种果树。