1.一种基于主成分分析和BP神经网络的中药材产地鉴别方法,其特征在于,包含以下步骤:
步骤一,样品制备:将植物类中药材根部粉碎、过筛得到均匀细腻的药材粉末样品,取同等质量的粉末样品制成厚度均匀的片状样品;
步骤二,样品的光谱数据采集:对n个不同产地的中药材进行LIBS光谱数据采集,每种产地的中药材样品采集m个等离子光谱,共获得N=n*m个等离子光谱;
步骤三,主成分分析:将不同产地中药材的光谱数据贴上标签,对光谱数据进行标准化,再采用交叉验证方法进行主成分分析;通过方差极大旋转将高维的光谱数据映射到低维空间,根据得分图的聚类效果结合累计贡献率选取主成分数,提取主成分得分矩阵;
步骤四,BP神经网络建模:N组中药材样品光谱数据的主成分得分矩阵为建模数据,选择部分组数据作为训练集,用于训练BP神经网络,将剩余组数据作为模型测试集,用于测试所建立BP神经网络模型识别精度;
步骤五,产地识别:重新采集同种中药光谱数据,按步骤三提取相同的主成分数,将得分矩阵输入已建立的BP神经网络中,即可得到预测的产地。
2.根据权利要求1所述的一种基于主成分分析和BP神经网络的中药材产地鉴别方法,其特征在于:步骤一所述的粉末样品是使用孔径0.075毫米的标准检验筛过筛,取0.5g的粉末样品制成片状样品。
3.根据权利要求1所述的一种基于主成分分析和BP神经网络的中药材产地鉴别方法,其特征在于:步骤二所述的产地数n≥3,等离子光谱数m≥50。
4.根据权利要求1所述的一种基于主成分分析和BP神经网络的中药材产地鉴别方法,其特征在于:步骤三所述的标签数为产地数目,主成分分析软件为Unscrambler软件,标准化方法为平均数方差法,函数形式如下:xk=(xk-xmean)/xvar
式中,xmean为数据序列的均值,xvar为数据的方差,xk为归一化后的数据;交叉验证方法中需选择片段数及对应的样本数,前N个样本属于第一个分段,接下来的N个样本属于第二个分段,以此类推,总的分段数目等于产地数目。
5.根据权利要求1所述的一种基于主成分分析和BP神经网络的中药材产地鉴别方法,其特征在于:步骤三所述的方差极大旋转为:原始数据表X分解为得分矩阵T和载荷矩阵PT的乘积:X=TPT,有单位矩阵I=RRT,R为正交矩阵原始数据用旋转载荷和得分重构,有:X=T×R(P×R)T=T×RRTPT=T×I×PT;定义R是为了使负载平方的方差最大化,最大化方差v可有下式计算出:其中n是样本的数量,p是得分,h是标准化因素和y是定义不同类型旋转的换算系数,方差极大旋转法中y的值设为1;基于累计贡献率选取主成分数,选取累计贡献率在85%~
99%之间的主成数。
6.根据权利要求1所述的一种基于主成分分析和BP神经网络的中药材产地鉴别方法,其特征在于:步骤四所述的BP神经网络包含输入层,隐含层,输出层,输入层数据矩阵为提取主成分数的得分矩阵,隐含层激励函数为: 输入矩阵随机排序后选择前80%作为训练集,剩余20%为预测集,输出变量为产地标签。
7.根据权利要求1所述的一种基于主成分分析和BP神经网络的中药材产地鉴别方法,其特征在于:步骤五所述的BP神经网络是步骤四中训练好的模型,输入新的数据作为模型的输入,模型输出相应的产地标签,得到每个光谱对应的产地,统计分析出产地识别率。