利索能及
我要发布
收藏
专利号: 2020113274359
申请人: 江苏科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-03-02
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于并联卷积神经网络的水果品种识别方法,其特征在于,包括如下步骤:

步骤1:将带有类别标签的水果图像改变成像素为128×128的3通道图片;

步骤2:对所述步骤1的结果同时进行平移、旋转、镜像翻转操作,生成各个尺度的水果图像数据集;包括对图片旋转30°、60°、90°,平移10%、20%、30%,镜像旋转30°、60°、90°;

步骤3、将所述步骤2的结果输入到生成对抗网络模型对数据进行增强;生成对抗网络包括生成器和判别器,向生成器中输入噪声,然后从噪声中随机采样,通过5层网络,生成

128×128的3通道数据样本;判别器对所述的数据样本与真实样本进行比较,判断生成器生成样本的真伪,生成器借助判别器固定的参数进行更新从而生成让判别器更难分辨真伪的图片;

提取出每张图片的最后一个池化层特征和最后一个全连接层特征;还可以对原始图像进行正则化操作,对切割图像进行最大池化,再进行正则化操作;

步骤4、构建并联卷积神经网络模型,对所述步骤3的结果进行多尺度的特征提取;所使用的并联卷积神经网络包括6个卷积层,3个最大池化层和全连接层,所述全连接层将卷积层和最大池化层具有分类信息的局部信息进行整合;

具体如下:C1、C2为16个3×3的卷积核,使用全零填充,步长为1,输出为128×128×3;

S1为2×2的最大池化层,步长为2,输出为64×64×16;C3为16个大小为3×3的卷积核,使用全零填充,步长为1,输出为64×64×16;C4为16个大小为3×3的卷积核,使用全零填充,步长为1,输出为64×64×16,S2为大小为2×2的最大池化层,步长为2,输出为32×32×16;将生成的特征图像输入到a、b两个并联通道中,a通道包含32个3×3的卷积层和一个2×2的最大池化层,卷积层使用全零填充,步长为1,池化层步长为4;b通道包含32个5×5的卷积核和两个2×2的最大池化层,其中卷积层使用全零填充,步长为1,最大池化层的步长为2,a、b通道各生成32个8×8的特征图,然后两个通道所生成的64个8×8的特征图作为C5的输入,C5和C6为64个大小为3×3的卷积层,使用全零填充,步长为1,S3为大小为2×2的最大池化层,步长为2;最后为全连接层,将卷积层和池化层具有分类信息的局部信息进行整合;具体如下:利用预测同一类别不同品种间的最大类间距损失函数与SoftmaxWithLoss函数组成新的损失函数来进行卷积神经网络的优化;其最大类间距损失函数公式如下:(i)

其中,i代表第i类水果,j代表第j类水果,m代表总共的水果种类,M 表示第i类水果的(j) (i,e)均值,M 代表第j类的均值,n代表第i水果的样本数量,x 代表第i类水果第e个品种的(i,e) (i,e‑1)值,hw,b(x )表示wx +b,w表示第e个品种的权值,b表示偏置项;所识别品种不需要与其余类水果进行一一比较,只需要与相似类比较即可,最大类间距会使相似品种间的间距随着训练次数的增多而增大;将最大类间距与SoftmaxWithLoss结合,得到公式:J=S‑λL                      (3)

其中,S表示SoftmaxWithLoss,L表示最大类间距函数,λ表示超参数,J使得相似类间的分类越来越准确;对L求导可得公式:(i,e)

其中,Z表示f(hw,b(x )),f、l、n分别表示激活函数、卷积层数、样本数量;

步骤5:根据所述步骤4提取的特征,并联卷积神经网络模型对水果图像的类别进行预测并与类别标签进行比对,根据比对结果对所述的并联卷积神经网络模型进行训练提高识别准确率。

2.根据权利要求1所述的一种基于并联卷积神经网络的水果品种识别方法,其特征在于,还包括将待分类水果图像作为目标图像,进行步骤1至步骤3的操作后,输入已完成训练的并联卷积神经网络模型进行水果品种识别。