利索能及
我要发布
收藏
专利号: 2023104597468
申请人: 淮阴工学院
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-24
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于深度学习的垃圾分类与识别的方法,其特征在于,包括以下步骤:

步骤S1:获取包含多种类垃圾图像的数据集;

步骤S2:对数据集中的图像进行预处理,并将预处理好的数据集划分为训练集和测试集;

步骤S3:选择ResNet‑50网络结构作为预训练模型,采用迁移学习的方式对预训练模型进行训练及微调,具体为:冻结预训练模型中靠近输入端的卷积块,保持起始层权重不变,用训练集训练剩余靠近输出端的卷积块和全连接分类器,得到新的权重,其中新的权重是用初始权重减去反向传播的误差,当反向传播的误差为正时,减小权重的数值,当反向传播的误差为负时,增加权重的数值;

步骤S4:在微调后的预训练模型中引入CBAM注意力机制模块,构建垃圾分类模型,具体为:在ResNet‑50网络结构中第一级卷积层中添加CBAM注意机制模块以改善图像特征的表征能力,固定除全连接层之外的其他层的权重,在最后一层前加入CBAM模块来增加特征提取过程中图像重要信息的关注;用由两层自适应平均池化组合而成的AP模块替换普通池化层用来增加对图像特征信息的优选;修改全连接层,再经过Softmax激活输出分类结果,并使用Dropout来降低过拟合现象,以提高垃圾分类模型的泛化能力;

其中,CBAM注意力机制模块包括通道注意力机制和空间注意力机制,通道注意力机制能够对不同通道进行加权,并保留对图像分类和识别最重要的通道特征信息,空间注意力机制关注图像中不同区域的特征信息,通过逐通道地对特征图进行计算来获得每个位置在空间上的重要性,通过将CBAM注意力机制模块引入微调后预训练模型中,使模型能够更好地捕获图像中的关键信息;

步骤S5:对垃圾分类模型进行性能分析。

2.根据权利要求1所述的基于深度学习的垃圾分类与识别的方法,其特征在于,步骤S2所述的对数据集中的图像进行预处理,包括数据标注、数据分析、图像缩放裁剪、图像数据标准化、数据增广;

其中,数据标注是指对数据集中每张图像进行分类和编号;

数据分析是指去除掉垃圾数据集中,因图像种类、长宽差异性及拍摄环境不同导致整体数据不均匀、质量差的图像;

图像数据标准化是指对图像进行归一化操作,把不同维度的特征值调整到相近的范围内;

数据增广是指对数据集进行扩充,以增加数据集内图像数量。

3.根据权利要求2所述的基于深度学习的垃圾分类与识别的方法,其特征在于,所述的归一化操作为:      (1),

式中,output 为图像像素值输出,input 为图像像素值输入,max 与 min 为最大像素值与最小像素值,经过归一化处理,将图像的像素值调整到(0,1)区间内。

4.根据权利要求2所述的基于深度学习的垃圾分类与识别的方法,其特征在于,所述的数据增广包括采用颜色增强、水平翻转、垂直翻转、图像锐化、高斯噪声以及高斯模糊对垃圾数据集内图像进行变换操作。

5.根据权利要求1所述的基于深度学习的垃圾分类与识别的方法,其特征在于,使用训练集和测试集对微调后的模型进行测试,评估微调后的模型关于训练集的准确率Train_Accuracy、损失值Train_Loss,以及测试集的准确率Val_Accuracy、损失值Val_Loss。

6.根据权利要求5所述的基于深度学习的垃圾分类与识别的方法,其特征在于,其中所述的准确率为     (2),

上述公式(2)中,TP表示被正确地划分为正例的个数,即实际为正例且被分类器划分为正例的实例数;TN表示被正确地划分为负例的个数,即实际为负例且被分类器划分为负例的实例数;FP表示被错误地划分为正例的个数,即实际为负例但被分类器划分为正例的实例数;FN表示被错误地划分为负例的个数,即实际为正例但被分类器划分为负例的实例数。

7.根据权利要求5所述的基于深度学习的垃圾分类与识别的方法,其特征在于,其中所述的损失值为          (3),

上式公式(3)中,N为样本总数,表示其中一个输出样本,y是实际值,x是预测值。

8.根据权利要求1所述的基于深度学习的垃圾分类与识别的方法,其特征在于,步骤S5所述的对垃圾分类模型进行性能分析,具体为:基于垃圾分类模型,选取交叉熵损失作为损失函数,并选取SGD和Adam两中优化函数进行比较,保持其他参数不变;使用测试集对不同优化函数进行训练,并记录每次迭代后的损失率,比较两种优化函数在测试集上的表现差异,分析损失率曲线的变化情况,选择合适的优化函数,以提高深度垃圾分类模型的性能和识别效率。

9.一种基于权利要求1所述基于深度学习的垃圾分类与识别的方法的系统,其特征在于:包括图像预处理模块、模型训练模块、模型分析模块;

图像预处理模块用于对多种类垃圾图像样本数据进行预处理;

模型训练模块包括对ResNet‑50网络结构进行训练及微调、在ResNet‑50网络结构基础上构建垃圾分类模型;

模型分析模块用于对垃圾分类模型进行性能分析。