买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于深度学习的垃圾分类与识别的方法及系统

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于深度学习的垃圾分类与识别的方法及系统

￥13800

专利号： 2023104597468

申请人：淮阴工学院

专利类型：发明专利

专利状态：已下证

更新日期：2026-06-24

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于深度学习的垃圾分类与识别的方法，其特征在于，包括以下步骤：

步骤S1：获取包含多种类垃圾图像的数据集；

步骤S2：对数据集中的图像进行预处理，并将预处理好的数据集划分为训练集和测试集；

步骤S3：选择ResNet‑50网络结构作为预训练模型，采用迁移学习的方式对预训练模型进行训练及微调，具体为：冻结预训练模型中靠近输入端的卷积块，保持起始层权重不变，用训练集训练剩余靠近输出端的卷积块和全连接分类器，得到新的权重，其中新的权重是用初始权重减去反向传播的误差，当反向传播的误差为正时，减小权重的数值，当反向传播的误差为负时，增加权重的数值；

步骤S4：在微调后的预训练模型中引入CBAM注意力机制模块，构建垃圾分类模型，具体为：在ResNet‑50网络结构中第一级卷积层中添加CBAM注意机制模块以改善图像特征的表征能力，固定除全连接层之外的其他层的权重，在最后一层前加入CBAM模块来增加特征提取过程中图像重要信息的关注；用由两层自适应平均池化组合而成的AP模块替换普通池化层用来增加对图像特征信息的优选；修改全连接层，再经过Softmax激活输出分类结果，并使用Dropout来降低过拟合现象，以提高垃圾分类模型的泛化能力；

其中，CBAM注意力机制模块包括通道注意力机制和空间注意力机制，通道注意力机制能够对不同通道进行加权，并保留对图像分类和识别最重要的通道特征信息，空间注意力机制关注图像中不同区域的特征信息，通过逐通道地对特征图进行计算来获得每个位置在空间上的重要性，通过将CBAM注意力机制模块引入微调后预训练模型中，使模型能够更好地捕获图像中的关键信息；

步骤S5：对垃圾分类模型进行性能分析。

2.根据权利要求1所述的基于深度学习的垃圾分类与识别的方法，其特征在于，步骤S2所述的对数据集中的图像进行预处理，包括数据标注、数据分析、图像缩放裁剪、图像数据标准化、数据增广；

其中，数据标注是指对数据集中每张图像进行分类和编号；

数据分析是指去除掉垃圾数据集中，因图像种类、长宽差异性及拍摄环境不同导致整体数据不均匀、质量差的图像；

图像数据标准化是指对图像进行归一化操作，把不同维度的特征值调整到相近的范围内；

数据增广是指对数据集进行扩充，以增加数据集内图像数量。

3.根据权利要求2所述的基于深度学习的垃圾分类与识别的方法，其特征在于，所述的归一化操作为：（1），

式中，output 为图像像素值输出，input 为图像像素值输入，max 与 min 为最大像素值与最小像素值，经过归一化处理，将图像的像素值调整到（0,1）区间内。

4.根据权利要求2所述的基于深度学习的垃圾分类与识别的方法，其特征在于，所述的数据增广包括采用颜色增强、水平翻转、垂直翻转、图像锐化、高斯噪声以及高斯模糊对垃圾数据集内图像进行变换操作。

5.根据权利要求1所述的基于深度学习的垃圾分类与识别的方法，其特征在于，使用训练集和测试集对微调后的模型进行测试，评估微调后的模型关于训练集的准确率Train_Accuracy、损失值Train_Loss，以及测试集的准确率Val_Accuracy、损失值Val_Loss。

6.根据权利要求5所述的基于深度学习的垃圾分类与识别的方法，其特征在于，其中所述的准确率为（2），

上述公式（2）中，TP表示被正确地划分为正例的个数，即实际为正例且被分类器划分为正例的实例数；TN表示被正确地划分为负例的个数，即实际为负例且被分类器划分为负例的实例数；FP表示被错误地划分为正例的个数，即实际为负例但被分类器划分为正例的实例数；FN表示被错误地划分为负例的个数，即实际为正例但被分类器划分为负例的实例数。

7.根据权利要求5所述的基于深度学习的垃圾分类与识别的方法，其特征在于，其中所述的损失值为（3），

上式公式（3）中，N为样本总数，表示其中一个输出样本，y是实际值，x是预测值。

8.根据权利要求1所述的基于深度学习的垃圾分类与识别的方法，其特征在于，步骤S5所述的对垃圾分类模型进行性能分析，具体为：基于垃圾分类模型，选取交叉熵损失作为损失函数，并选取SGD和Adam两中优化函数进行比较，保持其他参数不变；使用测试集对不同优化函数进行训练，并记录每次迭代后的损失率，比较两种优化函数在测试集上的表现差异，分析损失率曲线的变化情况，选择合适的优化函数，以提高深度垃圾分类模型的性能和识别效率。

9.一种基于权利要求1所述基于深度学习的垃圾分类与识别的方法的系统，其特征在于：包括图像预处理模块、模型训练模块、模型分析模块；

图像预处理模块用于对多种类垃圾图像样本数据进行预处理；

模型训练模块包括对ResNet‑50网络结构进行训练及微调、在ResNet‑50网络结构基础上构建垃圾分类模型；

模型分析模块用于对垃圾分类模型进行性能分析。