买专利、卖专利、专利购买、专利交易、专利出售、高企申报-基于压缩激励和紧密连接卷积神经网络的图像分类方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

基于压缩激励和紧密连接卷积神经网络的图像分类方法

￥31200

专利号： 2019109876894

申请人：南京信息工程大学

专利类型：发明专利

专利状态：已下证

更新日期：2026-06-16

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于压缩激励和紧密连接卷积神经网络的图像分类方法，其特征在于，包括以下步骤：(1)将采集的含有类别标签的图片进行预处理，转化为张量，形成训练集和测试集；

(2)训练卷积神经网络，并且规定训练次数，将训练集的图片张量输入到结合压缩激励模块的紧密连接卷积神经网络，将输出结果输入softmax函数，计算图片属于每个类别的概率，记为预测标签；

(3)将步骤(2)获得的预测标签和图片本身包含的类别标签进行比较，通过损失函数计算预测标签与实际标签的偏差，根据损失函数计算卷积神经网络参数的梯度，并运用梯度下降法更新网络的参数；

(4)测试卷积神经网络，将测试集的图片张量输入更新过的卷积神经网络，得到测试图片的预测标签，和其包含的图片标签进行对比，计算并且记录卷积神经网络的预测准确度，保存卷积神经网络模型参数；

(5)重复步骤(2)、步骤(3)和步骤(4)，再一次得到测试集在更新后的卷积神经网络的预测准确度，和上一次的预测准确度进行对比，保存准确度较高的准确度和卷积神经网络模型参数；

(6)达到规定的训练次数后，停止训练和测试，输出最高的准确度和保存对应的卷积神经网络参数，即得到效果最好的卷积神经网络模型；

所述步骤(2)包括以下步骤：

(21)每一个卷积层都包含一系列的非线性变换F·，包含归一化(BN)、修正线性单元(ReLU)和卷积操作(Conv)，l表示层数：其中x＝x1,x2,…,xD是有D个通道的张量输入，wi是卷积核上对应第i个通道上的权重，卷积层的输出张量大小满足以下公式：其中O为输出张量的尺寸，I为输入张量的尺寸，K为卷积核的尺寸，P为零填充数，S为移动步长，输出张量的通道数等于卷积核数；

(22)DenseNet的下一层和前面所有层直接相连，第l层的输入是前面所有层的拼接，第l层的输出可以表示为：l l l l 0 1 l‑1

y＝Fx＝Fx ,y ,…,y

l 0 1 l‑1 l 0

其中x ＝x ,y ,…,y 是第l层的输入，y是第l层的输出，拼接操作的先决条件是x 和

1 l‑1

从y到y 的张量尺寸不发生改变，采用步长为1的3x3的卷积核以及大小为1的零填充，即K＝3,P＝1,S＝1；

l l l

(23)记y＝y1,y2,…,yC,C是y的通道数，等于卷积核数，然后将y 输入压缩激励模块，首先进行压缩操作，通过全局平均池化生成一个通道描述符z＝z1,z2,…,zC：l

其中，c表示通道数，H*W是张量y的尺寸，通过压缩空间特征得到的通道描述符z包含了全局空间信息，然后进行激励操作，使用一个含有sigmoid函数的门控机制来完全捕获通道依赖关系，如下面公式所示：其中，表示sigmoid函数，δ表示ReLU函数，两个线性层分别包含参数W1和W2，组成瓶颈层；张量的每个通道称为一个特征映射，通过s对特征映射在通道维度了进行点乘来得到每个特征映射的权重，来表示张量中的每个特征映射在全局接受域的重要性，公式如下：yc:＝sc·yc

l l

激励操作重新校准输出y＝y1,y2,…,yC通道上的特征响应，将输出y＝y1,y2,…,yC传递到下一层，重复上述过程，最后将结合压缩激励模块的紧密连接网络的输出结果输入softmax函数，计算图片属于每个类别的概率，记为图片的预测标签Y；

所述步骤(3)包括以下步骤：

(31)通过交叉熵损失函数计算预测标签与实际标签的偏差，交叉熵损失函数，给定两个概率分布p和q，通过q来表示p的交叉熵损失为：^

其中，p表示图片自带的标签Y ，q表示预测值Y，交叉熵越小，两个概率分布越接近，即预测标签越接近真实标签；

(32)根据交叉熵损失函数计算卷积神经网络参数θi的梯度，运用梯度下降法更新网络的参数：其中，Lθi表示损失函数，以θi为参数，α表示学习率，用于控制梯度下降的速度。

2.根据权利要求1所述的基于压缩激励和紧密连接卷积神经网络的图像分类方法，其特征在于，步骤(1)所述的图片预处理，通过以下公式实现：其中，μ是图片的均值，X表示图片张量，σ表示标准方差，max表示图片张量的最大值，0

min表示图片张量的最小值，K1表示标准化后的图片张量，x表示归一化后的图片张量。

3.根据权利要求1所述的基于压缩激励和紧密连接卷积神经网络的图像分类方法，其特征在于，步骤(1)所述的训练集和测试集的比例为5:1。