买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于双重复用残差网络的物体识别方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于双重复用残差网络的物体识别方法

面议

专利号： 2023110039952

申请人：南京信息工程大学

专利类型：发明专利

专利状态：已下证

更新日期：2026-06-16

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于双重复用残差网络的物体识别方法，其特征在于：包括以下步骤：

S1、获取物体图像并进行数据预处理；

S2、构建初始双重复用残差网络，初始双重复用残差网络包括依次连接的第一卷积模块、第二卷积模块、第三卷积模块、第四卷积模块、第五卷积模块、残差复用路径、全局平均池化层以及全连接层；且残差复用路径与第二至第四卷积模块并行设置；第一卷积模块包括依次连接的卷积层、批归一化层以及激活函数层；第二卷积模块包括最大池化层和依次连接的特征复用残差单元；第三至第五卷积模块均包括依次连接的特征复用残差单元；

S3、利用样本数据集训练初始双重复用残差网络，得到目标双重复用残差网络；

S4、将预处理后的物体图像数据输入至目标双重复用残差网络中，获取网络输出，得到物体识别结果；

特征复用残差单元包括无下采样的特征复用残差单元和有下采样的特征复用残差单元；

无下采样的特征复用残差单元包括依次连接的第一批归一化层、第一激活函数层、第一卷积层、第二批归一化层、第二激活函数层、第二卷积层、第三批归一化层、第三激活函数层、第三卷积层、拼接运算层和融合运算层；还包括从第一卷积层和第二卷积层的输出到拼接运算层的输入的快捷连接，以及从该特征复用残差单元的输入到融合运算层的输入的快捷连接；

无下采样的特征复用残差单元中，融合运算层的输出即为该特征复用残差单元的特征输出，拼接运算层的输出即为该特征复用残差单元的残差输出；且前一个特征复用残差单元的特征输出连接下一个特征复用残差单元的输入；

步骤S2中，残差复用路径包括初始特征复用单元、4个转换单元、3个平均池化层、批归一化层以及激活函数层，其中，平均池化层池化域大小为2×2，步长为2，激活函数层使用Relu激活函数；

第二卷积模块中最大池化层的输出连接初始特征复用单元的输入，初始特征复用单元的输出和第二卷积模块中每个特征复用残差单元的残差输出连接第一转换单元的输入，第一转换单元的输出连接第一平均池化层的输入；

第一平均池化层的输出和第三卷积模块中每个特征复用残差单元的残差输出连接第二转换单元的输入，第二转换单元的输出连接第二平均池化层的输入；

第二平均池化层的输出和第四卷积模块中每个特征复用残差单元的残差输出连接第三转换单元的输入，第三转换单元的输出连接第三平均池化层的输入；

第三平均池化层的输出和第五卷积模块中每个特征复用残差单元的残差输出连接第四转换单元的输入，第四转换单元的输出连接批归一化层的输入，批归一化层的输出连接激活函数层的输入，激活函数层的输出即为残差复用路径的输出。

2.根据权利要求1所述的一种基于双重复用残差网络的物体识别方法，其特征在于：所述步骤S1中，对物体图像进行数据预处理的方法包括以下步骤：S1.1、对物体图像进行缩放，将物体图像的短边等比例缩放到256像素；

S1.2、对物体图像进行裁剪，居中裁剪出224×224大小的图片区域，得到预处理后的物体图像。

3.根据权利要求1所述的一种基于双重复用残差网络的物体识别方法，其特征在于：所述步骤S2中，第一卷积模块中卷积层卷积核大小为7×7，步长为2，通道数为40；激活函数层使用Relu激活函数；

第二卷积模块包含依次连接的1个最大池化层和N2个无下采样的特征复用残差单元，其中，最大池化层池化域大小为3×3，步长为2，N2为可调参数；

第三卷积模块包含依次连接的N3个特征复用残差单元，其中N3为可调参数，且仅有第1个特征复用残差单元使用下采样；

第四卷积模块包含依次连接的N4个特征复用残差单元，其中N4为可调参数，且仅有第1个特征复用残差单元使用下采样；

第五卷积模块包含依次连接的N5个特征复用残差单元，其中N5为是可调参数，且仅有第

1个特征复用残差单元使用下采样。

4.根据权利要求1所述的一种基于双重复用残差网络的物体识别方法，其特征在于：所述有下采样的特征复用残差单元包含依次连接的第一批归一化层、第一激活函数层、第一卷积层、第二批归一化层、第二激活函数层、第二卷积层、第三批归一化层、第三激活函数层、第三卷积层、拼接运算层和融合运算层；还包括从第一卷积层和第二卷积层的输出到拼接运算层的输入的快捷连接，以及从特征复用残差单元的输入到融合运算层的输入的快捷连接；

从第一卷积层的输出到拼接运算层的输入的快捷连接之间添加有步长为2的2×2平均池化层，从特征复用残差单元的输入到融合运算层的输入的快捷连接之间依次添加有批归一化层、Relu激活函数层、步长为1通道数为120的1×1卷积层以及步长为2的2×2平均池化层；

有下采样的特征复用残差单元中，融合运算层的输出即为该特征复用残差单元的特征输出，拼接运算层的输出即为该特征复用残差单元的残差输出；且前一个特征复用残差单元的特征输出连接下一个特征复用残差单元的输入。

5.根据权利要求1所述的一种基于双重复用残差网络的物体识别方法，其特征在于：所述初始特征复用单元包含依次连接的步长为1通道数为120的1×1卷积层、批归一化层以及Relu激活函数层。

6.根据权利要求1所述的一种基于双重复用残差网络的物体识别方法，其特征在于：所述转换单元包含依次连接的拼接运算层、批归一化层、Relu激活函数层以及步长为1且输出通道数可调的1×1卷积层，1×1卷积层的输出通道数设置为输入通道数的1/3。

7.根据权利要求1所述的一种基于双重复用残差网络的物体识别方法，其特征在于：所述步骤S2中，残差复用路径的输出依次连接全局平均池化层和全连接层，其中，全连接层使用Softmax激活函数，全连接层的神经元个数即为物体的类别数C，全连接层的输出即为初始双重复用残差网络的输出。

8.根据权利要求1所述的一种基于双重复用残差网络的物体识别方法，其特征在于：所述步骤S3中，对初始双重复用残差网络进行训练的方法包括以下步骤：S3.1、设定训练模型初始参数，优化器设置为SGD优化器；初始学习率设置为0.1；训练轮数设置为120；学习率衰减设置为在训练轮数为60和90时学习率衰减为之前的1/10；权重衰减设置为0.0001；动量设置为0.9；批大小设置为128；

S3.2、对训练集图片进行数据增强，即进行随机缩放、随机裁剪、随机翻转、归一化处理以及颜色抖动；同时对验证集图片进行缩放和裁剪；将数据增强后的训练集图片和处理后的验证集图片输入初始双重复用和卷积连接网络；

S3.3、在训练过程中使用交叉熵损失函数计算损失，计算公式如下：

L＝‑[ylogy′+(1‑y)log(1‑y′)]

其中，y表示真实值，y′表示预测值，log表示对数函数；

S3.4、使用精度对网络模型进行评估，计算方法如下：

其中，acc表示网络模型的识别精度；

S3.5、根据将步骤S3.3得到的损失函数计算梯度，采用SGD优化器更新网络参数；

S3.6、重复步骤S3.2至步骤S3.5的训练过程，每训练完一轮使用验证集图片对网络模型进行评估，按照最优acc值保存模型参数，直至训练轮数120轮全部完成，得到目标双重复用残差网络。