买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于通道分组注意力模型的细粒度车辆分类方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于通道分组注意力模型的细粒度车辆分类方法

￥19800

专利号： 2021105140906

申请人：山东科技大学

专利类型：发明专利

专利状态：已下证

更新日期：2025-10-27

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于通道分组注意力模型的细粒度车辆分类方法，其特征在于，采用通道分组与注意力模型相结合的方式构建CGA‑CNN网络并进行训练，然后利用CGA‑CNN网络进行多尺度的细粒度车辆分类；

采用所述CGA‑CNN网络进行多尺度的细粒度车辆分类时，首先输入车辆图像，输入的图像经过骨干网络和特征金字塔网络生成16倍和32倍下采样特征图；16倍下采样特征图经过全局平均池化层、全连接层和Softmax分类层得到初步分类结果；然后生成16倍下采样类激活图；通过K均值聚类算法进行通道分组，将各组内的类激活图相加生成注意力图；注意力图被下采样至32倍，与32倍下采样特征图进行元素级乘法，得到新的32倍下采样特征图；最后，新得到的32倍下采样特征图经过全局平均池化层、全连接层和Softmax分类层得到最终车辆分类结果。

2.根据权利要求1所述的基于通道分组注意力模型的细粒度车辆分类方法，其特征在于，基于CGA‑CNN网络进行多尺度的细粒度车辆分类方法具体包括如下步骤：S1.从车辆数据集中选取图像X进行预处理，将图像X裁剪成448×448的尺寸，灰度图和二值图转换为RGB三通道格式；

S2.利用卷积神经网络提取预处理后图像X的特征图；

S3.利用特征金字塔网络生成预处理后图像X的金字塔特征图，从中选取16倍、32倍下采样的特征图，分别记为A1、A2，其中其中，w1、h1、w2、h2分别表示A1、A2的宽与高，c表示特征通道数；

S4.对A1进行全局平均池化得到一个K维的特征向量V1，其中K表示数据集中图像的类别数，V1由对应的w1、h1代入公式(1)得到；

其中，fk(x，y)表示类别k在最后一个卷积层位置(x，y)的激活；

S5.在V1之后连接一个全连接层和softmax分类层得到图像X的预测向量P1；P1由公式(2)计算得到；

当为P1中的最大值时，表示类别c被激活，表示softmax分类层的输入向量；其中，由公式(3)计算得到；

其中，表示第c个节点第k个参数；

S6.对于A1中的每个特征通道，通过将被激活的类别c对应的全连接层中的节点的k个乘到相应的通道上，得到k个激活图，每个激活图由公式(4)表示；

S7.在A1中的每个特征通道中寻找最大响应值，得到其对应的坐标集合其中，是第i个特征通道的最大响应值的坐标，对M使用K均值聚类算法将通道分为N个通道组，其中K均值聚类算法的距离评价指标由公式(5)表示；

其中，D表示最大响应值之间的欧几里德距离，i，j∈1，…，s并且i≠j；第i个通道组内包含的通道由指示向量(6)表示，[1{1}，...，1{j}，...，1{s}] (6)其中，当第j个通道属于第i个通道组时，1{·}＝1，否则1{·}＝0；

S8.根据通道分组指示向量，将每个通道组内包含的激活图相加得到相应的注意力图T1，此操作共产生N个T1，组内激活图相加操作由公式(7)表示；

其中，表示16倍下采样的第i个注意力图，Cj(x，y)表示通道组内第j个激活图；

S9.将步骤S8得到的N个T1进行2倍下采样得到N个32倍下采样的注意力图T2；

S10.每个32倍下采样的T2中包含的通道与A2中相应的通道进行元素级的乘法操作，得到融合后的特征图F，F的第j个通道由公式(8)表示；

其中，表示32倍下采样的第i个注意力图在位置(x，y)上的值，表示A2中的第j个特征通道在位置(x，y)上的值，i∈1，...，N，j∈1，...，c；

S11.对F进行GAP操作，得到一个K维的特征向量V2，V2通过将对应的w2、h2代入公式(1)得到；

S12.在V2之后连接一个全连接层和softmax分类层得到最终的预测向量P2；P2由公式(9)计算得到；

其中，表示softmax分类层的输入向量；其中，由公式(10)计算得到；

其中，表示第c个节点第k个参数；

P2中的最大值对应的类别为最后的分类结果。

3.根据权利要求1所述的基于通道分组注意力模型的细粒度车辆分类方法，其特征在于，所述CGA‑CNN网络进行训练时，设置训练损失函数，计算训练损失值，X的损失函数定义由公式(11)表示：

(i) *

其中，Y 表示对于第k个类别该网络的预测，Y表示正确的类别，s表示图像尺度；Lcls表示分类损失，由公式(12)表示：其中，表示在S尺度上网络对于类别k预测的概率；Lrank表示ranking损失，由公式(13)表示，

其中，m为边缘参数，该网络使用m＝0.005作为缺省值；表示在S+1尺度上网络对于类别k预测的概率。

4.根据权利要求3所述的基于通道分组注意力模型的细粒度车辆分类方法，其特征在于，所述CGA‑CNN网络进行训练时，首先在ResNeXt‑101上预训练CGA‑CNN网络的骨干网络，然后再训练CGA‑CNN网络。

5.根据权利要求2所述的基于通道分组注意力模型的细粒度车辆分类方法，其特征在于，所述步骤S7中，某个特征通道最大响应点代表该特征通道对某种图像特征具有识别性，使用K均值聚类算法根据最大响应点坐标对特征通道进行分组，使每个组的特征通道集合表示特定模式的图像特征，有利于判别性区域的识别。

6.根据权利要求2所述的基于通道分组注意力图的细粒度车辆分类方法，其特征在于，所述注意力图本质上是像素级别的权重矩阵，表示特征图上每个像素的重要程度；通过步骤S8，就能够将组内的激活图相加得到注意力图，得到特征图上的不同部分对应的关注度。

7.根据权利要求2所述的基于通道分组注意力图的细粒度车辆分类方法，其特征在于，通过步骤S10将生成的注意力图与32倍下采样的特征图进行像素级乘法，得到新的特征图，使分类网络进一步注意到图像的判别性区域，提高图像分类精度。

推荐专利

基于注意力机制的白细胞细粒度分类方法

发明专利

￥19800

基于注意力机制的LSTM-CNN词嵌入的细粒度情感分类模型

我要求购

您有专利需要变现?

我要出售

智能匹配需求，快速出售

摘要:

权利要求书:

利索能及

友情链接

关于我们

联系我们