利索能及
我要发布
收藏
专利号: 2022100877060
申请人: 燕山大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于通道注意力的空间注意力计算方法,其特征在于:包括以下步骤:步骤1:获取通道注意力图和通道细化特征图;

步骤2:对对步骤1中得到的通道细化特征图的通道进行分组,将通道细化特征图的通道分为重要特征和次重要特征;

步骤3:对步骤2中得到的重要特征和次重要特征均进行通道轴方向的平均池化和最大池化操作;将各自的两种池化结果进行特征聚合;

步骤4:将步骤3中得到的聚合后的结果经过一层共享卷积层,进而生成一对空间特征描述符;

步骤5:对步骤4中获得的这对空间特征描述符进行非线性操作,即经过BN层和ReLU层;

步骤6:将步骤5中得到的这两个空间特征描述符进行通道维度上的聚合,再经过一层卷积层,进而获得空间注意力描述子;

步骤7:将步骤6中得到的空间注意力描述子经过BN层,ReLU层和Sigmoid层,进而获得了一个2D的空间注意力图。

2.根据权利要求1所述的一种基于通道注意力的空间注意力计算方法,其特征在于:在步骤1中获取的通道注意力图和通道细化特征均由SENet或ECA模块前向推导生成;其中,通道注意力图是一个1D向量,向量中的每一个值对应于通道细化特征中对应通道的重要程度。

3.根据权利要求1所述的一种基于通道注意力的空间注意力计算方法,其特征在于:在步骤2中采用通道分离技术对通道细化特征的通道分组,分为重要特征和次重要特征,具体操作步骤包括:

(1)获得通道细化特征图的通道维度,即通道数C;

(2)引入超参数:分离率λ,该参数是重要通道和次重要通道的分界线;将通道数和分离率相乘,取乘积的最近偶数,获得重要通道的数量Cim;使用通道数减去重要通道数,获得次重要通道数Csubim;上述的计算过程如公式(1)和(2)所示:Cim=|C·λ|even    (1)Csubim=C‑CimCsubim=C‑Cim    (2)其中|t|even表示距离t值最近的偶数;

(3)在通道注意力图中找到前Cim个最大的值,同时在这Cim个大值里面确定最小的值m;

(4)将通道注意力图中的值和m进行比较,大于或等于m的值重新赋为1,小于m的值重新赋为0,从而获得了重要通道掩码important_mask;

(5)将通道注意力图中的值和m进行比较,大于或等于m的值重新赋为0,小于m的值重新赋为1,从而获得了次重要通道掩码sub‑important_mask;

(6)将重要通道掩码和次重要通道掩码分别和通道细化特征图进行元素相乘,进而获得重要特征和次重要特征。

4.根据权利要求1所述的一种基于通道注意力的空间注意力计算方法,其特征在于:在步骤3中对重要特征和次重要特征均沿着通道轴方向进行平均池化和最大池化操作;池化操作结束后,将各自的两种池化结果进行通道维度上的聚合。

5.根据权利要求1所述的一种基于通道注意力的空间注意力计算方法,其特征在于:在步骤4中对聚合结果使用一层共用卷积层,从而获得一对空间特征描述符,卷积层的卷积核大小为7×7。

6.根据权利要求1所述的一种基于通道注意力的空间注意力计算方法,其特征在于:步骤5中对步骤4中获得的这两个空间特征描述符进行批量归一化和使用ReLU函数激活。

7.根据权利要求1所述的一种基于通道注意力的空间注意力计算方法,其特征在于:在步骤6中将经过非线性操作后的空间特征描述符在通道维度上进行特征聚合,再经过一层卷积层,得到空间注意力描述子;该卷积层不同于之前的共享卷积层,其卷积核的大小依然为7×7,卷积核尺寸的选择和选择共享卷积层卷积核尺寸的思想一致。

8.根据权利要求1所述一种基于通道注意力的空间注意力计算方法,其特征在于:在在所述步骤7中对空间注意力描述子进行一系列的非线性操作,非线性操作顺序为BN层,ReLU层和Sigmoid层,最终获得一个2D的空间注意力图;该注意力图是一个二维矩阵,大小和原通道细化特征图大小一致;

将上述步骤用数学公式进行表示,如公式(3),(4),(5),(6)所示:F’=F’1+F’2    (3)S1=Φ1(C2D1,7×7[AvgPool(F'1);MaxPool(F'1)])    (4)S2=Φ1(C2D1,7×7[AvgPool(F'2);MaxPool(F'2)])    (5)AS=Φ2(C2D2,7×7[S1;S2])    (6)其中,(3)式表示通道分离的过程,F’表示通道细化特征,F’1表示重要特征,F’2表示次重要特征;(4)式中Φ1表示BN层和ReLU层的集合,即非线性操作;C2D1,7×7表示共享卷积层,其卷积核大小为7×7;[a;b]表示将a,b两个特征聚合起来;AvgPool表示平均池化操作;

MaxPool表示最大池化操作;(4)式生成的是重要特征对应的空间特征描述符S1,(5)式生成的是次重要特征对应的空间特征描述符S2;(6)式中Φ2表示BN层,ReLU层和Sigmoid层的集合;C2D2,7×7表示第二个卷积层,其卷积核尺寸为7×7。