利索能及
我要发布
收藏
专利号: 2023109986180
申请人: 江苏科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-03-02
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种引入注意力修正的害虫识别方法,其特征在于,包括如下步骤:步骤1:获取原始图像的特征图;

步骤2:在原始图像的特征图中生成数个目标框,解算出每个目标框的所属类别,其中,类别包括:背景类、目标类;

步骤3:将属于背景类的目标框作为查询向量,将属于目标类的目标框作为键值,通过注意力机制获取每个目标类的目标框与每个背景类的目标框之间的相似度,当目标类的目标框与背景类的目标框之间的相似度大于第一预设标准相似度时,将当前目标类的目标框重新归类于背景类;

步骤4:将属于目标类的目标框作为查询向量,将属于背景类的目标框作为键值,通过注意力机制获取每个背景类的目标框与每个目标类的目标框之间的相似度,当背景类的目标框与目标类的目标框之间的相似度大于第二预设标准相似度时,将当前背景类的目标框的置信度与相似度最高的目标类的目标框的置信度交换;

步骤5:将优化修正之后的目标框通过一层前馈神经网络输出,预测害虫的位置与类别。

2.如权利要求1所述的引入注意力修正的害虫识别方法,其特征在于,所述步骤3中,注意力机制的查询矩阵为:q

Querymatrix1(i)=query1(i)·W1q

式中,query1(i)为目标类的目标框对应的查询向量;W1为目标类的目标框对应的第一可学习查询矩阵;

注意力机制的键值矩阵为:

k

Keymatrix1(j)=key1(j)·W1k

式中,key1(j)为背景类的目标框对应的键值向量;W1 为背景类的目标框对应的第一可学习键值矩阵;

所述步骤4中,注意力机制的查询矩阵为:

q

Querymatrix2(i)=query2(i)·W2q

式中,query2(i)为背景类的目标框对应的查询向量;W2为背景类的目标框对应的第二可学习查询矩阵;

注意力机制的键值矩阵为:

k

Keymatrix2(j)=key2(j)·W2k

式中,key2(j)为背景类的目标框对应的键值向量;W2为目标类的目标框对应的第二可学习键值矩阵。

3.如权利要求1所述的引入注意力修正的害虫识别方法,其特征在于,第一可学习查询矩阵、第一可学习键值矩阵、第二可学习查询矩阵、第二可学习键值矩阵均为:k*m规格的矩阵,其中,k为Transformer的解码器所需要的目标框的个数;m为Transformer架构中的维度参数。

4.如权利要求1所述的引入注意力修正的害虫识别方法,其特征在于,第一可学习查询矩阵、第一可学习键值矩阵、第二可学习查询矩阵、第二可学习键值矩阵中的各元素初始值通过如下公式设置:ω=c*(b‑a)+a

式中,a和b为人为设定的该矩阵的中的最大值与最小;c为随机数。

5.如权利要求2所述的引入注意力修正的害虫识别方法,其特征在于,所述步骤3、步骤

4中,在目标框对应的查询向量与可学习查询矩阵点乘以及目标框对应的键值向量与可学习键值矩阵点乘时,先将每一维向量包含的元素个数与Transformer的解码器所需要的目标框的个数进行比较,当每一维向量包含的元素个数小于Transformer的解码器所需要的目标框的个数时,在一维向量中补0直至元素个数与所需要的目标框的个数相同;

当每一维向量包含的元素个数大于Transformer的解码器所需要的目标框的个数时,从一维向量中删除最后一个元素直至元素个数与所需要的目标框的个数相同。

6.如权利要求1所述的引入注意力修正的害虫识别方法,其特征在于,在执行所述步骤

3之前还包括:

对第一预设标准相似度,第一可学习查询矩阵、第一可学习键值矩阵进行优化。

7.如权利要求1所述的引入注意力修正的害虫识别方法,其特征在于,在执行所述步骤

4之前还包括:

对第二预设标准相似度,第二可学习查询矩阵、第二可学习键值矩阵进行优化。

8.如权利要求6或7所述的引入注意力修正的害虫识别方法,其特征在于,所述优化方法为:通过Adam优化器进行优化。