1.一种基于改进注意力机制的Faster R‑CNN海洋底栖生物检测方法,其特征在于,包括以下步骤:步骤1: 获取海洋底栖生物目标检测数据集,所述海洋底栖生物目标检测数据集中的每个数据包括海洋底栖生物图片和生物种类标签;
步骤2:构建基于改进注意力机制的Faster R‑CNN海洋底栖生物检测模型,增加泛化能力:用残差网络ResNet50网络替换Faster R‑CNN模型中原有的卷积神经网络VGG16,在所述残差网络ResNet50的stage3之后添加一个多尺度通道注意力机制MSCAM,通过处理不同尺度的特征,增强模型对重要特征的关注;
将Faster R‑CNN模型中原有的RoIPooling层替换为RoIAlign层,显著减少量化误差;
在Faster R‑CNN模型中最后的分类和边界框回归部分,将Faster R‑CNN模型中原有的分类全连接层替换为极限学习机ELM分类器;得到海洋底栖生物检测模型;
步骤3:使用步骤1得到的海洋底栖生物目标检测数据集对海洋底栖生物检测模型进行训练,得到训练好的海洋底栖生物检测模型;获取待检测的海洋底栖生物图片,输入所述训练好的海洋底栖生物检测模型,得到检测结果。
2.如权利要求1所述的一种基于改进注意力机制的Faster R‑CNN海洋底栖生物检测方法,其特征在于,步骤S1中,所述海洋底栖生物检测数据集包括URPC2020数据集和RUOD数据集。
3.如权利要求1所述的一种基于改进注意力机制的Faster R‑CNN海洋底栖生物检测方法,其特征在于,步骤S2中,所述多尺度通道注意力机制MSCAM的输入特征图F为一个三位张量,具有C×H×W的形状,其中C为通道数,H和W为空间维度;输入特征图F首先通过双线性插值函数根据不同比例因子得到不同尺度的特征图,具体计算公式如下: ;
其中 为不同尺度下的比例因子, 为不同尺度下的输入特征图,再分别进入通道注意力机制的模块中,计算各自的通道注意力图 的计算表达式如下:;
;
其中 为多层感知器,表示参数经过两个全连接层和一个ReLU激活函数; 和分别表示通道为c的特征经过全局平均池化和全局最大池化后的计算结果, 和则表示两层全连接层的可训练参数;最后通过Hard sigmoid替换原有的sigmoid激活函数;
通过通道注意力机制的计算,得到不同尺度下的注意力图 后,将这些注意力图进行相加求平均得到融合后的注意力图 ,具体计算公式如下: ;
其中X代表尺度的数量;
最后将得到的综合注意力图扩展成输入特征图F的大小形状,并逐元素地应用到输入特征图F上,得到最终的输出特征图Fout。
4.如权利要求3所述的一种基于改进注意力机制的Faster R‑CNN海洋底栖生物检测方法,其特征在于,步骤S2中,所述RoIAlign层具有双线性插值技术,对每个感兴趣区域RoI实施精确采样。
5.如权利要求4所述的一种基于改进注意力机制的Faster R‑CNN海洋底栖生物检测方法,其特征在于,步骤S2中,所述极限学习机ELM的隐藏层参数在初始化后保持不变。
6.如权利要求1所述的一种基于改进注意力机制的Faster R‑CNN海洋底栖生物检测方法,其特征在于,步骤S3中,所述对海洋底栖生物检测模型进行训练,包括:在URPC2020数据集中,设置训练轮次Epoch 为100、批次大小BatchSize 为4 、学习率Learning‑rate为1e‑
4;在RUOD数据集中,设置训练轮次Epoch 为60、批次大小BatchSize为4、学习率Learning‑rate为1e‑4。