利索能及
我要发布
收藏
专利号: 2020114607231
申请人: 武汉工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-17
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种自然场景下船舶目标自动检测识别方法,其特征在于,包括以下步骤:S1、采集船舶目标视频流信息,分帧读取船舶目标视频流信息;

S2、对目标图像进行数据增强,生成增强图像,丰富训练数据集的数据;

S3、构建深度学习多尺度特征融合网络,将训练数据集的数据传入深度学习网络进行模型训练,生成训练模型;

S4、根据训练模型对船舶目标视频流实时检测,在船舶目标视频流中自动标记船舶目标。

2.根据权利要求1所述的方法,其特征在于,所述S2中图像增强方法包括图像缩放、图像平移、图像加雾处理、图像低照度调整和图像拼接。

3.根据权利要求1所述的方法,其特征在于,所述S3中构建多尺度模型的方法具体为:在YOLOv3网络结构基础上构建4层检测模块,分别包含32倍,16倍,8倍,4倍下采样特征图;

加入特征融合机制,通过Darknet-53网络进行特征提取后并经过几次卷积得到32倍粗尺度特征图,32倍粗尺度特征图进行上采样并将其与第四个残差块的输出拼接起来得到16倍特征图,16倍特征图进行上采样并将其与第三个残差块的输出拼接起来得到8倍特征图,

8倍特征图进行上采样并将其与第二个残差块的输出拼接起来得到4倍特征图;

形成尺度分别为13x13,26x26,52x52,104x104的4个尺度特征图,分别对应大,中,小,特小目标的检测。

4.根据权利要求1所述的方法,其特征在于,所述S3具体为:S3.1、使用GIoU计算预测框坐标回归损失,其公式如下,为目标框和真实框最小外包面积,为目标框和真实框覆盖的总面积,当IoU值为0时,GIoU的值依然存在,且C会根据目标框和真实框的变化而变化;

使用GIoU计算初步损失LGIoU,其公式如下,LGIoU=1-GIoU;

使用Focal loss损失函数代替YOLOv3中的置信度损失函数和类别损失函数,Focal损失是在交叉熵损失的基础上修改而来,其公式如下,FL(p,y)=-αy(1-p)γlog(p)-(1-α)(1-y)pγlog(1-p)其中,p为网络输出值,y为实际标签值,γ为控制难易样本参数,γ始终大于0,α为控制正负样本参数;当p越大时,(1-p)γ越小,损失越小;

改进后的损失函数使用GIoU损失作为预测框坐标回归损失,使用Focal loss损失函数作为置信度损失函数和类别损失函数以得到精度更高的最终损失Loss,其公式如下,S3.2、采用DBSCAN和K-means混合聚类算法对训练数据进行聚类分析,通过DBSCAN方法得聚类的个数和每个类的中心点,然后将中心点作为K-Means的起始点,利用K-Means算法获得最终的先验框;

S3.3、生成训练模型,进行迭代训练更新参数,设置迭代次数500,学习率步长为0.001。

5.一种用于实现如权利要求1所述的自然场景下船舶目标自动检测识别方法的系统,其特征在于,包括采集模块,增强模块,训练模块和检测模块;其中,所述采集模块,用于采集船舶目标视频流信息,分帧读取船舶目标视频流信息,去除其中的杂点生成目标图像;

所述增强模块,用于对目标图像进行数据增强,生成增强图像,丰富训练数据集的数据;

所述训练模块,用于构建深度学习多尺度特征融合网络,将训练数据集的数据传入深度学习网络进行模型训练,生成训练模型;

所述检测模块,用于根据训练模型对船舶目标视频流实时检测,在船舶目标视频流中自动标记船舶目标。

6.根据权利要求5所述的系统,其特征在于,所述增强模块中的图像增强方法包括图像缩放、图像平移、图像加雾处理、图像低照度调整和图像拼接。

7.根据权利要求5所述的系统,其特征在于,所述训练模块中的构建多尺度模型的方法具体为:

在YOLOv3网络结构基础上构建4层检测模块,分别包含32倍,16倍,8倍,4倍下采样特征图;

加入特征融合机制,通过Darknet-53网络进行特征提取后并经过几次卷积得到32倍粗尺度特征图,32倍粗尺度特征图进行上采样并将其与第四个残差块的输出拼接起来得到16倍特征图,16倍特征图进行上采样并将其与第三个残差块的输出拼接起来得到8倍特征图,

8倍特征图进行上采样并将其与第二个残差块的输出拼接起来得到4倍特征图;

形成尺度分别为13x13,26x26,52x52,104x104的4个尺度特征图,分别对应大,中,小,特小目标的检测。

8.根据权利要求5所述的系统,其特征在于,所述训练模块中生成训练模型的步骤如下:

使用GIoU计算预测框坐标回归损失,其公式如下,为目标框和真实框最小外包面积,为目标框和真实框覆盖的总面积,当IoU值为0时,GIoU的值依然存在,且C会根据目标框和真实框的变化而变化;

使用GIoU计算初步损失LGIoU,其公式如下,LGIoU=1-GIoU;

使用Focal loss损失函数代替YOLOv3中的置信度损失函数和类别损失函数,Focal损失是在交叉熵损失的基础上修改而来,其公式如下,FL(p,y)=-αy(1-p)γlog(p)-(1-α)(1-y)pγlog(1-p)其中,p为网络输出值,y为实际标签值,γ为控制难易样本参数,γ始终大于0,α为控制正负样本参数;当p越大时,(1-p)γ越小,损失越小;

改进后的损失函数使用GIoU损失作为预测框坐标回归损失,使用Focal loss损失函数作为置信度损失函数和类别损失函数以得到精度更高的最终损失Loss,其公式如下,采用DBSCAN和K-means混合聚类算法对训练数据进行聚类分析,通过DBSCAN方法得聚类的个数和每个类的中心点,然后将中心点作为K-Means的起始点,利用K-Means算法获得最终的先验框;

生成训练模型,进行迭代训练更新参数,设置迭代次数500,学习率步长为0.001。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4任一项所述方法的步骤。