利索能及
我要发布
收藏
专利号: 2020100551940
申请人: 深圳信息职业技术学院
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种水尺字符定位方法,其特征在于,所述水尺字符定位方法包括:

获取针对同一船舶的具有时间属性和空间位置属性的多张待识别的水尺字符图像;

根据所述时间属性和所述空间位置属性将多张所述待识别的水尺字符图像生成图像集合;

将所述图像集合输入到预先训练好的卷积神经网络,所述卷积神经网络结合所述图像集合中的所述水尺字符图像的所述时间属性和所述空间位置属性获得所述待识别的水尺字符图像中的水尺字符位置;

对所述待识别的水尺字符图像中的水尺字符进行标识处理;

其中,获得所述预先训练好的卷积神经网络包括:

获取针对同一船舶的具有时间属性和空间位置属性的多张样本水尺字符图像;

根据所述时间属性和所述空间位置属性将多张所述样本水尺字符图像生成样本图像集合;

将所述样本图像集合输入到所述卷积神经网络,所述卷积神经网络结合所述样本图像集合中的所述样本水尺字符图像的所述时间属性和所述空间位置属性获得所述样本水尺字符图像中的水尺字符位置;

通过损失函数对多张所述样本水尺字符图像的预测水尺字符位置定位结果进行计算,得到所述卷积神经网络的质量评估系数;

当所述质量评估系数未达到预设阈值时,调整所述卷积神经网络中各个特征的特征权重,重复将所述样本图像集合输入到所述卷积神经网络以获得预测的预测水尺字符位置,直至所述质量评估系数达到所述预设阈值,以获得所述预先训练好的卷积神经网络;

其中,所述质量评估系数根据下式(1)计算得到:

L(x,c,l,g)=

1/N(Lconf(x,c)+a1*Lloc1(x,l,g)+a2*Lloc2(x,l,g)+…+an*Llocn(x,l,g))(1)其中,其中N代表与实际字符框相匹配的先验字符框个数,x代表匹配指示矩阵,c代表置信度,l代表预测字符框,g代表实际字符框,Llocn代表第n个预测字符框的位置损失,Lconf代表Softmax逻辑回归损失,an代表第n个预测字符框位置损失的权重,a1代表第1个预测字符框位置损失的权重,a2代表第2个预测字符框位置损失的权重。

2.根据权利要求1所述的水尺字符定位方法,其特征在于,所述卷积神经网络结合所述图像集合中的所述水尺字符图像的所述时间属性和所述空间位置属性获得所述水尺字符图像中的水尺字符位置包括:所述预先训练好的卷积神经网络中的第一层卷积层、第二层卷积层和第三层卷积层分别提取处于同一时间点的不同空间位置的所述水尺字符图像的第一特征;

所述预先训练好的卷积神经网络中的第四层卷积层和第五层卷积层对所述第一特征进行抽取和融合,获得第二特征;

所述预先训练好的卷积神经网络中的全连接层根据所述第二特征分别对多张所述水尺字符图像中的水尺字符进行定位,得到水尺字符位置。

3.根据权利要求2所述的水尺字符定位方法,其特征在于,所述卷积神经网络中设置有多个第一层卷积层,将多个所述第一层卷积层分别与处于同一时间点的不同空间位置的多张所述水尺字符图像一一对应,所述第一层卷积层对与所述第一层卷积层对应的所述水尺字符图像的特征进行提取。

4.根据权利要求1所述的水尺字符定位方法,其特征在于,通过加速梯度下降算法对所述卷积神经网络中各个特征的特征权重进行调整。

5.根据权利要求1所述的水尺字符定位方法,其特征在于,所述样本水尺字符图像包括不同方位摄制的水尺字符图像、不同时间点设置的水尺字符图像、有水体倒影的水尺字符图像、无水体倒影的水尺字符图像中的至少一种。

6.一种水尺字符定位装置,其特征在于,包括:

水尺字符图像获取模块,用于针对同一船舶的具有时间属性和空间位置属性的多张待识别的水尺字符图像;

图像集合获取模块,用于根据所述时间属性和所述空间位置属性将多张所述待识别的水尺字符图像生成图像集合;

水尺字符位置获取模块,用于将所述图像集合输入到卷积神经网络,预先训练好的卷积神经网络结合所述图像集合中的所述水尺字符图像的所述时间属性和所述空间位置属性获得所述待识别的水尺字符图像中的水尺字符位置;

标识处理模块,用于对所述待识别的水尺字符图像中的水尺字符进行标识处理;

其中,获得所述预先训练好的卷积神经网络包括:

样本水尺字符图像获取模块,用于获取针对同一船舶的具有时间属性和空间位置属性的多张样本水尺字符图像;

样本图像集合获取模块,用于根据所述时间属性和所述空间位置属性将多张所述样本水尺字符图像生成样本图像集合;

样本水尺字符位置获取模块,用于将所述样本图像集合输入到所述卷积神经网络,所述卷积神经网络结合所述样本图像集合中的所述样本水尺字符图像的所述时间属性和所述空间位置属性获得所述样本水尺字符图像中的水尺字符位置;

质量评估系数获取模块,用于通过损失函数对多张所述样本水尺字符图像的预测水尺字符位置定位结果进行计算,得到所述卷积神经网络的质量评估系数;

卷积神经网络确定模块,用于当所述质量评估系数未达到预设阈值时,调整所述卷积神经网络中各个特征的特征权重,重复将所述样本图像集合输入到所述卷积神经网络以获得预测的预测水尺字符位置,直至所述质量评估系数达到所述预设阈值,以获得所述预先训练好的卷积神经网络;

其中,所述质量评估系数根据下式(1)计算得到:

L(x,c,l,g)=

1/N(Lconf(x,c)+a1*Lloc1(x,l,g)+a2*Lloc2(x,l,g)+…+an*Llocn(x,l,g))(1)其中,其中N代表与实际字符框相匹配的先验字符框个数,x代表匹配指示矩阵,c代表置信度,l代表预测字符框,g代表实际字符框,Llocn代表第n个预测字符框的位置损失,Lconf代表Softmax逻辑回归损失,an代表第n个预测字符框位置损失的权重,a1代表第1个预测字符框位置损失的权重,a2代表第2个预测字符框位置损失的权重。

7.一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述水尺字符定位方法的步骤。

8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述水尺字符定位方法的步骤。