利索能及
我要发布
收藏
专利号: 202410132108X
申请人: 山东科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于侧扫声呐目标识别的声强与图像耦合方法,其特征在于,包括以下步骤:S1、采用声强特征提取网络对声强域进行特征分析和提取,采用图像特征提取网络对图像域进行特征分析和提取;

S2、采用通道特征表示寻找两个域的潜在关系,声强域包含声强通道和信息融合通道,图像域包含图像通道和信息融合通道,同一域中的两类通道共享相同的初步特征提取,两个域中的信息融合通道进行融合寻找共同表示,声强通道和图像通道提取各自的特征表示;

S3、输出声强识别、图像识别和耦合识别;

步骤S1中,采用声强特征提取网络进行特征分析和提取,得到声强信息S;采用图像特征提取网络进行特征分析和提取,得到声学图像信息I;

设训练集为{S,I},S的数据形式为h×p,I的数据形式为c×h'×w,其中,h在数据集S中属于声强信息的通道;p为声强信息的采样点;c为输入声学图像的通道数;h’在数据集I中表示图像的宽,与声强信息通道h相等;w为图像的长;

输入的S和I数据先经过下采样卷积操作:S=conv(S),

I=conv(I),

分别采用声强特征提取网络NS(·)和图像特征提取网络NI(·)进行特征分析和提取;

声强特征提取网络NS(·)的输出如下:声强特征提取网络NS(·)的具体展开步骤如下所述:将S重塑得到B、C、D:

B=C=D=reshape(S),将B和C进行矩阵乘法操作和softmax处理得到E:最终增强结果为G:

最后经过上采样卷积操作:

图像特征提取网络NI(·)的输出如下:图像特征提取网络NI(·)的具体展开步骤如下所述:将I经过3×3和5×5卷积核处理得到的不同特征图M1和M2,并相加得到M:M=M1+M2,

对M进行池化:

其中,H和W分别为特征图M的长和宽;

然后进行如下操作:

Z=δ(η(P)),

A=φ(Z),

其中,η(·)为归一化处理,δ(·)为全连接操作,Z为全连接结果;φ(·)为softmax处理,A为权重;

将特征图M1和M2分别与权重A相乘后相加,得到Y:Y=Y1+Y2=AM1+AM2,Y为得到的不同尺度图像域的表示;

最后经过上采样卷积操作:

步骤S2中,声强通道表示如下:图像通道表示如下:

S I

其中,CS(·)和CI(·)为卷积核为1×1的卷积操作;θ和θ 分别表示声强域和图像域的参数;

信息融合通道表示如下:

F

其中,F(S,I)(·)为卷积核为1×1的卷积操作,θ为两个域的融合参数;步骤S3中,将声强通道SC与信息融合通道SF数据结合输出声强域识别SFC:将图像通道IC与信息融合通道SF数据结合输出图像域识别IFC:对SFC和IFC分别进行池化,得到拥有共同空间尺寸的SFC'和IFC’,然后进行结合,输出耦合识别O:其中,H’和W’表示SFC'和IFC’空间尺寸长和宽;

识别结果输出P’为SFC、IFC、O共同判定:其中,PA(·)表示三者识别的准确率。

2.根据权利要求1所述的基于侧扫声呐目标识别的声强与图像耦合方法,其特征在于,步骤S1中,侧扫声呐传感器探测过程中,当扫测到声强信息与背景信息不一致的目标物后,此时声强信息会产生波动;

根据声强与像素之间的关系,将声强作为声强域的输入,将像素作为图像域的输入。

3.根据权利要求1所述的基于侧扫声呐目标识别的声强与图像耦合方法,其特征在于,当P’大于阈值0.5时,则认定识别到目标物种类;反之,则未识别到目标物。