利索能及
我要发布
收藏
专利号: 2021114331298
申请人: 江苏科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-03-02
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于多模态融合的水声目标识别方法,其特征在于,包括:采集水声目标;

采用自适应带宽的核密度估计函数对水声目标进行处理,拟合得到水声目标的概率分布函数,按照标准采样率对概率分布函数进行抽样,得到优化水声目标;

对优化水声目标提取多模态特征后进行数据增强,将数据增强之前的特征和增强之后的特征进行合并,得到特征数据集;

使用多个典型相关分析模型对特征数据集进行选择和融合;

统计模型的输出结果,使用决策层进行融合输出。

2.根据权利要求1所述的基于多模态融合的水声目标识别方法,其特征在于,所述自适应带宽的核密度估计函数为:

其中,根据均方积分误差函数计算得到第j个点的自适应带宽hj,ω为带宽参数,n为变量维度,M为采样点个数,K(x)为高斯核函数,S为优化水声目标的协方差矩阵,k(x)是带宽为hj的核密度估计函数。

3.根据权利要求2所述的基于多模态融合的水声目标识别方法,其特征在于,所述高斯核函数带宽参数的最优为:

其中,α为灵敏因子,f为分布函数。

4.根据权利要求3所述的基于多模态融合的水声目标识别方法,其特征在于,所述得到优化水声目标,之后包括:

对优化水声目标进行长度为56ms的分帧处理,重叠长度为28ms,窗形状设置为汉宁窗。

5.根据权利要求4所述的基于多模态融合的水声目标识别方法,其特征在于,所述多模态特征,包括:谱分析特征、色度特征和梅尔频率倒谱特征。

6.根据权利要求5所述的基于多模态融合的水声目标识别方法,其特征在于,所述谱分析特征,提取过程包括:

对第n帧音频信号进行短时傅里叶变换。

7.根据权利要求5所述的基于多模态融合的水声目标识别方法,其特征在于,所述色度特征,提取过程包括:

将优化水声目标转换为帧,记录每个音高在每帧内的能量,得到音高图谱;

将同一时间、同一音级、不同八度的音符的能量叠加到色度向量内对应音级的元素,得到色度谱图。

8.根据权利要求5所述的基于多模态融合的水声目标识别方法,其特征在于,所述梅尔频率倒谱特征,提取过程包括:

将实际频率尺度转换为梅尔频率尺度;

根据音频信号幅度谱,计算得到梅尔频率轴上配置的三角形滤波器的输出:其中,m(l)为第l个滤波器的梅尔频率系数,L为滤波器的总数,Wl(k)为三角形滤波器,Xn(k)为音频信号幅度谱,o(l)、c(l)和h(l)分别是三角形滤波器的下限、中心和上限频率;

对所有的滤波器输出做对数运算,再进行离散余弦变换。

9.根据权利要求5所述的基于多模态融合的水声目标识别方法,其特征在于,所述使用多个典型相关分析模型对特征数据集进行选择和融合,包括:典型相关分析模型选择多模态特征中的两种进行融合;对融合后的特征和未融合的特征分别使用不同的模型进行训练。

10.根据权利9所述的基于多模态融合的水声目标识别方法,其特征在于,所述统计模型的输出结果,使用决策层进行融合输出,包括:其中,模型i输出二进制向量xi,N为模型的总数,包含D个元素,j为元素在向量中的位置,wi为第i个模型的权重系数,y(j)是长度d的行向量,在第k个时间,决策层输出d(k)满足