1.一种基于多模态融合的水声目标识别方法,其特征在于,包括:采集水声目标;
采用自适应带宽的核密度估计函数对水声目标进行处理,拟合得到水声目标的概率分布函数,按照标准采样率对概率分布函数进行抽样,得到优化水声目标;
对优化水声目标提取多模态特征后进行数据增强,将数据增强之前的特征和增强之后的特征进行合并,得到特征数据集;
使用多个典型相关分析模型对特征数据集进行选择和融合;
统计模型的输出结果,使用决策层进行融合输出。
2.根据权利要求1所述的基于多模态融合的水声目标识别方法,其特征在于,所述自适应带宽的核密度估计函数为:
其中,根据均方积分误差函数计算得到第j个点的自适应带宽hj,ω为带宽参数,n为变量维度,M为采样点个数,K(x)为高斯核函数,S为优化水声目标的协方差矩阵,k(x)是带宽为hj的核密度估计函数。
3.根据权利要求2所述的基于多模态融合的水声目标识别方法,其特征在于,所述高斯核函数带宽参数的最优为:
其中,α为灵敏因子,f为分布函数。
4.根据权利要求3所述的基于多模态融合的水声目标识别方法,其特征在于,所述得到优化水声目标,之后包括:
对优化水声目标进行长度为56ms的分帧处理,重叠长度为28ms,窗形状设置为汉宁窗。
5.根据权利要求4所述的基于多模态融合的水声目标识别方法,其特征在于,所述多模态特征,包括:谱分析特征、色度特征和梅尔频率倒谱特征。
6.根据权利要求5所述的基于多模态融合的水声目标识别方法,其特征在于,所述谱分析特征,提取过程包括:
对第n帧音频信号进行短时傅里叶变换。
7.根据权利要求5所述的基于多模态融合的水声目标识别方法,其特征在于,所述色度特征,提取过程包括:
将优化水声目标转换为帧,记录每个音高在每帧内的能量,得到音高图谱;
将同一时间、同一音级、不同八度的音符的能量叠加到色度向量内对应音级的元素,得到色度谱图。
8.根据权利要求5所述的基于多模态融合的水声目标识别方法,其特征在于,所述梅尔频率倒谱特征,提取过程包括:
将实际频率尺度转换为梅尔频率尺度;
根据音频信号幅度谱,计算得到梅尔频率轴上配置的三角形滤波器的输出:其中,m(l)为第l个滤波器的梅尔频率系数,L为滤波器的总数,Wl(k)为三角形滤波器,Xn(k)为音频信号幅度谱,o(l)、c(l)和h(l)分别是三角形滤波器的下限、中心和上限频率;
对所有的滤波器输出做对数运算,再进行离散余弦变换。
9.根据权利要求5所述的基于多模态融合的水声目标识别方法,其特征在于,所述使用多个典型相关分析模型对特征数据集进行选择和融合,包括:典型相关分析模型选择多模态特征中的两种进行融合;对融合后的特征和未融合的特征分别使用不同的模型进行训练。
10.根据权利9所述的基于多模态融合的水声目标识别方法,其特征在于,所述统计模型的输出结果,使用决策层进行融合输出,包括:其中,模型i输出二进制向量xi,N为模型的总数,包含D个元素,j为元素在向量中的位置,wi为第i个模型的权重系数,y(j)是长度d的行向量,在第k个时间,决策层输出d(k)满足