利索能及
我要发布
收藏
专利号: 2022111624681
申请人: 金陵科技学院
专利类型:发明专利
专利状态:已下证
更新日期:2026-07-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种采用局部敏感哈希的声源分离方法,其特征在于该方法包括步骤:(1)获取若干单帧混合声音信号作为训练集样本,提取每个样本的频谱构建训练集的频谱字典和IBM矩阵Y;

(2)采用二类分类器,学习得到若干最优投影向量,并采用学习得到的最优投影向量将频谱字典转为哈希二值码,得到哈希频谱字典;

(3)提取待分离混合信号的频谱,采用学习得到的最优投影向量将待分离混合信号的频谱转为哈希二值码;

(4)在哈希频谱字典中查找到与待分离混合信号的频谱哈希二值码最相近的 个频谱的索引值,利用 个索引值在IBM矩阵Y中找到所对应的 个IBM向量,并利用 个IBM向量的加权平均估计待分离混合信号中源信号的IBM向量(5)根据IBM向量 从待分离混合信号中恢复出源信号。

2.根据权利要求1所述的采用局部敏感哈希的声源分离方法,其特征在于:步骤(1)具体包括:(1‑1)获取若干单帧混合声音信号作为训练集样本,提取每个单帧混合声音信号的短时傅里叶频谱,并进行L2范数归一化;

(1‑2)将所有样本L2范数归一化后的短时傅里叶频谱组成集合 作为频谱字典,其中,N表示训练集中样本数,F表示短时傅里叶频谱维度;

(1‑3)计算训练集中所有样本的IBM值,并将所有样本的IBM值组成频谱字典的IBM矩阵其中,若样本当前频谱是目标信号占主导,则对应IBM值为1,若干扰信号占主导,则对应IBM值为0。

3.根据权利要求1所述的采用局部敏感哈希的声源分离方法,其特征在于:步骤(2)具体包括:(2‑1)将自相似矩阵权重 的初始值进行均匀分布初始化,将所有投影向量组成的投影矩阵 进行随机初始化,将分类器权重向量 的初始值赋值为零向量,其中,N表示训练集中样本数,L表示投影向量个数,F表示短时傅里叶频谱维度,:表示取该维度所有元素;

(2‑2)根据频谱字典按照下式计算得到引入上下文信息的频谱字典其中,H*,:表示频谱字典H第*行, 表示引入上下文信息的频谱字典 的第l行,ηl,·=exp(‑‖*‑l‖/τ)表示上下文窗,τ是窗宽度,concat表示沿列进行特征拼接;

(2‑3)设置循环次数l=1;

(2‑4)按照下式依次计算:

A、

B、

C、

D、

式中, 表示迭代中的哈希频谱字典 的第*列,且Pl,:表示P的第l行;T为矩阵转置运算;sgn(·)为符号函数; 为偏置项, 分别表示自相似矩阵权重矩阵 的第l、l‑1个子矩阵,⊙表示逐元素相乘,βl‑1、βl分别表示第l‑1、l个分类器权重,Dist{·}表示按矩阵内各元素计算的交叉熵代价函数,εl表示第l次投影的代价函数;

(2‑5)将计算得到的Pl,:作为最优投影向量 判断l是否小于L,若是,则将l=l+1,并返回执行步骤(2‑4),若否,则执行步骤(2‑6);

(2‑6)按照下式采用学习得到的最优投影向量 将频谱字典转为哈希二值码,得到最优的哈希频谱字典

4.根据权利要求1所述的采用局部敏感哈希的声源分离方法,其特征在于:步骤(3)具体包括:(3‑1)提取待分离混合信号的短时傅里叶频谱,并进行L2范数归一化;

(3‑2)按照下式采用学习得到的投影向量将待分离混合信号L2范数归一化的频谱转为哈希二值码:式中, 表示待分离混合信号的频谱哈希二值码,x表示待分离混合信号L2范数归一*化的频谱;sgn(·)为符号函数; 为偏置项,P表示学习得到的最优投影向量组成的最优投影矩阵,L表示投影向量个数,T为矩阵转置运算。

5.根据权利要求1所述的采用局部敏感哈希的声源分离方法,其特征在于:步骤(4)具体包括:(4‑1)设置集合 初始化时随机选择 个码字索引填充 设置表示集合 中所有码字与 的最远距离;

(4‑2)设置迭代次数t=1;

(4‑3)计算待分离混合信号的频谱哈希二值码 和哈希频谱字典 的第t行 的汉明距离,赋值给Dt,并判断Dt是否小于 若是则执行步骤(4‑4),若否则执行步骤(4‑

6);

(4‑4)将t替换掉 中距离最大值所对应的索引;

(4‑5)按照下式更新

式中,Hm()表示求汉明距离, 表示哈希频谱字典 的第k行;

(4‑6)判断t是否小于N,N表示哈希频谱字典 的行数,若是,则将t=t+1,并返回执行步骤(4‑3),否则执行步骤(4‑7);

(4‑7)按照下式进行归一化:

(4‑8)按照下式估计待分离混合信号中源信号的掩蔽向量式中,Yk,:表示IBM矩阵Y的第k行。

6.根据权利要求1所述的采用局部敏感哈希的声源分离方法,其特征在于:步骤(5)具体包括:根据掩蔽向量 从待分离混合信号恢复出源信号ss:式中,⊙表示逐元素相乘,x表示待分离混合信号的短时傅里叶频谱。

7.一种采用局部敏感哈希的声源分离装置,其特征在于,包括:一个或多个处理器;

存储器,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1‑6中任一所述方法。

8.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1‑6中任一所述方法。