买专利、卖专利、专利购买、专利交易、专利出售、高企申报-采用局部敏感哈希的声源分离方法、装置及存储介质

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

采用局部敏感哈希的声源分离方法、装置及存储介质

面议

专利号： 2022111624681

申请人：金陵科技学院

专利类型：发明专利

专利状态：已下证

更新日期：2026-07-01

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种采用局部敏感哈希的声源分离方法，其特征在于该方法包括步骤：(1)获取若干单帧混合声音信号作为训练集样本，提取每个样本的频谱构建训练集的频谱字典和IBM矩阵Y；

(2)采用二类分类器，学习得到若干最优投影向量，并采用学习得到的最优投影向量将频谱字典转为哈希二值码，得到哈希频谱字典；

(3)提取待分离混合信号的频谱，采用学习得到的最优投影向量将待分离混合信号的频谱转为哈希二值码；

(4)在哈希频谱字典中查找到与待分离混合信号的频谱哈希二值码最相近的个频谱的索引值，利用个索引值在IBM矩阵Y中找到所对应的个IBM向量，并利用个IBM向量的加权平均估计待分离混合信号中源信号的IBM向量(5)根据IBM向量从待分离混合信号中恢复出源信号。

2.根据权利要求1所述的采用局部敏感哈希的声源分离方法，其特征在于：步骤(1)具体包括：(1‑1)获取若干单帧混合声音信号作为训练集样本，提取每个单帧混合声音信号的短时傅里叶频谱，并进行L2范数归一化；

(1‑2)将所有样本L2范数归一化后的短时傅里叶频谱组成集合作为频谱字典，其中，N表示训练集中样本数，F表示短时傅里叶频谱维度；

(1‑3)计算训练集中所有样本的IBM值，并将所有样本的IBM值组成频谱字典的IBM矩阵其中，若样本当前频谱是目标信号占主导，则对应IBM值为1，若干扰信号占主导，则对应IBM值为0。

3.根据权利要求1所述的采用局部敏感哈希的声源分离方法，其特征在于：步骤(2)具体包括：(2‑1)将自相似矩阵权重的初始值进行均匀分布初始化，将所有投影向量组成的投影矩阵进行随机初始化，将分类器权重向量的初始值赋值为零向量，其中，N表示训练集中样本数，L表示投影向量个数，F表示短时傅里叶频谱维度，:表示取该维度所有元素；

(2‑2)根据频谱字典按照下式计算得到引入上下文信息的频谱字典其中，H*,:表示频谱字典H第*行，表示引入上下文信息的频谱字典的第l行，ηl,·＝exp(‑‖*‑l‖/τ)表示上下文窗，τ是窗宽度，concat表示沿列进行特征拼接；

(2‑3)设置循环次数l＝1；

(2‑4)按照下式依次计算：

A、

B、

C、

D、

式中，表示迭代中的哈希频谱字典的第*列,且Pl,:表示P的第l行；T为矩阵转置运算；sgn(·)为符号函数；为偏置项, 分别表示自相似矩阵权重矩阵的第l、l‑1个子矩阵，⊙表示逐元素相乘，βl‑1、βl分别表示第l‑1、l个分类器权重，Dist{·}表示按矩阵内各元素计算的交叉熵代价函数，εl表示第l次投影的代价函数；

(2‑5)将计算得到的Pl,:作为最优投影向量判断l是否小于L，若是，则将l＝l+1，并返回执行步骤(2‑4)，若否，则执行步骤(2‑6)；

(2‑6)按照下式采用学习得到的最优投影向量将频谱字典转为哈希二值码，得到最优的哈希频谱字典

4.根据权利要求1所述的采用局部敏感哈希的声源分离方法，其特征在于：步骤(3)具体包括：(3‑1)提取待分离混合信号的短时傅里叶频谱，并进行L2范数归一化；

(3‑2)按照下式采用学习得到的投影向量将待分离混合信号L2范数归一化的频谱转为哈希二值码：式中，表示待分离混合信号的频谱哈希二值码，x表示待分离混合信号L2范数归一*化的频谱；sgn(·)为符号函数；为偏置项，P表示学习得到的最优投影向量组成的最优投影矩阵，L表示投影向量个数，T为矩阵转置运算。

5.根据权利要求1所述的采用局部敏感哈希的声源分离方法，其特征在于：步骤(4)具体包括：(4‑1)设置集合初始化时随机选择个码字索引填充设置表示集合中所有码字与的最远距离；

(4‑2)设置迭代次数t＝1；

(4‑3)计算待分离混合信号的频谱哈希二值码和哈希频谱字典的第t行的汉明距离，赋值给Dt，并判断Dt是否小于若是则执行步骤(4‑4)，若否则执行步骤(4‑

6)；

(4‑4)将t替换掉中距离最大值所对应的索引；

(4‑5)按照下式更新

式中，Hm()表示求汉明距离，表示哈希频谱字典的第k行；

(4‑6)判断t是否小于N，N表示哈希频谱字典的行数，若是，则将t＝t+1,并返回执行步骤(4‑3)，否则执行步骤(4‑7)；