1.一种语音信号的特征获取方法,其特征在于,包括:
对待分析的语音信号进行时频化处理,获取所述语音信号的语谱图;
统计获取所述语谱图内各能量点的方向信息;
根据所述语谱图内各能量点的方向信息,基于核密度估计算法建立形式背景,所述形式背景以能量点作为对象,能量点所含有的方向区间作为属性,用于描述所述语谱图中能量点与其所含有的方向区间之间的对应关系;
根据所述形式背景,建立所述语音信号的方向共生属性拓扑图,所述方向共生属性拓扑图用于描述所述形式背景中属性对之间的共生关系;
其中,所述统计获取所述语谱图内各能量点的方向信息,包括:
对所述语谱图按照以下公式如下进行滑窗处理:
P(t,f)=[P1(t,f),P2(t,f),…,Pn(t,f)];
其中,n为所述语谱图中子区域窗口的数量,Pi(t,f)表示所述语谱图的第i个子区域窗口;P(t,f)为所述语音信号的语谱图的表达式,所述P(t,f)表示在时刻t和频率f下的能量值;
按照以下公式计算子区域窗口Pi(t,f)下时频混合域内(t0,f0)处能量点的方向变化率其中,所述l表示所述子区域窗口Pi(t,f)下时频混合域内(t0,f0)处能量点的方向,表示在子区域窗口下时频混合域内(t0,f0)处的能量点(t0,f0)的时间变化率,表示在子区域窗口下的时频混合域内(t0,f0)处的能量点(t0,f0)的频率变化率,所述 为所述语谱图内时频平面坐标轴到(t0,f0)处能量点的方向l的夹角;
所述根据所述语谱图内各能量点的方向信息,基于核密度估计算法建立形式背景,包括:按照以下公式,对子区域窗口Pi(t,f)下时频混合域内(t0,f0)处能量点的方向变化率值分布进行核概率密度估计,得到(t0,f0)处能量点方向变化率的近似分布函数其中, 为独立同分布 里的ar个样本点,ar为子区域窗口Pi(t,f)下时频混合域内(t0,f0)处能量点的所有方向变化率的数量,h>0为一个平滑系数,kel(·)为核函数;
按照以下公式,对子区域窗口Pi(t,f)下时频混合域内(t0,f0)处能量点的方向值分布进行核概率密度估计,得到(t0,f0)处能量点的方向值的近似分布函数其中, 为独立同分布 里的af个样本点,af为子区域窗口Pi(t,f)下时频混合域内(t0,f0)处能量点的所有方向值的数量;
按照以下公式计算能量点与其所含有的方向区间的对应关系:
其中,所述 为通过近似分布函数 和近似分布函数 得出的方向
值 的期望,σ为方向值 的方差,gp表示子区域窗口Pi(t,f)下第p个能量点即(t0,f0)处能量点,所述p取值为1,2,......,d,所述d为子区域窗口Pi(t,f)内的能量点的数量;ψq是子区域窗口Pi(t,f)下所有能量点的所有方向值的值域等间隔大小量化后的方向区间,ψq表示能量点gp所含有的的属性,q取值为1,2,......,b,所述b为等间隔量化的方向区间的数量,I为对象与属性之间的关系,所述gpIψq表示能量点gp与能量点gp所含属性ψq之间的对应关系;
以子区域窗口Pi(t,f)下的能量点为对象,所述子区域窗口Pi(t,f)下所有能量点的所有方向值的值域等间隔大小量化后的方向区间为属性建立形式背景K=(G,M,I),其中,G表示子区域窗口Pi(t,f)内所有能量点的集合,M为子区域窗口Pi(t,f)内所有能量点方向值的值域等间隔量化后的方向区间的集合;
所述根据所述形式背景,建立所述语音信号的方向共生属性拓扑图,包括:按照以下公式计算所述形式背景中属性对之间边上的共生强度矩阵Edgei(ψu,ψv):其中,g(ψu)为在所述形式背景中与方向区间ψu的对应关系为1的能量点集合,g(ψv)为在所述形式背景中与方向区间ψv的对应关系为1的能量点集合;#(g(ψu))表示g(ψu)中的能量点数量;#(g(ψu)∩g(ψv))表示g(ψu)∩g(ψv)中的能量点数量,u,v取值为1,2,.......,b;
根据所述Edgei(ψu,ψv)构建所述语音信号的方向共生属性拓扑图。
2.根据权利要求1所述的方法,其特征在于,所述对待分析的语音信号进行时频化处理,获取所述语音信号的语谱图,包括:按照以下公式对所述语音信号进行短时傅立叶变换:
其中,x(u)为语音信号,w(u‑t)为窗函数,t表示时间,f表示频率,u‑t∈[0,L‑1],所述L为所述窗函数的步长;
以P(t,f)作为所述语音信号的语谱图的表达式,按照以下公式计算P(t,f):2
P(t,f)=|STFT(t,f)|。
3.根据权利要求2所述的方法,其特征在于,所述w(u‑t)为汉明窗的窗函数。
4.一种语音信号的特征获取装置,其特征在于,包括:
获取模块,被配置为对待分析的语音信号进行时频化处理,获取所述语音信号的语谱图;
统计模块,被配置为统计获取所述语谱图内各能量点的方向信息;
第一建立模块,被配置为根据所述语谱图内各能量点的方向信息,基于核密度估计算法建立形式背景,所述形式背景以能量点作为对象,能量点所含有的方向区间作为属性,用于描述所述语谱图中能量点与其所含有的方向区间之间的对应关系;
第二建立模块,被配置根据所述形式背景,建立所述语音信号的方向共生属性拓扑图,所述方向共生属性拓扑图用于描述所述形式背景中属性对之间的共生关系;
其中,所述统计获取所述语谱图内各能量点的方向信息,包括:
对所述语谱图按照以下公式如下进行滑窗处理:
P(t,f)=[P1(t,f),P2(t,f),…,Pn(t,f)];
其中,n为所述语谱图中子区域窗口的数量,Pi(t,f)表示所述语谱图的第i个子区域窗口;P(t,f)为所述语音信号的语谱图的表达式,所述P(t,f)表示在时刻t和频率f下的能量值;
按照以下公式计算子区域窗口Pi(t,f)下时频混合域内(t0,f0)处能量点的方向变化率其中,所述l表示所述子区域窗口Pi(t,f)下时频混合域内(t0,f0)处能量点的方向,表示在子区域窗口下时频混合域内(t0,f0)处的能量点(t0,f0)的时间变化率,表示在子区域窗口下的时频混合域内(t0,f0)处的能量点(t0,f0)的频率变化率,所述 为所述语谱图内时频平面坐标轴到(t0,f0)处能量点的方向l的夹角;
所述根据所述语谱图内各能量点的方向信息,基于核密度估计算法建立形式背景,包括:按照以下公式,对子区域窗口Pi(t,f)下时频混合域内(t0,f0)处能量点的方向变化率值分布进行核概率密度估计,得到(t0,f0)处能量点方向变化率的近似分布函数其中, 为独立同分布 里的ar个样本点,ar为子区域窗口Pi(t,f)下时频混合域内(t0,f0)处能量点的所有方向变化率的数量,h>0为一个平滑系数,kel(·)为核函数;
按照以下公式,对子区域窗口Pi(t,f)下时频混合域内(t0,f0)处能量点的方向值分布进行核概率密度估计,得到(t0,f0)处能量点的方向值的近似分布函数其中, 为独立同分布 里的af个样本点,af为子区域窗口Pi(t,f)下时频混合域内(t0,f0)处能量点的所有方向值的数量;
按照以下公式计算能量点与其所含有的方向区间的对应关系:
其中,所述 为通过近似分布函数 和近似分布函数 得出的方向
值 的期望,σ为方向值 的方差,gp表示子区域窗口Pi(t,f)下第p个能量点即(t0,f0)处能量点,所述p取值为1,2,......,d,所述d为子区域窗口Pi(t,f)内的能量点的数量;ψq是子区域窗口Pi(t,f)下所有能量点的所有方向值的值域等间隔大小量化后的方向区间,ψq表示能量点gp所含有的的属性,q取值为1,2,......,b,所述b为等间隔量化的方向区间的数量,I为对象与属性之间的关系,所述gpIψq表示能量点gp与能量点gp所含属性ψq之间的对应关系;
以子区域窗口Pi(t,f)下的能量点为对象,所述子区域窗口Pi(t,f)下所有能量点的所有方向值的值域等间隔大小量化后的方向区间为属性建立形式背景K=(G,M,I),其中,G表示子区域窗口Pi(t,f)内所有能量点的集合,M为子区域窗口Pi(t,f)内所有能量点方向值的值域等间隔量化后的方向区间的集合;
所述根据所述形式背景,建立所述语音信号的方向共生属性拓扑图,包括:按照以下公式计算所述形式背景中属性对之间边上的共生强度矩阵Edgei(ψu,ψv):其中,g(ψu)为在所述形式背景中与方向区间ψu的对应关系为1的能量点集合,g(ψv)为在所述形式背景中与方向区间ψv的对应关系为1的能量点集合;#(g(ψu))表示g(ψu)中的能量点数量;#(g(ψu)∩g(ψv))表示g(ψu)∩g(ψv)中的能量点数量,u,v取值为1,2,.......,b;
根据所述Edgei(ψu,ψv)构建所述语音信号的方向共生属性拓扑图。