利索能及
我要发布
收藏
专利号: 2016109701862
申请人: 南京邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-04-10
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种语音信号的压缩感知重构方法,其特征在于,所述方法包括如下步骤:步骤1:获得观测信号并得到观测信号的稀疏表示,给定一段.wav格式的语音,采样之后得到时域语音信号x,选取高斯观测矩阵,求得观测向量y,选取离散余弦稀疏基对原语音信号进行稀疏表示;

步骤2:采用SL0算法重构原信号,通过实验选择平滑函数,利用梯度投影和最速下降法求解最小 范数,所述的平滑函数为:

步骤3:对整段语音的重构效果作出评价,包括从重构时间和重构质量这两个方面分析上述步骤2中三种方法的优劣,其中,重构质量评估主要从主观、客观这两个方面展开;

步骤3-1.在MATLAB中,使用tic、toc函数对重构的时间进行计算;

步骤3-2.在客观方面,将压缩比分别设置为0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8和

0.9,求出不同压缩比下的平均帧信噪比,在主观方面,对在不同压缩比情况下重构的语音信号,进行平均意见得分评估,平均帧信噪比公式为:

2.根据权利要求1所述的一种语音信号的压缩感知重构方法,其特征在于,所述步骤1包括:步骤1-1:对一段时域语音信号进行数字化采样,对采样后的数字信号进行加窗、分帧,帧长取30ms;

步骤1-2:构造一个大小为M×N的矩阵Ψ,其中M是得到观测信号的维数,N是原信号的维数,当Ψ中的每一个元素独立的服从均值为0,方差为1/M的高斯分布 时,观测信号表示为y=Ψx;

步骤1-3:根据压缩感知理论,必须对原语音信号x进行稀疏表示,采用离散余弦变换基对时域信号进行稀疏表示,用Φ表示离散余弦基矩阵,则x=Φα,其中α是向量x在基Φ下的坐标。

3.根据权利要求1所述的一种语音信号的压缩感知重构方法,其特征在于,所述步骤2包括:步骤2-1:传统的高斯平滑函数表示为 考虑到语音信号自身的特点,结合实验,该步骤作出作出重大改进,在平滑函数的形式和参数上给出了改进,改进后的平滑函数表示为步骤2-2:分别利用传统的OMP算法、基于高斯平滑函数以及基于本发明提出的改进的平滑函数的SL0算法分别重构语音信号,本发明提出的改进的SL0算法,包括如下步骤:A.设置初始值,重构信号α=ΞTy,余量初始值r0=0,平滑函数初始参数σ=1;

B.求-Fσ的搜索方向d;

C.使用修正的牛顿算法更新重构信号α=α+μd;

D.使用梯度投影算法得到α=α-ΦT(ΦΦT)-1(Φα-y),计算余量r=y-Φα;

E.得到最优近似值

F.对求得的α进行离散余弦反变换,得到重构语音信号的时域表示。

4.根据权利要求2所述的一种语音信号的压缩感知重构方法,其特征在于:步骤1-1包括对语音信号的分帧、加窗。

5.根据权利要求2所述的一种语音信号的压缩感知重构方法,其特征在于:步骤1-2包括选取高斯观测矩阵作为本发明的观测矩阵。

6.根据权利要求1所述的一种语音信号的压缩感知重构方法,其特征在于:步骤1-3包括选取离散余弦变换基对时域信号进行稀疏表示。

7.根据权利要求1所述的一种语音信号的压缩感知重构方法,其特征在于:步骤3包括从重构时间、重构质量两个方面评价重构算法的优劣,重构质量使用平均帧信噪比和平均帧意见分两个指标。