利索能及
我要发布
收藏
专利号: 2017103115443
申请人: 深圳信息职业技术学院
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种情绪宣泄模式的确定方法,其特征在于,包括:

获取目标用户输入的语音信号;

将所述语音信号划分为两个以上的语音信号段;

分别提取各个所述语音信号段的预设类型的特征参数;

归一化各个所述语音信号段的特征参数;

将各个所述语音信号段的归一化后的特征参数分别构建成各个所述语音信号段对应的特征向量,每个所述语音信号段对应一个特征向量;

采用聚类算法对各个所述语音信号段对应的特征向量进行聚类运算,确定各个所述特征向量聚类后所对应的簇,所述簇与预设的情绪宣泄模式一一对应;

根据各个所述特征向量聚类后所对应的簇确定所述目标用户对应的情绪宣泄模式。

2.如权利要求1所述的情绪宣泄模式的确定方法,其特征在于,所述分别提取各个所述语音信号段的预设类型的特征参数包括分别提取各个所述语音信号段的平均幅度、静音比和基频拟合斜率,所述采用聚类算法对各个所述语音信号段对应的特征向量进行聚类运算所采取的初始聚类中心通过以下步骤确定:分别将各个所述语音信号段的归一化后的平均幅度、静音比和基频拟合斜率按照预设的加权系数进行累加,得到各个所述语音信号段的基准系数值;

将各个所述语音信号段的基准系数值所落入的阈值区间分别确定为各个所述语音信号段对应的阈值区间,所述阈值区间包括两个以上预设的连续数值区间;

分别计算各个所述阈值区间中每个阈值区间对应的所有语音信号段的特征向量之间的质心坐标值;

将计算得到的各个所述质心坐标值分别确定为各个所述初始聚类中心。

3.如权利要求2所述的情绪宣泄模式的确定方法,其特征在于,所述采用聚类算法对各个所述语音信号段对应的特征向量进行聚类运算包括:利用改进的曼哈坦距离公式计算各个所述特征向量中每个特征向量和各个所述初始聚类中心中每个初始聚类中心两两之间的距离,所述改进的曼哈坦距离公式为传统曼哈坦距离公式的平方;

将与所述每个特征向量的距离最小的初始聚类中心确定为所述每个特征向量对应的初始聚类中心;

分别计算各个所述初始聚类中心中每个初始聚类中心对应的所有特征向量之间的质心坐标值;

将各个所述初始聚类中心中每个初始聚类中心对应的所有特征向量之间的质心坐标值确定为所述聚类运算的新聚类中心;

重复利用所述改进的曼哈坦距离公式分别计算各个所述特征向量和所述各个新聚类中心之间的距离,迭代直至所述聚类过程收敛;

当所述聚类过程收敛时,确定各个所述特征向量聚类后所对应的簇。

4.如权利要求1所述的情绪宣泄模式的确定方法,其特征在于,所述分别提取各个所述语音信号段的预设类型的特征参数包括分别提取各个所述语音信号段的基频拟合斜率,所述分别提取各个所述语音信号段的基频拟合斜率包括:按照各个所述语音信号段的短时能量值是否大于预设的能量阈值将各个所述语音信号段分别划分为一个以上的信号帧,所述信号帧为各个所述语音信号段中短时能量值大于所述能量阈值的信号段;

利用短时幅度差方法分别计算各个所述信号帧的第一基频值;

利用倒谱方法分别计算各个所述信号帧的第二基频值;

将各个所述信号帧的第一基频值和第二基频值分别按照预设的加权系数累加,得到各个所述信号帧的目标基频值;

将各个所述语音信号段对应的所有信号帧的目标基频值按照第一顺序排列组成各个所述语音信号段的目标基频序列,所述第一顺序为所述所有信号帧中的各个信号帧在各个所述语音信号段中的排列顺序;

将各个所述语音信号段的目标基频序列分别划分为前基频序列和后基频序列;

利用最小均方误差准则分别对各个所述语音信号段的前基频序列和后基频序列作直线拟合,得到各个所述语音信号段的第一拟合直线和第二拟合直线;

分别计算各个所述语音信号段的第一拟合直线和第二拟合直线的斜率作为各个所述语音信号段的基频拟合斜率。

5.如权利要求1至4中所一项所述的情绪宣泄模式的确定方法,其特征在于,所述分别提取各个所述语音信号段的预设类型的特征参数包括分别提取各个所述语音信号段的互信息值,所述分别提取各个所述语音信号段的互信息值包括:分别对各个所述语音信号段进行语音识别,得到各个所述语音信号段对应的文字信息;

将各个所述语音信号段对应的文字信息与预设的关键字分类表进行匹配,确定所述文字信息中包含的目标关键字和所述目标关键字对应的互信息值,所述关键字分类表记录有归类于各种情绪宣泄模式的关键字,以及所述归类于各种情绪宣泄模式的关键字对应的互信息值;

将各个所述语音信号段中所述目标关键字对应的互信息值确定为各个所述语音信号段的互信息值。

6.如权利要求5所述的情绪宣泄模式的确定方法,其特征在于,所述关键字分类表根据以下步骤建立:确定收录关键字,将所有收录关键字按照各种情绪宣泄模式进行分类,记录所述各个收录关键字的类别;

获取样本语音信号,对所述样本语音信号进行语音识别,得到对应的样本文字信息,所述样本语音信号是用于确定所述关键字分类表中各个收录关键字对应的互信息值而输入的测试信号;

统计所述样本文字信息中属于第一类别的第一关键字的个数p、属于第一类别的除所述第一关键字外的其它关键字的个数q、不属于第一类别的第一关键字的个数s和所述样本文字信息的总字数t,所述第一类别为所述各个收录关键字的类别中的任意一种类别,所述第一关键字为所述收录关键字中的任意一个关键字;

将所述第一关键字与第一类别之间的互信息值确定为

以与确定所述第一关键字与第一类别之间的互信息值相同的方式确定所述关键字分类表中每个收录关键字与对应的关键字类别之间的互信息值,记录在所述关键字分类表中。

7.一种情绪宣泄模式的确定装置,其特征在于,包括:

语音获取模块,用于获取目标用户输入的语音信号;

信号划分模块,用于将所述语音信号划分为两个以上的语音信号段;

特征参数提取模块,用于分别提取各个所述语音信号段的预设类型的特征参数;

归一化模块,用于归一化各个所述语音信号段的特征参数;

特征向量构建模块,用于将各个所述语音信号段的归一化后的特征参数分别构建成各个所述语音信号段对应的特征向量,每个所述语音信号段对应一个特征向量;

聚类模块,用于采用聚类算法对各个所述语音信号段对应的特征向量进行聚类运算,确定各个所述特征向量聚类后所对应的簇,所述簇与预设的情绪宣泄模式一一对应;

模式确定模块,用于根据各个所述特征向量聚类后所对应的簇确定所述目标用户对应的情绪宣泄模式。

8.如权利要求7所述的情绪宣泄模式的确定装置,其特征在于,所述特征参数提取模块用于分别提取各个所述语音信号段的平均幅度、静音比和基频拟合斜率,所述聚类模块包括:参数累加单元,用于分别将各个所述语音信号段的归一化后的平均幅度、静音比和基频拟合斜率按照预设的加权系数进行累加,得到各个所述语音信号段的基准系数值;

区间确定单元,用于将各个所述语音信号段的基准系数值所落入的阈值区间分别确定为各个所述语音信号段对应的阈值区间,所述阈值区间包括两个以上预设的连续数值区间;

质心计算单元,用于分别计算各个所述阈值区间中每个阈值区间对应的所有语音信号段的特征向量之间的质心坐标值;

初始聚类中心确定单元,用于将计算得到的各个所述质心坐标值分别确定为各个所述初始聚类中心。

9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的情绪宣泄模式的确定方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的情绪宣泄模式的确定方法的步骤。