利索能及
我要发布
收藏
专利号: 2021104977576
申请人: 陕西师范大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于参数稀疏共享的中国方言语种分类系统,其特征在于,包括有特征提取模块、基础网络训练模块、子任务网络训练模块、联合训练模块、标签输出模块;所述特征提取模块用于原始音频预处理及音频的MFCC特征提取;所述基础网络训练模块,是针对MFCC特征建立相应的基于长短期记忆网络,并以此作为基础网络,通过不同方言数据训练集,训练基础网络结构;所述子任务网络训练模块,选择子任务,使用迭代裁剪方法依次对所述子任务进行裁剪并保留最优网络结构;所述联合训练模块用于将子任务网络及基础网络集成形成基于稀疏共享机制的网络模型,输入各个任务数据更新基于稀疏共享机制的网络模型对应的网络参数并保存模型;所述输出模块用于将语音特征输入至基于稀疏共享机制的网络模型并输出语种预测结果。

2.根据权利要求1所述的基于参数稀疏共享的中国方言语种分类系统,其特征在于,所述特征提取模块包括:

1)预处理原始音频数据,将原始语音裁剪缩短或通过复制扩充至统一时长2秒;

2)对统一时长的语音预加重、加窗、分帧、傅里叶变换、Mel滤波器组处理、取对数、DCT离弦变换后,最终获取原始音频的MFCC特征。

3.根据权利要求1所述的基于参数稀疏共享的中国方言语种分类系统,其特征在于,所述基础网络训练模块,该模块建立基于MFCC特征搭建CNN_LSTM网络;所述网络最后一层为所述子任务各自的输出层。

4.根据权利要求3所述的基于参数稀疏共享的中国方言语种分类系统,其特征在于,所述基础网络训练模块所述子任务各自的输出层均为全连接层,输出大小为子任务分类类别。

5.根据权利要求1所述的基于参数稀疏共享的中国方言语种分类系统,其特征在于,所述子任务网络训练模块,该模块子任务为方言语种分类任务及方言区域分类任务所述迭代裁剪方法,设定最低参数保留率thred(α)或迭代的最大轮数作为迭代终止的界限,当保留率α小于最低保留率thred(α)或迭代轮数大于迭代的最大轮数则完成迭代,每轮计算裁剪率pruning_rate,pruning_rate指每轮将被裁剪的参数与当前网络保留参数总数的比值,其计算公式为 按裁剪率对网络进行裁剪,至此,网络被裁剪的参数总数total_m发生变化,统计参数状态并更新裁剪参数总数total_m,进一步更新参数保留率α,更新公式为α=1‑round(100.0*total_m/total_params,2),total_params为参数总数,round()函数对结果进行四舍五入操作,2为结果保留的小数点后的位数;对裁剪后的网络进行训练并保存其准确率、参数及其留存状态,选取准确率最高的网络作为所述子任务网络。

6.根据权利要求5所述的基于参数稀疏共享的中国方言语种分类系统,其特征在于,所述参数保留率α指保留参数与参数总数的比值,thred(α)为最低参数保留率,其值为10%,所述迭代轮数为裁剪次数,最大迭代轮数为10;所述参数状态使用二进制掩码矩阵M∈{0,

1}存储,二进制掩码矩阵M对应值表示参数是否保存;其中对应M值为1表示参数保留,对应M值为0表示参数被裁剪。

7.根据权利要求1所述的基于参数稀疏共享的中国方言语种分类系统,其特征在于,所述联合训练模块包括:

1)加载子任务对应的M矩阵及子任务各自数据集;

2)加载所述基础网络,交叉输入子任务数据集,输入前加载步骤所述子任务M矩阵进行参数更新;

3)保存模型。

8.根据权利要求7所述的基于参数稀疏共享的中国方言语种分类系统,其特征在于,所述联合训练模块,所述子任务数据集分别由方言语种分类数据集和方言区域分类数据集构成,其中方言语种分类数据集由特征及方言语种标签构成,方言区域分类数据集由特征及方言区域标签构成;所述输出模块,该模块将测试集语音特征输入至联合训练模块所述的网络模型中,输出对应的方言语种。