利索能及
我要发布
收藏
专利号: 202110949412X
申请人: 内蒙古工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2024-12-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种用于蒙古语对话模型联合建模方法,其特征在于,具体步骤包括如下:建立词典库、语法规则库、对话场景分类模型、和目标语言模型;

获取蒙古话原始语句,其中所述蒙古话原始语句为文本形式;

所述蒙古话原始语句根据所述词典库和所述语法规则库进行语句划分,将所述蒙古话原始语句划分为单词或短语;

将所述单词或短语输入所述对话场景分类模型中,确定对话场景;

根据所述单词或短语在所述对话场景中出现的次数确定所述单词或所述短语的内容,并输入所述目标语言模型内根据目标语言的语法规则输出文本;

所述对话场景分类模型具体场景分类方法:接收输入的用户对话信息;

基于所述用户对话信息,采用预置的场景识别规则对预置候选场景进行筛选,得到所述用户对话信息对应的第一类候选场景;以及基于所述用户对话信息,采用对话场景分类模型对所述预置候选场景进行筛选,得到所述用户对话信息对应的第二类候选场景;

基于所述第一类候选场景与所述第二类候选场景,对所述用户对话信息进行增强学习处理,得到与所述用户对话信息对应的最优对话场景;

还包括模糊匹配模型;所述模糊匹配模型包括:转换模糊匹配子模型和文本模糊匹配子模型;其中,所述转换模糊匹配子模型用于识别用户的声纹特征,与预设的声纹特征不匹配,则从所述转换模糊匹配子模型的声纹数据库中调用发音相同或相近的预设声纹特征;

所述单词或短语在所述对话场景中出现的次数为零时,所述单词或短语输入所述文本模糊匹配子模型,则从所述文本模糊匹配子模型的文本数据库中调用同义或近义的单词或短语;

所述语句划分的具体步骤包括:

确定所述蒙古话原始语句中每个字出现的先后顺序;

根据语法规则进行划分;

还包括语义验证;具体步骤包括:

根据所述蒙古话原始语句确定原始语义;

根据语法规则进行划分,划分成不同句子成分的单词或短语;

根据所述单词或短语对应的句子成分进行组合得到第二语义;

所述原始语义与所述第二语义进行比对;

若匹配,则划分正确;

若不匹配,则输入文本模糊匹配子模型进行模糊匹配。

2.根据权利要求1所述的一种用于蒙古语对话模型联合建模方法,其特征在于,还包括语音文本互转模型;所述语音文本互转模型接收的所述蒙古话原始语句,其中所述蒙古话原始语句为语音形式;

识别用户的声纹特征,与预设的声纹特征进行匹配;若匹配,则将语音形式的所述蒙古话原始语句转换成文本形式。

3.根据权利要求2所述的一种用于蒙古语对话模型联合建模方法,其特征在于,所述语音文本互转模型将所述目标语言模型的输出的文本形式的目标语言转换成语音形式。

4.一种用于蒙古语对话模型联合建模系统,其特征在于,包括:模型库,用于存储对话场景分类模型、目标语言模型;

数据库,包括词典库、语法规则库;

语句划分模块,将蒙古话原始语句调用所述词典库和所述语法规则库进行语句划分,将所述蒙古话原始语句划分为单词或短语;

控制器,所述控制器根据所述单词或短语调用所述对话场景分类模型,确定对话场景;

对话输出模块,输出控制器调用目标语言模型得到的目标语言;

所述数据库还包括:声纹数据库和文本数据库;所述模型库还包括:转换模糊匹配子模型和文本模糊匹配子模型;

其中,所述转换模糊匹配子模型根据所述控制器的指令进行声纹匹配,识别用户的声纹特征,与预设的声纹特征不匹配,则从所述转换模糊匹配子模型的声纹数据库中调用发音相同或相近的预设声纹特征;

所述控制器根据所述单词或短语在所述对话场景中出现的次数为零时,所述单词或短语输入所述文本模糊匹配子模型,则从所述文本模糊匹配子模型的文本数据库中调用同义或近义的单词或短语;

所述对话场景分类模型具体场景分类方法:接收输入的用户对话信息;

基于所述用户对话信息,采用预置的场景识别规则对预置候选场景进行筛选,得到所述用户对话信息对应的第一类候选场景;以及基于所述用户对话信息,采用对话场景分类模型对所述预置候选场景进行筛选,得到所述用户对话信息对应的第二类候选场景;

基于所述第一类候选场景与所述第二类候选场景,对所述用户对话信息进行增强学习处理,得到与所述用户对话信息对应的最优对话场景;

所述语句划分的具体步骤包括:

确定所述蒙古话原始语句中每个字出现的先后顺序;

根据语法规则进行划分;

还包括语义验证;具体步骤包括:

根据所述蒙古话原始语句确定原始语义;

根据语法规则进行划分,划分成不同句子成分的单词或短语;

根据所述单词或短语对应的句子成分进行组合得到第二语义;

所述原始语义与所述第二语义进行比对;

若匹配,则划分正确;

若不匹配,则输入文本模糊匹配子模型进行模糊匹配。

5.根据权利要求4所述的一种用于蒙古语对话模型联合建模系统,其特征在于,所述模型库还包括:语音文本互转模型;所述语音文本互转模型根据所述控制器的指令进行语音和文本形式的互相转换。

6.一种用于蒙古语对话模型联合建模设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至3中任一项所述方法的步骤。