1.一种基于人工智能的意图识别方法,其特征在于,包括下述步骤:
根据有标签文本构造关键词词典,其中,所述根据有标签文本构造关键词词典的步骤具体包括:将预定义的意图设为文本领域;在所述文本领域中抽取出现频次高于所述文本领域之外的文本领域的词语,将所述词语设为所述文本领域的关键词,并利用所述关键词构造关键词词典,具体的,所述在所述文本领域中抽取出现频次高于其他文本领域的有标签文本,将所述有标签文本设为所述文本领域的关键词,并利用所述关键词构造关键词词典的步骤具体包括:对所述文本领域的有标签文本进行分词,并将分词后的所有词汇作为候选关键词;计算每个所述候选关键词的领域特性分数,所述计算每个候选关键词的领域特性分数的计算公式为: ;
其中,idf 表示逆文档频率,^ domain表示除文本领域domain之外的文本领域,w为关键词,domain为文本领域;根据所述领域特性分数对所述候选关键词进行升序排序,并将所述领域特性分数小于分数阈值的所述候选关键词作为所述文本领域的关键词;将所述文本领域的关键词合并得到关键词词典;
根据所述关键词词典中的关键词信息对无标签文本进行数据增强,得到无标签文本对;
计算所述无标签文本对的一致性损失,根据所述无标签文本对的一致性损失与有标签文本的损失得出意图识别模型的最终损失;
将所述关键词词典融合至所述意图识别模型内,并基于融合后的所述意图识别模型对输入数据进行意图识别。
2.根据权利要求1所述的基于人工智能的意图识别方法,其特征在于,在所述根据所述关键词词典中的关键词信息对无标签文本进行数据增强的步骤具体包括:等概率随机删除无标签文本中的任一非关键词,随机在无标签文本中选择两个非关键词并交换两个非关键词的位置,随机在无标签文本中选择任一非关键词并用该非关键词的同义词进行替换,及随机在无标签文本中选择任一非关键词并将同义词插入无标签文本的任意位置。
3.根据权利要求1所述的基于人工智能的意图识别方法,其特征在于,所述计算所述无标签文本对的一致性损失的步骤具体包括:将所述无标签文本对输入至预设的机器学习模型中以得到两个输出分布;
计算两个所述输出分布之间的距离,标定所述距离为所述无标签文本对的一致性损失。
4.根据权利要求1所述的基于人工智能的意图识别方法,其特征在于,所述将所述关键词词典融合至所述意图识别模型内的步骤具体包括:针对训练文本或测试文本,根据关键词词典进行匹配得到文本的关键词;
将关键词融合到所述意图识别模型中;
所述将关键词融合到所述意图识别模型的步骤具体包括:
设立关键词词向量矩阵,所述关键词词向量矩阵的每一行对应关键词词典中的一个关键词,所述关键词词向量矩阵的行数等于关键词的个数,所述关键词词向量矩阵的列数等于意图识别模型卷积之后得到的句向量 的维度;
根据匹配得到的关键词的词向量进行计算,得到基于关键词的句向量 ;
将所述关键词的句向量 与意图识别模型卷积之后得到的句向量 的维度相加,得到文本的最终句向量;
根据所述文本的最终句向量将所述关键词融合到所述意图识别模型中。
5.一种基于人工智能的意图识别装置,其特征在于,所述基于人工智能的意图识别装置用于实现如权利要求1至4中任一项所述的基于人工智能的意图识别方法的步骤,所述基于人工智能的意图识别装置包括:构造模块,用于根据有标签文本构造关键词词典;
数据增强模块,用于根据所述关键词词典中的关键词信息对无标签文本进行数据增强,得到无标签文本对;
一致性损失计算模块,用于计算所述无标签文本对的一致性损失,将所述一致性损失输入至监督学习的损失函数中训练得到意图识别模型;及融合模块,用于将所述关键词词典融合至所述意图识别模型内,并基于所述意图识别模型对输入数据进行意图识别;
所述构造模块、数据增强模块、计算模块及融合模块依次连接。
6.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至4中任一项所述的基于人工智能的意图识别方法的步骤。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至4中任一项所述的基于人工智能的意图识别方法的步骤。