欢迎来到利索能及~ 联系电话:18621327849
利索能及
我要发布
收藏
专利号: 2022113833959
申请人: 华南师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-10-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种融合句法和语义信息的情感分析方法,其特征在于,包括以下步骤:

获得待测语句以及预设的情感分析模型,其中,所述待测语句包括若干个单词,所述情感分析模型包括句子编码模块、多头自注意力模块、信息融合模块、信息共享模块以及情感分析模块;所述信息融合模块包括前后级联的第一句法信息提取模块以及第一语义信息提取模块,所述信息共享模块包括平行连接的第二句法信息提取模块以及第二语义信息提取模块,且所述第二句法信息提取模块以及第二语义信息提取模块的权重参数相同;

将所述待测语句输入至所述句子编码模块中进行编码处理,获得所述待测语句的句子特征表示;

获取初始依存句法树,所述初始依存句法树包括若干个节点,将所述待测语句的若干个单词分别设置于所述初始依存句法树的节点上,构建所述待测语句的初始邻接矩阵;

获取所述待测语句的依存关系信息,所述依存关系信息用于指示所述待测语句中单词与单词之间的连接关系,根据所述待测语句的依存关系信息,将所述待测语句的初始邻接矩阵转化为初始句法邻接矩阵,并根据预设的第一标准化算法,对所述初始句法邻接矩阵进行标准化处理,构建所述待测语句的句法邻接矩阵,其中,所述第一标准化算法为:式中, 为所述句法邻接矩阵,Asyn为所述初始句法邻接矩阵, 为所述初始句法f

邻接矩阵Asyn的度矩阵,I为单位矩阵;

将所述待测语句的句子特征表示以及所述句法邻接矩阵输入至所述第一句法信息提取模块中,获得所述待测语句的第一句法特征表示;将所述第一句法特征表示输入至所述多头自注意力模块,构建所述待测语句的语义邻接矩阵,将所述第一句法特征表示以及所述语义邻接矩阵输入至所述第一语义信息提取模块中进行语义特征提取,获得所述待测语句的第一融合特征表示;

将所述待测语句的句子特征表示以及所述句法邻接矩阵输入至所述第二句法信息提取模块中,获得所述待测语句的第二句法特征表示;将所述待测语句的句子特征表示以及所述语义邻接矩阵输入至所述第二句法信息提取模块中,获得所述待测语句的第二句法特征表示,对所述第二句法特征表示以及第二语义特征表示进行融合处理,获得所述待测语句的第二融合特征表示;

将所述待测语句的第一融合特征表示以及第二融合特征表示输入至所述情感分析模块,获得所述待测语句的情感分析结果。

2.根据权利要求1所述的融合句法和语义信息的情感分析方法,其特征在于:所述第一句法信息提取模块为多层图卷积网络结构;

所述将所述待测语句的句子特征表示以及句法邻接矩阵输入至所述第一句法信息提取模块中,获得所述待测语句的第一句法特征表示,包括步骤:根据所述标准化处理后的句法邻接矩阵以及预设的第一隐藏特征计算算法,获得所述第一句法信息提取模块的若干层的句子隐藏表示,从所述若干层的句子隐藏表示中,提取若干个目标层的句子隐藏表示,对所述若干个目标层的句子隐藏表示进行拼接处理,获得拼接处理后的句子隐藏表示,作为所述待测语句的第一句法特征表示,其中,所述第一隐藏特征计算算法为:c

式中, 为所述第一句法信息提取模块的第l+1层的句子隐藏表示, H

为所述待测语句的句子特征表示, 为所述第一句法信息提取模块的第l+1层的权重参数, 为所述第一句法信息提取模块的第l层的偏置参数。

3.根据权利要求1所述的融合句法和语义信息的情感分析方法,其特征在于:所述将所述第一句法特征表示输入至所述多头自注意力模块,构建所述待测语句的语义邻接矩阵,包括步骤:根据所述待测语句的第一句法特征表示以及预设的多头自注意力计算算法,构建若干个初始语义邻接矩阵,其中,所述多头自注意力计算算法为:式中,Asem,j为第j个初始语义邻接矩阵,Hsem为所述第一句法特征表示,Wsem,k为所述多头自注意力模块的第一权重参数,Wsem,q为所述多头自注意力模块的第二权重参数,dhead为多头自注意力的维度参数;

根据所述若干个初始语义邻接矩阵以及预设的矩阵概率计算算法,获取所述若干个初始语义邻接矩阵的概率向量,从所述若干个初始语义邻接矩阵中,提取概率向量最大的初始语义邻接矩阵,其中,所述矩阵概率计算算法为:Asem=argmax[softmax(Asem,1,…,sem,K)]

式中,Asem为所述概率向量最大的初始语义邻接矩阵,K为所述语义邻接矩阵的数目,softmax()为归一化函数,argmax()为求集合函数;

根据预设的快速选择算法,对所述概率向量最大的初始语义邻接矩阵进行初始化处理,构建所述待测语句的目标语义邻接矩阵,其中,所述快速选择算法为:A’sem=op‑k(Asem)

式中,A’sem为所述目标语义邻接矩阵,top‑k()为快速选择函数;

根据预设的第二标准化算法,对所述目标语义邻接矩阵进行标准化处理,构建所述待测语句的语义邻接矩阵,其中,所述第二标准化算法为:式中, 为所述标准化处理后的语义邻接矩阵,A’sem为所述目标语义邻接矩阵,f

为所述目标语义邻接矩阵A’sem的度矩阵,I为单位矩阵。

4.根据权利要求3所述的融合句法和语义信息的情感分析方法,其特征在于,所述将所述第一句法特征表示以及语义邻接矩阵输入至所述第一语义信息提取模块中进行语义特征提取,获得所述待测语句的第一融合特征表示,包括步骤:将所述待测语句的第一句法特征表示作为所述第一语义信息提取模块的首层输入数据,根据所述语义邻接矩阵以及预设的第二隐藏特征计算算法,获得所述第一语义信息提取模块的最后一层的句子隐藏表示,作为所述待测语句的第一融合特征表示,其中,所述第二隐藏特征计算算法为:式中, 为所述第一语义信息提取模块的第l层的句子隐藏表示, 为所述第一语义信息提取模块的第l层的权重参数, 为所述第一语义信息提取模块的第l层的偏置参数。

5.根据权利要求2所述的融合句法和语义信息的情感分析方法,其特征在于:所述第二句法信息提取模块以及第二语义信息提取模块均为多层图卷积网络结构;

所述将所述待测语句的句子特征表示以及所述句法邻接矩阵输入至所述第二句法信息提取模块中,获得所述待测语句的第二句法特征表示;将所述待测语句的句子特征表示以及所述语义邻接矩阵输入至所述第二句法信息提取模块中,获得所述待测语句的第二句法特征表示,对所述第二句法特征表示以及第二语义特征表示进行融合处理,获得所述待测语句的第二融合特征表示,包括步骤:将所述待测语句的句子特征表示作为所述第二句法信息提取模块的首层输入数据,根据所述句法邻接矩阵以及预设的第三隐藏特征计算算法,获得所述第二句法信息提取模块的最后一层的句子隐藏表示,作为所述待测语句的第二句法特征表示,其中,所述第三隐藏特征计算算法为:c

式中, 为所述第二句法信息提取模块的第l+1层的句子隐藏表示,H为所述待测语句的句子特征表示,RELU()为非线性函数, 为所述句法邻接矩阵, 为所述第二句法信息提取模块的第l+1层的权重参数, 为所述第二句法信息提取模块的第l层的偏置参数;

将所述待测语句的句子特征表示作为所述第二语义信息提取模块的首层输入数据,根据所述语义邻接矩阵以及预设的第四隐藏特征计算算法,获得所述第二语义信息提取模块的最后一层的句子隐藏表示,作为所述待测语句的第二语义特征表示,其中,所述第四隐藏特征计算算法为:式中, 为所述第二语义信息提取模块的第l+1层的句子隐藏表示, 为所述语义邻接矩阵, 为所述第二语义信息提取模块的第l+1层的权重参数, 为所述第二语义信息提取模块的第l层的偏置参数;

根据所述待测语句的第二句法特征表示、第二语义特征表示以及预设的融合特征计算算法,获得所述待测语句的第二融合特征表示,其中,所述融合特征计算算法为:式中, 为所述第二融合特征表示。

6.根据权利要求2所述的融合句法和语义信息的情感分析方法,其特征在于:所述待测语句还包括由若干个单词组成的方面词;

所述待测语句的第一融合特征表示包括若干个单词的第一隐藏向量以及方面词的第一隐藏向量,所述待测语句的第二融合特征表示包括若干个单词的第二隐藏向量以及方面词的第二隐藏向量;

所述将所述待测语句的第一融合特征表示以及第二融合特征表示输入至所述情感分析模块,获得所述待测语句的情感分析结果,包括步骤:对所述待测语句的第一融合特征表示中非方面词的单词的第一隐藏向量,以及所述第二融合特征表示中非方面词的单词的第二隐藏向量进行掩码处理,获得掩码处理后的所述待测语句的第一融合特征表示以及第二融合特征表示,并对所述掩码处理后的所述待测语句的第一融合特征表示以及第二融合特征表示进行拼接处理,获得拼接处理后的融合特征表示;

根据所述拼接处理后的融合特征表示以及预设的情感分析算法,获得所述待测语句的情感分类极性概率分布向量,根据所述情感分类极性概率分布向量,获得概率最大的维度对应的情感极性,作为所述待测语句的情感分析结果,其中,所述情感分析算法为:式中,为所述情感分类极性概率分布向量,ha为所述拼接处理后的融合特征表示,softmax()为归一化函数,W1为所述情感分析模块的权重参数,b1为所述情感分析模块的偏置参数。

7.一种融合句法和语义信息的情感分析装置,其特征在于,包括:

获得模块,用于获得待测语句以及预设的情感分析模型,其中,所述待测语句包括若干个单词,所述情感分析模型包括句子编码模块、多头自注意力模块、信息融合模块、信息共享模块以及情感分析模块;所述信息融合模块包括前后级联的第一句法信息提取模块以及第一语义信息提取模块,所述信息共享模块包括平行连接的第二句法信息提取模块以及第二语义信息提取模块,且所述第二句法信息提取模块以及第二语义信息提取模块的权重参数相同;

句子编码模块,用于将所述待测语句输入至所述句子编码模块中进行编码处理,获得所述待测语句的句子特征表示;获取初始依存句法树,所述初始依存句法树包括若干个节点,将所述待测语句的若干个单词分别设置于所述初始依存句法树的节点上,构建所述待测语句的初始邻接矩阵;

获取所述待测语句的依存关系信息,所述依存关系信息用于指示所述待测语句中单词与单词之间的连接关系,根据所述待测语句的依存关系信息,将所述待测语句的初始邻接矩阵转化为初始句法邻接矩阵,并根据预设的第一标准化算法,对所述初始句法邻接矩阵进行标准化处理,构建所述待测语句的句法邻接矩阵,其中,所述第一标准化算法为:式中, 为所述句法邻接矩阵,Asyn为所述初始句法邻接矩阵, 为所述初始句法f

邻接矩阵Asyn的度矩阵,I为单位矩阵;

第一特征表示计算模块,用于将所述待测语句的句子特征表示以及所述句法邻接矩阵输入至所述第一句法信息提取模块中,获得所述待测语句的第一句法特征表示;将所述第一句法特征表示输入至所述多头自注意力模块,构建所述待测语句的语义邻接矩阵,将所述第一句法特征表示以及所述语义邻接矩阵输入至所述第一语义信息提取模块中进行语义特征提取,获得所述待测语句的第一融合特征表示;

第二特征表示计算模块,用于将所述待测语句的句子特征表示以及所述句法邻接矩阵输入至所述第二句法信息提取模块中,获得所述待测语句的第二句法特征表示;将所述待测语句的句子特征表示以及所述语义邻接矩阵输入至所述第二句法信息提取模块中,获得所述待测语句的第二句法特征表示,对所述第二句法特征表示以及第二语义特征表示进行融合处理,获得所述待测语句的第二融合特征表示;

情感分析模块,用于将所述待测语句的第一融合特征表示以及第二融合特征表示输入至所述情感分析模块,获得所述待测语句的情感分析结果。

8.一种计算机设备,其特征在于,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的融合句法和语义信息的情感分析方法的步骤。

9.一种存储介质,其特征在于:所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的融合句法和语义信息的情感分析方法的步骤。