1.一种文本情感分析方法,其特征在于,包括以下步骤:获取待分析文本;所述待分析文本包括若干个句子;每个所述句子包括若干个单词;
获取所述句子的句子初始化表示、所述句子中单词之间的余弦相似度、以及所述句子中单词之间的局部关联值;所述局部关联值用于表示两个单词之间的相关程度;
根据所述句子中单词之间的余弦相似度,得到句子的通用语义矩阵;根据所述句子中单词之间的局部关联值,得到句子的结构语义矩阵;
将所述通用语义矩阵、结构语义矩阵、句子初始化表示输入至图卷积神经网络、交叉网络和激活函数,得到所述句子的通用语义句法表示和结构语义句法表示;
对所述句子的结构语义隐藏表示和所述结构语义句法表示按照预设的第一权重占比进行计算,得到目标结构语义句法表示;对所述句子的通用语义隐藏表示和所述通用语义句法表示按照预设的第二权重占比进行计算,得到目标通用语义句法表示;所述句子的结构语义隐藏表示是将所述结构语义矩阵和所述句子初始化表示输入到双通道图卷积神经网络后得到的输出表示;所述句子的通用语义隐藏表示是将所述通用语义矩阵和所述句子初始化表示输入到双通道图卷积神经网络后得到的输出表示;
对所述目标通用语义句法表示和所述目标结构语义句法表示进行拼接以及非属性词屏蔽处理,得到句子的属性词特征表示;获取所述句子的属性词特征表示中的各个单词的属性词特征表示,根据词嵌入表示和所述各属性词特征表示,计算句子中各个单词的注意力权重;
根据所述词嵌入表示和各个所述单词的注意力权重得到句子的目标表示,将所述句子的目标表示输入到softmax逻辑回归模型,得到句子情感极性。
2.根据权利要求1所述的文本情感分析方法,其特征在于,所述根据所述句子中单词之间的余弦相似度,得到句子的通用语义矩阵的步骤,包括:通过以下方式计算所述句子的每个单词的词嵌入表示对应的余弦相似度:;其中, 为余弦相似度, 和 分别为所述句子的第个单词和第 个单词的词嵌入表示;
若单词之间的余弦相似度超过预设的第一阈值,将所述余弦相似度作为对应的单词之间的通用语义相关性值;否则,对应的单词之间的通用语义相关性值为0;
根据每个单词与各个单词之间的通用语义相关性值,得到所述通用语义矩阵。
3.根据权利要求1所述的文本情感分析方法,其特征在于,所述根据所述句子中单词之间的局部关联值,得到句子的结构语义矩阵的步骤,包括:通过以下方式计算所述句子同时含有第 个单词和第 个单词的概率:,
其中, 为所述句子的第 个单词, 为所述句子的第 个单词, 为所述句子同时含有第 个单词和第 个单词的概率, 为第 个单词和第 个单词在所述句子中同时出现的次数, 为所述待分析文本的句子总数;
通过以下方式计算所述句子含有第 个单词的概率:,
其中, 为所述句子含有第 个单词的概率, 为 在所述句子中出现的次数;
通过以下方式计算所述句子含有第 个单词的概率:,
其中, 为所述句子含有第 个单词的概率, 为第 个单词在所述句子中出现的次数;
根据所述句子同时含有第 个单词和第 个单词的概率、所述句子含有第 个单词的概率,以及所述句子含有第 个单词的概率,通过以下方式计算出所述句子第 个单词和第 个单词的局部关联值:
,
为所述句子第 个单词和第 个单词的局部关联值;
若所述局部关联值大于预设的第二阈值,将所述局部关联值确定为对应的单词之间的关联值;否则,对应的单词之间的关联值为0;
根据每个单词与各个单词之间的关联值,得到所述结构语义矩阵。
4.根据权利要求1所述的文本情感分析方法,其特征在于,所述将所述通用语义矩阵、结构语义矩阵、句子初始化表示输入至图卷积神经网络、交叉网络和激活函数,得到所述句子的通用语义句法表示和结构语义句法表示,包括:将所述通用语义矩阵和所述句子初始化表示输入到双通道图卷积神经网络,得到句子的通用语义隐藏表示,将所述结构语义矩阵和所述句子初始化表示输入到双通道图卷积神经网络,得到句子的结构语义隐藏表示;
将所述句子初始化表示、所述句子的通用语义隐藏表示和所述句子的结构语义隐藏表示拼接并输入到预设的交叉网络计算公式,得到通用语义句子表示和结构语义句子表示;
获取所述句子的句法依存矩阵;将所述通用语义句子表示、所述结构语义句子表示,分别与所述句法依存矩阵输入到激活函数,得到所述通用语义句法表示和所述结构语义句法表示。
5.根据权利要求4所述的文本情感分析方法,其特征在于,所述将所述通用语义矩阵和所述句子初始化表示输入到双通道图卷积神经网络,得到句子的通用语义隐藏表示,将所述结构语义矩阵和所述句子初始化表示输入到双通道图卷积神经网络,得到句子的结构语义隐藏表示,包括:
将所述通用语义矩阵和所述句子初始化表示,输入到所述双通道图卷积神经网络,获得句子的通用语义隐藏表示;通过以下方式计算所述句子的通用语义隐藏表示:,
其中, 为所述句子中的第 个单词的第 层的通用语义隐藏表示, 为所述通用语义矩阵中的第 个通用语义子矩阵, 为所述句子中的第 个单词的第 层的通用语义隐藏表示,其中 , 为所述句子第 个单词的初始化表示, 为所述通用语义矩阵的第 层的参数矩阵, 为所述通用语义矩阵的第 层的偏置; 为激活函数; 为通用语义隐藏表示或结构语义隐藏表示的层数的最大值;
根据各个单词的最后一层的通用语义隐藏表示,得到所述句子的通用语义隐藏表示;
将所述结构语义矩阵和所述句子的初始化表示,输入到所述双通道图卷积神经网络,通过以下方式计算句子的结构语义隐藏表示:,
其中, 为所述句子的第 个单词的第 层的结构语义隐藏表示, 为所述结构语义矩阵的第 个结构语义子矩阵, 为所述句子的第 个单词的第 层的结构语义隐藏表示,其中 , 为所述结构语义矩阵的第 层的参数矩阵, 为所述结构语义矩阵的第 层的偏置;
根据各个单词的最后一层的结构语义隐藏表示,得到所述句子的结构语义隐藏表示。
6.根据权利要求4所述的文本情感分析方法,其特征在于,所述将所述句子初始化表示、所述句子的通用语义隐藏表示和所述句子的结构语义隐藏表示拼接并输入到预设的交叉网络计算公式,得到通用语义句子表示和结构语义句子表示,包括:通过以下方式计算得到交叉网络的初始层表示:,
为信息交叉网络的初始层表示, 为句子初始化表示, 为张量拼接,为所述句子的单词数量,为词向量维度;
通过以下方式计算得到所述交叉网络的第一层表示:,
为信息交叉网络的第一层表示,为句子的结构语义隐藏表示, 为句子通用语义隐藏表示;
根据所述交叉网络的初始层表示和第一层表示更新所述交叉网络的层数表示,通过以下方式计算得到交叉网络的各层表示:,
为第 层交叉网络中的参数矩阵, 为第 层交叉网络的偏置, 为矩阵的转置,为预设的第二层数值, 为第 层交叉网络的表示;
将最后一层的交叉网络的表示确定为所述交叉网络的目标层表示,从所述交叉网络的目标层表示中拆分出通用语义句子表示 和结构语义句子表示,其中, 为第 个单词的初始层的通用语义表示, 为第 个单词的初始层的结构语义表示。
7.根据权利要求4所述的文本情感分析方法,其特征在于,所述获取所述句子的句法依存矩阵;将所述通用语义句子表示、所述结构语义句子表示,分别与所述句法依存矩阵输入到激活函数,得到所述通用语义句法表示和所述结构语义句法表示,包括:根据句子的句法依存树,通过以下方式计算获取各个单词间的句法关联性:, 为单词间的句法关联性,
为所述句子的第 个单词, 为所述句子的第 个单词;
根据各个单词间的句法关联性,得到所述句法依存矩阵;
将所述通用语义句子表示与所述句法依存矩阵输入到激活函数,通过以下方式计算得到各个单词的各层的通用语义表示:,
其中, ; 是位置权重转换函数;
是第 个单词的第 层的通用语义表示, 是第 个单词的 层的通用语义表示, 是所述句子的句法依存矩阵中的第 个通用语义子矩阵, 是第 个单词的通用语义表示的第 层的参数矩阵, 是第 个单词的通用语义表示的第 层的偏置; 为通用语义表示或结构语义表示的层数的最大值;
将各个单词的最后一层的通用语义表示确定为各个单词的通用语义单词表示,根据所述通用语义单词表示,得到所述句子的通用语义句法表示;
将所述结构语义句子表示与所述句法依存矩阵输入到激活函数,通过以下方式计算得到各个单词的各层的结构语义表示:;
其中, ;
是第 个单词的第 层的结构语义表示, 是第 个单词的 层的结构语义表示, 是第 个单词的结构语义表示的第 层的参数矩阵, 是第 个单词的结构语义表示的第 层的偏置;
将各个单词的最后一层的结构语义表示确定为各个单词的结构语义单词表示,根据所述结构语义单词表示,得到所述句子的结构语义句法表示。
8.根据权利要求1所述的文本情感分析方法,其特征在于:所述对所述句子的结构语义隐藏表示和所述结构语义句法表示按照预设的第一权重占比进行计算,得到目标结构语义句法表示,通过以下方式计算:;其中, 是目标结构语义句法表示, 是第一权重参数,是句子的结构语义隐藏表示, 是所结构语义句法表示;
所述对所述句子的通用语义隐藏表示和所述通用语义句法表示按照预设的第二权重占比进行计算,得到目标通用语义句法表示,通过以下方式计算:;其中, 是目标通用语义句法表示, 是第二权重参数,是句子的通用语义隐藏表示, 是通用语义句法表示。
9.根据权利要求1所述的文本情感分析方法,其特征在于,所述对所述目标通用语义句法表示和所述目标结构语义句法表示进行拼接以及非属性词屏蔽处理,得到句子的属性词特征表示;获取所述句子的属性词特征表示中的各个单词的属性词特征表示,根据所述词嵌入表示和所述各属性词特征表示,计算句子中各个单词的注意力权重,包括:对所述目标通用语义句法表示和所述目标结构语义句法表示进行拼接,通过以下方式计算得到句子的特征表示:
; 是句子的特征表示, 为张量拼接;
对所述句子的特征表示进行非属性词屏蔽处理,通过以下方式计算得到句子的属性词特征表示:
;
其中, 为所述句子的属性词特征表示, 表示通过 函数对所述句子的特征表示进行非属性词屏蔽处理, 为所述句子第 个单词的属性词特征表示;
根据各个单词的初始化表示和属性词特征表示,通过以下方式计算得到各个单词的注意力得分:
;
其中, 是第 个单词的注意力得分, 是第 个单词的初始化表示;是属性词特征表示的总个数;
根据所述注意力得分,得到各个单词的注意力权重,计算过程如下:;
其中, 为第 个单词的注意力权重。
10.根据权利要求9所述的文本情感分析方法,其特征在于:所述根据所述词嵌入表示和各个所述单词的注意力权重得到句子的目标表示,通过以下方式计算:
;
其中, 为所述句子的目标表示;
所述将所述句子的目标表示输入到softmax逻辑回归模型,得到句子情感极性,通过以下方式计算:
;
其中, 为所述句子情感极性, 为所述句子初始化表示的参数矩阵, 为所述句子初始化表示的偏置。