1.一种基于语句的情感分析方法,其特征在于,包括以下步骤:
获取若干个样本语句、依存信息、词性信息以及情感标签集;其中,所述样本语句包括若干个单词以及方面词,所述依存信息为所述方面词与各个单词之间的依存类型标记信息,所述词性信息为所述若干个样本语句中若干个非方面词的词性标记信息,所述情感标签集包括所述若干个样本语句对应的真实情感概率分布向量;
获取预设的情感分类模型;所述情感分类模型包括句子编码网络、嵌入矩阵构建网络、第一图卷积网络、第二图卷积网络、多层互双仿射网络以及全连接网络;将所述若干个样本语句输入至所述句子编码网络,获得所述若干个样本语句的句子特征表示;
根据所述依存信息,构建所述若干个样本语句的依存句法图,根据所述词性信息,构建所述若干个样本语句的正例表示序列以及负例表示序列;
将所述若干个样本语句的依存句法图、相应的正例表示序列以及负例表示序列输入至所述嵌入矩阵构建网络,获得所述若干个样本语句的嵌入矩阵,将所述若干个样本语句的嵌入矩阵分别与相应的所述正例表示序列以及负例表示序列相乘,获得所述若干个样本语句的正例嵌入矩阵以及负例嵌入矩阵;根据所述若干个样本语句的嵌入矩阵、正例嵌入矩阵以及负例嵌入矩阵,获得所述嵌入矩阵构建网络输出的第一损失值;
将所述若干个样本语句的句子特征表示输入至所述第一图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始语义特征表示;将所述若干个样本语句的句子特征表示以及相应的嵌入矩阵输入至所述第二图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始句法特征表示;
将所述若干个样本语句的初始语义特征表示以及初始句法特征表示输入至所述多层互双仿射网络中进行融合处理,获得所述若干个样本语句的融合语义特征表示以及融合句法特征表示;
将所述若干个样本语句的融合语义特征表示、融合句法特征表示输入至所述全连接网络中,获得所述若干个样本语句的预测情感概率分布向量,根据所述若干个样本语句的预测情感概率分布向量,获得所述若干个样本语句的情感极性;
将所述若干个样本语句的情感标签集输入至所述全连接网络,根据所述若干个样本语句的预测情感概率分布向量以及相应的真实情感概率分布向量,获得所述全连接网络输出的第二损失值;
将具有相同情感极性的所述若干个样本语句进行组合,获得若干个正例样本语句集,根据所述若干个正例样本语句集对应的若干个样本语句的融合语义特征表示以及融合句法特征表示,获得所述全连接网络输出的第三损失值以及第四损失值;
根据所述第一损失值、第二损失值、第三损失值以及第四损失值,构建所述情感分类模型的总损失函数,结合所述总损失函数,对所述情感分类模型进行迭代训练,直到满足训练停止条件,获取训练好的情感分类模型;
获取待测语句,将所述待测语句输入至所述训练好的情感分类模型,获得所述待测语句的情感极性,作为所述待测语句的情感分析结果。
2.根据权利要求1所述的基于语句的情感分析方法,其特征在于:所述句子特征表示集包括若干个样本语句的句子特征表示;
所述将所述若干个样本语句的句子特征表示输入至所述第一图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始语义特征表示,包括步骤:根据所述若干个样本语句的句子特征表示以及预设的第一多头自注意力算法,获得所述若干个样本语句的第一注意力权重矩阵,其中,所述第一多头自注意力算法为:sem
式中,A 为所述样本语句的第一注意力权重矩阵,Softmax( )为归一化指数函数,H为q k所述样本语句的句子特征表示,W为预设的第一可训练权重参数矩阵,W为预设的第二可训练权重参数矩阵,d为第一多头自注意力的维度参数;
根据所述若干个样本语句的第一注意力权重矩阵以及预设的语义特征计算算法,获得所述若干个样本语句的初始语义特征表示,其中,所述语义特征计算算法为:sem v
Hsem=σ(A WH+b)
v
式中,Hsem为所述样本语句的语义特征表示,σ( )为非线性激活函数,W为预设的第三可训练权重参数矩阵,b为预设的第一偏置参数。
3.根据权利要求2所述的基于语句的情感分析方法,其特征在于,所述将所述若干个样本语句的句子特征表示以及相应的嵌入矩阵输入至所述第二图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始句法特征表示,包括步骤:根据所述若干个样本语句的句子特征表示、相应的嵌入矩阵以及预设的第二多头自注意力算法,获得所述若干个样本语句的第二注意力权重矩阵,其中,所述第二多头自注意力算法为:syn
式中,att为所述样本语句的第二注意力权重矩阵,Softmax( )为归一化指数函数,At为所述样本语句的嵌入矩阵,H为所述样本语句的句子特征表示,W为预设的第四可训练权h
重参数矩阵,W为预设的第五可训练权重参数矩阵,dm为第二多头自注意力的维度参数;bD为预设的第二偏置参数,bh为预设的第三偏置参数;
根据所述若干个样本语句的第二注意力权重矩阵以及预设的句法特征计算算法,获得所述若干个样本语句的初始句法特征表示,其中,所述句法特征计算算法为:Hsyn=att*H
式中,Hsyn为所述样本语句的语义特征表示。
4.根据权利要求3所述的基于语句的情感分析方法,其特征在于,所述将所述若干个样本语句的初始语义特征表示以及初始句法特征表示输入至所述多层互双仿射网络中进行融合处理,获得所述若干个样本语句的融合语义特征表示以及融合句法特征表示,包括步骤:将所述若干个样本语句的初始语义特征表示以及初始句法特征表示作为所述多层互双仿射网络的第一层的输入信息;
根据所述多层互双仿射网络的第一层的输入信息以及预设的特征融合计算算法,获得所述多层互双仿射网络的最后一层输出的所述若干个样本语句的融合语义特征表示以及融合句法特征表示,其中,所述特征融合计算算法为:式中, 为所述互双仿射网络的第l层输出的样本语句的融合语义特征表示, 为所述互双仿射网络的第l层输出的样本语句的融合句法特征表示,Softmax( )为归一化指数函数, 为所述互双仿射网络的第l‑1层对应的第一可学习参数, 为所述互双仿射网络的第l‑1层对应的第二可学习参数。
5.根据权利要求4所述的基于语句的情感分析方法,其特征在于,所述将所述若干个样本语句的融合语义特征表示、融合句法特征表示输入至所述全连接网络中,获得所述若干个样本语句的预测情感概率分布向量,根据所述若干个样本语句的预测情感概率分布向量,获得所述若干个样本语句的情感极性,包括步骤:从所述若干个样本语句的融合语义特征表示、融合句法特征表示中,获取所述若干个样本语句的方面词的融合语义特征向量、融合句法特征向量,根据所述若干个样本语句的方面词的融合语义特征向量、融合句法特征向量以及预设的池化计算算法,获得池化处理后的所述若干个样本语句的融合语义特征表示以及融合句法特征表示,其中,所述池化计算算法为:式中, 为所述池化处理后的若干个样本语句的融合语义特征表示, 为所述池化处理后的若干个样本语句的融合句法特征表示, 为所述互双仿射网络的第l层输出的样本语句的方面词中第a个位置索引对应的单词的融合语义特征向量, 为所述互双仿射网络的第l层输出的样本语句的第a个位置索引对应的单词的融合句法特征向量,a为所述方面词中单词的起始索引,la为所述方面词的长度,avgpool( )为平均池化函数;
将池化处理后的同一所述样本语句的融合语义特征表示以及融合句法特征表示进行拼接处理,获得所述若干个样本语句的拼接处理特征表示,根据所述若干个样本语句的拼接处理特征表示以及预设的情感概率分布向量计算算法,获得所述若干个样本语句的情感概率分布向量,其中,所述情感分析特征计算算法为:z
式中,Z为所述样本语句的情感概率分布向量,W 为预设的第六可训练权重参数矩阵,为所述拼接处理特征表示,bz为预设的预设的第四偏置参数;
根据所述若干个样本语句的情感概率分布向量,获得所述若干个样本语句的概率最大的维度对应的情感极性。
6.根据权利要求5所述的基于语句的情感分析方法,其特征在于:所述嵌入矩阵包括若干个单词的依存类型向量,所述正例嵌入矩阵包括若干个单词的正例嵌入向量,所述负例嵌入矩阵包括若干个单词的负例嵌入向量;
所述将所述若干个样本语句的正例嵌入矩阵以及负例嵌入矩阵输入至所述嵌入矩阵构建网络,根据所述若干个样本语句的嵌入矩阵、正例嵌入矩阵以及负例嵌入矩阵,获得所述嵌入矩阵构建网络输出的第一损失值,包括步骤:根据预设的批次,将所述若干个样本语句划分为若干个批次对应的样本语句训练集;
根据所述若干个批次对应的样本语句训练集中若干个样本语句的嵌入矩阵中若干个单词的依存类型向量、所述正例嵌入矩阵中若干个单词的正例嵌入向量、负例嵌入矩阵中若干个单词的负例嵌入向量以及预设的第一损失函数,获得所述嵌入矩阵构建网络输出的第一损失值,其中,所述第一损失函数为:式中, 为所述第一损失值,B为所述批次对应的样本语句训练集中样本语句的数目,N为所述样本语句中单词的数目,j为所述批次对应的样本语句训练集中样本语句的位置索引,i以及t均为所述样本语句的单词的位置索引, 为所述样本语句的第t个单词syn,i的正例嵌入向量,A 为所述样本语句的第i个单词的依存类型向量, 为所述样本语句的第t个单词的负例嵌入向量,sim( )为余弦相似度函数,τ1为预设的第一温度系数。
7.根据权利要求6所述的基于语句的情感分析方法,其特征在于,所述将所述若干个样本语句的情感标签集输入至所述全连接网络,根据所述若干个样本语句的预测情感概率分布向量以及相应的真实情感概率分布向量,获得所述全连接网络输出的第二损失值,包括步骤:根据所述若干个批次对应的样本语句训练集中若干个样本语句的预测情感概率分布向量、相应的真实情感概率分布向量以及预设的第二损失函数,获得所述全连接网络输出的第二损失值,其中,所述第二损失函数为:式中, 为所述第二损失值,为所述预测情感概率分布向量,y为所述真实情感概率分布向量。
8.根据权利要求7所述的基于语句的情感分析方法,其特征在于,所述将具有相同情感极性的所述若干个样本语句进行组合,获得若干个正例样本语句集,根据所述若干个正例样本语句集对应的若干个样本语句的融合语义特征表示以及融合句法特征表示,获得所述全连接网络输出的第三损失值以及第四损失值,包括步骤:分别将所述若干个批次对应的样本语句训练集中具有相同情感极性的所述若干个样本语句进行组合,获取若干个批次对应的若干个正例样本语句集;
根据所述若干个批次对应的若干个正例样本语句集对应的若干个样本语句的融合语义特征表示、融合句法特征表示以及预设的第三损失函数,获得所述全连接网络输出的第三损失值,其中,所述第三损失函数为:式中, 为所述第三损失值,s以及b均为所述批次对应的样本语句训练集中样本语句的位置索引, 为所述正例样本语句集中样本语句的数目,c为所述正例样本语句集中样本语句的位置索引, 为所述批次对应的样本语句训练集中第s个样本语句的融合句法特征表示, 为所述正例样本语句集中第c个样本语句的融合语义特征表示, 为所述批次对应的样本语句训练集中第b个样本语句的融合语义特征表示,τ2为预设的第二温度系数;
根据所述若干个批次对应的若干个正例样本语句集对应的若干个样本语句的融合语义特征表示、融合句法特征表示以及预设的第四损失函数,获得所述全连接网络输出的第四损失值,其中,所述第四损失函数为:式中, 为所述第四损失值, 为所述批次对应的样本语句训练集中第s个样本语句的融合语义特征表示, 为所述正例样本语句集中第c个样本语句的融合句法特征表示, 为所述批次对应的样本语句训练集中第b个样本语句的融合语义特征表示,τ3为预设的第三温度系数。
9.根据权利要求8所述的基于语句的情感分析方法,其特征在于:所述总损失函数为:
式中,为所述总损失函数,α以及β分别为预设的第一超参数以及第二超参数。
10.一种基于对比学习的情感分析装置,其特征在于,包括:
数据获取模块,用于获取若干个样本语句、依存信息、词性信息以及情感标签集,根据预设的批次,将所述若干个样本语句划分为若干个样本语句,其中,所述样本语句包括若干个单词以及方面词,所述依存信息为所述方面词与各个单词之间的依存类型标记信息,所述词性信息为所述若干个样本语句中若干个非方面词的词性标记信息,所述情感标签集包括所述若干个样本语句对应的真实情感概率分布向量;
句子信息提取模块,用于获取预设的情感分类模型,所述情感分类模型包括句子编码网络、嵌入矩阵构建网络、第一图卷积网络、第二图卷积网络、多层互双仿射网络以及全连接网络,将所述若干个样本语句输入至所述句子编码网络,获得所述若干个样本语句的句子特征表示;
数据构建模块,用于根据所述依存信息,构建所述若干个样本语句的依存句法图,根据所述词性信息,构建所述若干个样本语句的正例表示序列以及负例表示序列;
第一损失值计算模块,用于将所述若干个样本语句的依存句法图、相应的正例表示序列以及负例表示序列输入至所述嵌入矩阵构建网络,获得所述若干个样本语句的嵌入矩阵,将所述若干个样本语句的嵌入矩阵分别与相应的所述正例表示序列以及负例表示序列相乘,获得所述若干个样本语句的正例嵌入矩阵以及负例嵌入矩阵;根据所述若干个样本语句的嵌入矩阵、正例嵌入矩阵以及负例嵌入矩阵,获得所述嵌入矩阵构建网络输出的第一损失值;
语法信息提取模块,用于将所述若干个样本语句的句子特征表示输入至所述第一图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始语义特征表示,将所述若干个样本语句的句子特征表示以及相应的嵌入矩阵输入至所述第二图卷积网络中进行图卷积处理,获得所述若干个样本语句的初始句法特征表示;
特征融合模块,用于将所述若干个样本语句的初始语义特征表示以及初始句法特征表示输入至所述多层互双仿射网络中进行融合处理,获得所述若干个样本语句的融合语义特征表示以及融合句法特征表示;
情感分析模块,用于将所述若干个样本语句的融合语义特征表示、融合句法特征表示输入至所述全连接网络中,获得所述若干个样本语句的预测情感概率分布向量,根据所述若干个样本语句的预测情感概率分布向量,获得所述若干个样本语句的情感极性;
第二损失值计算模块,用于将所述若干个样本语句的情感标签集输入至所述全连接网络,根据所述若干个样本语句的预测情感概率分布向量以及相应的真实情感概率分布向量,获得所述全连接网络输出的第二损失值;
第三损失值计算模块,用于将具有相同情感极性的所述若干个样本语句进行组合,获得若干个正例样本语句集,根据所述若干个正例样本语句集对应的若干个样本语句的融合语义特征表示以及融合句法特征表示,获得所述全连接网络输出的第三损失值以及第四损失值;
模型训练模块,用于根据所述第一损失值、第二损失值、第三损失值以及第四损失值,构建所述情感分类模型的总损失函数,结合所述总损失函数,对所述情感分类模型进行迭代训练,直到满足训练停止条件,获取训练好的情感分类模型;
处理模块,用于获取待测语句,将所述待测语句输入至所述训练好的情感分类模型,获得所述待测语句的情感极性,作为所述待测语句的情感分析结果。