1.一种方面情感三元组提取方法,其特征在于,包括以下步骤:
获得待测语句以及预设的三元组提取模型,其中,所述待测语句包括若干个单词,所述三元组提取模型包括句子编码模块、超图信息提取模块、关系感知提示模块以及三元组提取模块;
将所述待测语句输入至所述句子编码模块中进行编码处理,获得所述待测语句的句子编码表示;
构建所述待测语句的超图关系矩阵,其中,所述超图关联矩阵包括若干个节点与若干条超边之间的关系向量;
将所述句子编码表示以及超图关系矩阵输入至所述超图信息提取模块中进行超图信息提取,获得所述待测语句的句子超图信息表示;
将所述句子超图信息表示输入至所述关系感知提示模块中进行词对关系分类以及关系感知,获得所述待测语句的关系感知提示表示;
将所述句子编码表示以及关系感知提示表示输入至所述三元组提取模块中进行三元组提取,获得所述待测语句的方面情感三元组提取结果。
2.根据权利要求1所述的方面情感三元组提取方法,其特征在于,所述构建所述待测语句的超图关系矩阵,包括步骤:获得所述待测语句的句法依赖图以及依赖关系标签数据,根据所述依赖关系标签数据中若干个单词之间的依赖关系标签,确定所述句法依赖图中相应的若干个单词之间连接的依赖边;
对所述待测语句进行语法归纳处理,获得所述待测语句的语法结构图以及所述语法结构图中若干条语法边;分别将与所述依赖边以及语法边有连接关系的单词作为关系超图的节点,所述依赖边以及语法边作为关系超图的超边,构建所述待测语句的关系超图,对所述关系超图进行转换,获得所述超图关系矩阵。
3.根据权利要求2所述的方面情感三元组提取方法,其特征在于:所述上下文超图信息提取模块包括以及超图注意力网络以及前馈神经网络;
所述将所述句子编码表示以及超图关系矩阵输入至所述超图信息提取模块中进行超图信息提取,获得所述待测语句的句子超图信息表示,包括步骤:将所述句子编码表示以及超图关系矩阵输入至所述超图注意力网络中进行注意力超图信息提取,获得节点注意力信息表示;
将所述节点注意力信息表示输入至所述前馈神经网络中进行信息拟合,获得节点信息拟合表示,将所述信息拟合后的节点信息表示中若干个节点的信息拟合向量作为所述待测语句中对应的单词的信息向量,获得所述句子超图信息表示。
4.根据权利要求3所述的方面情感三元组提取方法,其特征在于:所述超图注意力网络包括若干层图注意力层;
所述将所述句子编码表示以及超图关系矩阵输入至所述超图注意力网络中进行注意力超图信息提取,获得节点注意力信息表示,包括步骤:将所述句子编码表示作为所述超图注意力网络的首层图注意力层的节点输入表示以及节点输出表示,根据所述超图关系矩阵、节点输出表示以及预设的第一注意力分数计算算法,获得第一注意力分数数据;其中,所述第一注意力分数数据包括与若干条超边有连接关系的若干个节点与若干条超边之间的注意力分数;所述第一注意力分数计算算法为:式中,αjk为与第j条超边有连接关系的第k个节点与第j条超边之间的注意力分数,为第l‑1层图注意力层的节点输出表示中第k个节点的输出向量,MLP(·)为多层感知机函数,ej为第j条超边,vp为与第j条超边有连接关系的第p个节点, 为第l‑1层图注意力层的节点输出表示中第p个节点的输出向量;所述超图注意力网络的第l层图注意力层的节点输入表示为超图注意力网络的第l‑1层图注意力层的节点输出表示;
根据所述第一注意力分数数据、节点输入表示以及预设的超边注意力聚合算法,获得若干条超边的超边注意力聚合表示,其中,所述超边注意力聚合算法为:式中, 为第l层图注意力层的第j条超边的超边注意力聚合表示,σ(·)为激活函数,vk为与第j条超边有连接关系的第k个节点,Wn为第一权重参数;
根据所述超图关系矩阵、节点输出表示、若干条超边的超边注意力聚合表示以及预设的第二注意力分数计算算法,获得第二注意力分数数据,其中,所述第二注意力分数数据包括若干个节点与若干个节点有连接关系的超边集合中若干条超边之间的注意力分数所述第二注意力分数计算算法为:式中,βij为第i个节点与第i个节点有连接关系的超边集合中第j条超边之间的注意力分数,εi为与第i个节点有连接关系的超边集合,ep为第p个节点有连接关系的超边集合中第j条超边, 为第l层图注意力层的第j条超边的超边注意力聚合表示, 为第l‑1层图注意力层的节点输出表示中第p个节点的输出向量;所述超图注意力网络的第l层图注意力层的节点输入表示为超图注意力网络的第l‑1层图注意力层的节点输出表示;
根据所述第二注意力分数数据、节点输入表示以及预设的节点注意力聚合算法,获得节点注意力聚合表示,作为所述超图注意力网络的首层图注意力层的节点输出表示以及下一层图注意力层的节点输入表示,重复进行计算,获得所述超图注意力网络的最后一层图注意力层的节点输出表示,作为所述节点注意力信息表示,其中,所述节点注意力聚合算法为:式中, 为第l层图注意力层的节点输出表示中第i个节点的输出向量,ej为第i个节点有连接关系的超边集合中第j条超边,βij为第i个节点与第i个节点有连接关系的超边集合中第j条超边之间的注意力分数,We为第二权重参数。
5.根据权利要求4所述的方面情感三元组提取方法,其特征在于:所述关系感知提示模块包括第一多层感知机网络以及第二多层感知机网络;
所述将将所述句子超图信息表示输入至所述关系感知提示模块中进行词对关系分类以及关系感知,获得所述待测语句的关系感知提示表示,包括步骤:采用双仿射注意力方法,根据所述句子超图信息表示以及预设的关系概率分布计算算法,获得词对关系表示,其中,所述词对关系表示包括若干个单词对的关系概率分布预测数据,所述关系概率分布计算算法为:F F
R=Biaffine(MLPa(H),MLPo(H))
式中,R为所述词对关系表示,Biaffine(·)为双仿射注意力函数,MLPa(·)为第一多层F感知机网络的处理函数,MLPo(·)为第二多层感知机网络的处理函数,H为所述句子超图信息表示;
对所述词对关系表示进行最大池化处理,获得最大池化处理后的词对关系表示,根据所述句子超图信息表示以及最大池化处理后的词对关系表示,采用门控机制进行信息融合,获得关系感知提示表示。
6.根据权利要求5所述的方面情感三元组提取方法,其特征在于,所述将所述句子编码表示以及关系感知提示表示输入至所述三元组提取模块中进行三元组提取,获得所述待测语句的方面情感三元组提取结果,包括步骤:将所述句子编码表示以及关系感知提示表示输入至解码器中,根据预设的第一句子解码算法,获得句子解码模板表示,根据所述句子解码模板表示,其中,所述句子解码模板表示为由固定的类型顺序排列的若干个三元组组成的,所述第一句子解码算法为:d e
H=Decoder(H,P)
d e
式中,H为句子解码模板表示,Decoder(·)为解码函数,H 为句子编码表示,P为关系感知提示表示;
根据所述句子解码模板表示,根据所述句子解码模板表示中若干个三元组的位置索引,确定所述句子解码模板表示中若干个三元组的类型以及情感极性,获得所述待测语句的方面情感三元组提取结果。
7.根据权利要求6所述的方面情感三元组提取方法,其特征在于,还包括步骤:对所述三元组提取模型进行训练;
所述对所述三元组提取模型进行训练,包括步骤:
获得若干个样本句子以及样本句子的标签模板表示,其中,所述标签模板表示为由固定的类型顺序排列的所述样本句子中的若干个三元组的标签数据组成的,所述三元组的标签数据包括单词对的单词概率分布标签数据以及单词对的情感概率分布标签数据;
将若干个所述样本句子输入至待训练的三元组提取模型中,获得若干个所述样本句子的句子编码表示以及词对关系表示,其中,所述词对关系表示包括若干个单词对应的关系概率分布预测数据,所述关系概率分布预测数据包括若干个类型的关系概率分布预测向量;
获得若干个所述样本句子中若干个单词对的关系概率分布标签数据,根据若干个所述样本句子中若干个单词对的关系概率分布预测数据、关系概率分布标签数据以及预设的第一交叉熵损失函数,获得第一交叉熵损失值,其中,所述关系概率分布标签数据包括若干个类型的关系概率分布标签向量,所述第一交叉熵损失函数为:式中, 为第一交叉熵损失值,n为样本句子中的单词数目,yij为样本句子中第i个单词与第j个单词组成的单词对的关系概率分布标签向量,为类型的数目,c为类型,ri,j|c为第i个单词与第j个单词组成的单词对的类型c的关系概率分布预测向量;
分别将若干个样本句子的句子编码表示作为所述待训练的三元组提取模型中的解码器的输入表示,若干个所述样本句子的标签模板表示作为解码器的初始输出表示,根据预设的第二句子解码算法进行若干次迭代解码,获得若干个所述样本句子的若干个时刻的句子解码表示,其中,所述第二句子解码算法为:e
式中, 为样本句子的第t个时刻的句子解码表示,H′为样本句子的句子编码表示,为样本句子的第t‑1个时刻的句子解码表示;
分别将若干个所述样本句子的若干个时刻的句子解码表示进行条件概率转换,获得若干个样本句子的若干个时刻的条件概率表示,根据若干个样本句子的若干个时刻的条件概率表示以及预设的第二交叉熵损失函数,获得第二交叉熵损失值,根据所述第一交叉熵损失值以及第二交叉熵损失值,对所述待训练的三元组提取模型进行训练,其中,所述第二交叉熵损失函数为:式中, 为第二交叉熵损失值,T为总时长, 为样本句子的第t个时
刻的条件概率表示。
8.一种方面情感三元组提取装置,其特征在于,包括:
数据获得单元,用于获得待测语句以及预设的三元组提取模型,其中,所述待测语句包括若干个单词,所述三元组提取模型包括句子编码模块、超图信息提取模块、关系感知提示模块以及三元组提取模块;
句子编码单元,用于将所述待测语句输入至所述句子编码模块中进行编码处理,获得所述待测语句的句子编码表示;
矩阵构建单元,用于构建所述待测语句的超图关系矩阵,其中,所述超图关联矩阵包括若干个节点与若干条超边之间的关系向量;
特征提取单元,用于将所述句子编码表示以及超图关系矩阵输入至所述超图信息提取模块中进行超图信息提取,获得所述待测语句的句子超图信息表示;
关系感知单元,用于将所述句子超图信息表示输入至所述关系感知提示模块中进行词对关系分类以及关系感知,获得所述待测语句的关系感知提示表示;
三元组提取单元,用于将所述句子编码表示以及关系感知提示表示输入至所述三元组提取模块中进行三元组提取,获得所述待测语句的方面情感三元组提取结果。
9.一种计算机设备,其特征在于,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方面情感三元组提取方法的步骤。
10.一种存储介质,其特征在于:所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方面情感三元组提取方法的步骤。