1.一种句子情感分析方法,其特征在于,包括以下步骤:
获取待测语句的句子表示、依赖信息以及词性标注信息,其中,所述待测语句包括若干个句子,所述句子包括若干个单词,所述单词包括上下文单词以及方面词,所述依赖信息包括依赖边信息以及依赖类型信息,所述依赖边信息为单词与单词之间的具有依赖关系,所述依赖类型信息为单词与单词之间的依赖类型向量表示,所述词性标注信息为各个单词对应的词性标注向量表示;
将所述句子表示输入至预设的词嵌入模型,获取所述各个单词对应的词嵌入表示;
获取所述待测语句中单词与单词之间的依赖边特征,将所述待测语句的各个单词对应的词嵌入表示以及依赖边特征输入至预设的记忆神经网络的权重层,根据预设的第一权重系数计算算法,获取所述待测语句的第一权重系数集,其中,所述第一权重系数集包括单词与单词之间的第一权重系数,所述第一权重系数计算算法为:式中, 为第i个单词以及第j个单词之间的第一权重系数, 为第i个单词对应的词嵌入表示, 为第j个单词对应的词嵌入表示,n为所述待测语句的单词的总数目; 为第i个单词与第j个单词之间的依赖边特征;
将所述第一权重系数集、待测语句的依赖类型信息以及词性标注信息输入至所述记忆神经网络的编码层,根据预设的依赖类型特征表示计算算法以及词性标注特征表示计算算法,分别获取所述待测语句的各个单词对应的依赖类型特征表示以及词性标注特征表示,其中,所述依赖类型特征表示计算算法为:式中, 为第i个单词对应的依赖类型特征表示, 为第i个单词以及第j个单词之间的依赖类型向量表示;
所述词性标注特征表示计算算法为:
式中, 为第i个单词对应的词性标注特征表示, 为第j个对应的词性标注向量表示;
将所述待测语句的依赖信息以及词性标注信息,所述待测语句的各个单词对应的词嵌入表示、依赖类型特征表示以及词性标注特征表示输入至预设的图卷积神经网络中,获取各个单词对应的隐藏层特征表示,其中,所述隐藏层特征表示包括上下文单词对应的隐藏层特征表示以及方面词对应的隐藏层特征表示;
获取所述上下文单词与所述方面词之间的距离数据,将所述隐藏层特征表示以及所述距离数据输入至预设的面向方面词语句表示模型中,获取目标语句特征表示;
将所述方面词对应的隐藏层特征表示、目标语句特征表示输入至预设的全连接神经网络,获取情感分析结果。
2.根据权利要求1所述的句子情感分析方法,其特征在于,所述获取所述待测语句中单词与单词之间的依赖边特征表示之前,包括步骤:根据所述依赖信息中的依赖边信息,构建所述待测语句的依赖边矩阵,其中,所述依赖边矩阵为:式中,A为所述依赖边矩阵, 为依赖边特征表示, 代表所述依赖边信息为单词与单词之间的具有依赖关系, 代表所述依赖边信息为单词与单词之间的不具有依赖关系。
3.根据权利要求2所述的句子情感分析方法,其特征在于:
所述图卷积神经网络包括依次连接的图卷积计算模块、权重计算模块以及隐藏特征计算模块,其中,所述图卷积计算模块以及隐藏特征计算模块均包括依次连接的输入层以及若干个图卷积层;
结合所述依赖信息以及词性标注信息,将所述待测语句的各个单词对应的词嵌入表示、依赖类型特征表示以及词性标注特征表示输入至预设的图卷积神经网络中,获取所述图卷积神经网络输出的各个单词对应的隐藏层特征表示,包括步骤:将所述待测语句的各个单词对应的词嵌入表示、依赖类型特征表示以及词性标注特征表示输入至所述图卷积计算模块的输入层,根据预设的第一拼接公式,获取所述图卷积计算模块的输入层对应的各个单词对应的拼接特征表示,并将所述图卷积计算模块的输入层对应的各个单词对应的拼接特征表示作为所述隐藏特征计算模块的输入层对应的各个单词对应的拼接特征表示,其中,所述第一拼接公式为:式中, 为所述图卷积计算模块的输入层对应的第i个单词对应的拼接特征表示,为拼接符号;为图卷积计算模块的输入层对应的第j个单词对应的拼接特征表示;
将所述隐藏特征计算模块的输入层对应的各个单词对应的拼接特征表示、所述依赖信息中的依赖类型信息以及词性标注信息输入至所述图卷积计算模块的图卷积层,根据预设的第二拼接公式,获取所述图卷积计算模块的图卷积层的第一层对应的各个单词对应的拼接特征表示,其中,所述第二拼接公式为:式中, 为所述隐藏特征计算模块的第l层对应的第i个单词对应的隐藏层特征表示;
获取所述待测语句中单词与单词之间的依赖边特征,将所述图卷积计算模块的图卷积层的第一层对应的各个单词对应的拼接特征表示输入至所述权重计算模块,根据预设的第二权重系数计算算法,获取所述权重计算模块的第一层对应的第二权重系数,其中,所述第二权重系数计算算法为:式中, 为所述权重计算模块的第l层对应的第i个单词以及第j个单词对应的第二权重系数, 为所述依赖边特征表示, 为所述图卷积计算模块的第l层的图卷积层对应的第i个单词对应的拼接特征表示, 为所述图卷积计算模块的第l层的图卷积层对应的第j个单词对应的拼接特征表示;
将所述隐藏特征计算模块的输入层对应的各个单词对应的隐藏层特征表示以及所述权重计算模块的第一层对应的第二权重系数输入至所述隐藏特征计算模块的图卷积层中,获取所述隐藏特征计算模块的图卷积层的其余各个层对应的隐藏层特征表示,作为所述图卷积神经网络输出的各个单词对应的隐藏层特征表示。
4.根据权利要求3所述的句子情感分析方法,其特征在于,所述将所述隐藏特征计算模块的输入层对应的各个单词对应的隐藏层特征表示以及所述权重计算模块的第一层对应的第二权重系数输入至所述隐藏特征计算模块的图卷积层中,获取所述隐藏特征计算模块的各个图卷积层对应的隐藏层特征表示,包括步骤:根据所述隐藏特征计算模块的输入层对应的各个单词对应的隐藏层特征表示、所述权重计算模块的第一层对应的第二权重系数以及预设的隐藏层特征计算算法,获取所述隐藏特征计算模块的图卷积层的第一层对应的隐藏层特征表示,其中,所述隐藏层特征计算算法为:式中,为Relu激活函数, 为第一可训练参数,为第二可训练参数;
将所述隐藏特征计算模块的图卷积层的第一层对应的隐藏层特征表示作为输入参数,结合所述第二拼接公式、第二权重系数计算算法以及隐藏层特征计算算法,进行迭代计算,获取所述隐藏特征计算模块的图卷积层的其余各个层对应的隐藏层特征表示。
5.根据权利要求3所述的句子情感分析方法,其特征在于,所述面向方面词语句表示模型包括依次连接的位置特征表示模块、权重模块以及目标语句特征表示模块;
所述将所述隐藏层特征表示以及距离数据输入至预设的面向方面词语句表示模型中,获取所述面向方面词语句表示模块输出的目标语句特征表示,包括步骤:将所述距离数据、所述各个单词对应的隐藏层特征表示输入至所述位置特征表示模块,根据预设的位置系数计算算法以及预设的距离阈值,获取所述各个单词对应的位置系数,其中,所述位置系数计算算法为:式中, 为第i个单词对应的位置系数,dis为所述距离数据,k为所述距离阈值;
根据所述各个单词对应的位置系数、隐藏层特征表示以及预设的位置特征表示计算算法,获取所述位置特征表示模块输出的各个单词对应的位置特征表示,其中,所述位置特征表示计算算法为:式中, 为所述第i个单词对应的位置特征表示;
将所述各个单词对应的位置特征表示、方面词对应的隐藏层特征表示输入至所述权重模块,根据预设的第三权重系数计算算法,获取所述权重模块输出的各个单词对应的第三权重系数,其中,所述第三权重系数计算算法为:式中, 为第t个单词对应的第三权重参数,m为所述方面词的数目, 为所述隐藏特征计算模块的第l层对应的第c个方面词对应的隐藏层特征表示;
将所述各个单词对应的第三权重系数、位置特征表示输入至所述目标语句特征表示模块,根据预设的目标语句特征表示计算算法,获取所述目标语句特征表示模块输出的目标语句特征表示,其中,所述目标语句特征表示计算算法为:式中,z为所述目标语句特征表示, 为训练系数。
6.根据权利要求5所述的句子情感分析方法,其特征在于:
所述全连接神经网络包括依次连接的全连接层以及归一化激活函数层;
所述将所述方面词对应的隐藏层特征表示、目标语句特征表示输入至预设的全连接神经网络,获取所述全连接神经网络输出的待测语句的情感分析结果,包括步骤:将所述目标语句特征表示输入至所述全连接层进行降维处理,获得所述全连接层输出的降维处理后的目标语句特征;
将所述降维处理后的目标语句特征表示输入至所述归一化激活函数层,根据预设的情感分析算法,获取情感分类极性概率分布向量,根据所述情感分类极性概率分布向量,获取概率最大的维度对应的情感极性,将所述情感极性作为所述待测语句的情感分析结果,其中,所述情感分析算法为:式中,u为所述情感分类极性概率分布向量, 为所述全连接神经网络的参数矩阵,为所述全连接神经网络的偏置值,softmax()为归一化函数。
7.一种句子情感分析装置,其特征在于,包括:
获取模块,用于获取待测语句的句子表示、依赖信息以及词性标注信息,其中,所述待测语句包括若干个句子,句子包括若干个单词,所述单词包括上下文单词以及方面词,所述依赖信息包括依赖边信息以及依赖类型信息,所述依赖边信息为单词与单词之间的具有依赖关系,所述依赖类型信息为单词与单词之间的依赖类型向量表示,所述词性标注信息为各个单词对应的词性标注向量表示;
词嵌入处理模块,用于将所述各个单词对应的词嵌入表示、所述依赖类型信息以及所述词性标注信息输入预设的记忆神经网络中,获取所述各个单词对应的依赖类型特征表示以及词性标注特征表示;
第一特征处理模块,用于获取所述待测语句中单词与单词之间的依赖边特征,将所述待测语句的各个单词对应的词嵌入表示以及依赖边特征输入至预设的记忆神经网络的权重层,根据预设的第一权重系数计算算法,获取所述待测语句的第一权重系数集,其中,所述第一权重系数集包括单词与单词之间的第一权重系数,所述第一权重系数计算算法为:式中, 为第i个单词以及第j个单词之间的第一权重系数, 为第i个单词对应的词嵌入表示, 为第j个单词对应的词嵌入表示,n为所述待测语句的单词的总数目; 为第i个单词与第j个单词之间的依赖边特征;
将所述第一权重系数集、待测语句的依赖类型信息以及词性标注信息输入至所述记忆神经网络的编码层,根据预设的依赖类型特征表示计算算法以及词性标注特征表示计算算法,分别获取所述待测语句的各个单词对应的依赖类型特征表示以及词性标注特征表示,其中,所述依赖类型特征表示计算算法为:式中, 为第i个单词对应的依赖类型特征表示, 为第i个单词以及第j个单词之间的依赖类型向量表示;
所述词性标注特征表示计算算法为:
式中, 为第i个单词对应的词性标注特征表示, 为第j个对应的词性标注向量表示;
第二特征处理模块,用于将所述待测语句的依赖信息以及词性标注信息,所述待测语句的各个单词对应的词嵌入表示、依赖类型特征表示以及词性标注特征表示输入至预设的图卷积神经网络中,获取各个单词对应的隐藏层特征表示,其中,所述隐藏层特征表示包括上下文单词对应的隐藏层特征表示以及方面词对应的隐藏层特征表示;
第三特征处理模块,用于获取所述上下文单词与所述方面词之间的距离数据,将所述隐藏层特征表示以及所述距离数据输入至预设的面向方面词语句表示模型中,获取所述面向方面词语句表示模型输出的目标语句特征表示;
分析模块,用于将所述方面词对应的隐藏层特征表示、目标语句特征表示输入至预设的全连接神经网络,获取所述全连接神经网络输出的待测语句的情感分析结果。
8.一种计算机设备,其特征在于,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如权利要求
1至6中任一项所述的句子情感分析方法的步骤。
9.一种存储介质,其特征在于:所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的句子情感分析方法的步骤。