欢迎来到利索能及~ 联系电话:18621327849
利索能及
我要发布
收藏
专利号: 202211047550X
申请人: 华南师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-10-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于方面类别的语句情感分析方法,其特征在于,包括以下步骤:

获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词,所述特征词的类型包括实体词以及属性词;

将所述若干个样本语句以及相应的若干个方面词类别组进行拼接处理,获得若干个拼接处理后的样本语句;

将所述若干个拼接处理后的样本语句输入至神经网络模型中的编码模块,获得所述若干个拼接处理后的样本语句的若干个单词对应的词嵌入表示,若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示;

将同一个拼接处理后样本语句的若干个单词对应的词嵌入表示进行拼接,获得所述若干个样本语句的句子特征表示,作为句子特征表示集;

将同一个拼接处理后样本语句的若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示进行组合,获得所述若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,作为词嵌入特征表示集;

将包含有同一实体词的拼接处理后的样本语句进行组合,获得若干个实体词对应的样本语句集,以及将包含有同一属性词的拼接处理后的样本语句进行组合,获得若干个属性词对应的样本语句集;

将所述若干个实体词对应的样本语句集以及所述若干个属性词对应的样本语句集分别输入至所述神经网络模型中的编码模块,获得所述若干个实体词对应的样本语句集中若干个样本语句的方面类别特征表示,以及获得所述若干个属性词对应的样本语句集中若干个样本语句的方面类别特征表示,作为方面类别特征表示集;

将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示;

将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示;

将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据;

根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型;

响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。

2.根据权利要求1所述的基于方面类别的语句情感分析方法,其特征在于,所述将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示,包括步骤:构建与所述样本语句相应的特征词相关联的图网络结构,其中,所述图网络包括中心节点以及若干个子节点;

将所述特征词对应的词嵌入表示设置在所述图网络结构的中心节点,并从所述方面类别特征表示集中,将同一特征词对应的样本语句的方面类别特征表示分别设置在所述图网络结构的子节点上,构建所述若干个样本语句的若干个方面类别组的邻接矩阵;

根据所述若干个特征词对应的样本语句的方面类别特征表示、相应的特征词对应的邻接矩阵以及所述图注意力网络模块的图注意力计算算法,获得所述若干个样本语句的若干个方面类别组的若干个特征词对应的注意力特征表示,其中,所述特征词对应的注意力特征表示包括实体词对应的注意力特征表示,以及属性词对应的注意力特征表示,所述图注意力计算算法为:式中, 为所述图注意力网络模块的第l层的特征词对应的注意力特征表示,ReLU()为激活函数,q为所述图网络结构的子节点的数目, 为所述图注意力网络模块的第l层的权重参数, 为所述图注意力网络模块的第l层的可训练的位置关系矩阵, 为所述图注意力网络模块的第l层的方面类别特征表示, 为所述图注意力网络模块的第l层的偏置参数, 为第j个样本语句的第k个方面类别组的邻接矩阵中节点之间关系, 为所述图注意力网络模块的参数矩阵, 为所述图注意力网络模块的第l‑1层的特征词对应的词嵌入表示;

根据所述同一个方面类别组的实体词对应的注意力特征表示、所述属性词对应的注意力特征表示以及预设的特征融合算法,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示,其中,所述特征融合算法为:式中, 为第i个样本语句中的第k个方面类别组对应的注意力特征表示, 为所述图注意力网络模块的第l层的实体词对应的注意力特征表示, 为所述图注意力网络模块的第l层的属性词对应的注意力特征表示,为预设的第一可训练权重参数,为预设的第二可训练权重参数。

3.根据权利要求1所述的基于方面类别的语句情感分析方法,其特征在于:所述语义特征表示包括第一语义特征表示以及第二语义特征表示;

所述将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示,包括步骤:获得所述若干个样本语句的若干个方面类别组的拼接向量,以及所述若干个样本语句的词性矩阵,其中,所述拼接向量为同一组方面类别组的若干个特征词对应的词嵌入表示进行拼接处理的结果;

根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样本语句的词性矩阵以及预设的第一语义特征计算算法,获得若干个样本语句的若干个方面类别组的第一语义特征表示,其中,所述第一语义特征计算算法为:式中, 为第i个样本语句的第k个方面类别组关于第n个单词的第一融合词性表示,表示截取到第p到p+t个单词对应的词性表示,p+t≤n, 为第一卷积核参数,为第i个样本语句的第k个方面类别组的拼接向量, 为第一可训练参数矩阵,为第一可训练偏置参数, 为第二可训练参数矩阵, 为为第二可训练偏置参数, 为第i个样本语句的第k个方面类别组关于第n个单词的第二融合词性表示, 为第i个样本语句的第k个方面类别组关于第n个单词的第一语义特征表示;

根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样本语句的词性矩阵以及预设的第二语义特征计算算法,获得若干个样本语句的若干个方面类别组的第二语义特征表示,其中,所述第二语义特征计算算法为:式中, 为第i个样本语句的第k个方面类别组关于第n个单词的第三融合词性表示,表示截取到第p到p+t个单词对应的词嵌入表示; 为第二卷积核参数, 为第i个样本语句的第k个方面类别组关于第n个单词的第四融合词性表示, 为第i个样本语句的第k个方面类别组关于第n个单词的第二语义特征表示。

4.根据权利要求3所述的基于方面类别的语句情感分析方法,其特征在于:所述预测分布数据包括分类预测分布数据以及情感预测分布数据;

所述将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据,包括步骤:根据若干个样本语句的若干个方面类别组的第一语义特征表示以及预设的分类预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的分类预测分布数据,其中,所述分类预测分布数据计算算法为:式中, 为第i个样本语句的第k个方面类别组的分类预测分布数据, 为第i个样本语句的第k个方面类别组的第一语义特征表示,由第i个样本语句的第k个方面类别组的各个单词的第一语义特征表示进行拼接操作获得的; 为第三可训练的参数矩阵,, 为第一语义特征表示的维度,T为预设的与方面类别相关联的伪标签的数目, 为第三偏置参数; 为归一化函数;

根据若干个样本语句的若干个方面类别组的第一语义特征表示、第二语义特征表示、注意力特征表示以及预设的情感预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的情感预测分布数据,其中,所述情感预测分布数据计算算法为:式中, 为第i个样本语句的第k个方面类别组的情感预测分布数据, 为第i个样本语句中的第k个方面类别组对应的注意力特征表示, 为可训练的参数矩阵, 为第i个样本语句的第k个方面类别组的第二语义特征表示,由第i个样本语句的第k个方面类别组的各个单词的第二语义特征表示进行拼接操作获得的;其中,C表示情感类别,包含积极、消极以及中立, 为第四偏置参数。

5.根据权利要求4所述的基于方面类别的语句情感分析方法,其特征在于,所述根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,包括步骤:获得所述若干个样本语句的若干个方面类别组的分类真实分布数据,根据所述若干个样本语句的若干个方面类别组的分类真实分布数据以及分类预测分布数据,构建分类损失函数,其中,所述分类损失函数为:式中, 为所述分类损失函数,m为所述样本语句的数目,K为所述样本语句中方面类别组的数目, 为第i个样本语句的第k个方面类别组的分类真实分布数据,为正则项参数,为所述神经网络模型的所有参数;

获得所述若干个样本语句的若干个方面类别组的情感真实分布数据,根据所述若干个样本语句的若干个方面类别组的情感真实分布数据以及情感预测分布数据,构建情感损失函数,其中,所述情感损失函数为:式中, 为所述情感损失函数, 为第i个样本语句的第k个方面类别组的

情感真实分布数据;

根据所述分类损失函数以及情感损失函数,构建所述神经网络模型的损失函数,其中,所述神经网络模型的损失函数为:式中, 为所述神经网络模型的损失函数, 为第一可训练损失参数, 为第二可训练损失参数。

6.根据权利要求5所述的基于方面类别的语句情感分析方法,其特征在于,所述将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果,包括步骤:将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的关于方面类别组的情感预测分布数据;

根据所述待测语句的关于方面类别组的情感预测分布数据,获得所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,将所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,作为所述待测语句的情感分析结果。

7.一种基于方面类别的语句情感分析装置,其特征在于,包括:

语句获得模块,用于获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词,所述特征词的类型包括实体词以及属性词;

编码模块,用于将所述若干个样本语句以及相应的若干个方面词类别组进行拼接处理,获得若干个拼接处理后的样本语句;

将所述若干个拼接处理后的样本语句输入至神经网络模型中的编码模块,获得所述若干个拼接处理后的样本语句的若干个单词对应的词嵌入表示,若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示;

将同一个拼接处理后样本语句的若干个单词对应的词嵌入表示进行拼接,获得所述若干个样本语句的句子特征表示,作为句子特征表示集;

将同一个拼接处理后样本语句的若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示进行组合,获得所述若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,作为词嵌入特征表示集;

将包含有同一实体词的拼接处理后的样本语句进行组合,获得若干个实体词对应的样本语句集,以及将包含有同一属性词的拼接处理后的样本语句进行组合,获得若干个属性词对应的样本语句集;

将所述若干个实体词对应的样本语句集以及所述若干个属性词对应的样本语句集分别输入至所述神经网络模型中的编码模块,获得所述若干个实体词对应的样本语句集中若干个样本语句的方面类别特征表示,以及获得所述若干个属性词对应的样本语句集中若干个样本语句的方面类别特征表示,作为方面类别特征表示集;

注意力计算模块,用于将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示;

语义特征提取模块,用于将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示;

分布预测模块,用于将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据;

训练模块,用于根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型;

分析模块,用于响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。

8.一种计算机设备,其特征在于,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如权利要求

1至6中任一项所述的基于方面类别的语句情感分析方法的步骤。

9.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的基于方面类别的语句情感分析方法的步骤。