欢迎来到利索能及~ 联系电话:18621327849
利索能及
我要发布
收藏
专利号: 2022114710941
申请人: 华南师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-10-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于子句级关系图的方面词的情感分析方法,其特征在于,包括以下步骤:

获取待测语句以及预设的情感分析模型,其中,所述待测语句包括若干个单词,所述单词包括上下文单词以及由若干个单词组合的若干个方面词,所述情感分析模型包括句子编码网络、图卷积网络、关系图注意网络以及全连接网络;

将所述待测语句输入至所述句子编码网络,获得所述待测语句的句子特征表示;

构建所述待测语句的依存句法图,根据所述依存句法图,获得所述待测语句的第一邻接矩阵;

将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理,获得所述待测语句的第一特征表示,其中,所述第一特征表示包括所述若干个方面词的第一特征向量;

构建所述待测语句的子句级关系图,所述子句级关系图包括所述若干个方面词彼此的连接关系,根据所述子句级关系图以及所述句子特征表示,构建所述待测语句的第二邻接矩阵,其中,所述第二邻接矩阵包括所述若干个方面词彼此的连接关系对应的特征向量;

根据所述第一特征表示,获取所述若干个方面词的第一特征向量,将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理,获得所述若干个方面词的第二特征向量;

将所述若干个方面词的第一特征向量以及第二特征向量输入至所述全连接网络进行拼接处理,获取所述若干个方面词的拼接特征向量,对所述若干个方面词的拼接特征向量进行情感分析,获得所述若干个方面词的情感分析结果。

2.根据权利要求1所述的基于子句级关系图的方面词的情感分析方法,其特征在于:所述句子特征表示包括若干个单词的隐藏层向量,所述第一邻接矩阵包括若干个单词之间的依存关系向量;

所述将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理,获得所述待测语句的第一特征表示,包括步骤:将所述待测语句的句子特征表示中若干个单词的隐藏层向量作为所述图卷积网络的首层的输入信息,根据所述待测语句的第一邻接矩阵中若干个单词之间的依存关系向量以及预设的第一特征计算算法,获得所述图卷积网络的最后一层的若干个单词的初始第一特征向量,其中,所述第一特征计算算法为:式中,i和j为单词的索引,为所述图卷积网络的第l层的第i个单词的初始第一特征向量, 为所述图卷积网络的第l层的第j个单词的初始第一特征向量, 为非线性激活函数, 为所述第一邻接矩阵中第i个单词与第j个单词之间的依存关系向量, 为第一可训练权重参数矩阵, 为第一偏差参数,n是所述待测语句的单词数目;

根据所述待测语句的若干个单词的初始第一特征向量以及预设的加权算法,对所述若干个单词的初始第一特征向量进行加权处理,获得加权处理后的所述若干个单词的初始第一特征向量,并进行编码处理,获得加权处理后的所述待测语句的第一特征表示,并对所述加权处理后的待测语句的第一特征表示进行平均池化处理,获得平均池化处理后的第一特征表示,作为所述待测语句的第一特征表示,其中,所述加权算法为:式中,τ为所述方面词的开始位置,m为所述方面词的数目,为第i个单词的位置权重参数,为所述加权处理后的所述第i个单词对应的第一特征向量。

3.根据权利要求2所述的基于子句级关系图的方面词的情感分析方法,其特征在于,所述构建所述待测语句的子句级关系图,根据所述子句级关系图以及所述句子特征表示,构建所述待测语句的第二邻接矩阵,包括步骤:将所述待测语句划分为若干个子待测语句,根据所述若干个子待测语句,获取所述方面词的句子标识,根据所述方面词的句子标识,构建所述待测语句的子句级关系图;

根据所述若干个方面词彼此的连接关系,对所述待测语句的句子特征表示中的单词的隐藏层向量进行屏蔽处理,构建第一屏蔽句子特征表示以及第二屏蔽句子特征表示;

根据所述第一屏蔽句子特征表示、第二屏蔽句子特征表示以及预设的连接关系特征计算算法,获得所述若干个方面词彼此的连接关系对应的特征向量,构建所述待测语句的第二邻接矩阵,其中,所述连接关系特征计算算法为:式中,p和q为所述方面词的索引, 为第p个方面词与第q个方面词的连接关系对应的特征向量,i,j,k分别单词的索引, 为所述第二屏蔽句子特征表示中第k个单词的隐藏层向量, 为所述第一屏蔽句子特征表示中第i个单词的隐藏层向量, 为所述第二屏蔽句子特征表示中第j个单词的隐藏层向量,T表示转置。

4.根据权利要求3所述的基于子句级关系图的方面词的情感分析方法,其特征在于,所述将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理,获得所述若干个方面词的第二特征向量,包括步骤:根据所述第二邻接矩阵中若干个方面词彼此的连接关系对应的特征向量以及预设的注意力系数计算算法,获得所述关系图注意网络的若干层对应的若干个所述连接关系对应的注意力系数,其中,所述注意力系数计算算法为:式中, 为所述关系图注意网络的第l层对应的所述第p个方面词与第q个方面词彼此的连接关系对应的注意力系数, 为非线性激活函数,relu()为线性激活函数, 为第二可训练权重参数矩阵, 为第三可训练权重参数矩阵, 为第二偏差参数, 为第三偏差参数, 为所述第p个方面词连接的方面词的集合;

将所述若干个方面词的第一特征向量作为所述关系图注意网络的首层的输入信息,根据若干个所述连接关系对应的注意力系数以及预设的第二特征计算算法,获得所述关系图注意网络的最后一层的所述若干个方面词的第二特征向量,其中,所述第二特征计算算法为:式中, 为所述关系图注意网络的最后一层的所述方面词的第二特征向量, 为所述方面词的第一特征向量, 为第四可训练权重参数矩阵。

5.根据权利要求4所述的基于子句级关系图的方面词的情感分析方法,其特征在于,所述对所述若干个方面词的拼接特征向量进行情感分析,获得所述若干个方面词的情感分析结果,包括步骤:根据所述若干个方面词的拼接特征向量以及预设的情感概率分布向量计算算法,获得所述若干个方面词的拼接特征向量的预测情感概率分布向量,根据所述预测情感概率分布向量,获得概率最大的维度对应的预测情感极性,作为所述若干个方面词的情感分析结果,其中,所述情感概率分布向量计算算法为:式中,pre为所述若干个方面词的预测情感概率分布向量, 为归一化函数,为预设的第五可训练权重参数矩阵,x为所述情感分析特征向量, 为预设的第五偏置参数。

6.根据权利要求5所述的基于子句级关系图的方面词的情感分析方法,其特征在于,还包括训练所述情感分析模型,所述训练所述情感分析模型,包括步骤:获取待训练的情感分析模型、若干个样本语句以及样本语句对应的情感标签信息,其中,所述样本语句包括若干个样本方面词;所述情感标签信息包括真实情感概率分布向量;

获取若干个样本方面词的句子标识,根据所述若干个样本方面词的句子标识,构建连接关系集,其中,所述连接关系集包括若干个样本方面词彼此的连接关系;

获得所述若干个样本方面词对应的预测情感概率分布向量以及预测情感极性,根据所述若干个样本方面词彼此的连接关系以及所述若干个样本方面词对应的预测情感极性,构建标签关系集,其中,所述标签关系集包括若干个样本方面词彼此的连接关系对应的标签关系信息;

根据所述连接关系集、标签关系集以及预设的第一损失函数,获取第一损失值,根据所述若干个样本方面词对应的预测情感概率分布向量、真实情感概率分布向量以及预设的第二损失函数,获取第二损失值,根据所述第一损失值、第二损失值以及预设的总损失函数,获取总损失值,根据所述总损失值,对所述待训练的情感分析模型进行训练,获取所述情感分析模型。

7.根据权利要求6所述的基于子句级关系图的方面词的情感分析方法,其特征在于:所述第一损失函数为:式中, 为所述第一损失值,u、v以及b为所述连接关系集中的连接关系的索引, 为所述连接关系集中第u个所述样本方面词彼此的连接关系, 为所述连接关系集中第v个所述样本方面词彼此的连接关系, 为所述连接关系集中第b个所述样本方面词彼此的连接关系,R为所述连接关系集中所述样本方面词彼此的连接关系的数目, 为所述连接关系集中第u个所述样本方面词彼此的连接关系对应的标签关系信息, 为所述连接关系集中第v个所述样本方面词彼此的连接关系对应的标签关系信息, 为所述第u个所述样本方面词彼此的连接关系对应的标签关系信息的数目,为温度系数,sim()为余弦相似度函数;

所述第二损失函数为:

式中,L为所述第二损失值,K为所述样本方面词的数目,k表示第k个样本方面词, 为所述样本方面词对应的真实情感概率分布向量, 为所述样本方面词对应的预测情感概率分布向量;

所述总损失函数为:

式中,Loss为所述总损失值,为第一衰减系数,为第二衰减系数, 为可训练参数。

8.一种基于子句级关系图的方面词的情感分析装置,其特征在于,包括:

获取模块,用于获取待测语句以及预设的情感分析模型,其中,所述待测语句包括若干个单词,所述单词包括上下文单词以及由若干个单词组合的若干个方面词,所述情感分析模型包括句子编码网络、图卷积网络、关系图注意网络以及全连接网络;

句子编码模块,用于将所述待测语句输入至所述句子编码网络,获得所述待测语句的句子特征表示;

第一邻接矩阵计算模块,用于构建所述待测语句的依存句法图,根据所述依存句法图,获得所述待测语句的第一邻接矩阵;

第一特征计算模块,用于将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理,获得所述待测语句的第一特征表示,其中,所述第一特征表示包括所述若干个方面词的第一特征向量;

第二邻接矩阵计算模块,用于构建所述待测语句的子句级关系图,根据所述子句级关系图以及所述句子特征表示,构建所述待测语句的第二邻接矩阵,其中,所述第二邻接矩阵包括所述若干个方面词彼此的连接关系对应的特征向量;

第二特征计算模块,用于根据所述第一特征表示,获取所述若干个方面词的第一特征向量,将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理,获得所述若干个方面词的第二特征向量;

情感分析模块,用于将所述若干个方面词的第一特征向量以及第二特征向量输入至所述全连接网络进行拼接处理,获取所述若干个方面词的拼接特征向量,对所述若干个方面词的拼接特征向量进行情感分析,获得所述若干个方面词的情感分析结果。

9.一种计算机设备,其特征在于,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的基于子句级关系图的方面词的情感分析方法的步骤。

10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于子句级关系图的方面词的情感分析方法的步骤。