欢迎来到利索能及~ 联系电话:18621327849
利索能及
我要发布
收藏
专利号: 2019107587245
申请人: 华南师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-10-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种情感分析方法,其特征在于:包括以下步骤:

获取用户语料中的目标词和上下文;

将所述目标词中的词语与Glove模型预训练的目标词向量进行匹配,将所述上下文中的词语与Glove模型预训练的上下文词向量进行匹配,获取目标词嵌入矩阵和上下文词嵌入矩阵;将所述目标词嵌入矩阵和上下文词嵌入矩阵输入门控循环单元获得所述上下文词嵌入矩阵和目标词嵌入矩阵的隐藏层输出;

将所述上下文词嵌入矩阵和目标词嵌入矩阵的隐藏层输出作为计算参数,基于注意力机制计算上下文和目标词的注意力机制系数,根据所述注意力机制系数对上下文向量和目标词向量进行加权求和,获取新的上下文向量和目标词向量;

将所述新的上下文向量和目标词向量进行拼接,并通过分类器进行分类,得到所述目标词的情感分析结果;

所述将所述上下文词嵌入矩阵和目标词嵌入矩阵的隐藏层输出作为计算参数,基于注意力机制计算上下文和目标词的注意力机制系数,根据所述注意力机制系数对上下文向量和目标词向量进行加权求和,获取新的上下文向量和目标词向量的步骤包括:按照以下方式获取上下文和目标词之间的注意力机制系数矩阵:其中,relu表示激活函数, 是HC的转置矩阵,HC是上下文词嵌入矩阵的隐藏层输出,W是参数矩阵,HT是目标词嵌入矩阵的隐藏层输出,H是上下文和目标词之间的注意力机制系数矩阵;

基于注意力机制系数矩阵,按照以下方式获取上下文词和目标词的注意力权重系数:RC=relu(WCHC+WTHTHT)

RT=relu(WTHT+WCHCH)

其中,WC和WT是上下文词和目标词的参数矩阵,HT为H的转置矩阵;

基于自注意力机制,按照以下方式计算上下文词和目标词的注意力机制系数:α=softmax(wCRC)

β=softmax(wTRT)

其中,α为上下文词的注意力机制系数,β为目标词的注意力机制系数,wC为上下文词的词矩阵,wT为目标词的词矩阵;

利用所述上下文词和目标词的注意力机制系数,对所述上下文向量和目标词向量进行加权求和,获得新的上下文向量和目标词向量:其中,所述rC为新的上下文向量,rT为新的目标词向量,n为上下文中的词语数,m为用户语料中目标词中包含的词语数,αi为第i个上下文词的注意力机制系数,βj为第j个目标词的注意力机制系数, 为第i个上下文词的注意力权重系数, 为第j个目标词的注意力权重系数。

2.根据权利要求1所述的情感分析方法,其特征在于:所述将所述目标词中的词语与Glove模型预训练的目标词向量进行匹配,将所述上下文中的词语与Glove模型预训练的上下文词向量进行匹配,获取目标词嵌入矩阵和上下文词嵌入矩阵;将所述目标词嵌入矩阵和上下文词嵌入矩阵输入门控循环单元获得所述上下文词嵌入矩阵和目标词嵌入矩阵的隐藏层输出的步骤包括:将所述用户语料中的目标词和上下文输入Glove模型,获取预训练的目标词向量和上下文词向量;

将所述目标词中的词语与Glove模型预训练的目标词向量进行匹配,将所述上下文中的词语与Glove模型预训练的上下文词向量进行匹配,获取目标词嵌入矩阵和上下文词嵌入矩阵;

对目标词嵌入矩阵进行平均池化操作,按照以下方式得到目标词嵌入矩阵的均值向量:其中, 表示目标词 的词向量,t表示均值向量,m为用户语料中目标词中包含的词语数;

将上下文词嵌入矩阵中的每个元素与所述均值向量拼接,更新上下文词嵌入矩阵;

将所述目标词嵌入矩阵和上下文词嵌入矩阵分别输入门控循环单元获得所述上下文词嵌入矩阵和目标词嵌入矩阵的隐藏层输出。

3.根据权利要求1所述的情感分析方法,其特征在于:所述将所述新的上下文向量和目标词向量进行拼接,并通过分类器进行分类,得到所述目标词的情感分析结果的步骤包括:按照以下方式将所述新的上下文向量和目标词向量进行拼接:

其中,所述rC为新的上下文向量,rT为新的目标词向量,r为拼接后的词向量;

利用softmax分类器进行分类,按照以下方式获得所述目标词的情感极性,得到所述目标词的情感分析结果:x=Wrr+br

其中,Wr为参数矩阵,br为偏置向量,C为分类总数,x为分类向量,xi为第i个分类向量,xj为第j个分类向量, yi为目标词被判定为第i类情感极性的情感分析结果。

4.一种情感分析系统,其特征在于:包括:

获取模块,用于获取用户语料中的目标词和上下文;

隐藏层输出获取模块,用于将所述目标词中的词语与Glove模型预训练的目标词向量进行匹配,将所述上下文中的词语与Glove模型预训练的上下文词向量进行匹配,获取目标词嵌入矩阵和上下文词嵌入矩阵;将所述目标词嵌入矩阵和上下文词嵌入矩阵输入门控循环单元获得所述上下文词嵌入矩阵和目标词嵌入矩阵的隐藏层输出;

向量获取模块,用于将所述上下文词嵌入矩阵和目标词嵌入矩阵的隐藏层输出作为计算参数,基于注意力机制计算上下文和目标词的注意力机制系数,根据所述注意力机制系数对上下文向量和目标词向量进行加权求和,获取新的上下文向量和目标词向量;

情感分析结果获取模块,用于将所述新的上下文向量和目标词向量进行拼接,并通过分类器进行分类,得到所述目标词的情感分析结果;

所述向量获取模块包括:

注意力机制系数矩阵获取单元,用于按照以下方式获取上下文和目标词之间的注意力机制系数矩阵:其中,relu表示激活函数, 是HC的转置矩阵,HC是上下文词嵌入矩阵的隐藏层输出,W是参数矩阵,HT是目标词嵌入矩阵的隐藏层输出,H是上下文和目标词之间的注意力机制系数矩阵;

注意力权重系数获取单元,用于基于注意力机制系数矩阵,按照以下方式获取上下文词和目标词的注意力权重系数:RC=relu(WCHC+WTHTHT)

RT=relu(WTHT+WCHCH)

其中,WC和WT是上下文词和目标词的参数矩阵,HT为H的转置矩阵;

注意力机制系数计算单元,用于基于自注意力机制,按照以下方式计算上下文词和目标词的注意力机制系数:α=softmax(wCRC)

β=softmax(wTRT)

其中,α为上下文词的注意力机制系数,β为目标词的注意力机制系数,wC为上下文词的词矩阵,wT为目标词的词矩阵;

向量获取单元,用于利用所述上下文词和目标词的注意力机制系数,对所述上下文向量和目标词向量进行加权求和,获得新的上下文向量和目标词向量:其中,所述rC为新的上下文向量,rT为新的目标词向量,n为上下文中的词语数,m为用户语料中目标词中包含的词语数,αi为第i个上下文词的注意力机制系数,βj为第j个目标词的注意力机制系数, 为第i个上下文词的注意力权重系数, 为第j个目标词的注意力权重系数。

5.根据权利要求4所述的情感分析系统,其特征在于:所述隐藏层输出获取模块包括:词向量获取单元,用于将所述用户语料中的目标词和上下文输入Glove模型,获取预训练的目标词向量和上下文词向量;

词嵌入矩阵获取单元,用于将所述目标词中的词语与Glove模型预训练的目标词向量进行匹配,将所述上下文中的词语与Glove模型预训练的上下文词向量进行匹配,获取目标词嵌入矩阵和上下文词嵌入矩阵;

平均池化单元,用于对目标词嵌入矩阵进行平均池化操作,按照以下方式得到目标词嵌入矩阵的均值向量:其中, 表示目标词 的词向量,t表示均值向量,m为用户语料中目标词中包含的词语数;

更新单元,用于将上下文词嵌入矩阵中的每个元素与所述均值向量拼接,更新上下文词嵌入矩阵;

隐藏层输出获取单元,用于将所述目标词嵌入矩阵和上下文词嵌入矩阵分别输入门控循环单元获得所述上下文词嵌入矩阵和目标词嵌入矩阵的隐藏层输出。

6.根据权利要求4所述的情感分析系统,其特征在于:所述情感分析结果获取模块包括:拼接单元,用于按照以下方式将所述新的上下文向量和目标词向量进行拼接:其中,所述rC为新的上下文向量,rT为新的目标词向量,r为拼接后的词向量;

情感分析结果获取单元,用于利用softmax分类器进行分类,按照以下方式获得所述目标词的情感极性,得到所述目标词的情感分析结果:x=Wrr+br

其中,Wr为参数矩阵,br为偏置向量,C为分类总数,x为分类向量,xi为第i个分类向量,xj为第j个分类向量, yi为目标词被判定为第i类情感极性的情感分析结果。

7.一种计算机可读存储介质,其上储存有计算机程序,其特征在于:该计算机程序被处理器执行时实现如权利要求1-3任意一项所述的情感分析方法的步骤。

8.一种计算机设备,其特征在于:包括存储器、处理器以及存储在所述存储器中并可被所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-3中任意一项所述的情感分析方法的步骤。