利索能及
我要发布
收藏
专利号: 2018100868169
申请人: 南京邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-04-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种评论文本情感分类模型训练方法,其特征在于,包括如下步骤:

(1)获取包括评论文本、与所述评论文本关联的主体和客体信息的训练集文本;

(2)将训练集的评论文本中单词转变成词向量表示,输入到第一层Bi-LSTM网络中,再结合前后向隐藏层输出向量乘以单词级评论文本关联的主体和客体信息注意力机制训练出的权重,提取句子级特征表示;

(3)将句子级特征表示输入到第二层Bi-LSTM网络中,结合前后向隐藏层输出向量乘以句子级评论文本关联的主体和客体信息注意力机制训练出的权重,提取评论文本的文档级特征表示;

(4)采用双曲正切非线性映射函数将即得的文档级语义特征映射至情感类别空间,采用softmax分类,对模型中的参数进行训练,得到最优文本情感分类模型。

2.根据权利要求1所述的评论文本情感分类模型训练方法,其特征在于,步骤(2)中,基于单词级注意力机制提取得到的第i个句子的句子级语义特征 其中, 表示第i个句子中第j个词 的重要程度,T是第i个句子中词的数量, 为第一层Bi-LSTM网络中的前向LSTM模型的输出 和后向LSTM模型的输出 的结合;

其中, 公式

表示 评论主体文本信息u和评论客体文本信息p对词 重要程度的计算,其中参数矩阵WH、WU、WP和向量v、b在训练过程中不断优化得到最优值。

3.根据权利要求1所述的评论文本情感分类模型训练方法,其特征在于,步骤(3)中,基于句子级注意力机制提取得到的文档级特征 其中,βi表示文档中第i个句子yi的重要程度,M是文档中句子的数量, 为第二层Bi-LSTM网络中的前向LSTM模型的输出 和后向LSTM模型的输出 的结合; 其中,e(hi,u,p)=vTtanh(WHhi+WUu+WPp+b),公式e(hi,u,p)表示hi、评论主体文本信息u和评论客体文本信息p对句子yi重要程度的计算,其中参数矩阵WH、WU、WP和向量v、b在训练过程中不断优化得到最优值。

4.根据权利要求1所述的评论文本情感分类模型训练方法,其特征在于,步骤(4)中包括:(4.1)采用双曲正切tanh非线性映射函数将即得的文档级语义特征d映射到情感类别数目为C的情感类别空间, 其中Wc是文档特征d的参数矩阵,bc是偏差向量,参数矩阵及偏差向量由训练过程优化得出最优值;

(4.2)利用softmax分类器决策判决得到文本情感类别,使用交叉熵损失函数作为模型训练的优化目标,通过反向传播BP算法计算损失函数梯度同时不断更新模型中相关参数得到最优模型。

5.根据权利要求4所述的评论文本情感分类模型训练方法,其特征在于,利用softmax分类器决策判决得到文本情感类别的计算公式为:其中, 是文档语义特征映射为情感类别为c的表示,pc是文本情感类别为c的预测概率。

6.根据权利要求5所述的评论文本情感分类模型训练方法,其特征在于,所述交叉熵损失函数的计算公式为:其中,训练集 bi是训练集中的第i个样本文本,yi是样本bi的基准的情感标签,N是训练集大小; 即如果文本情感分类为c,那么 的值为1,否则的值为0;pc是文本情感类别为c的预测概率。

7.一种使用根据权利要求1所述的评论文本情感分类模型训练方法得到的文本情感分类模型进行文本情感分类的方法,其特征在于,包括如下步骤:获取包括评论文本、与所述评论文本关联的主体和客体信息的测试集文本;

将测试集文本输入至所述的最优文本情感分类模型中进行预测得到情感类别。

8.一种评论文本情感分类模型训练装置,其特征在于,包括:

获取模块,用于获取包括评论文本、与所述评论文本关联的主体和客体信息的训练集文本;

句子级特征提取模块,用于将训练集文本的评论文本中单词转变成词向量表示,输入到第一层Bi-LSTM网络中,再结合前后向隐状态输出矢量乘以单词级评论文本关联的主体和客体信息注意力机制训练出的权重,提取句子级特征表示;

文档级特征提取模块,用于将句子级特征表示输入到第二层Bi-LSTM网络中,结合前后向隐状态输出矢量乘以句子级评论文本关联的主体和客体信息注意力机制训练出的权重,提取评论文本的文档级特征表示;

以及,训练模块,用于采用双曲正切非线性映射函数将即得的文档级语义特征映射至情感类别空间,采用softmax分类,对模型中的参数进行训练,得到最优文本情感分类模型。

9.一种使用根据权利要求1所述的评论文本情感分类模型训练方法得到的文本情感分类模型进行文本情感分类的装置,其特征在于,包括:获取模块,用于获取包括评论文本、与所述评论文本关联的主体和客体信息的测试集文本;

以及,分类预测模块,用于将测试集文本输入至所述的最优文本情感分类模型进行预测得到情感类别。

10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-6所述的评论文本情感分类模型训练方法或者实现权利要求7所述的文本情感分类方法。