欢迎来到利索能及~ 联系电话:18621327849
利索能及
我要发布
收藏
专利号: 2022105955687
申请人: 华南师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-10-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于情感分析的文本语句处理方法,其特征在于,包括以下步骤:

获取样本语句以及与所述样本语句的相关联的若干组四元组标签信息;

获取样本语句的初始句子序列,根据所述样本语句的初始句子序列以及四元组标签信息,构建所述样本语句的四元组标签序列;

将所述样本语句的初始句子序列以及四元组标签序列输入至预设的词嵌入模型,获取所述词嵌入模型输出的第一损失值;

基于所述样本语句的四元组标签序列,构建与所述样本语句对应的若干组正例查询语句序列以及对应的若干组负例查询语句序列;

将所述若干组正例查询语句序列划分为若干个类型对应的样本正例查询语句序列,获取所述若干组正例查询语句序列对应的样本查询语句序列,根据所述样本正例查询语句序列,获取所述词嵌入模型输出的第二损失值;

将所述样本语句对应的正例查询语句序列以及负例查询语句序列进行拼接,获取若干组四元组表示,获取标签训练集,所述标签训练集包括所述若干组四元组表示对应的真实标签值,将所述若干组四元组表示以及标签训练集输入至预设的全连接网络中,获取所述全连接网络输出的第三损失值;

根据所述第一损失值、第二损失值以及第三损失值,构建所述词嵌入模型的损失函数,重复将所述样本语句的初始句子序列以及四元组标签序列输入至所述词嵌入模型的词嵌入模型中,进行迭代训练,直到满足训练停止条件,获取训练好的词嵌入模型;

获取待测样本语句,将所述待测样本语句输入至所述训练好的词嵌入模型,获取所述训练好的词嵌入模型输出的所述待测样本语句的情感分析结果。

2.根据权利要求1所述的基于情感分析的文本语句处理方法,其特征在于:所述样本语句包括若干个单词,所述单词包括方面词以及观点词,所述四元组标签信息包括与所述样本语句相关联的特定词以及标记词,所述特定词包括特定方面词以及特定观点词,标记词包括方面词种类以及情感极性。

3.根据权利要求2所述的基于情感分析的文本语句处理方法,其特征在于,所述根据所述样本语句的初始句子序列以及四元组标签信息,构建所述样本语句的四元组标签序列,包括步骤:对于每一组四元组标签信息,根据所述特定词在所述样本语句的初始句子序列上的位置索引,获取特定词索引向量,其中,所述特定词索引信息包括方面词索引向量以及观点词索引向量;

根据所述标记词在预设的映射表上的相应列表的索引,获取标记词索引向量,其中,所述标记词索引向量包括方面词种类索引向量以及情感极性索引向量;

将所述特定词索引向量以及标记词索引向量进行组合,获取各组四元组标签信息对应的四元组标签表示,将所述各组四元组标签表示进行组合,构建所述样本语句的四元组标签序列。

4.根据权利要求3所述的基于情感分析的文本语句处理方法,其特征在于,所述将所述样本语句的初始句子序列以及四元组标签序列输入至预设的词嵌入模型,获取所述词嵌入模型输出的第一损失值,包括步骤:获取所述样本语句的初始句子序列对应的词嵌入表示,将所述词嵌入表示进行编码处理,获取所述样本语句的多维句子序列;

确定所述四元组标签序列的各个四元组标签表示的对应的目标词,获取所述各个四元组标签表示对应的目标词的索引向量,进行组合,构建所述四元组标签序列对应的目标标签序列,并获取所述目标标签序列对应的词嵌入表示,其中,所述目标标签序列对应的词嵌入表示包括目标词为方面词种类对应的词嵌入表示以及目标词为情感极性对应的词嵌入表示;

根据所述样本语句的多维句子序列以及四元组标签序列对应的目标标签序列,获取所述样本语句的状态表示;

根据所述样本语句的词嵌入表示、多维句子序列、多维状态表示、所述目标标签序列对应的词嵌入表示以及预设的第一损失值计算算法,获取所述第一损失值,其中,所述第一损失值计算算法为:式中, 为所述样本语句的多维句子序列; 为 经所述词嵌入模型的线性层的输出; 为所述样本语句的词嵌入表示; 为所述线性层的权重矩阵; 为概率分布; 为所述目标词为方面词种类对应的词嵌入表示; 为所述目标词为情感极性对应的词嵌入表示; 为所述样本语句的状态表示; 为所述第一损失值;m为所述目标标签序列的长度, 为所述四元组标签序列的索引向量,X为所述样本语句的初始句子序列,t为时间步进, 为归一化函数。

5.根据权利要求4所述的基于情感分析的文本语句处理方法,其特征在于,所述构建与所述样本语句对应的若干组正例查询语句序列以及对应的若干组负例查询语句序列,包括步骤:结合预设的上下文信息,以及所述四元组标签序列中的各个四元组标签表示对应的目标词的索引向量,构建所述样本语句的若干个正例语句表示;

获取任意一个所述样本语句的单词对应的索引向量,对所述正例语句表示中的目标词的索引向量进行替换,构建对应的若干组负例语句表示;

将所述样本语句的初始句子序列分别与每个正例语句表示、负例语句表示进行组合,获取若干组正例查询语句序列以及负例查询语句序列。

6.根据权利要求5所述的基于情感分析的文本语句处理方法,其特征在于,所述根据所述样本正例查询语句序列,获取所述词嵌入模型输出的第二损失值,包括步骤:根据预设的训练批次,将所述样本正例查询语句序列划分为若干个样本正例查询语句序列训练集,其中,所述样本正例查询语句序列训练集包括若干组样本正例查询语句序列;

根据所述若干个样本正例查询语句序列训练集以及预设的第二损失值计算算法,获取各个样本正例查询语句序列训练集对应的第二损失值,将所述各个样本正例查询语句序列训练集对应的第二损失值进行累加,作为所述词嵌入模型输出的第二损失值,其中,所述第二损失值计算算法为:式中, 为当前样本正例查询语句序列训练集中索引为j的样本正例查询语句序列和索引为c的样本正例查询语句序列之间的第二损失值,h为样本正例查询语句序列,j、k、c为所述样本正例查询语句序列的第一索引参数、第二索引参数以及第三索引参数, 为与属于同种类型的样本正例查询语句序列, 为全部样本正例查询语句序列;若 ,,反之 ;为温度参数; 为内积函数;N为 与 相同类型的样本正例查询语句序列的数目, 表示 与 的类型相同的样本正例查询语句序列的数目,B为训练批次。

7.根据权利要求6所述的基于情感分析的文本语句处理方法,其特征在于,所述将所述若干组四元组表示以及标签训练集输入至预设的全连接网络中,获取所述全连接网络输出的第三损失值,包括步骤:根据所述四元组表示以及预设的预测标签值计算算法,获取各个四元组表示对应的预测标签值,其中,所述预测标签值计算算法为:式中,为所述预测标签值,W为所述全连接网络的权重参数, 为所述四元组表示,,其中, 为所述正例查询语句序列, 为所述负例查询语句序列,b为所述全连接网络的偏置参数;

根据所述训练批次,将所述四元组表示划分为若干个四元组表示训练集,其中,所述四元组表示训练集包括若干组四元组表示;

根据所述若干个四元组表示训练集中各个四元组表示对应的预测标签值、真实标签值以及预设的第三损失值计算算法,获取各个四元组表示训练集对应的第三损失值,将所述各个四元组表示训练集对应的第三损失值进行累加,作为所述全连接网络输出的第三损失值,其中,所述第三损失值计算算法为:式中, 为当前四元组表示训练集的第三损失值, 为当前四元组表示训练集中第q个四元组表示对应的属于p类别的真实标签值,其中,p类别包括正例类别以及负例类别,用于区分所述四元组表示属于正例表示还是负例表示; 为当前四元组表示训练集中第q个四元组表示对应的属于p类别的预测标签值。

8.一种基于情感分析的文本语句处理装置,其特征在于,包括:

第一获取模块,用于获取样本语句以及与所述样本语句的相关联的若干组四元组标签信息;

第二获取模块,用于获取样本语句的初始句子序列,根据所述样本语句的初始句子序列以及四元组标签信息,构建所述样本语句的四元组标签序列;

第一损失值计算模块,用于将所述样本语句的初始句子序列以及四元组标签序列输入至预设的词嵌入模型,获取所述词嵌入模型输出的第一损失值;

查询语句构建模块,用于基于所述样本语句的四元组标签序列,构建所述样本语句的若干组正例查询语句序列以及对应的若干组负例查询语句序列;

第二损失值计算模块,用于将所述若干组正例查询语句序列划分为若干个类型对应的样本正例查询语句序列,获取所述若干组正例查询语句序列对应的样本查询语句序列,根据所述样本正例查询语句序列,获取所述词嵌入模型输出的第二损失值;

第三损失值计算模块,用于将所述样本语句对应的正例查询语句序列以及负例查询语句序列进行拼接,获取若干组四元组表示,获取标签训练集,所述标签训练集包括所述若干组四元组表示对应的真实标签值,将所述若干组四元组表示以及标签训练集输入至预设的全连接网络中,获取所述全连接网络输出的第三损失值;

训练模块,用于根据所述第一损失值、第二损失值以及第三损失值,构建所述词嵌入模型的损失函数,重复将所述样本语句的初始句子序列以及四元组标签序列输入至所述词嵌入模型的词嵌入模型中,进行迭代训练,直到满足训练停止条件,获取训练好的词嵌入模型;

分析模块,用于获取待测样本语句,将所述待测样本语句输入至所述训练好的词嵌入模型,获取所述训练好的词嵌入模型输出的所述待测样本语句的情感分析结果。

9.一种计算机设备,其特征在于,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如权利要求

1至7中任一项所述的基于情感分析的文本语句处理方法的步骤。

10.一种存储介质,其特征在于:所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于情感分析的文本语句处理方法的步骤。