利索能及
我要发布
收藏
专利号: 202010214894X
申请人: 杭州电子科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于上下文感知嵌入的细粒度情感分析方法,其特征在于包括如下步骤:步骤1、对需要进行情感分析的数据文本进行预处理;

步骤2、将处理好的数据文本输入预训练模型中,获得固定长度的句子向量;

步骤3、将句子向量输入胶囊网络的WordCaps层,通过动态路由算法,利用平方欧几里得损失函数获取方面类型对应的极度相似的相关上下文信息;

步骤4、将相关上下文信息与方面词结合,得到重构的方面类型;

步骤5、将重构的方面向量输入胶囊网络的ApsectCaps层,通过动态路由算法进行情感分析,得到不同方面的情感极性;

步骤1具体实现如下:

1.1.将在整个数据文本的语料库中仅出现一次的单词删除并使用UNK标记进行替换;

1.2.删除少于5个单词的句子;

步骤2具体实现如下:

2.1.用BERT词向量模型将每一条句子表示为句子向量形式ht={w1,w2…wn},n是句子长度即该句子对应的单词的个数;

步骤3具体实现如下:

3.1.将输入的句子向量中的每个单词wi都分别当做一个胶囊,从而组成胶囊网络的第一层,也就是WordCaps层;使用激活函数得到每个胶囊的预测向量,该预测向量表示WordCaps层的第t个胶囊属于AspectCaps层的第i个胶囊的可能性,该预测向量的公式可表示为:其中,t∈{1,2,...,n},表示句子的单词个数即胶囊的个数,σ表示激活函数,和 是需要通过训练学习的参数;DA和DH是已知参数,其中DA表示AspectCaps层的预测向量的维度;

3.2.从WordCaps层到AspectCaps层动态路由每个单词的预测向量,通过预测概率来确定每个方面类型对应的上下文信息si,所述的方面类型是指胶囊对应的类型,每个胶囊对应一个方面类型;

所述的上下文信息si的公式可表示为:

其中,ci|t是WordCaps层第t个胶囊和AspectCaps层第i个胶囊之间的协议值,是动态路由自动学习的参数;

3.3.对于确定第i个方面类型对应的上下文信息si,使用的损失函数为平方欧几里得损失函数,其公式为:其中,K指代AspectCaps层的方面类型的数量;ai表示给定的数据文本每个单词对应的真实的方面类型。

2.根据权利要求1所述的基于上下文感知嵌入的细粒度情感分析方法,其特征在于步骤4具体实现如下:

4.1.对于得到的上下文信息si,将其与对应的方面类型进行重构,其公式可表示为:其中, 为最终的方面类型,α是超参数,表示为控制方面类型和上下文信息之间影响的参数。

3.根据权利要求2所述的基于上下文感知嵌入的细粒度情感分析方法,其特征在于步骤5具体实现如下:

5.1.将最终的方面类型 进行挤压,使方面类型 的长度在[0,1]区间,其公式可表示为:

5.2.将挤压得到的向量ua使用激活函数得到方面胶囊,组成胶囊网络的第二层即AspectCaps层,其公式可表示为:其中,p∈{1,2,3},表示不同的极性,这里极性共有3种,分别是:积极、消极和中立;且积极、消极以及中立这3种不同的极性构成胶囊网络的第三层,即情感分类器;σ表示激活函数, 和 是需要通过训练学习的参数;

5.3.利用动态路由算法对AspectCaps层的方面胶囊进行情感极性分类,其公式可表示为:其中,DYNAMIC ROUTING表示动态路由算法,与步骤3的3.2中使用的动态路由算法相同;iterintent表示动态路由的迭代次数;

5.4.情感分类器的结果所采用的损失函数为边界损失函数,其公式可表示为:其中, 表示AspectCaps层的第i个方面类型的真实情感极性,当第i个方面类型属于情感分类器的第j个情感极性时,