1.一种基于知识迁移的跨领域情感分析方法,其特征在于,包括以下步骤:构建语义网络,将精炼后的文本与conceptNet结合起来,构成一个语义网络;
提取语义特征,通过RGCN对语义网络进行处理,得到图的特征表示,所述RGCN将一个异构网络划分成多个同构网络来处理,将指向内外的节点都作为邻接点,同时加入自循环特征,进行特征融合,参与节点更新;
定义传播模型,用于计算图中vi表示的实体或节点的前向传递更新:其中:
表示节点vi在第l层的隐藏状态;
σ表示激活函数;
W表示权重矩阵;
表示关系r下节点i的邻接索引集合;
Ci,r表示一个特定于问题的归一化常数,预先学习或选择;
RGCN处理步骤为:
(1)根据公式(1)计算图形中单个节点的状态;
(2)收集来自相邻节点的激活,然后分别为每个关系类型进行变换,就会得到2N种关系类型;
(3)将所得到的各种关系类型的表示和自循环特征以归一化和的形式累积,并通过激活函数,即得到最终的特征表示,这样每个节点的更新都与整个图中的共享参数并行计算;
域对抗训练,包括特征提取器、域分类器和类别预测器,将两个毫不相关的领域之间的特征进行迁移学习;
所述特征提取器将提取的源域和目标域的文本信息通过多层神经网络的映射得到文本特征表示M(xs/t),然后将提取的特征表示分别传入类别预测器和域分类器;
所述类别预测器,对特征提取器提取到的文本信息进行标签分类,区分不同领域的文本信息;类别预测器所采用的损失函数为:其中:K为已标记样本总数;M(xs)为源域的样本信息;C为训练的分类器,使用softmax作为激活函数的神经网络模型;
所述域分类器,对特征提取器提取到的文本信息进行域分类,判断传入的信息到底是来自源域还是目标域,并计算损失,域分类器所采用的损失函数为交叉熵损失函数,交叉熵用来度量两个概率分布间的差异性;
Ldomain=‑logDadv(M(xs))‑log(1‑Dadv(M(xt))其中:M(xt)为目标域的样本信息;Dadv(M(xs))表示样本在源域的概率;Dadv(M(xt))表示样本在目标域的概率;
所以,综上最终训练出来的模型参数满足以下关系:θ=arg min max(Llabel+λLdomain)其中:λ表示超参数。
2.根据权利要求1所述一种基于知识迁移的跨领域情感分析方法,其特征在于:所述构建语义网络具体包括:
1.1用一个三元组<节点1,关系,节点2>来表示图,提取评论集的关键信息,并将其设置为节点,观察与其他节点之间的关系;
1.2将原始数据集进行处理,使用分词工具,将其划分为短语,并忽略去停词,得到第一精炼文本信息;
1.3对步骤1.2中的第一精炼文本信息继续进行精炼提取,取出在文本中出现频率高的词语,得到精炼后的文本;
1.4将精炼后的文本与conceptNet构建异构图网络,得到一个语义网络。
3.根据权利要求1所述一种基于知识迁移的跨领域情感分析方法,其特征在于:所述特征提取器将源域样本和目标域样本进行映射和混合,将提取的信息传入域分类器;
所述域分类器判断传入的信息到底是来自源域还是目标域,并计算损失;
所述类别预测器对来自源域的数据进行分类。
4.一种计算机可读存储介质,其特征在于:该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现如权利要求1‑3任一项所述的基于知识迁移的跨领域情感分析方法。