1.一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,具体包括以下步骤:从数据平台以及社交平台提供的API接口中获取包含谣言、非谣言和评论转发消息的多类型话题信息以及相关用户信息;
基于话题和用户特征,从各个话题中将用户关系、转发关系、用户行为、评论信息进行特征提取,提取的特征包括消息自带属性和用户情感影响因素,消息自带属性包括信息基本属性和评论观点分歧度,用户情感影响因素包括用户消息的情感度和用户信誉度;
通过长短期记忆网络模型从信息基本属性、评论观点分歧度、用户消息的情感度、用户信誉度中提取得到用于前期融合和后期融合的特征;
利用得到的特征基于注意力机制和分类器构建前期融合结果和后期融合结果;
使用Dempster组合规则对得到的前期融合结果和后期融合结果进行融合,得到融合后的混合融合结果,即得到预测结果。
2.根据权利要求1所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,信息基本属性包括:MAttri(mi)={text(mi),emojiNums(mi),urlNums(mi),tagNums(mi)};
其中,text(mi)表示用户评论mi的基础语义内容,emojiNums(mi)表示用户评论mi包含的表情符号的数量,urlNums(mi)表示用户评论mi包含的URL数量,tagNums(mi)表示用户评论mi包含的hashTag的数量。
3.根据权利要求1所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,评论观点分歧度包括:其中,Wsenti(mi)为用户评论mi的情感强度因子,Senti(mi)为用户评论mi的情感值;P{y=Senti(mi)|C}表示当用户的情感值y的值为Senti(mi)时,用户的情感值在评论集合C中的情感分布概率。
4.根据权利要求1所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,用户消息的情感度的计算包括:其中,NSenti(mi)表示用户评论mi的情感度;wt表示用户评论mi分词后的词语;SentiDic表示包含情感值的情感词典;SentiDeg(wt)表示基于BosonNLP情感词典进行得分计算的wt的情感值,AdvDeg(wt)表示修饰wt的程度副词的程度值。
5.根据权利要求4所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,通过情感互影响力对用户消息的情感度进行修正,包括:综合用户内部因素和外部因素,使用多元线性回归算法,构造用户情感影响力函数,根据函数计算得到用户ui支持、反对话题的情感影响力;
获取支持、反对当前用户评论mi的比例,结合用户ui支持、反对话题的情感影响力计算用户支持、反对用户评论mi的收益;
基于用户支持、反对用户评论mi的收益计算用户ui的支持、反对话题的正负情感互影响力;
根据用户ui的支持、反对话题的正负情感互影响力对用户消息的情感度进行修正,包括:其中,Senti(mi)为修正后用户消息的情感度;α、β为调整系数;Mutsup(ui)为用户ui的支持话题的正负情感互影响力,Mutobj(ui)为用户ui的反对话题的正负情感互影响力。
6.根据权利要求5所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,用户ui的支持话题的正负情感互影响力表示为:用户ui的反对话题的正负情感互影响力表示为:
其中,Prosup(ui)表示用户支持话题的收益,表示为Prosup(ui)=P1×Infsup(ui),Infsup(ui)为用户ui支持话题的情感影响力,P1为支持话题的比例;Proobj(ui)为用户ui反对话题的情感影响力,表示为Proobj(ui)=P2×Infobj(ui),Infobj(ui)为用户ui反对话题的情感影响力,P2为反对话题的比例。
7.根据权利要求6所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,用户ui支持话题的情感影响力表示为:用户ui反对话题的情感影响力表示为:
其中, 为用户ui支持话题的情感影响力函数中训练得到的多元线
性回归算法的偏回归系数; 为用户ui支持话题情感的内部驱动因素,表示为FriNum(ui)表示用户ui参与话题的好友数量,FriSupNum(ui)表示用户ui好友中持正向态度的个数; 为用户支持话题的内部影响因素,表示为 posWord(mi)为用户评论mi中积极词汇出现的个数,negWord(mi)为用户评论mi中消极词汇出现的个数; 为用户ui反对话题的情感影响力函数中训练得到的多元线性回归算法的偏回归系数; 为用户反对话题的内部影响因素,表示为为用户反对话题的外部影响因素,表示为
8.根据权利要求1所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,用户信誉度包括:Cre(ui)=baseCre(ui)+authCra(ui)+α×fansNum(ui);
其中,baseCre(ui)表示用户ui的基础信誉度,authCra(ui)表示用户ui的官方账号等级,fansNum(ui)表示用户ui的粉丝数;α∈[0,1]为衰减因子。
9.根据权利要求2所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,获取前期融合特征和后期融合特征并利用Dempster组合规则对得到的前期融合特征和后期融合特征进行融合具体包括以下步骤:将信息基本属性、评论观点分歧度、用户信誉度以及用户的情感值拼接在一起输入预训练的长短期记忆网络模型提取得到对应的特征;
将信息基本属性、评论观点分歧度、用户信誉度以及用户的情感值通过注意力机制获取对应的注意力权重;
利用注意力权重对预训练的长短期记忆网络模型提取的特征加权求和,得到前期融合结果;
将预训练的长短期记忆网络模型提取的信息基本属性、评论观点分歧度、用户信誉度以及用户的情感值特征分别输入一个全连接层;
利用注意力权重对全连接层的输出进行加权求和,得到后期融合结果;
基于Dempster组合规则对后期融合结果和后期融合结果进行融合,得到一个信息的谣言和非谣言概率分配,包括:其中,P(n,r|topic)为信息的谣言和非谣言概率分配,A为P(n,r|topic)的取值空间,表示为A∈{谣言,非谣言};mE(B)为前期融合证据B的概率分配,即前期融合结果;mL(C)为后期融合证据C的概率分配,即后期融合结果;B为前期融合的特征空间,C为后期融合的特征空间;K为特征之间的冲突程度。
10.根据权利要求8所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,利用长短期记忆网络模型建立谣言检测模型时,将情感倾向Senti(mi)、评论观点分歧度MDiff(mi)、信息基本属性MAttri(mi)以及用户信誉度Cre(ui)四种特征作为模型的输入,谣言检测模型表示为:其中,Y表示谣言检测模型的输出,当Y=1表示话题topic为谣言话题,当Y=0表示话题topic为非谣言话题;P(r|topic)为当前话题topic为谣言的概率;P(n|topic)为当前话题topic为非谣言的概率;P(n,r|topic)为当前话题topic为谣言和非谣言概率的集合。