1.一种基于交互关系的用户影响力分析方法,其特征在于,包括以下步骤:
S1、基于微博公开的数据资源,采用爬虫技术采集特定微博话题中的用户信息;
S2、根据用户信息构建微博交互信息模型并设置用户的影响力的初始值;
S3、通过微博交互信息模型获取转发强度、评论强度和提及强度,并通过转发强度、评论强度和提及强度计算交互强度因子;
S4、利用交互强度因子改进PageRank算法,并通过改进的PageRank算法测量用户的影响力,得出影响力排名。
2.根据权利要求1所述的一种基于交互关系的用户影响力分析方法,其特征在于,用户信息包括微博文本信息、微博被转发次数、微博被评论次数、微博被提及次数以及用户在微博所进行的互动信息和用户的基本信息,其中互动信息包括评论、转发、提及关系,用户基本信息包括粉丝数、关注数和关注关系。
3.根据权利要求1所述的一种基于交互关系的用户影响力分析方法,其特征在于,构建微博交互信息模型包括:将微博系统的用户关系网络定义为一带权有向图,有向图的节点代表微博系统中的用户,有向图的边代表微博系统中用户之间的关系;微博系统中用户之间的关系构建微博交互信息模型,其中微博系统中用户之间的关系包括传播关系、转发关系以及评论关系。
4.根据权利要求3所述的一种基于交互关系的用户影响力分析方法,其特征在于,当用户vj为用户vi的粉丝时,则用户vj和用户vi之间具有传播关系,在带权有向图中表示为sr=(mi,
5.根据权利要求3所述的一种基于交互关系的用户影响力分析方法,其特征在于,所述将微博系统的用户关系网络定义为一带权有向图包括:UR=(V,E,P,W);
其中,V表示节点的集合,节点包括微博用户和微博用户发表的微博;E表示有向边的集合,有向边包括微博用户指向微博用户的有向边、微博指向微博的有向边以及微博用户指向微博的有向边;P表示节点权重的集合,W表示边权重集合。
6.根据权利要求1所述的一种基于交互关系的用户影响力分析方法,其特征在于,通过微博交互信息模型获取转发强度表示为:其中,Tweets(vi)表示用户vi的所发微博数量,Retweeted(vj)表示用户vj转发微博的数量,Retweeted(vj,m)表示用户vj转发其他人微博的数量,Retweeted(vj,vi)表示用户vj转发用户vi微博的数量。
7.根据权利要求1所述的一种基于交互关系的用户影响力分析方法,其特征在于,通过微博交互信息模型获取评论强度表示为:其中,Tweets(vi)表示用户vi的所发微博数量,Retweeted(vj)表示用户vj转发微博的数量,Commented(vj)表示用户vj被评论的微博数量,Comment(vj,vi)表示用户vj评论用户vi微博的数量,Comment(vj,m)表示用户vj评论其他人微博的数量。
8.根据权利要求1所述的一种基于交互关系的用户影响力分析方法,其特征在于,通过微博交互信息模型获取提及强度表示为:其中,Tweets(vi)表示用户vi的所发微博数量,Retweeted(vj)表示用户vj转发微博的数量,Mentioned(vj)表示用户vi所提及的微博数量,Mention(vj,vi)表示用户vj提及用户vi微博的数量,Mention(vj,m)表示用户vj提及其他人微博的数量。
9.根据权利要求1所述的一种基于交互关系的用户影响力分析方法,其特征在于,交互强度因子IS(vi,vj)表示为:其中,RT(vi,vj)表示微博用户vi转发微博用户vj的微博的转发强度,RT(vi,vj)表示微博用户vi评论微博用户vj的微博的评论强度,MN(vi,vj)表示微博用户vi提及微博用户vj的微博的提及强度。
10.根据权利要求9所述的一种基于交互关系的用户影响力分析方法,其特征在于,改进的PageRank算法表示为:其中,d为阻尼系数;Followers(vi)表示用户vi的追随者集合,Is(vi,vj)表示交互强度因子,IRPR(vj)表示用户vi的影响力,PR(vj)为用户vj的影响力。