利索能及
我要发布
收藏
专利号: 2016104539956
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种面向社交网络的用户关系分析方法,其特征在于包括以下步骤:(1)利用网络爬虫或者通过各社交网站开放API平台获取原始数据;

(2)提取用户的个人属性、用户的好友关系信息以及用户的社团信息,根据所提取的信息建立个人兴趣影响因子函数、好友关系影响因子函数和社团驱动影响因子函数;

所述个人兴趣影响因子函数为

其中,yk表示用户之间是否存在链接,如果存在,则yk=1,反之为0; 表示个人兴趣方面的第i个特征, 表示用户个人兴趣特征和用户关系的相关性;

所述好友关系影响因子函数为

其中,yk表示用户之间是否存在链接,如果存在,则yk=1,反之为0; 表示好友关系特征和用户关系的相关性; 表示好友关系方面的第i个特征;

所述社团驱动影响因子函数为

其中,yk表示用户之间是否存在链接,如果存在,则yk=1,反之为0; 表示社团驱动特征和用户关系的相关性; 表示社团驱动方面的第i个特征;

(3)以最大熵原理为基础构建用户关系分析模型,并对用户关系分析模型进行参数训练,获得最优参数集合;

用户关系分析模型为:

约束条件1如下所示:

其中p(y|x)是条件概率,表示的是在x特征出现的情况下,y出现的概率;对于影响因子函数fi(x,y),它相对于样本(x,y)联合分布概率 的期望值为:影响因子函数fi(x,y)相对于模型条件概率p(y|x)的期望值为:其中p(y|x)是要求的条件概率, 是特征x的统计概率;

令这两个的期望值相等,得到约束条件2,即:

(4)根据最优参数集合以及用户关系分析模型对用户之间是否存在关系进行预测。

2.根据权利要求1所述一种面向社交网络的用户关系分析方法,其特征在于:所述步骤(1)中还包括去掉原始数据中属性缺失的、重复的以及无效的数据节点。

3.根据权利要求2所述一种面向社交网络的用户关系分析方法,其特征在于:所述提取用户的个人属性时,从清洗后的数据中构建初始用户关系网络G=(V,E),从初始网络G中抽取顶点对,若该顶点对存在好友关系则构成正样本,不存在好友关系的顶点对集合构建负s s s s样本;然后选取其中的一部分作为源网络G =(V ,E),从源网络G提取用户的个人属性信息。

4.根据权利要1或2或3所述一种面向社交网络的用户关系分析方法,其特征在于:所述用户的个人属性包括用户的ID、用户名称、性别、描述、所在地以及精英用户。