1.一种用户好友数据的分析方法,其特征在于,所述方法包括:
获取包括若干行数据的好友关系文档;其中,每一行数据包括用户身份标识码以及所述用户身份标识码对应的好友列表,所述好友列表包括与所述用户身份标识码绑定为好友关系的好友身份标识码,所述用户身份标识码以及好友身份标识码均为非负数值;
将所述好友关系文档发送至目标映射服务器,以使所述目标映射服务器根据所述好友关系文档生成所述好友关系文档对应的键值对总列表;所述键值对总列表包括所述好友关系文档中每一行数据对应的键值对列表,所述键值对列表包括第一键值对和第二键值对,所述第一键值对包括行数据对应的好友列表中的任意两个好友身份标识码,所述第二键值对包括标记标识码和用户元组,所述用户元组包括所述行数据对应的用户身份标识码和所述行数据对应的好友列表中的好友数量,所述标记识别码为负数值;
将所述目标映射服务器反馈的所述键值对总列表传输至目标规约服务器,以使所述目标规约服务器根据所述键值对总列表获取目标计算参数,以及由所述目标规约服务器根据所述目标计算参数获取所述好友关系文档中任意两个用户身份标识码对应的jaccard相似度,所述目标计算参数包括所述好友关系文档中的用户身份标识码对应的好友数量以及任意两个用户身份标识码的共同好友数量;
接收所述目标规约服务器反馈的所述好友关系文档中任意两个用户身份标识码对应的jaccard相似度;
输出好友匹配率列表,所述好友匹配率列表包括所述好友关系文档中任意两个用户身份标识码对应的jaccard相似度。
2.根据权利要求1所述的方法,其特征在于,所述将所述好友关系文档发送至目标映射服务器,以使所述目标映射服务器根据所述好友关系文档生成所述好友关系文档对应的键值对总列表,包括:根据预设的文档分割规则,将所述好友关系文档分割为若干个好友关系子文档;
将所述若干个好友关系子文档分别发送至所述若干个好友关系子文档各自对应的映射服务器,以使若干个所述映射服务器分别根据接收到的好友关系子文档生成所述收到的好友关系子文档对应的键值对子列表,所述键值对子列表包括所述收到的好友关系子文档中每一行数据对应的键值对列表;
根据所述若干个好友关系子文档各自对应的映射服务器分别反馈的键值对子列表生成键值对总列表;
所述将所述目标映射服务器反馈的所述键值对总列表传输至目标规约服务器,以使所述目标规约服务器根据所述键值对总列表获取目标计算参数,包括:将所述键值对总列表传输至目标规约服务器,以使所述目标规约服务器根据所述键值对总列表获取目标计算参数。
3.根据权利要求2所述的方法,其特征在于,所述根据所述若干个好友关系子文档各自对应的映射服务器分别反馈的键值对子列表生成键值对总列表之后,所述方法还包括:按照预设的排序规则对所述键值对总列表进行升序排序,获得排序后的目标键值对总列表;
将所述目标键值对总列表分割为若干个键值对分列表,其中,包括相同的标记标识码的行数据对应的键值对列表被分配至同一个键值对分列表;
所述将所述键值对总列表传输至目标规约服务器,以使所述目标规约服务器根据所述键值对总列表获取目标计算参数,包括:将所述若干个键值对分列表分别传输至所述若干个键值对分列表各自对应的规约服务器,以使若干个所述规约服务器分别根据接收到的键值对分列表获取所述接收到的键值对分列表对应的初始计算参数;所述初始计算参数包括所述接收到的键值对分列表中的用户身份标识码对应的好友数量以及任意两个用户身份标识码的共同好友数量;以及由目标规约服务器在接收到若干个所述规约服务器分别反馈的若干个所述初始计算参数后,整合若干个所述初始计算参数以获得目标计算参数,所述目标规约服务器为若干个所述规约服务器中运算速度最快的规约服务器。
4.根据权利要求3所述的方法,其特征在于,所述将所述若干个好友关系子文档分别发送至所述若干个好友关系子文档各自对应的映射服务器之前,所述方法还包括:获取可用的规约服务器的数量N,N为正整数;
生成N个标记标识码;
将所述N个标记标识码与不同的规约服务器关联存储至标记标识码与规约服务器的对照表;
所述将所述若干个键值对分列表分别传输至所述若干个键值对分列表各自对应的规约服务器,包括:查找所述对照表,以根据所述若干个键值对分列表各自对应的标记标识码将所述若干个键值对分列表分别传输至所述若干个键值对分列表各自对应的规约服务器。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述jaccard相似度的计算公式为:其中,n1、n2分别表示所述任意两个用户身份标识码各自对应的好友数量,n3表示所述任意两个用户身份标识码的共同好友数量。
6.根据权利要求1~5任一项所述的方法,其特征在于,所述输出好友匹配率列表之后,所述方法还包括:遍历所述好友匹配率列表,以获得所述好友匹配率列表中高于预设的jaccard相似度阈值的目标jaccard相似度;
将所述目标jaccard相似度对应两个用户身份标识码关联标记为潜在好友对;
根据所述潜在好友对生成好友推荐列表,所述好友推荐列表包括所述好友关系文档中的用户身份标识码以及所述好友关系文档中的用户身份标识码各自对应的潜在好友的用户身份标识码。
7.根据权利要求6所述的方法,其特征在于,所述根据所述潜在好友对生成好友推荐列表之后,所述方法还包括:检测所述好友关系文档中各用户身份标识码对应的用户活跃度;所述用户活跃度与用户的用户身份标识码的使用频率成正比;
根据好友推荐列表以及目标用户的用户身份标识码为目标用户推送好友推荐信息,所述好友推荐信息至少包括所述目标用户的潜在好友的用户身份标识码,所述目标用户为所述用户活跃度低于预设的用户活跃度阈值的用户。
8.一种用户好友数据的分析系统,其特征在于,所述系统包括:
第一获取单元,用于获取包括若干行数据的好友关系文档;其中,每一行数据包括用户身份标识码以及所述用户身份标识码对应的好友列表,所述好友列表包括与所述用户身份标识码绑定为好友关系的好友身份标识码,所述用户身份标识码以及好友身份标识码均为非负数值;
发送单元,用于将所述好友关系文档发送至目标映射服务器,以使所述目标映射服务器根据所述好友关系文档生成所述好友关系文档对应的键值对总列表;所述键值对总列表包括所述好友关系文档中每一行数据对应的键值对列表,所述键值对列表包括第一键值对和第二键值对,所述第一键值对包括行数据对应的好友列表中的任意两个好友身份标识码,所述第二键值对包括标记标识码和用户元组,所述用户元组包括所述行数据对应的用户身份标识码和所述行数据对应的好友列表中的好友数量,所述标记识别码为负数值;
传输单元,用于将所述目标映射服务器反馈的所述键值对总列表传输至目标规约服务器,以使所述目标规约服务器根据所述键值对总列表获取目标计算参数,以及由所述目标规约服务器根据所述目标计算参数获取所述好友关系文档中任意两个用户身份标识码对应的jaccard相似度,所述目标计算参数包括所述好友关系文档中的用户身份标识码对应的好友数量以及任意两个用户身份标识码的共同好友数量;
接收单元,用于接收所述目标规约服务器反馈的所述好友关系文档中任意两个用户身份标识码对应的jaccard相似度;
输出单元,用于输出好友匹配率列表,所述好友匹配率列表包括所述好友关系文档中任意两个用户身份标识码对应的jaccard相似度。
9.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1~7中任一项所述的用户好友数据的分析方法的步骤。
10.一种计算机可读存储介质,其特征在于,其存储计算机程序,所述计算机程序使得计算机执行权利要求1~7任一项所述的用户好友数据的分析方法。