利索能及
我要发布
收藏
专利号: 2018102845000
申请人: 武汉斗鱼网络科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种相似度度量方法,其特征在于,包括:

依据与待度量相似度的物品相对应的用户数据,确定两个所述物品之间的用户集合,所述用户集合包括用户交集、用户相对补集和用户并集的绝对补集;

依据所述用户集合的香农熵,以及基于极大似然比检验的预设相似度度量规则,确定两个所述物品之间的相似度。

2.根据权利要求1所述的方法,其特征在于,所述预设相似度度量规则为:row_entropy=entropy(N11+N12,N21+N22)column_entropy=entropy(N11+N21,N12+N22)maxtrix_entropy=entropy(N11,N12,N21,N22)其中,Sij为两个所述物品之间的相似度,entropy为香农熵,N11为物品i对应的用户集I和物品j对应的用户集J的用户交集,N12为用户集I中用户集J的用户相对补集,N21为用户集J中用户集I的用户相对补集,N22为用户集I与用户集J的用户并集的绝对补集。

3.根据权利要求1所述的方法,其特征在于,在所述依据与待度量相似度的物品相对应的用户数据,确定两个所述物品之间的用户集合之前,还包括:确定热门物品,以及与所述热门物品相对应的设定类型的用户行为数据;

依据所述用户行为数据及预设类型权重值,确定所述热门物品对应用户的用户偏好值;

依据所述用户偏好值,确定所述热门物品对应的有效用户数据;

所述依据与待度量相似度的物品相对应的用户数据,确定两个所述物品之间的用户集合包括:确定所述有效用户数据为所述热门物品对应的热门用户数据;

依据所述热门用户数据和/或非热门物品对应的所述用户数据,确定两个所述物品之间的用户集合。

4.根据权利要求3所述的方法,其特征在于,所述确定热门物品包括:依据第一预设时间段内所述物品对应的用户数量及预设用户数量,确定所述热门物品。

5.根据权利要求3所述的方法,其特征在于,所述依据所述用户行为数据及预设类型权重值,确定所述热门物品对应用户的用户偏好值包括:对第二预设时间段内的所述用户行为数据进行标准化,获得标准用户行为数据;

依据所述标准用户行为及所述预设类型权重值,确定所述热门物品对应用户的用户偏好值。

6.根据权利要求3所述的方法,其特征在于,所述物品为直播间;

所述设定类型的用户行为数据包括观看时长、弹幕发布次数和关注行为。

7.根据权利要求6所述的方法,其特征在于,在所述依据所述用户集合的香农熵,以及基于极大似然比检验的预设相似度度量规则,确定两个所述物品之间的相似度之后,还包括:确定目标用户的历史观看直播间;

按照待推荐直播间与所述历史观看直播间的相似度,对所述待推荐直播间排序;

确定排序结果中预设数量的所述待推荐直播间为目标推荐直播间。

8.一种相似度度量装置,其特征在于,包括:

用户集合确定模块,用于依据与待度量相似度的物品相对应的用户数据,确定两个所述物品之间的用户集合,所述用户集合包括用户交集、用户相对补集和用户并集的绝对补集;

相似度度量模块,用于依据所述用户集合的香农熵,以及基于极大似然比检验的预设相似度度量规则,确定两个所述物品之间的相似度。

9.一种设备,其特征在于,所述设备包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的相似度度量方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一所述的相似度度量方法。