利索能及
我要发布
收藏
专利号: 2018110260249
申请人: 武汉斗鱼网络科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2024-12-10
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于用户行为的用户聚类方法,其特征在于,其包括:

获取相同行为下的每个用户的M个行为参数,所述M为大于0的整数;

将各个行为参数作为M维空间坐标值,计算任意两个用户之间的欧式距离作为行为差距值;

若N个用户之间的行为差距值小于预设阈值,且N大于预设的密集度个数,则将所述N个用户归为一簇,其中,N为大于1的整数。

2.如权利要求1所述的一种基于用户行为的用户聚类方法,其特征在于:所述行为参数包括观看参数和弹幕内容,所述观看参数包括用户观看时长、观看时间段、关注主播数量和/或送虚拟礼物金额;

根据观看参数计算用户之间在观看习惯上的偏差值作为观看偏差值,根据弹幕内容计算用户之间在弹幕用语上的偏差值作为用语偏差值;

根据观看偏差值和用语偏差值计算用户行为偏差值。

3.如权利要求2所述的一种基于用户行为的用户聚类方法,其特征在于,所述根据观看参数计算用户之间在观看习惯上的偏差值作为观看偏差值:所述行为参数包括A个观看参数,将每个用户的所述A个观看参数的值作为A维空间的坐标值,计算两个用户的欧式距离作为观看偏差值,所述A为大于0的整数。

4.如权利要求2所述的一种基于用户行为的用户聚类方法,其特征在于,所述根据弹幕内容计算用户之间在弹幕用语上的偏差值作为用语偏差值:使用word2vec模型将所述词组转换为B维的词向量,计算两个用户对应词向量的欧式距离作为语言偏差值。

5.如权利要求2所述的一种基于用户行为的用户聚类方法,其特征在于,所述根据观看偏差值和用语偏差值计算用户行为偏差值具体为:所述观看偏差和语言偏差均设有对应的权重,所述行为差距等于观看偏差、语言偏差与各自权重相乘后的和。

6.如权利要求2所述的一种基于用户行为的用户聚类方法,其特征在于,所述预设算法使用的具体公式为:其中,DXY为用户X和用户Y的行为偏差,m为观看参数的总数,n为词向量参数的总个数,MXi为用户X的第i个观看参数,MYi为用户Y的第i个观看参数,LXi为用户X的第i个词向量参数,LYi为用户Y的第i个词向量参数,W1为观看偏差的权重,W2为语言偏差的权重。

7.如权利要求1所述的一种基于用户行为的用户聚类方法,其特征在于,所述若N个用户之间的行为差距值小于预设阈值,且N大于预设的密集度个数,则将所述N个用户归为一簇包括以下步骤:A设定所有所述与该未分簇的用户的行为差距小于预设阈值的用户为待确认用户,选定一个待确认用户;

B统计与所述待确认用户的行为差距小于预设阈值的用户的个数,若所述个数大于预设的密集度个数,则将与待确认用户的行为差距小于预设阈值的用户以及与未分簇的用户的行为差距小于预设阈值的用户归于同一簇,并将该簇的用户设为待确认用户;

C针对每一个待确认用户,执行步骤B,直至所有待确认用户确认完毕。

8.一种存储介质,该存储介质上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1至7任一项所述的方法。

9.一种电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的方法。

10.一种基于用户行为的用户聚类系统,其特征在于,其包括:统计模块,用于获取相同行为下的每个用户的M个行为参数,所述M为大于0的整数;

计算模块,用于将各个行为参数作为M维空间坐标值,计算任意两个用户之间的欧式距离作为行为差距值;

分簇模块,用于若N个用户之间的行为差距值小于预设阈值,且N大于预设的密集度个数,则将所述N个用户归为一簇,其中,N为大于1的整数。