1.一种基于熵值法的用户分区偏好计算方法,其特征在于,该方法包括以下流程:S1:根据需要计算用户偏好的用户观看视频直播时对不同分区的行为信息,在每个分区中分别为每位用户构建评估指标,转到S2;
S2:定时统计需要计算用户偏好的所有用户的评估指标,根据所有用户的评估指标构建初始化矩阵X,转到S3;
定义所述初始化矩阵X中的Xzj为第z位用户的第j项评估指标,z=1,2,…,n;n代表为最大用户数量;j=1,2,…,m;m代表每位用户的最大评估指标数量;
S3:在初始化矩阵X中计算第z位用户的第j项评估指标的优化指标X′zj,转到S4;
X′zj的计算公式为:
或者:
上述公式中max(X1j,X2j,...,Xnj)表示选取所有用户中第j项评估指标的最大值;min(X1j,X2j,...,Xnj)表示选取所有用户中第j项评估指标的最小值;
S4:根据X'zj计算第j项评估指标下第z位用户的贡献度Pzj,转到S5;
Pzj的计算公式为:
S5:根据Pzj计算第j项评估指标的熵值ej,转到S6;
ej的计算公式为: 其中k=1/ln(n),ln为自然对数;
S6:根据ej计算第j项评估指标的差异系数gj,转到S7;
gj的计算公式为:gj=1-ej;
S7:根据gj计算第j项评估指标的权重Wj,转到S8;
Wj的计算公式为:
S8:根据S4至S7的过程,计算当前初始化矩阵X中第z位用户的每项评估指标的权重W1,W2,…Wm;计算W1,W2,…Wm时,j对应取1,2,…m;根据每项评估指标的权重,计算第z位用户在当前初始化矩阵X中对应的每个分区的偏好得分S,计算公式为:S=w1·Xz1+w2·Xz2+……+wm·Xzm。
2.如权利要求1所述的基于熵值法的用户分区偏好计算方法,其特征在于,S1的具体流程为:S101:根据用户对不同分区的行为信息,为每位用户构建每个分区的一级指标,转到S102;
S102:从一级指标中确定对视频直播房间的行为信息指标,判断行为信息指标是否存在2个相关系数的绝对值大于0.8的行为信息指标,若是,转到S103,否则转到S104;
S103:剔除1个相关系数的绝对值大于0.8的行为信息指标,转到S104;
S104:根据预先设置的筛选要求,在剩余的行为信息指确定评估指标。
3.如权利要求1所述的基于熵值法的用户分区偏好计算方法,其特征在于:S1中所述评估指标包括有效观看次数、有效观看时长、有效观看房间数、有效观看天数、弹幕次数、弹幕房间数、弹幕天数、赠送礼物量、赠送礼物房间数和赠送礼物天数;
在此基础上,S1中所述在每个分区中分别为每位用户构建分区偏好评估指标后,还包括以下步骤:将评估指标中弹幕次数、弹幕房间数、弹幕天数、赠送礼物量、赠送礼物房间数和赠送礼物天数均为0的用户确定为观看类用户,将观看类用户的评估指标中的弹幕次数、弹幕房间数、弹幕天数、赠送礼物量、赠送礼物房间数和赠送礼物天数剔除;此时S2和S7中所述m≤10。
4.如权利要求1至3任一项所述的基于熵值法的用户分区偏好计算方法,其特征在于:S8之后还包括以下步骤:S9:根据偏好得分确定第z位用户的最终兴趣偏好分区类型。
5.如权利要求4所述的基于熵值法的用户分区偏好计算方法,其特征在于,S9的具体流程为:将第z位用户所有分区的偏好得分按照从大到小的顺序排列,确定偏好得分排名前10的分区类型为第z位用户的最终兴趣偏好分区类型。
6.一种实现权利要求1至5任一项所述计算方法的基于熵值法的用户分区偏好计算系统,其特征在于:该系统包括评估指标构建模块、初始化矩阵构建模块、优化指标计算模块、用户贡献度计算模块、评估指标熵值计算模块、评估指标差异系数计算模块、评估指标权重计算模块和偏好得分计算模块;
评估指标构建模块用于:根据需要计算用户偏好的用户观看视频直播时对不同分区的行为信息,在每个分区中分别为每位用户构建评估指标;
初始化矩阵构建模块用于:定时统计需要计算用户偏好的所有用户的评估指标;根据所有用户的评估指标构建初始化矩阵X,其中Xzj为第z位用户的第j项评估指标,z=1,2,…,n;n代表为最大用户数量;j=1,2,…,m;m代表每位用户的最大评估指标数量;
优化指标计算模块用于:在初始化矩阵X中计算第z位用户的第j项评估指标的优化指标X′zj计算公式为:
或者:
上述公式中max(X1j,X2j,...,Xnj)表示选取所有用户中第j项评估指标的最大值;min(X1j,X2j,...,Xnj)表示选取所有用户中第j项评估指标的最小值;
用户贡献度计算模块用于:根据X′zj计算第j项评估指标下第z位用户的贡献度Pzj,计算公式为:评估指标熵值计算模块用于:根据Pzj计算第j项评估指标的熵值ej,计算公式为:其中k=1/ln(n),ln为自然对数;
评估指标差异系数计算模块用于:根据ej计算第j项评估指标的差异系数gj,计算公式为:gj=1-ej;
评估指标权重计算模块用于:根据gj计算第j项评估指标的权重Wj,计算公式为:偏好得分计算模块用于:根据当前初始化矩阵X中第z位用户的每项评估指标的权重W1,W2,…Wm;计算第z位用户在初始化矩阵X中对应的每个分区的偏好得分S,计算公式为:S=w1·Xz1+w2·Xz2+……+wm·Xzm;其中W1对应j为1,W2对应j为2,…Wm对应j为m。
7.如权利要求6所述的基于熵值法的用户分区偏好计算系统,其特征在于,所述评估指标构建模块的具体工作流程为:根据用户对不同分区的行为信息,为每位用户构建每个分区的一级指标;从一级指标中确定对视频直播房间的行为信息指标,判断行为信息指标是否存在2个相关系数的绝对值大于0.8的行为信息指标:若是,则剔除1个相关系数的绝对值大于0.8的行为信息指标后,根据预先设置的筛选要求,在剩余的行为信息指确定评估指标;否则直接根据预先设置的筛选要求,在剩余的行为信息指确定评估指标。
8.如权利要求6所述的基于熵值法的用户分区偏好计算系统,其特征在于:所述评估指标构建模块构建的评估指标包括有效观看次数、有效观看时长、有效观看房间数、有效观看天数、弹幕次数、弹幕房间数、弹幕天数、赠送礼物量、赠送礼物房间数和赠送礼物天数;
在此基础上,评估指标构建模块在每个分区中分别为每位用户构建分区偏好评估指标后,还包括以下工作流程:将评估指标中弹幕次数、弹幕房间数、弹幕天数、赠送礼物量、赠送礼物房间数和赠送礼物天数均为0的用户确定为观看类用户,将观看类用户的评估指标中的弹幕次数、弹幕房间数、弹幕天数、赠送礼物量、赠送礼物房间数和赠送礼物天数剔除。
9.如权利要求6至8任一项所述的基于熵值法的用户分区偏好计算系统,其特征在于:该系统还包括分区类型确定模块,其用于:根据偏好得分确定第z位用户的最终兴趣偏好分区类型。
10.如权利要求9所述的基于熵值法的用户分区偏好计算系统,其特征在于,所述分区类型确定模块的具体工作流程为:将第z位用户所有分区的偏好得分按照从大到小的顺序排列,确定偏好得分排名前10的分区类型为第z位用户的最终兴趣偏好分区类型。