1.一种基于主成分分析的用户房间兴趣度计算方法,其特征在于,包括以下步骤:S1、根据用户对房间的行为信息,提取多个行为指标,并对所述行为指标进行分析,对相关系数绝对值大于相关阈值的行为指标进行相互替代,筛选出6个具有代表性的行为指标作为主要评估指标,构建兴趣度计算指标体系,6个主要评估指标分别为:有效观看时长、有效观看天数、发送弹幕数、免费礼物数、付费礼物数、是否关注;
S2、获取一定时间段内多个用户所产生的房间行为信息,构建初始化矩阵X,对初始化矩阵X进行标准化处理,得到标准化矩阵Z;计算标准化矩阵Z的相关系数矩阵R,并计算相关系数矩阵R对应的特征值λ;将特征值λ由大到小排列,得到λ1、λ2、……、λn,对应的特征向量为e1、e2、……、en,特征向量e满足|e|=1,每个特征值对应一个主成分,每个特征向量包含n个元素;
S3、计算每个主成分的方差贡献率v,va=λa/(λ1+λ2+……+λn),a为正整数,1≤a≤n,va表示第a个主成分的方差贡献率,λa表示第a个主成分对应的特征值;计算主成分的累计方差贡献率,第a个主成分的累计方差贡献率=第1个主成分的方差贡献率至第(a‑1)个主成分的方差贡献率之和;
S4、按照特征值大于1,累计方差贡献率大于指定阈值的原则,提取满足条件的特征值个数,作为最终选择的主成分个数;如果满足条件的特征值个数为b,选择b个主成分,λ1,λ2,……,λb为b个主成分分别对应的特征值,其分别对应的特征向量e1,e2,……,eb为b个主成分的特征向量,特征向量和标准化后的数据相乘,得到主成分的线性表达式;
S5、以主成分的方差贡献率为权重,对主要评估指标在各个主成分线性表达式中的系数进行加权平均,计算每个主要评估指标的综合权重;将所有n个主要评估指标的综合权重进行归一化,得到每个主要评估指标的权重值w′,w′j=第j个主要评估指标的综合权重wj/所有主要评估指标的综合权重之和,j为正整数,且1≤j≤n;根据获得的权重值,进行加权计算,得到每个用户对不同房间的兴趣度得分S:S=w′1*Z1+w′2*Z2+……+w′n*Zn,其中,Z1表示第1个指标经过标准化处理后的值,Zn表示第n个指标经过标准化处理后的值,根据兴趣度得分向用户推荐感兴趣的房间。
2.如权利要求1所述的基于主成分分析的用户房间兴趣度计算方法,其特征在于,步骤S2中,所述对初始化矩阵X进行标准化处理的过程如下:初始化矩阵X中的元素包括xij、xj,xij表示第i个用户第j个行为指标的数据情况,xj表示第j个行为指标的数据情况,i为正整数;采用最大值函数max和最小值函数min对初始化矩阵X进行标准化处理,具体公式为:zij=(xij‑min(xj))/(max(xj)‑min(xj)),其中,zij表示标准化矩阵Z中的一个元素。
3.如权利要求1所述的基于主成分分析的用户房间兴趣度计算方法,其特征在于,步骤S4中,所述主成分的线性表达式如下:
Yc=ec1*Z1+ec2*Z2+……+ecn*Zn,其中,c为正整数,1≤c≤b,Yc表示第c个主成分,ec1为第1个指标在第c个主成分线性表达式中的系数,表示第c个特征向量中的第1个元素,ecn为第n个指标在第c个主成分线性表达式中的系数,表示第c个特征向量中的第n个元素,Z1表示第1个指标经过标准化处理后的值,Zn表示第n个指标经过标准化处理后的值。
4.如权利要求1所述的基于主成分分析的用户房间兴趣度计算方法,其特征在于,步骤S5中,计算综合权重的公式如下:
wj=v1*e1j/(v1+v2……+vb)+v2*e2j/(v1+v2……+vb)+……+vb*ebj/(v1+v2……+vb),其中,v1表示第1个主成分的方差贡献率,vb表示第b个主成分的方差贡献率。
5.一种基于主成分分析的用户房间兴趣度计算系统,其特征在于,该系统包括:体系构建单元、主成分分析单元、权重分析单元,其中,所述体系构建单元用于:根据用户对房间的行为信息,提取多个行为指标,并对所述行为指标进行分析,对相关系数绝对值大于相关阈值的行为指标进行相互替代,筛选出6个具有代表性的行为指标作为主要评估指标,构建兴趣度计算指标体系,6个主要评估指标分别为:有效观看时长、有效观看天数、发送弹幕数、免费礼物数、付费礼物数、是否关注;
所述主成分分析单元用于:获取一定时间段内多个用户所产生的房间行为信息,构建初始化矩阵X,对初始化矩阵X进行标准化处理,得到标准化矩阵Z;计算标准化矩阵Z的相关系数矩阵R,并计算相关系数矩阵R对应的特征值λ;将特征值λ由大到小排列,得到λ1、λ2、……、λn,对应的特征向量为e1、e2、……、en,特征向量e满足|e|=1,每个特征值对应一个主成分,每个特征向量包含n个元素;
计算每个主成分的方差贡献率v,va=λa/(λ1+λ2+……+λn),a为正整数,1≤a≤n,va表示第a个主成分的方差贡献率,λa表示第a个主成分对应的特征值;计算主成分的累计方差贡献率,第a个主成分的累计方差贡献率=第1个主成分的方差贡献率至第(a‑1)个主成分的方差贡献率之和;
按照特征值大于1,累计方差贡献率大于指定阈值的原则,提取满足条件的特征值个数,作为最终选择的主成分个数;如果满足条件的特征值个数为b,选择b个主成分,λ1,λ2,……,λb为b个主成分分别对应的特征值,其分别对应的特征向量e1,e2,……,eb为b个主成分的特征向量,特征向量和标准化后的数据相乘,得到主成分的线性表达式;
所述权重分析单元用于:以主成分的方差贡献率为权重,对主要评估指标在各个主成分线性表达式中的系数进行加权平均,计算每个主要评估指标的综合权重;将所有n个主要评估指标的综合权重进行归一化,得到每个主要评估指标的权重值w′,w′j=第j个主要评估指标的综合权重wj/所有主要评估指标的综合权重之和,j为正整数,且1≤j≤n;根据获得的权重值,进行加权计算,得到每个用户对不同房间的兴趣度得分S:S=w′1*Z1+w′2*Z2+……+w′n*Zn,其中,Z1表示第1个指标经过标准化处理后的值,Zn表示第n个指标经过标准化处理后的值,根据兴趣度得分向用户推荐感兴趣的房间。
6.如权利要求5所述的基于主成分分析的用户房间兴趣度计算系统,其特征在于,所述对初始化矩阵X进行标准化处理的过程如下:初始化矩阵X中的元素包括xij、xj,xij表示第i个用户第j个行为指标的数据情况,xj表示第j个行为指标的数据情况,i为正整数;采用最大值函数max和最小值函数min对初始化矩阵X进行标准化处理,具体公式为:zij=(xij‑min(xj))/(max(xj)‑min(xj)),其中,zij表示标准化矩阵Z中的一个元素。
7.如权利要求5所述的基于主成分分析的用户房间兴趣度计算系统,其特征在于,所述主成分的线性表达式如下:
Yc=ec1*Z1+ec2*Z2+……+ecn*Zn,其中,c为正整数,1≤c≤b,Yc表示第c个主成分,ec1为第1个指标在第c个主成分线性表达式中的系数,表示第c个特征向量中的第1个元素,ecn为第n个指标在第c个主成分线性表达式中的系数,表示第c个特征向量中的第n个元素,Z1表示第1个指标经过标准化处理后的值,Zn表示第n个指标经过标准化处理后的值。
8.如权利要求5所述的基于主成分分析的用户房间兴趣度计算系统,其特征在于,计算综合权重的公式如下:
wj=v1*e1j/(v1+v2……+vb)+v2*e2j/(v1+v2……+vb)+……+vb*ebj/(v1+v2……+vb),其中,v1表示第1个主成分的方差贡献率,vb表示第b个主成分的方差贡献率。