1.一种基于加权混合的移动APP推荐方法,其特征在于,包括以下步骤:S1:抓取移动APP标签数据和移动APP简介数据,然后对移动APP标签数据、移动APP简介数据及用户移动APP下载数据进行数据预处理;
S2:针对预处理后的移动APP标签数据和用户移动APP下载数据,通过对用户行为进行分析建立个性化标签模型,然后对用户所下载APP的标签数据集进行加权量化,利用个性化标签模型遍历所有候选移动APP,计算用户对候选移动APP的预测分数以此得到第一推荐列表;
S3:针对处理后的移动APP简介数据和用户移动APP下载数据,建立LDA用户模型,通过该模型得到主题下用户的概率分布,然后利用KL散度计算用户之间的相似度以此形成第二推荐列表;
S4:对第一推荐列表与第二推荐列表进行加权混合,通过并列式的混合方式形成最终推荐列表。
2.根据权利要求1所述的基于加权混合的移动APP推荐方法,其特征在于,步骤S1中通过定向爬虫技术,即利用Nutch工具的爬虫组件Crawler对移动APP标签数据和移动APP简介数据进行抓取。
3.根据权利要求1所述的一种基于加权混合的移动APP推荐方法,其特征在于,步骤S2中得到第一推荐列表的方法包括:针对处理后的移动APP标签数据和用户移动APP下载数据,对用户行为进行分析,根据用户下载来源对用户所下载的移动APP进行划分,将其划分为High、Normal和Low三个等级,得到用户移动APP的划分后,对标签数据集进行划分,将其划分为High Tags Set、Normal Tags Set和Low Tags Set三个数据集,去除重复标签,根据每个标签的频率对标签进行加权量化,
得到标签的权重后,建立个性化标签模型,
利用个性化标签模型遍历所有候选移动APP,计算用户对候选移动APP的预测分数,通过对预测分数排序,得到第一推荐列表。
4.根据权利要求3所述的一种基于加权混合的移动APP推荐方法,其特征在于,根据用户下载来源对用户所下载的移动APP进行划分,将其划分为High、Normal和Low三个等级,具体如下:High:搜索、猜你喜欢、更新管理,收藏;
Normal:软件、首页,游戏;
Low:后台下载、来源未知、none。
5.根据权利要求1所述的一种基于加权混合的移动APP推荐方法,其特征在于,步骤S3中得到第二推荐列表的方法包括:针对处理后的移动APP简介数据和用户下载列表数据,建立LDA用户模型,首先是对数据格式的系列转换,具体包括将数据转换成SequenceFile格式,将SequenceFile格式文件转换为向量表示,且将单词形式转换成单词id的形式,使用CVB0方法对LDA用户模型训练,设定迭代次数和主题个数,LDA用户模型训练后得到用户在主题空间下的概率分布,
利用优化后的KL散度计算用户之间的相似度,
利用用户之间的相似度,选定相应的移动APP,给用户形成第二推荐列表。
6.根据权利要求1所述的一种基于加权混合的移动APP推荐方法,其特征在于,所述步骤S4中加权混合的方法为:对于第一推荐列表与第二推荐列表,利用并行式混合模型思想将其进行混合,利用加权因子来对不同方法生成的推荐结果进行控制,形成最终推荐列表。