1.一种基于互联网的电商在线直播方法,包括:采集用户在电商平台的行为数据;
建立MySQL数据库,存储采集的用户的行为数据;
利用监督学习算法,基于采集的用户的行为数据和商品ID数据,构建并训练用户的商品ID偏好模型,生成用户的多维画像;
基于TensorFlow机器学习框架,构建多层协同过滤的神经网络模型,利用生成的用户的多维画像训练构建的多层协同过滤的神经网络模型;
利用训练后的多层协同过滤的神经网络模型,根据用户的实时请求,生成针对用户的商品ID推荐列表。
2.根据权利要求1所述的基于互联网的电商在线直播方法,其特征在于:生成针对用户的商品ID推荐列表,还包括:利用构建的多层协同过滤的神经网络模型,根据用户的实时请求,生成针对用户的第一推荐列表;
在构建的多层协同过滤的神经网络模型的输出层后设置统计单元,统计单元包含多个计数器,通过商品ID映射的方式,统计各商品ID在多层协同过滤的神经网络模型中出现的总次数;
根据统计单元统计的各商品ID出现的总次数,计算商品ID分布信息熵作为新颖度指标;
当新颖度指标低于阈值时,构建基于Scikit learn的随机森林算法冷启动推荐生成器;
冷启动推荐生成器基于用户的多维画像,生成与用户的多维画像相匹配且未推荐的商品ID集合;
将生成的商品ID集合与第一推荐列表进行拼接,生成第二推荐列表作为针对用户的商品ID推荐列表。
3.根据权利要求2所述的基于互联网的电商在线直播方法,其特征在于:生成与用户的多维画像相匹配且未推荐的商品ID集合,还包括:对商品ID数据进行编码,生成商品特征向量;
利用基于Sklearn的One Hot Encoder对用户的行为数据进行编码,生成用户特征向量;
根据用户特征向量和商品特征向量,计算用户和商品ID之间的匹配度;
在冷启动生成器中构建基于Pybloom的布隆过滤器,布隆过滤器根据商品ID推荐列表,生成已推荐商品ID集S;
冷启动推荐生成器从MySQL数据库中随机抽取商品ID作为候选集;
布隆过滤器采用散列函数判断候选集中的商品ID是否在已推荐商品ID集S中;
将匹配度高于阈值且不在已推荐商品ID集S中的商品ID,作为与用户的多维画像相匹配且未推荐的商品ID集合。
4.根据权利要求3所述的基于互联网的电商在线直播方法,其特征在于:对商品ID数据进行编码,生成商品特征向量,还包括:商品ID数据包含商品标题和商品详情页面;
对商品标题和商品详情页面的文本内容,利用Text Rank算法提取关键词;
基于提取的关键词构建商品ID数据的TF IDF词频矩阵;
获取TF IDF词频矩阵中词频大于阈值的词汇,生成表示商品ID属性的词汇集合;
对词汇集合中的词语,通过预训练的BERT语言模型获取语义向量表示;
根据TF IDF词频矩阵中词汇对应的权重,对相应的语义向量进行加权平均,生成商品特征向量。
5.根据权利要求3所述的基于互联网的电商在线直播方法,其特征在于:布隆过滤器设置两层;
第一层布隆过滤器的位数组大小设置为N1比特;
第二层布隆过滤器的位数组大小设置为N2比特,其中N2大于N1。
6.根据权利要求5所述的基于互联网的电商在线直播方法,其特征在于:还包括:
设置M个不同的哈希函数,针对同一商品ID生成M个不同的哈希值;
将商品ID推荐列表中的每个商品ID利用M个哈希函数分别映射到两层布隆过滤器的位数组中;
输入的候选集中的商品ID,通过M个不同的哈希函数生成M个对应的哈希值;
第一层布隆过滤器中,若生成的M个对应的哈希值对应的位数组的位置均为零,则将对应的商品ID发送到第二层布隆过滤器;
仅当第一层布隆过滤器和第二层布隆过滤器对应的全部位数组的位置均为零时,判定对应的商品ID不在推荐列表中。
7.根据权利要求3所述的基于互联网的电商在线直播方法,其特征在于:利用基于Sklearn的One Hot Encoder对用户的行为数据进行编码,生成用户特征向量,还包括:根据时间戳,将采集的用户的行为数据分割为多个会话序列;
将获取的会话序列输入预训练的LSTM网络,输出反映用户时间偏好的特征矩阵A;
利用One Hot Encoder对用户的形式数据进行编码,生成表示用户基础特征的向量B;
通过numpy中的hstack函数,将矩阵A和向量B按列进行水平拼接,生成用户特征矩阵C;
将生成的用户特征矩阵平展为用户特征向量。
8.根据权利要求7所述的基于互联网的电商在线直播方法,其特征在于:预训练的LSTM网络为双向LSTM网络。
9.根据权利要求7所述的基于互联网的电商在线直播方法,其特征在于:计算用户和商品ID之间的匹配度,还包括:将用户特征向量作为查询向量,输入基于Annoy的最近邻搜索索引;
将商品特征向量作为输入,通过Annoy构建商品特征向量的最近邻搜索索引;
在构建的商品特征向量的最近邻搜索索引中,利用余弦相似度作为距离度量,搜索与用户特征向量最相似的前K1个商品特征向量;
计算搜索到的前K1个商品特征向量和用户特征向量之间的余弦相似度,作为用户和商品ID之间的匹配度。
10.根据权利要求9所述的基于互联网的电商在线直播方法,其特征在于:将生成的商品ID集合与第一推荐列表进行拼接,生成第二推荐列表作为针对用户的商品ID推荐列表,还包括:从第一推荐列表中,按照商品的点击购买次数排名,提取前K2个商品ID;
根据用户和商品ID之间的匹配度,选择匹配度最高的K3个商品ID;
通过笛卡尔积,计算K2个商品ID和K3个商品ID的组合;
对生成的组合,根据组合中每个商品ID对应的用户和商品ID之间的匹配度之和进行排序;
按照排序结果,选择排名最高的W个组合作为第二推荐列表。