1.一种商品推荐方法,其特征在于,所述方法包括以下步骤:步骤S100、获取预先收集的历史商品信息,从所述历史商品信息中提取待切分中文句,根据所述待切分中文句建立商品的特征词表;
步骤S200、确定与用户行为关联的商品,获取所述商品的商品信息,根据所述特征词表删除所述商品信息中不属于所述特征词表的特征词,得到所述商品的商品特征项;
步骤S300、基于所述商品特征项建立用户画像信息表,其中,所述用户画像信息表包括列表区和特征项序列,所述列表区包括每个商品的商品标识和商品权重,所述特征项序列为所述列表区中全部商品权重的集合;
步骤S400、从所述用户画像信息表中的特征项序列中筛选出特征序列,作为该用户的用户画像;
步骤S500、基于目标用户的用户画像确定目标用户的近邻用户,从所述近邻用户的列表区中确定目标用户的商品推荐列表;
其中,步骤S100中,所述根据所述待切分中文句建立商品的特征词表包括:步骤S110、取待切分中文句的c个字符作为待匹配字段,将所述待匹配字段与词典进行查找匹配,将匹配成功的待匹配字段作为一个词切分出来;其中,c为词典中最长词条的字符数;
步骤S120、将匹配不成功的待匹配字段的最后一个字去掉,将所述待匹配字段中剩下的字符串作为新的匹配字段,对所述新的匹配字段进行再次匹配,直到所述待匹配字段中的所有字段均完成匹配;
步骤S130、将全部切分得到的词形成词表,将所述词表与预先设置的停用词表进行遍历匹配,将所述词表中匹配到的词进行删除,得到有效词表;
步骤S140、采用TF‑IDF算法确定所述有效词表中每个词的词频,将所述有效词表中词频较高的词删掉,得到商品的特征词表;
所述步骤S300包括:
步骤S310、对所述商品的商品特征项赋予行为权重,得到商品权重,基于目标商品的商品标识和商品权重建立列表区;
步骤S320、基于所述列表区中全部商品权重的集合建立特征项序列;
步骤S330、基于所述列表区和特征项序列建立用户画像信息表;其中,所述用户画像信息表包括列表区和特征项序列;所述列表区包括商品的编码item_id和每个商品的商品权重Q_Clear_word;特征项序列为所述列表区中全部商品权重Q_Clear_word的集合;其中,浏览行为的权重为J,收藏行为的权重为K,购买行为的权重为L,其中,J、K、L∈N*,N*表示正自然数集;
所述步骤S400包括:
步骤S410、确定所述特征项序列中每个商品特征项的权重;
步骤S420、对所述特征项序列中的所有商品特征项分别进行权重赋值,得到所有商品特征项的权值;
步骤S430、从所有商品特征项中选取权值最大的N个商品特征项,作为目标用户的特征序列,用于表示该目标用户的用户画像;其中,所述用户画像信息表中的特征项序列表示为Segment=S(W1,W2,…,Wn),其中,每个所述特征项序列中包含n个商品特征项,Wt表示第t个商品特征项,1≤t≤n;每个商品特征项都对应一个权重,所述特征项序列采用商品特征项与权重来表示,即S(W1,Q1;W2,Q2;……Wn,Qn),简记为S(W1,W2,…,Wn),其中Qt是Wt的权重;N=m×n;其中,m表示特征序列的总数,n表示每个所述特征项序列中包含的商品特征项,N表示全部特征项的总数,1≤i≤m,1≤j≤n;
商品特征项的权重计算公式为:
其中,nj表示特征项序列中包含商品特征项j的特征序列数,tfij表示商品特征项j在特征序列i中出现的频率,Wij表示特征序列i中商品特征项j的权重;
选取权值最大的N个商品特征项,重新组成该用户的特征序列,用于表示该用户的画像,目标用户的画像表示为Icon(W1,W2,……,Wn);
所述步骤S500包括:
步骤S510、将所有用户的用户画像划分为多个分类簇;
步骤S520、基于目标用户的用户画像,从目标用户所在的分类簇中求得多个最近邻用户;从所述多个最近邻用户的列表区中确定目标用户的推荐列表;
所述步骤S510包括:
步骤S511、设所有用户的用户画像组成的用户画像集为D,D=(D1,D2,Di,…,Dp),在用户画像集D中随机设定k个初始质心点S,S=(S1,S2,Sj,…,Sk),根据所述k个初始质心点对所述用户画像集D进行簇分配,其中,p为用户的总数;
步骤S512、当任意一个初始质心点的簇分配结果发生改变时,计算每个初始质心点与所述用户画像集中的每个用户画像之间的距离,将所述用户画像分配到距离最近的初始质心点所在的簇;
步骤S513、将每个簇中所有用户画像的均值更新为该簇的质心点,直至目标函数达到最小,所述目标函数为:其中,Di为用户画像集D中的第i个用户画像,Sj为第j个质心点;
所述步骤S520包括:
步骤S521、确定目标用户的用户画像所在的簇中的K个最近邻用户;
步骤S522、分别确定K个最近邻用户的特征序列中TF‑IDF值最大的商品特征项,得到K个商品特征项MAX_K;
步骤S523、从所述K个最近邻用户的列表区中寻找有商品特征项存在于所述K个商品特征项MAX_K中的商品,作为推荐商品,将所述推荐商品的商品标识进行记录,得到所述目标用户的推荐列表;
所述步骤S521包括:
确定目标用户所在的簇人数是否≤K,若是,则该目标用户的最近邻为该用户所在簇中的所有其他用户;若否,确定该目标用户与簇中其他用户的相似度sim(i,j);
对计算得到的相似度排序,取相似度最大的K个用户作为该目标用户的K‑最近邻用户;
所述方法还包括:
根据用户画像中特征序列的长度确定所述特征序列的衰减周期,以所述衰减周期对所述特征序列中的全部商品特征项进行衰减;
当所述特征序列中的商品特征项衰减到0时,将该商品特征项移出用户画像中的特征序列;所述衰减周期的计算公式如下:‑0.13
X=3.2L0 ;
L0=L‑Lmin;
其中,X为衰减周期,L为用户画像中特征项序列的长度,Lmin为特征项序列的最小长度,L0>0。
2.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1所述的商品推荐方法的步骤。
3.一种商品推荐系统,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1所述的商品推荐方法。