1.一种用户画像方法,其特征在于,所述方法包括:将目标样本对应的标签中、目标用户当前所不具有的至少一个标签确定为候选标签;
确定每一所述候选标签与所述目标用户的匹配参数;
根据每一所述候选标签与所述目标用户的匹配参数,从所述候选标签中确定能够用于标记所述目标用户的目标标签,并为所述目标用户标记所述目标标签;
其中,所述确定每一所述候选标签与所述目标用户的匹配参数,包括:针对每一所述候选标签,确定该候选标签在每个相似用户所具有的标签中对应的占比,并将与每个相似用户对应的占比确定为该候选标签与该相似用户对应的第一权重;
确定由全部候选标签所形成的标签向量与每个相似用户的标签向量之间的相似度,并将所述相似度的平均值确定为每一所述候选标签对应的第二权重;
根据所述候选标签的所述第一权重和所述第二权重,通过以下公式确定所述候选标签与所述目标用户的匹配参数:其中,Fit表示所述候选标签与所述目标用户的匹配参数;
M表示所述相似用户的数量;
wwhole表示所述候选标签w的第二权重;
wi表示所述候选标签w与第i个相似用户对应的第一权重。
2.根据权利要求1所述的方法,其特征在于,所述根据每一所述候选标签与所述目标用户的匹配参数,从所述候选标签中确定能够用于标记所述目标用户的目标标签,包括以下中的任一者:将与所述目标用户的匹配参数小于预设的匹配阈值的候选标签确定为所述目标标签;
将按照与所述目标用户的匹配参数由小至大的顺序、排名前S的候选标签确定为所述目标标签,其中,S为正整数。
3.根据权利要求1所述的方法,其特征在于,所述目标样本通过如下方式确定:将所述至少一个相似用户感兴趣的至少一个样本确定为第一样本;
以每个所述第一样本作为类中心对待聚类样本进行聚类处理,获得与所述第一样本数量相同的样本类簇,其中,所述待聚类样本为样本集中除所述相似用户和所述目标用户所关联的样本之外的样本;
从每个所述样本类簇中确定能够代表该样本类簇的多个第二样本,并将每个所述第二样本确定为所述目标样本。
4.根据权利要求3所述的方法,其特征在于,所述以每个所述第一样本作为类中心对待聚类样本进行聚类处理,包括:针对每个所述待聚类样本,根据该待聚类样本及其所属的用户的标签向量,确定该待聚类样本与各个所述第一样本之间的距离,并将该待聚类样本划分至距离最短的第一样本对应的样本类簇中。
5.根据权利要求4所述的方法,其特征在于,根据该待聚类样本及其所属的用户的标签向量,通过以下公式,确定该待聚类样本与各个所述第一样本之间的距离:其中,D(X,Y)表示待聚类样本X和第一样本Y之间的距离;
表示所述待聚类样本所属的用户Ux和所述第一样本所属的用户Uy之间的相似度;
K表示所述待聚类样本X和第一样本Y所关联的标签去重后的总个数;
xi表示所述待聚类样本X的标签向量中第i维对应的标签的权重;
yi表示所述第一样本Y的标签向量中第i维对应的标签的权重。
6.根据权利要求4所述的方法,其特征在于,所述从每个所述样本类簇中确定能够代表该样本类簇的多个第二样本,包括以下中的任一者:在对应的样本类簇中,按照与第一样本之间的距离由大至小的顺序、排名前T的待聚类样本及所述第一样本确定为所述第二样本,其中,T为正整数;
在对应的样本类簇中,将与第一样本之间的距离小于预设的距离阈值的样本及所述第一样本确定为所述第二样本。
7.根据权利要求1‑6中任一项所述的方法,其特征在于,在所述将目标样本对应的标签中、目标用户当前所不具有的至少一个标签确定为候选标签的步骤之前,所述方法还包括:确定目标用户对应的至少一个相似用户和至少一个非相似用户;
根据目标样本与所述至少一个相似用户的第一匹配度及所述目标样本与所述至少一个非相似用户的第二匹配度,确定所述目标样本与所述目标用户的匹配度;
所述将目标样本对应的标签中、目标用户当前所不具有的至少一个标签确定为候选标签,包括:在所述目标样本与所述目标用户的匹配度超过预设的匹配度阈值时,将目标样本对应的标签中、目标用户当前所不具有的至少一个标签确定为候选标签。
8.根据权利要求7所述的方法,其特征在于,通过如下公式确定目标样本与所述至少一个相似用户的第一匹配度:其中, 表示所述第一匹配度;
M表示所述相似用户的数量;
P表示所述目标样本的标签向量;
Xi表示第i个相似用户的标签向量。
9.根据权利要求7所述的方法,其特征在于,通过如下公式确定目标样本与所述至少一个非相似用户的第二匹配度:其中, 表示所述第二匹配度;
N表示所述非相似用户的数量;
P表示所述目标样本的标签向量;
Yi表示第i个非相似用户的标签向量。
10.根据权利要求7所述的方法,其特征在于,所述根据目标样本与所述至少一个相似用户的第一匹配度及所述目标样本与所述至少一个非相似用户的第二匹配度,确定所述目标样本与所述目标用户的匹配度,包括:将所述第一匹配度的加权值与所述第二匹配度的加权值之差确定为所述目标样本与所述目标用户的匹配度。
11.一种用户画像装置,其特征在于,所述装置包括:第一确定模块,用于将目标样本对应的标签中、目标用户当前所不具有的至少一个标签确定为候选标签;
第二确定模块,用于确定每一所述候选标签与所述目标用户的匹配参数;
标记模块,用于根据每一所述候选标签与所述目标用户的匹配参数,从所述候选标签中确定能够用于标记所述目标用户的目标标签,并为所述目标用户标记所述目标标签;
所述第二确定模块包括:
第一确定子模块,用于针对每一所述候选标签,确定该候选标签在每个相似用户所具有的标签中对应的占比,并将与每个相似用户对应的占比确定为该候选标签与该相似用户对应的第一权重;
第二确定子模块,用于确定由全部候选标签所形成的标签向量与每个相似用户的标签向量之间的相似度,并将所述相似度的平均值确定为每一所述候选标签对应的第二权重;
第三确定子模块,用于根据所述候选标签的所述第一权重和所述第二权重,通过以下公式确定所述候选标签与所述目标用户的匹配参数:其中,Fit表示所述候选标签与所述目标用户的匹配参数;
M表示所述相似用户的数量;
wwhole表示所述候选标签w的第二权重;
wi表示所述候选标签w与第i个相似用户对应的第一权重。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1‑10中任一项所述方法的步骤。
13.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1‑10中任一项所述方法的步骤。