1.一种基于多信息节点图网络的短视频点击率预测方法,其特征在于:根据所有用户历史交互序列,构建短视频的多信息节点图网络;
把用户序列中的短视频输入多信息节点图网络,更新短视频的所有模态特征表征;对于一个用户的点击行为序列X=[x1,…,xn],其中短视频xj由 和 两种模态构成,是短视频的封面图特征向量, 是短视频的文本特征向量,d是模态特征向量的长度;把短视频封面图特征 和文本特征 同时输入图网络,生成多模态特征表征 其中p∈{a,b};模态特征表征 和 在多信息节点图网络中的更新公式分别为:a→a b→a b→b a→b
其中,W 、W 、W 、W 是图参数,分别代表模态a对模态a的影响参数、模态b对模态a的影响参数、模态b对模态b的影响参数和模态a对模态b的影响参数;b是偏置参数,k代表在图网络T中的搜索深度,k的最大深度由搜索深度参数L控制;σ为sigmoid函数,max代表元素级别的max操作,可以有效捕捉邻居的各个方面属性;B(j)为短视频图网络T中短视频xj的a b
邻居集合,按照图T边由大到小排序采样(sampling)获得;W 和W是转化矩阵参数,CONCAT表示向量连接操作; 和 代表第j个短视频的模态a和模态b在k层的向量表征,第j个短视频的模态a和模态b的 和 分别被初始化为 和 短视频的多模态特征表征即是不同模态特征在短视频图网络中更新深度L之后的 根据短视p
频多模态特征 生成用户在不同模态下的兴趣表征v ,p∈{a,b};本方法采用了长短期记忆网络结构,可以有效地捕捉到用户短视频序列的序列性;
p
融合不同模态下的兴趣表征v ,p∈{a,b},生成用户兴趣表征v;
a b
其中,v和v分别为用户在模态a和模态b下的兴趣表征, 为向量拼接操作,W是线性转化矩阵;
根据用户兴趣表征,预测用户对目标短视频的点击率:其中,v代表用户的兴趣向量,xnew为目标短视频, 为目标短视频模态a的向量表征,为目标短视频模态b的向量表征;Wnew为转换矩阵, 为向量拼接操作,σ为sigmoid函数;
根据模型特性,设计损失函数;通过用户对目标短视频的点击率预测值 计算预测值和真实值y之间的误差,进而使用误差来更新模型参数;本方法采用交叉熵损失函数来指导模型参数的更新过程:
其中,y∈{0,1}是真实值,代表用户是否点击了目标短视频;σ是sigmoid函数;最后采用Adam优化器更新模型参数。
2.根据权利要求1所述的一种基于多信息节点图网络的短视频点击率预测方法,其特征在于:所述短视频的多信息节点图网络构造方法为:为了捕捉短视频模态和短视频模态之间的转移关系,本方法从所有用户序列中构建物品图网络T;给定一个用户点击行为序列X=[x1,…,xn],任一短视频xj为图网络T的节点,(xj‑1,xj)为图网络T的边,(xj‑1,xj)表示一个用户点击短视频xj‑1后点击短视频xj;图的边数值属性为边(xj‑1,xj)出现的次数;图网络的节点包含了多种信息,因此从图节点的信息更新方式来看,该图网络T可以称之为多信息节点图网络T。
3.根据权利要求1所述的一种基于多信息节点图网络的短视频点击率预测方法,其特征在于:所述长短期记忆网络结构具体为:ij=σ(Wiuj+Uihj‑1+bi)fj=σ(Wfuj+Ufhj‑1+bf)oj=σ(Wouj+Uohj‑1+bo)cj=ijtanh(Wcuj+Uchj‑1+bc)+fjcj‑1hj=ojcj
其中, 和 更新方法相同且参数不共享,为了描述方便,公式略去p∈{a,b};模态a和模态b的长短期记忆网络的最后一层的隐藏状态hj的输出就是用户在模态a和模态b下的兴a b
趣表征v和v;uj是当前层的节点输入,Wi、Ui、Wf、Uf、Wo和Uo分别是控制输入门ij、遗忘门fj和输出门oj的参数;σ为sigmoid函数;所有这些参数和输入:隐层状态ht‑1、当前输入xt以及节点xt的的空间信息gt共同参与计算,来输出结果hj。