欢迎来到利索能及~ 联系电话:18621327849
利索能及
我要发布
收藏
专利号: 2021110359612
申请人: 中国计量大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-10-29
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于多来源信息异构图的会话推荐方法,其特征在于:根据用户当前会话中的物品序列,召回邻居会话集合;本方法采用记忆矩阵M存储最近发生的会话;基于当前会话s={v1,v2,…,v|s|},从记忆矩阵M中用cosine相似度找出最相似的k个会话作为当前会话s的邻居会话集合Ns,cosine相似度计算公式如下:其中,sj是记忆矩阵M中存储的任一会话; 是会话s的二进制向量表示,如果一个物品出现在会话中,那么s中对应位置为1,否则为0;同理, 是会话sj的二进制向量表示;l(s)和l(sj)分别代表了会话s和sj的长度;对于记忆矩阵M中存储的所有会话,用公式sim(s,sj)计算出和当前会话s的cosine相似度,把相似度低于阈值simthre的会话过滤掉,再按照cosine相似度由高到低排序,找出前k个会话作为当前会话s的邻居会话集合Ns;simthre设置小数值,可以增加推荐物品的多样性,simthre设置大数值,可以过滤掉更多的噪音;

对邻居会话集合进行处理,并结合用户当前会话构建异构图;异构图G中的节点为当前会话s和邻居会话集合Ns中出现的物品集合的并集;异构图G中的边是无向边,且存在两种语义的边:一种边来源于当前会话中物品转移关系,代表当前用户的兴趣转移;另外一种边来源于邻居会话中的物品转移关系,代表着物品的普遍转移规律;这两种边的数据来源不同,因此代表的语义也不同;当前会话s={v1,v2,…,v|s|}中的(vj‑1,vj)为异构图G的边,表示点击物品vj‑1之后,点击物品vj;同理,邻居会话集合Ns中的会话中也可以构建出异构图G的另一种语义的边;先对邻居会话集合Ns中会话里出现的所有边的次数进行统计,过滤掉出现次数小于ε的边;出现次数小于ε的边被认为不能代表物品的普遍转移关系;此时,异构图G中存在两种来源的边,在异构图的表示中,边使用标志φ∈{inner,outer}进行区分,分别表示来源为当前会话内部和邻居会话集合,代表的语义分别是当前用户兴趣转移和普遍物品转移规律;

基于异构图,采用多来源信息门机制得到当前会话中的物品向量表征;异构图中有两种语义的边存在,因此对于目标物品节点vi,存在两种语义邻居节点;采用多来源信息门机制对目标物品节点vi的两种语义邻居节点进行选择和汇集到目标物品节点vi中;注意,这里的目标物品节点vi属于当前会话中出现的物品,也就是只需要对出现在当前会话中的物品节点进行向量更新;目标节点vi的最终向量表征xi更新公式如下:其中,ci表示物品节点vi的下标,矩阵 存放所有物品的向量表征,所以通过获得物品节点vi的向量表征vi; 和 分别代表两种语义下的转换矩阵;将目标物品节点vi的两种语义下的邻居节点集合 和 分别汇聚成两种语义下的邻居信息向量 和 和 分别表示 集合和 集合的个数;然后用基于和vi的多来源信息门机制得到门向量gi,门向量gi控制代表当前用户兴趣转移语义下的邻居信息向量 向量1‑gi控制普遍物品转移语义下的邻居信息向量 得到 这里, 和Wg是转换矩阵,sigmoid是sigmoid函数;也就是,不同语义下的邻居节点信息的传递采用多来源信息门机制来控制,而多来源信息门机制的信息输入是不同语义下的邻居和目标节点本身;最后, 和目标节点的原来向量表征vi进行连接,并采用转换矩阵Wx转化成新的目标节点向量xi,这里||表示向量的连接操作;

根据用户当前会话中物品序列,获得用户兴趣表征;得到所有物品的向量表征之后,采用门控制循环神经网络(GRU)对用户当前会话s={v1,v2,…,v|s|}进行表征,得到会话表征,即用户当前兴趣表征p;

根据用户兴趣表征,推荐物品;将物品vj的向量vj乘以用户兴趣向量p,再应用softmax函数计算出物品vj的分数:

其中,p代表用户的兴趣向量,代表物品vj成为下一个交互物品的可能性;同时根据的对数似然函数值,计算损失函数:

其中,yj代表vj的one‑hot编码, 函数用梯度下降法来最优化。

2.根据权利要求1所述的一种基于多来源信息异构图的会话推荐方法,其特征在于:所述门控制循环神经网络(GRU)为:

zi=σ(Wxz·xi+Whz·hi‑1)ri=σ(Wxr·xi+Whr·hi‑1)其中,ri是重置门,zi为更新门,这两个门控向量决定了哪些信息能作为门控循环单元的输出;是当前记忆内容;xi是当前层的节点输入;Wxz、Whz、Wxr和Whr分别是控制更新门zi和重置门ri的参数;Wxh和Whh是控制前记忆内容 的参数;⊙是元素级别的矩阵相乘,σ是sigmoid函数;门控制循环神经网络(GRU)的最后一个隐藏层的输出h|s|就是该会话表征,即用户当前兴趣表征p。