利索能及
我要发布
收藏
专利号: 2024105824548
申请人: 南通大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-13
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于暂退法与去噪技术的图对比学习推荐方法,其特征在于,包括以下步骤:S1、数据预处理,将yelp2018数据集处理成用户、商品和评价星级的交互数据文件;

S2、视图生成,通过用户与商品的交互数据集构建用户‑商品二分图,并分别使用暂退法和去噪技术生成新的第一视图与第二视图;

S3、视图学习,使用多层GCN分别学习第一视图和第二视图的嵌入表示;

S4、训练损失,使用BPR贝叶斯个性化排序损失函数和对比学习损失函数InfoNCE信息对比估计进行联合训练,反向传播以更新模型参数,优化模型效果;

S5、预测,将第一视图和第二视图的嵌入表示相加,通过softmax函数获得预测结果;

S6、性能评估,计算模型Recall召回率和NDCG归一化折损累计增益来校验模型性能;

所述步骤S1包括以下步骤:

S101、数据集收集:收集开源网站数据集yelp2018,并筛选出用户id、商品id和评价星级数据;

S102、数据预处理:对筛选出的数据进行清洗,处理缺失值、重复值、异常值;

S103、数据集划分:将预处理好的数据按照7:1:2的比例划分为训练集、验证集和测试集;

所述步骤S2包括以下步骤:

S201、根据用户与商品的交互数据构建成用户‑商品二分图,并生成对应的邻接矩阵;

S202、在用户‑商品二分图上进行暂退法构成新的第一视图,即使用边暂退法以概率ρ丢弃二分图的边,生成新的视图,其公式为:Adropout(g)=(V,Mε⊙ε)    (1)|ε|

其中,Mε∈{0,1} 是边集ε上的掩码向量,⊙表示逐元素乘积;

S203、在用户‑商品二分图上进行去噪技术构成新的第二视图,即使用去噪层来去除噪声边;使用一个具有去噪层的GCN来滤除输入图中的噪声边;对于第l层GCN,使用二进制矩l |V|×|V|阵M∈0,1 ,矩阵中 表示节点ui和vj之间的边是否存在噪声,0表示有噪声的边;

形式上,所得视图的邻接矩阵为:

l l

A=A⊙M    (2);

所述步骤S3包括以下步骤:

S301、将使用暂退法和去噪技术生成的第一视图和第二视图的邻接矩阵 分别进行对称归一化,其公式为:其中,D(u)和D(v)分别表示用户和商品的度矩阵, 表示与用户i有交互的商品的数量,表示与商品j有交互的用户的数量;

S302、分别对第一视图和第二视图的用户和商品之间的交互模式进行编码,将它们嵌入到d维潜在空间中进行传播,局部图嵌入传播层公式如下:(u) (v)

其中,E 和E 分别表示用户和商品的嵌入矩阵;

S303、将多个图嵌入传播层集成,细化用户/商品表示并聚合上下文嵌入的局部邻域信息,将用户ui和商品vj在第l层图神经网络GNN的嵌入分别表示为 和 从第(l‑1)层到第l层的消息传递过程如下:将所有层的嵌入表示相加,获得用户和商品的最终嵌入表示:其中, 表示用户ui和商品vj之间的预测偏好。

2.根据权利要求1所述的基于暂退法与去噪技术的图对比学习推荐方法,其特征在于,所述步骤S4包括以下步骤:S401、首先将原始用户‑商品二分图通过BPR损失函数进行训练,该损失函数为:+ ‑ + ‑

其中,O={(u,i,j)|(u,i)∈O,(u,j)∈O}是训练数据,O是观察到的交互,O=U×I/O+是未观察到的交互,σ(·)表示sigmod激活函数;

S402、然后将生成的第一视图和第二视图使用对比学习InfoNCE损失函数进行训练,即最大化正对的预测一致性,最小化负对的预测一致性:其中,(e′u,e″u)表示同一节点的不同视图的正对,(e′u,e″v)表示不同节点的不同视图的负对,s表示cosine相似度函数,τ表示温度系数;

上述公式(8)表示计算用户节点的对比损失,同理可得出商品节点的对比损失 则最终的对比损失函数为S403、最后进行联合训练,反向传播以更新模型参数,优化模型效果:

3.根据权利要求2所述的基于暂退法与去噪技术的图对比学习推荐方法,其特征在于,所述步骤S5在于从不同视图学习到的嵌入表示进行加权,并且通过softmax函数输出预测结果。

4.根据权利要求3所述的基于暂退法与去噪技术的图对比学习推荐方法,其特征在于,所述步骤S6中,Recall召回率的计算公式:其中,TP表示正确预测为用户喜欢的商品的数量,FN表示将用户实际上喜欢的商品错误地预测为不喜欢的数量;

NDCG归一化折损累计增益的计算公式为:

其中,relt表示在第t个位置上的结果的相关性,|REL|表示结果集的实际相关性的数量。