利索能及
我要发布
收藏
专利号: 2021105900957
申请人: 桂林电子科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种商品信息推荐方法,其特征在于,包括如下步骤:S1:导入原始数据集,将所述原始数据集处理成知识图谱,通过知识图谱形式得到知识图谱数据集,并将所述知识图谱数据集划分为训练集和测试集;

S2:根据强化学习方法构建探索策略;

S3:基于图神经网络对所述知识图谱和所述探索策略构建策略网络定义目标商品,并计算目标商品的奖励函数和损失函数;

S4:通过损失函数和奖励函数分别计算出所述知识图谱数据集中各个数据的总损失值和累计奖励,再通过反向传播算法对所有数据的总损失值和累计奖励进行反向传播,得到商品推荐模型,并通过所述训练集对所述商品推荐模型进行训练;

S5:将所述测试集输入经训练后的商品推荐模型中,通过经训练后的商品推荐模型得到商品推荐结果。

2.根据权利要求1所述的商品信息推荐方法,其特征在于,所述步骤S1的过程包括:S1.1:定义原始数据集O={(u,i)|u∈U,i∈I},其中,U为用户集,I为商品集,(u,i)为用户u与商品i存在互动;

S1.2:定义知识图谱G={e,r}|,e为节点,r为节点间关系,其中{u,i}∈e,所述知识图谱包括用户集和商品集,将所述知识图谱以所述互动(u,i)为起点,寻找到中间节点e′,所述中间节点e′与节点i和节点j相连,所述中间节点e′为用户u选择节点i所对应商品的判断因素以及适合用户u的节点j所对应商品的判断因素。

3.根据权利要求2所述的商品信息推荐方法,其特征在于,所述步骤S2的过程具体包括:

S2.1:基于马尔可夫决策过程定义寻找目标节点的采样过程,所述采样过程的过程包括:所述目标节点为M={S,A,P,R};其中,A={a},A为探索动作a的集合,S={s},S为状态s的集合,P为状态s的转移函数,R为奖励函数,采样器为fS(),参数为θS;

S2.2:定义探索过程,所述定义探索过程的过程包括:在任一探索步骤t中,定义采样的动作at=(et→et′→et+1),ɑt为两跳的路径,所述ɑt包括(et,et′)和(et′,et+1)两跳路径,所述路径在T次探索后,通过所述采样器生成2T跳的路径;定义探索策略π=(e1,e2…eT),eT为所述采样器最终选择的目标节点,并将所述目标节点eT作为目标商品推荐给用户;

S2.3:定义探索状态,所述定义探索状态的过程包括:在任一探索步骤t中,所述采样器当前访问节点et,定义状态st=(u,et),探索步骤t为(s0,a1,s1…at,st),初始化状态s0=(u,i)为以所述互动(u,i)为起点开始探索的状态;

S2.4:定义探索动作,所述定义探索动作的过程包括:在任一探索步骤t中,所述节点et所有的探索动作at构成动作空间At;

S2.5:定义转移函数,所述定义转移函数的过程包括:在任一探索步骤t中,动作at由状态st转移到下一个状态时需要的转移函数为:P(st+1=(u,et+1)|st=(u,et),at=(et→et′→et+1))=1),从而构建得到探索策略。

4.根据权利要求3所述的商品信息推荐方法,其特征在于,所述步骤S3的过程包括:+

S3.1:根据图神经网络中的GraphSage算法,在所述知识图谱G和用户商品图O上生成节点的嵌入表示,在第l个图卷积层,节点e表示为 节点e的邻居节点集合Ne表示为节点e聚合所述节点e邻居节点集Ne的信息并更新表示,其中,其中,

其中, 为所述节点e经过l次传播后的表示,所述 为所述节点e经过第l‑1次传(l)

播后的表示,W 为权重矩阵,||为连接操作,ρ为LeakyReLU激活函数, 为所述节点e经过第l‑1次传播后的邻居集合表示;

每个零节点信息表示为 经过L次传播后的节点表示为 并将经过L次传播后的节点表示嵌入到知识表示中;

S3.2:经过所述GraphSage算法的节点表示为:经过GCN的节点表示为:

S3.3:构建基于GraphSage算法的GCN策略网络,所述构建基于GraphSage算法的GCN策略网络包括:

通过GCN网络生成的节点表示hGCN经过GraphSage生成节点表示hGraphSage,并经过dropout生成最终的节点表示hout;其公式为:hout=dropout(hGraphSage),其中,hGraphSage=GraphSage(hGCN),或构建基于GCN的GraphSage策略网络,所述构建基于GCN的GraphSage策略网络的过程包括:

将所述知识图谱数据集分别经过GraphSage算法和GCN生成的节点分别表示为所述hGraphSage和所述hGCN,并将两者相加后并通过GCN层生成表示h′GCN,并经过dropout生成最终的节点表示hout;其公式为:hout=dropout(h′GCN),其中,h′GCN=GCN(hGraphSage+hGCN);

S3.4:定义探索步骤,所述定义探索步骤的过程包括:在所述状态st=(u,et)中,所述动作at=(et→et′→et+1)包括两个环节,第一环节为(et,et′),第二环节为(et′,et+1),所述动作at=(et→et′→et+1)满足P(at,st)=P((et,et)|st)·P((et′,et+1)|st,(et,et′)),其中,P(at,st)为目标节点et+1的概率,经过所述第一环节和所述第二环节的节点选择,最终得到目标节点;

S3.5:计算知识图谱节点的邻居节点注意力,所述计算知识图谱节点的邻居节点注意力的过程包括:

所述节点et的邻居节点et′重要性表示为: P(et,et′)为et′能获得注意力大小或选择概率;

利用softmax函数进行归一化处理:所述节点et的某个所述邻居节点et′在所有邻居节点et″中能获得的注意力为:S3.6:计算商品的邻居节点注意力,所述计算商品的邻居节点注意力的过程包括;

从所述节点et′邻居中选出目标节点et+1;选择所述目标节点et+1的概率为所述目标节点et+1在所述节点et′所有邻居e″t+1中被选中的概率为

经过两次注意力的计算选出概率为P(at,st)的节点,将概率最高的目标节点et+1作为所述目标商品j推荐给所述用户u;

S3.7:邻居节点简化,所述邻居节点简化的过程包括:所述节点e的邻居节点集Ne中随机采样n1个节点构成集合 使用评分函数匹配e和e′的相似度,选出排名靠前的n2个节点构成集合 用所述集合 代替所述邻居节点集Ne,其中,n2

S3.8:计算所述目标商品j的奖励函数,所述计算所述目标商品的奖励函数的过程包括:

R(j)=gate*fu(u,j)+(1‑gate)*fi(i,j),T T

其中,fu(u,j)=rurj为所述用户u和所述节点j的匹配程度,fi(i,j)=rirj为所述节点j和所述商品i的相似度,gate=sigmoid(Wfi(i,j))为分配预测奖励与相似度奖励所占比重;

S3.9计算目标商品j的损失函数,所述计算目标商品j的损失函数的过程包括:计算所述目标商品j的损失值为:其中, 为L2正则化项,σ为sigmoid函数;ru为用户信息,ri为历史商品信息,rj为推荐商品信息。

5.根据权利要求4所述的商品信息推荐方法,其特征在于,所述步骤S4的过程包括:S4.1:通过累计奖励和策略梯度算法对所述采样器进行优化,得到所述目标商品j累积折扣奖励的最大化值,公式为:

其中,λ为折扣率,策略π得到的所述节点j最大的经验奖励;

S4.2:通过BPR贝叶斯个性化排序损失函数和随机梯度下降法进行推荐优化,得到目标商品j最小损失值:

S4.3:根据反向传播算法得到目标商品j推荐模型,并通过所述训练集对所述商品推荐模型进行训练,得到经训练后的商品推荐模型。

6.根据权利要求5所述的商品信息推荐方法,其特征在于,所述步骤S5的过程包括:在数据集中,所述历史商品分别记作 则:其中,concate为向量拼接操作,k为用户u购买过的历史商品数量,i为将历史商品拼接成一个历史商品向量;

在每次推荐过程中,用户u分别记作 则:其中,user为将用户拼接成一个用户向量;

目标商品j分别记作 则:

通过用户u和历史商品i得到用户对历史商品i的购买意愿信息,具体为:p(u,i)=user⊙i,

通过用户u和目标商品j得到用户对目标商品的购买意愿信息:p(u,j)=user⊙j,

通过所述用户对目标商品的购买意愿与所述用户对历史商品的购买意愿信息进行对比,并将对比结果作为商品推荐结果,具体为:

7.一种商品信息推荐系统,其特征在于,包括:原始数据集处理模块,用于导入原始数据集,将所述原始数据集处理成知识图谱,通过知识图谱形式得到知识图谱数据集,并将所述知识图谱数据集划分为训练集和测试集;

策略构建模块,用于根据强化学习方法构建探索策略;

目标商品定义模块,用于基于图神经网络对所述知识图谱和所述探索策略构建策略网络定义目标商品,并计算目标商品的奖励函数和损失函数;

模型训练模块,用于通过损失函数和奖励函数分别计算出所述知识图谱数据集中各个数据的总损失值和累计奖励,再通过反向传播算法对所有数据的总损失值和累计奖励进行反向传播,得到商品推荐模型,并通过所述训练集对所述商品推荐模型进行训练;

商品推荐结果获得模块,用于将所述测试集输入经训练后的商品推荐模型中,通过经训练后的商品推荐模型得到商品推荐结果。

8.根据权利要求7所述的商品信息推荐系统,其特征在于,所述原始数据集处理模块具体用于:

定义原始数据集O={(u,i)|u∈U,i∈I},其中,U为用户集,I为商品集,(u,i)为用户u与商品i存在互动;

定义知识图谱G={e,r}|,e为节点,r为节点间关系,其中{u,i}∈e,所述知识图谱包括用户集和商品集,将所述知识图谱以所述互动(u,i)为起点,寻找到中间节点e′,所述中间节点e′与节点i和节点j相连,所述中间节点e′为用户u选择节点i所对应商品的判断因素以及适合用户u的节点j所对应商品的判断因素。

9.一种商品信息推荐装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,当所述处理器执行所述计算机程序时,实现如权利要求1至6任一项所述的商品信息推荐方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,当所述计算机程序被处理器执行时,实现如权利要求1至6任一项所述的商品信息推荐方法。