利索能及
我要发布
收藏
专利号: 2022106496787
申请人: 燕山大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-07-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种融合内容和图结构信息的慕课推荐算法,其特征在于:包括如下步骤:步骤S1、数据预处理,构建GEMRec模型和CNNMRec模型的输入数据;

步骤S2、将邻接矩阵集合A输入到GEMRec模型,得到用户图嵌入向量和课程图嵌入向量;

步骤S3、将用户图嵌入向量、课程图嵌入向量、用户词嵌入向量和课程词嵌入向量输入到CNNMRec模型,输出用户学习与课程之间的交互概率;

步骤S4、训练时,使用二分类交叉熵损失函数,通过梯度下降法减小损失,推荐时,计算用户与所有候选课程的余弦相似度,为用户推荐相似度最大的前K门课程。

2.根据权利要求1所述的一种融合内容和图结构信息的慕课推荐算法,其特征在于:所述步骤S1的具体步骤如下:步骤S11、利用用户、课程和知识概念构造用包含单位矩阵I的邻接矩阵集合A表示的异构信息网络;

步骤S12、去掉课程介绍文本中的HTML标签和首尾的转义字符,用[UNK]标记替换文本中间的转义字符,长度超过512个字符的文本在第510个字符后进行截断;

步骤S13、将处理后的课程介绍输入到预训练模型BERT中,在输出层取[CLS]标记对应的特征向量作为该课程的词嵌入向量;

步骤S14、对用户学习过的课程序列中的每一门课程的词嵌入向量加权求和得到用户词嵌入向量,使用指数衰减法为课程分配权重,公式如下:其中, 表示用户ui的词嵌入向量, 表示用户ui学习的课程数量,t表示用户学习的第t门课程, 表示第t门课程的词嵌入向量, 表示用户最新学习的课程。

3.根据权利要求2所述的一种融合内容和图结构信息的慕课推荐算法,其特征在于:所述步骤S2的具体步骤如下:步骤S21、邻接矩阵集合A输入到包含两个并行多通道1×1卷积神经网络的MG子层生成元路径邻接矩阵;

(l) N×N×C

步骤S22、将图卷积网络应用于元路径邻接矩阵A ∈R 的每个通道,并将每个节点不同通道的表征进行拼接,公式如下:其中,||是拼接操作符,C表示通道数,σ为Sigmoid激活函数, 是第i个通道d×d带自连接的元路径邻接矩阵, 是 的度矩阵,W∈R 是跨通道共享的可训练权重矩阵,N×dX∈R 是特征矩阵,Z包含了来自C个不同元路径图的节点表征,每个元路径邻接矩阵的长度不一样;

步骤S23、将Z中的用户表征作为状态输入到强化学习模型Policy Gradient中,通过最大化得到的奖励更新异构信息网络,从而更新图中的节点表征,最终得到用户和课程的图嵌入向量。

4.根据权利要求3所述的一种融合内容和图结构信息的慕课推荐算法,其特征在于:所述步骤S21的具体步骤如下:步骤S211、利用多通道1×1卷积从邻接矩阵集合A中软选择两个邻接矩阵Q1、Q2,公式如下:

1×1×K e

其中,φ是卷积层,Wφ∈R 是φ的参数,T表示边类型的集合, 是边类型ti在第l个MG子层的权重, 是边类型ti对应的邻接矩阵;

步骤S212、根据软选择的两个邻接矩阵通过矩阵乘法Q1*Q2计算元路径邻接矩阵;

步骤S213、任意长度为l的元路径的邻接矩阵可通过堆叠MG子层实现,具体的计算公式如下:其中,AP表示元路径邻接矩阵。

5.根据权利要求4所述的一种融合内容和图结构信息的慕课推荐算法,其特征在于:所述步骤S23的具体步骤如下:步骤S231、给定特定的用户,将用户图嵌入向量作为状态输入到Policy Gradient中,输出学习每门课程的概率,取概率最大的课程作为预测值,如果预测的课程 是正确的,奖励设置为1,模型将通过在用户和正确推荐的课程之间添加边来更新异构信息网络,从而更新状态得到新的用户表征,继续输入到Policy Gradient,该回合继续进行;

步骤S232、如果预测的课程 是错误的,奖励设置为‑1,则该回合结束,进行模型参数更新,具体过程如下:步骤S2321、一个回合结束后获得的奖励是单个时间步获得奖励的累积,公式如下:其中,γ表示折扣因子,t和k表示时间步。

步骤S2322、所有回合的累积奖励的计算公式如下:其中,πθ(τ)表示采取τ策略的发生概率,N为采样τ的数目;

步骤S2323、目标是最大化累积奖励L(θ),如果将其作为损失函数,需要求解损失函数的最小值,即最小化‑L(θ),通过求解其导数,进而求得极值点,求导过程的公式如下:;

步骤S2324、每个回合结束后参数更新公式如下:步骤S2325、为了缓解强化学习中探索与利用之间权衡的特殊问题,采用熵正则化的方法,公式如下:步骤S2326、最终的目标函数公式如下:

‑L(θ)+λH[πθ(at|st)]。

6.根据权利要求5所述的一种融合内容和图结构信息的慕课推荐算法,其特征在于:所述步骤S3的具体步骤如下:步骤S31、将得到的图嵌入向量和词嵌入向量输入到CNNMRec模型中,输出用户与课程之间的交互概率,整个过程的公式表示如下:g w g

其中, 表示模型输出的预测值,f对应CNNMRec模型中的卷积层和全连接层,U、U 、Cw和C分别表示用户图嵌入向量、用户词嵌入向量、课程图嵌入向量和课程词嵌入向量,θ为待求解的模型参数,这些参数包括神经网络中的权重矩阵以及神经元的偏置。

7.根据权利要求6所述的一种融合内容和图结构信息的慕课推荐算法,其特征在于:所述步骤S31的具体步骤如下:步骤S311、将图嵌入向量和词嵌入向量分别输入到两个并行的卷积神经网络中;

步骤S312、将卷积神经网络的输出传入全连接层中,输出两个特征向量,即用户嵌入和课程嵌入,计算它们的余弦相似度作为用户与该课程之间的交互概率。

8.根据权利要求7所述的一种融合内容和图结构信息的慕课推荐算法,其特征在于:所述步骤S4的具体步骤如下:步骤S41、计算二分类交叉熵损失函数,公式如下:(i)

其中,y 的取值为0或1,代表用户是否学习过当前课程;

步骤S42、通过HR@K和NDCG@K衡量推荐效果:HR@K公式如下:

其中,|GT|表示测试集的大小;

NDCG@K公式如下:

其中,r(j)表示每个物品的相关分数,Zkq是归一化因子。