利索能及
我要发布
收藏
专利号: 2025101120776
申请人: 临沂大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-04-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于关系属性的可解释习题推荐方法,其特征在于,包括以下步骤:步骤1、处理Junyi Academy Online Learning Activity Dataset数据集中用户与习题的交互数据,根据数据间的关系构建三元组从而搭建用户‑习题知识图谱,并对用户‑习题知识图谱进行初始化;

步骤2、将初始化后的用户‑习题知识图谱实例输入至TransE模型进行训练,得到训练后实体和关系的嵌入向量;

步骤3、在用户‑习题知识图谱上进行用户练习习题推荐,将用户练习习题推荐形式化为马尔科夫决策过程,通过构建一个强化学习系统在用户‑习题知识图谱上进行多步骤路径推理实现用户练习习题推荐;

步骤3.1、构建强化学习系统:

强化学习系统以用户‑习题知识图谱为环境,通过强化学习系统与环境的交互来学习推荐策略;

强化学习系统中整个用户练习习题推荐过程的时长为 ,其中每一时间步表示为 ,1;

用户练习习题推荐过程中每一时间步的状态为一个一元组,表示为 ,进入强化学习系统之前的初始用户状态为 ( ),其中 表示空, 表示初始用户实体, 表示在系统在第 步时的实体, 表示第 步之前系统经过的实体的记录, 表示系统在到达第 步时的关系属性特征组合;

关系属性特征组合 获取过程如下:

将关系属性 和 对应的关系嵌入向量拼接成向量 送入Mamba编码器进行特征提取,再通过线性层进行输出映射,得到关系属性特征组合 ,作为当前状态 中的参数,关系属性特征组合 计算过程如下:,

其中,表示线性层的偏置, 表示线性层, 表示Mamba解码器,表示线性层的权重;

步骤3.2、通过强化学习系统现用户练习习题推荐:

步骤3.2.1、根据当前在系统在第 步时的实体 在用户‑习题知识图谱 中直接关联的实体和关系构建动作空间 ,动作空间表示为 ,表示第 步实体 之前的实体;

然后根据策略网络 从当前状态 的动作空间 中选择动作 ,计算过程如下:,

其中,第 步时的动作 中包括第 步时的实体 、第 步时的实体 、实体 与实体 之间的关系 ;

步骤3.2.2、执行选定的动作 后,状态从 转移到 ,状态中参数随着转移过程进行更新,计算在给定当前状态 和动作 的情况下,强化学习系统在下一步到达新状态的概率 ,具体过程如下:,

其中,新状态 , 表示第 步时的状态,

表示初始用户实体, 表示第 步时的实体, 表示第 步之前系统经过的实体的记录, 表示系统在到达第 步时的关系属性特征组合, 表示当前第步实体与下一步实体之间的关系;

步骤3.2.3、当前实体 的类型为习题实体时,通过考虑知识点相似性和难度适应性的动态奖励机制 计算当前实体 的即时奖励 ,计算过程如下:,

其中, ,  表示第 步之前系统经过的实体的记录 中的习题实体,表示关系类型为习题难度 的习题实体, 表示关系类型为回答上的正确性 的习题实体, 表示习题实体的概念, 表示当前第 步时的习题实体的概念, 表示关系类型为习题难度 的当前第 步时的习题实体,是奖励数值, 和 分别表示真实推荐中的两种情况;

步骤3.2.4、在完成第 个时间步的即时奖励 计算后,通过评分函数 计算终端奖励 ,计算过程如下:,

其中, 表示第 步时的实体,表示用户‑习题知识图谱 中所有习题实体的集合,表示集合 中任意一个习题实体, 表示取最大值, 表示 和 之间的关系, 作为评分函数中的头实体,作为评分函数中的尾实体。

2.根据权利要求1所述的一种基于关系属性的可解释习题推荐方法,其特征在于,步骤

1具体如下:

步骤1.1、加载Junyi Academy Online Learning Activity Dataset数据集,将数据集中用户与习题之间的交互数据转化为用户‑习题的关系数据,用户‑习题的关系数据包括用户ID、习题ID和习题的完成状态,习题的完成状态包括是否正确、练习时间和习题难度;

步骤1.2、根据用户‑习题的关系数据创建用户‑习题知识图谱,用户‑习题知识图谱的构建如下:用户‑习题知识图谱 由实体集 和关系集 构建的三元组 构成,,其中 表示头实体,表示关系,表示尾实体,头实体 和尾实体 属于实体集 ,头实体 和尾实体 包含用户、习题和概念三种类型,关系 属于关系集 ,关系 包含练习和训练两种类型,练习关系的属性包括回答的正确性 、练习时间和习题难度 三种属性;

步骤1.3、对用户‑习题知识图谱 进行初始化并保存。

3.根据权利要求2所述的一种基于关系属性的可解释习题推荐方法,其特征在于,步骤

2具体如下:

将初始化后的用户‑习题知识图谱 加载到TransE模型中,将用户‑习题知识图谱 中实体集 和关系集 的每个实体和关系映射到一个维度为 的向量空间中,得到对应的实体嵌入向量 和关系嵌入向量 ,实体嵌入向量 包括头实体嵌入向量 和尾实体嵌入向量 ,然后对实体和关系的嵌入向量进行随机初始化,作为TransE模型训练的起点,后续通过最小化TransE的损失函数,利用用户‑习题知识图谱 的训练数据对初始化的嵌入向量进行优化,最终得到最优的实体和关系嵌入向量。

4.根据权利要求3所述的一种基于关系属性的可解释习题推荐方法,其特征在于:在通过TransE模型对实体和关系的嵌入向量进行初始化的过程中,使用梯度下降算法对TransE模型进行训练来不断优化TransE模型中实体和关系的嵌入向量,并通过优化目标函数 优化TransE模型,优化目标函数 如下:,

其中,表示初始化后的知识图谱 中的三元组集合, 表示随机替换后的三元组, 表示随机替换三元组中的头实体或尾实体生成的负样本集合,负样本指通过对原始三元组进行随机替换生成的错误或不真实的三元组,表示距离函数,表示 和之间的距离, 表示替换后 和 的距离,距离函数的计算过程中采用L1或L2范数,表示控制正负样本之间距离差异的预设边界值, 表示取正部分;

通过训练后的TransE模型进一步计算每个三元组的得分,对于正样本三元组,训练后的TransE模型使得分 变小,使头实体与关系向量之间和与尾实体向量之间的距离变小,从而使正样本在向量空间中更加紧密地联系在一起,对于负样本三元组,训练后的TransE模型使得分 变大,使错误或不真实的三元组在向量空间中的距离将被拉大,从而区分正样本与负样本,正样本三元组的得分表示为 ,负样本三元组的得分表示为 ;

训练完成后,得到实体集 和关系集 的中每个实体 和关系 优化后的实体嵌入向量和关系嵌入向量 。

5.根据权利要求4所述的一种基于关系属性的可解释习题推荐方法,其特征在于:步骤3.3、输出用户练习习题推荐结果:

输出结果包括记录推荐系统在知识图谱中遍历路径的路径集 、记录推荐给用户习题序列的练习集 、记录每次推荐操作获得奖励的奖励集 ;

其中, , 表示初始用户实体, 表示第 步时的实体, 表示第步时的实体; , 表示第 步时的动作; ,

表示第 步时的实体 对应的即时奖励。