买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于关系属性的可解释习题推荐方法及系统

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于关系属性的可解释习题推荐方法及系统

￥25000

专利号： 2025101120776

申请人：临沂大学

专利类型：发明专利

专利状态：已下证

更新日期：2026-04-09

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于关系属性的可解释习题推荐方法，其特征在于，包括以下步骤：步骤1、处理Junyi Academy Online Learning Activity Dataset数据集中用户与习题的交互数据，根据数据间的关系构建三元组从而搭建用户‑习题知识图谱，并对用户‑习题知识图谱进行初始化；

步骤2、将初始化后的用户‑习题知识图谱实例输入至TransE模型进行训练，得到训练后实体和关系的嵌入向量；

步骤3、在用户‑习题知识图谱上进行用户练习习题推荐，将用户练习习题推荐形式化为马尔科夫决策过程，通过构建一个强化学习系统在用户‑习题知识图谱上进行多步骤路径推理实现用户练习习题推荐；

步骤3.1、构建强化学习系统：

强化学习系统以用户‑习题知识图谱为环境，通过强化学习系统与环境的交互来学习推荐策略；

强化学习系统中整个用户练习习题推荐过程的时长为，其中每一时间步表示为，1；

用户练习习题推荐过程中每一时间步的状态为一个一元组，表示为，进入强化学习系统之前的初始用户状态为 ( )，其中表示空，表示初始用户实体，表示在系统在第步时的实体，表示第步之前系统经过的实体的记录，表示系统在到达第步时的关系属性特征组合；

关系属性特征组合获取过程如下：

将关系属性和对应的关系嵌入向量拼接成向量送入Mamba编码器进行特征提取，再通过线性层进行输出映射，得到关系属性特征组合，作为当前状态中的参数，关系属性特征组合计算过程如下：，

其中，表示线性层的偏置，表示线性层，表示Mamba解码器，表示线性层的权重；

步骤3.2、通过强化学习系统现用户练习习题推荐：

步骤3.2.1、根据当前在系统在第步时的实体在用户‑习题知识图谱中直接关联的实体和关系构建动作空间，动作空间表示为，表示第步实体之前的实体；

然后根据策略网络从当前状态的动作空间中选择动作，计算过程如下：，

其中，第步时的动作中包括第步时的实体、第步时的实体、实体与实体之间的关系；

步骤3.2.2、执行选定的动作后，状态从转移到，状态中参数随着转移过程进行更新，计算在给定当前状态和动作的情况下，强化学习系统在下一步到达新状态的概率，具体过程如下：，

其中，新状态，表示第步时的状态，

表示初始用户实体，表示第步时的实体，表示第步之前系统经过的实体的记录，表示系统在到达第步时的关系属性特征组合，表示当前第步实体与下一步实体之间的关系；

步骤3.2.3、当前实体的类型为习题实体时，通过考虑知识点相似性和难度适应性的动态奖励机制计算当前实体的即时奖励，计算过程如下：，

其中， , 表示第步之前系统经过的实体的记录中的习题实体，表示关系类型为习题难度的习题实体，表示关系类型为回答上的正确性的习题实体，表示习题实体的概念，表示当前第步时的习题实体的概念，表示关系类型为习题难度的当前第步时的习题实体，是奖励数值，和分别表示真实推荐中的两种情况；

步骤3.2.4、在完成第个时间步的即时奖励计算后，通过评分函数计算终端奖励，计算过程如下：，

，

其中，表示第步时的实体，表示用户‑习题知识图谱中所有习题实体的集合，表示集合中任意一个习题实体，表示取最大值，表示和之间的关系，作为评分函数中的头实体，作为评分函数中的尾实体。

2.根据权利要求1所述的一种基于关系属性的可解释习题推荐方法，其特征在于，步骤

1具体如下：

步骤1.1、加载Junyi Academy Online Learning Activity Dataset数据集，将数据集中用户与习题之间的交互数据转化为用户‑习题的关系数据，用户‑习题的关系数据包括用户ID、习题ID和习题的完成状态，习题的完成状态包括是否正确、练习时间和习题难度；

步骤1.2、根据用户‑习题的关系数据创建用户‑习题知识图谱，用户‑习题知识图谱的构建如下：用户‑习题知识图谱由实体集和关系集构建的三元组构成，，其中表示头实体，表示关系，表示尾实体，头实体和尾实体属于实体集，头实体和尾实体包含用户、习题和概念三种类型，关系属于关系集，关系包含练习和训练两种类型，练习关系的属性包括回答的正确性、练习时间和习题难度三种属性；

步骤1.3、对用户‑习题知识图谱进行初始化并保存。

3.根据权利要求2所述的一种基于关系属性的可解释习题推荐方法，其特征在于，步骤

2具体如下：

将初始化后的用户‑习题知识图谱加载到TransE模型中，将用户‑习题知识图谱中实体集和关系集的每个实体和关系映射到一个维度为的向量空间中，得到对应的实体嵌入向量和关系嵌入向量，实体嵌入向量包括头实体嵌入向量和尾实体嵌入向量，然后对实体和关系的嵌入向量进行随机初始化，作为TransE模型训练的起点，后续通过最小化TransE的损失函数，利用用户‑习题知识图谱的训练数据对初始化的嵌入向量进行优化，最终得到最优的实体和关系嵌入向量。

4.根据权利要求3所述的一种基于关系属性的可解释习题推荐方法，其特征在于：在通过TransE模型对实体和关系的嵌入向量进行初始化的过程中，使用梯度下降算法对TransE模型进行训练来不断优化TransE模型中实体和关系的嵌入向量，并通过优化目标函数优化TransE模型，优化目标函数如下：，

其中，表示初始化后的知识图谱中的三元组集合，表示随机替换后的三元组，表示随机替换三元组中的头实体或尾实体生成的负样本集合，负样本指通过对原始三元组进行随机替换生成的错误或不真实的三元组，表示距离函数，表示和之间的距离，表示替换后和的距离，距离函数的计算过程中采用L1或L2范数，表示控制正负样本之间距离差异的预设边界值，表示取正部分；

通过训练后的TransE模型进一步计算每个三元组的得分，对于正样本三元组，训练后的TransE模型使得分变小，使头实体与关系向量之间和与尾实体向量之间的距离变小，从而使正样本在向量空间中更加紧密地联系在一起，对于负样本三元组，训练后的TransE模型使得分变大，使错误或不真实的三元组在向量空间中的距离将被拉大，从而区分正样本与负样本，正样本三元组的得分表示为，负样本三元组的得分表示为；

训练完成后，得到实体集和关系集的中每个实体和关系优化后的实体嵌入向量和关系嵌入向量。

5.根据权利要求4所述的一种基于关系属性的可解释习题推荐方法，其特征在于：步骤3.3、输出用户练习习题推荐结果：

输出结果包括记录推荐系统在知识图谱中遍历路径的路径集、记录推荐给用户习题序列的练习集、记录每次推荐操作获得奖励的奖励集；

其中，，表示初始用户实体，表示第步时的实体，表示第步时的实体；，表示第步时的动作；，

表示第步时的实体对应的即时奖励。