利索能及
我要发布
收藏
专利号: 2021100878800
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于根因分析的课程推荐方法,其特征在于,所述基于根因分析的课程推荐方法包括:

响应于基于根因分析的课程推荐指令,根据所述课程推荐指令获取课程数据;

识别所述课程数据中每个课程的标签;

根据每个课程的标签及所述课程数据构建训练样本训练预测模型;

根据所述预测模型,采用改进的ID3算法计算每个标签的信息熵;

根据每个标签的信息熵计算每个标签的信息增益;

根据每个标签的信息增益生成课程推荐列表。

2.如权利要求1所述的基于根因分析的课程推荐方法,其特征在于,所述根据所述课程推荐指令获取课程数据包括:

解析所述课程推荐指令的方法体,得到所述课程推荐指令所携带的信息;

获取预设标签;

根据所述预设标签构建正则表达式;

利用所述正则表达式在所述课程推荐指令所携带的信息中进行遍历,并将遍历到的数据确定为数据库标识;

根据所述数据库标识调取目标数据库,并从所述目标数据库中获取数据作为所述课程数据。

3.如权利要求1所述的基于根因分析的课程推荐方法,其特征在于,所述识别所述课程数据中每个课程的标签包括:

对每个课程对应的课程文本进行分词处理;

提取分词处理后的每个课程文本的词袋模型特征;

确定每个课程文本与每个课程的匹配度;

对每个匹配度进行二分类处理,得到高匹配度课程文本及低匹配度课程文本;

基于随机森林算法,计算所述高匹配度课程文本对应的词袋模型特征的第一重要性,及所述低匹配度课程文本对应的词袋模型特征的第二重要性;

按照重要性由高到低的顺序分别对所述第一重要性及所述第二重要性进行排序;

从所述第一重要性中获取排在前预设位的词袋模型特征作为所述高匹配度课程文本的关键词;

从所述第二重要性中获取排在所述前预设位的词袋模型特征作为所述低匹配度课程文本的关键词;

将所述高匹配度课程文本的关键词及所述低匹配度课程文本的关键词确定为每个课程的标签。

4.如权利要求1所述的基于根因分析的课程推荐方法,其特征在于,所述根据每个课程的标签及所述课程数据构建训练样本训练预测模型包括:将每个课程的标签确定为因子;

从所述课程数据中获取每个课程的标签对应的用户绩效作为训练目标;

根据所述因子及所述训练目标,基于GBDT算法进行训练,得到所述预测模型。

5.如权利要求1所述的基于根因分析的课程推荐方法,其特征在于,所述根据所述预测模型,采用改进的ID3算法计算每个标签的信息熵包括:以回圈方式每次去掉一个标签,并将每次去掉的标签确定为当前标签;

获取每次去掉所述当前标签后所述预测模型的当前贡献参数;

根据每个当前贡献参数计算每个当前标签的信息熵;

整合每次回圈过程中每个当前标签的信息熵,得到每个标签的信息熵。

6.如权利要求5所述的基于根因分析的课程推荐方法,其特征在于,采用下述公式根据每个当前贡献参数计算每个当前标签的信息熵:其中,H(xn)表示当前标签xn的信息熵,pn表示当前标签xn的贡献参数,i=1,2,...,n,n为正整数。

7.如权利要求1所述的基于根因分析的课程推荐方法,其特征在于,采用下述公式根据每个标签的信息熵计算每个标签的信息增益:其中,IG(tm)表示标签tm的信息增益,T表示所有标签构成的标签集合,Entropy(T)表示所述标签集合中标签的总信息熵,Entropy(tm)表示标签tm的信息熵,m为正整数。

8.一种基于根因分析的课程推荐装置,其特征在于,所述基于根因分析的课程推荐装置包括:

获取单元,用于响应于基于根因分析的课程推荐指令,根据所述课程推荐指令获取课程数据;

识别单元,用于识别所述课程数据中每个课程的标签;

训练单元,用于根据每个课程的标签及所述课程数据构建训练样本训练预测模型;

计算单元,用于根据所述预测模型,采用改进的ID3算法计算每个标签的信息熵;

所述计算单元,还用于根据每个标签的信息熵计算每个标签的信息增益;

生成单元,用于根据每个标签的信息增益生成课程推荐列表。

9.一种电子设备,其特征在于,所述电子设备包括:存储器,存储至少一个指令;及处理器,执行所述存储器中存储的指令以实现如权利要求1至7中任意一项所述的基于根因分析的课程推荐方法。

10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现如权利要求1至7中任意一项所述的基于根因分析的课程推荐方法。