1.一种基于跨媒体动态知识图谱的教学方法,其特征在于,包括:
‑构建跨媒体动态知识图谱;
‑在知识图谱中存放实体相关信息,通过学科知识问答,返回实体相应的属性值;
‑获取学生以及知识点的反馈信息,计算知识点推荐度以及学习资源推荐值评分,从而构造出知识点推荐列表与学习资源推荐列表返回给学习者;
‑构建课程知识卡片:为不同类型的实体构建不同的知识卡片,通过用户查询实体并在知识图谱中进行匹配,以知识卡片的形式返回相应的实体及其属性值;
‑好友推荐:向当前用户推荐与当前用户学习进度、学习情况相近的其他用户;
构造出知识点推荐列表与学习资源推荐列表的过程包括:
首先通过构建学习者‑资源类型矩阵、学习者‑知识点评分矩阵、知识点‑资源类型矩阵,获取学生以及知识点的显式反馈信息与隐式反馈信息,包括学习者的学习兴趣偏好、学习情况以及知识点包含资源类型;然后利用协同过滤与神经网络相结合的方法,计算知识点推荐度以及学习资源推荐值评分,根据评分构造列表;
定义学习者集合为:U={u1,u2,u3,…,um},资源类型集合为:R={r1,r2,r3,…,rq},由此得到学习者‑资源类型矩阵,行向量代表学生,列向量代表资源类型,矩阵元素pij代表学生i对资源类型j的使用率,i={1,2,3,…,m},j={1,2,3,…q};为避免冷启动问题,学习者对各资源类型的使用次数均初始化为1,再根据后续学习行为更新使用次数;资源类型使用率计算公式如下:其中,vij表示用户i对资源类型j的使用次数;
定义学习者集合为:U={u1,u2,u3,…,um},知识点集合为:K={k1,k2,k3,…,kn},由此得到学习者‑知识点评分矩阵,行向量代表学生,列向量代表知识点,矩阵元素代表学生对知识点的得分率;通过试题检测,统计学生对每个知识点的得分;其中,主观题通过对标准答案和学生答案的相似度计算得到一个相似度值,再根据该题目的总分,给出学生的得分;将学生对每个知识点得分进行归一化,将获得的分数映射到[0,1]区间,得到学生对知识点的得分率;
构造候补推荐知识点列表K',由学习者‑知识点评分矩阵,筛选候补推荐知识点;设定阈值T,当学生对知识点的得分率小于阈值时,表明学生对该知识点的掌握比较薄弱,将该知识点作为候补推荐知识点;结合知识图谱中学生最近学习知识点与候补推荐知识点的位置关系确定推荐知识点列表K’1;采用BFS广度优先搜索计算最近学习知识点与候补推荐知识点的最短路径,最短路径距离越小,知识点相关性越强,值得推荐程度越高,用d(o,t)表示最近学习知识点o与候补推荐知识点t的最短路径距离;结合学生最近学习知识点与候补推荐知识点的相似度确定推荐知识点列表K’2;根据知识图谱中存放的各知识点的属性值计算知识点相似度,知识点相似度越大,值得推荐程度越高,采用WV‑CNN模型进行文本相似度计算,用sim(o,t)表示最近学习知识点o与候补推荐知识点t的文本相似度;WV‑CNN模型由三部分组成:第一部分是对输入文本进行词语向量化表示,通过对输入的中文语句进行分词、编码、生成向量的过程获得文本的词向量,将其作为卷积神经网络(CNN)的输入;第二部分是CNN,设置了卷积层、Dropout层、池化层和Flatten层四层,通过梯度下降法对网络中的权重矩阵不断进行调节,得到优化的参数和结果;第三部分是输出,即文本语义相似度计算的结果;
将生成的推荐知识点列表K’1和推荐知识点列表K’2的内容线性组合生成最后的知识点推荐列表,通过知识点推荐度选取前F个知识点推荐给学习者;
用lit表示候补推荐知识点t对于用户i的知识点推荐度,计算公式如下:
其中,α与β是调整因子,两者取值必须满足α·β=1;
引入知识点‑资源类型矩阵,定义知识点集合为:K={k1,k2,k3,…,kn},资源类型集合为:R={r1,r2,r3,…,rq},行向量代表知识点,列向量代表资源类型,矩阵元素atj表示知识点t是否包含资源类型j,t={1,2,3,…,n},j={1,2,3,…q};其中包含记为1,否则记为0;
融合学习者使用资源类型偏好,知识点推荐度以及知识点包含的资源类型得出学习资源推荐列表,学习资源推荐值评分计算公式如下:scoreitj=pij·lit·atj
其中,scoreitj表示用户i对知识点t中的j类型资源的推荐值评分,pij表示用户i对资源类型j的使用率,lit表示知识点t对于用户i的知识点推荐度,atj表示知识点t是否包含资源类型j;根据学习资源推荐值评分选取前F项学习资源推荐给学习者。
2.根据权利要求1所述基于跨媒体动态知识图谱的教学方法,其特征在于,构建跨媒体动态知识图谱包括:使用Python工具爬取所需课程的相关信息,相关信息包括文本、图像、视频、习题以及PPT;对爬取的数据进行清洗,并对文本数据采用BIO方法进行人工标注;抽取处理好的数据集中的实体以及实体间属性和关系,将抽取出的实体集、关系集以及图像、视频进行整合,构成跨媒体知识图谱,跨媒体知识图谱经系统人员授权后由学生和教师共同编辑,对在学习过程中发现图谱缺少的知识点进行反馈与补充,形成跨媒体动态知识图谱。
3.根据权利要求2所述基于跨媒体动态知识图谱的教学方法,其特征在于,构建学科领域专有名词词典,在分词时将其加入jieba的自定义词库,融合内置传统字典对文本进行分词;采用Word2vec作为词向量训练模型,将整理好的学科领域数据集作为该模型的训练语料对其进行训练,采用BILSTM+CRF神经网络模型进行实体抽取,并通过标注好的文本数据对神经网络模型进行训练,并将词向量表示作为BILSTM网络的输入,使用两个LSTM网络来获取词向量的上下文信息提取特征进行建模,再融合CRF中转移矩阵的计算,最终预测词作为实体的概率从而完成实体抽取;采用基于模板的方式进行属性抽取和关系抽取,属性抽取是对实体进行描述,通过属性完整的表达实体;关系抽取则是抽取实体之间存在的内在逻辑关系,将分散的实体连接起来,共同构成一个语义网络;通过将抽取出的实体集、关系集以及图像、视频整合之后分批导入Neo4j,完成知识存储,构成跨媒体知识图谱。
4.根据权利要求1所述基于跨媒体动态知识图谱的教学方法,其特征在于,学科知识问答的过程包括:在知识图谱中以“实体‑属性‑属性值”的三元组形式存放实体相关信息,当提出问题时,首先通过命名实体识别,抽取出问句中的实体,与知识图谱进行链接,找到相应实体,然后利用问句信息结合提前设置好的规则模板进行实体属性匹配,返回相应属性值。
5.根据权利要求4所述基于跨媒体动态知识图谱的教学方法,其特征在于,对问句进行分词及词向量训练,在分词过程中,使用jieba工具并加入提前设定的学科领域专有词典;
利用BILSTM+CRF模型对自然语言问句进行实体抽取;结合已构建的知识图谱,将抽取出的实体与图谱中实体进行匹配,若知识图谱中有相匹配实体,选定该实体,若知识图谱中没有相匹配实体,则利用余弦相似度算法进行语义相似度计算,选取最接近实体;将所选实体和属性与知识图谱中的三元组进行匹配;返回相应属性值,作为该问句的答案提供给用户。
6.根据权利要求1所述基于跨媒体动态知识图谱的教学方法,其特征在于,进行好友推荐的过程包括:获取当前学生u和其他学生v最近一次学习知识点在知识图谱中的节点位置,当前学生位置表示为A,其他学生位置表示为B;结合学生基于知识图谱的最近学习位置这一特征,计算当前学生u和其他学生v之间的位置相似度,位置相似度计算公式如下:其中,d(A,B)指的是在知识图谱中A节点与B节点的最短路径距离,由BFS广度优先搜索计算得出,即A与B距离越远,相似度越低,最近所学知识关联性越低;距离越近,相似度越高,最近所学知识关联性越高;
引入学习者‑知识点的二部图关联模型,定义学习者集合为:U={u1,u2,u3,…,um},知识点集合为:K={k1,k2,k3,…,kn},由此得到学习者‑知识点矩阵,行向量代表学生,列向量代表学生关于知识点的学习行为,其中学习过的知识点标记为1,其余为0;
计算当前学生u与其他学生v的学习情况相似度,计算公式如下:
其中uki和vki分别表示当前学生u和其他学生v对知识点ki的学习行为,n为知识点的总数,计算的相似度结果越大,表明两学生都学习过的知识点越多,学习情况越相近;
计算用户之间的综合相似度;将位置相似度和学习情况相似度进行线性加权融合,并用参数α来平衡两者的权重关系,综合相似度计算公式如下:sim(u,vi)=α·sim(place(u,vi))+(1‑α)·sim(LS(u,vi))
返回综合相似度计算前N名的学生,作为好友推荐给当前学生。
7.一种基于跨媒体动态知识图谱的教学系统,其特征在于:
包括数据层、数据分析层、应用层以及用户层;数据层涵盖构建跨媒体动态知识图谱所需要的资源类型,不同媒体类型的数据在形式上多源异构,语义上互相关联;数据分析层用于处理所爬取的教学资源,处理方式包括实体抽取、关系抽取、属性抽取、语义相似度计算;
应用层为用户提供知识服务,知识服务包括学科知识问答、学习资源推荐、课程知识卡片以及好友推荐;用户层将用户分为三类,分别面向学生、教师以及系统人员;
构造出知识点推荐列表与学习资源推荐列表的过程包括:
首先通过构建学习者‑资源类型矩阵、学习者‑知识点评分矩阵、知识点‑资源类型矩阵,获取学生以及知识点的显式反馈信息与隐式反馈信息,包括学习者的学习兴趣偏好、学习情况以及知识点包含资源类型;然后利用协同过滤与神经网络相结合的方法,计算知识点推荐度以及学习资源推荐值评分,根据评分构造列表;
定义学习者集合为:U={u1,u2,u3,…,um},资源类型集合为:R={r1,r2,r3,…,rq},由此得到学习者‑资源类型矩阵,行向量代表学生,列向量代表资源类型,矩阵元素pij代表学生i对资源类型j的使用率,i={1,2,3,…,m},j={1,2,3,…q};为避免冷启动问题,学习者对各资源类型的使用次数均初始化为1,再根据后续学习行为更新使用次数;资源类型使用率计算公式如下:其中,vij表示用户i对资源类型j的使用次数;
定义学习者集合为:U={u1,u2,u3,…,um},知识点集合为:K={k1,k2,k3,…,kn},由此得到学习者‑知识点评分矩阵,行向量代表学生,列向量代表知识点,矩阵元素代表学生对知识点的得分率;通过试题检测,统计学生对每个知识点的得分;其中,主观题通过对标准答案和学生答案的相似度计算得到一个相似度值,再根据该题目的总分,给出学生的得分;将学生对每个知识点得分进行归一化,将获得的分数映射到[0,1]区间,得到学生对知识点的得分率;
构造候补推荐知识点列表K',由学习者‑知识点评分矩阵,筛选候补推荐知识点;设定阈值T,当学生对知识点的得分率小于阈值时,表明学生对该知识点的掌握比较薄弱,将该知识点作为候补推荐知识点;结合知识图谱中学生最近学习知识点与候补推荐知识点的位置关系确定推荐知识点列表K’1;采用BFS广度优先搜索计算最近学习知识点与候补推荐知识点的最短路径,最短路径距离越小,知识点相关性越强,值得推荐程度越高,用d(o,t)表示最近学习知识点o与候补推荐知识点t的最短路径距离;结合学生最近学习知识点与候补推荐知识点的相似度确定推荐知识点列表K’2;根据知识图谱中存放的各知识点的属性值计算知识点相似度,知识点相似度越大,值得推荐程度越高,采用WV‑CNN模型进行文本相似度计算,用sim(o,t)表示最近学习知识点o与候补推荐知识点t的文本相似度;WV‑CNN模型由三部分组成:第一部分是对输入文本进行词语向量化表示,通过对输入的中文语句进行分词、编码、生成向量的过程获得文本的词向量,将其作为卷积神经网络(CNN)的输入;第二部分是CNN,设置了卷积层、Dropout层、池化层和Flatten层四层,通过梯度下降法对网络中的权重矩阵不断进行调节,得到优化的参数和结果;第三部分是输出,即文本语义相似度计算的结果;
将生成的推荐知识点列表K’1和推荐知识点列表K’2的内容线性组合生成最后的知识点推荐列表,通过知识点推荐度选取前F个知识点推荐给学习者;
用lit表示候补推荐知识点t对于用户i的知识点推荐度,计算公式如下:
其中,α与β是调整因子,两者取值必须满足α·β=1;
引入知识点‑资源类型矩阵,定义知识点集合为:K={k1,k2,k3,…,kn},资源类型集合为:R={r1,r2,r3,…,rq},行向量代表知识点,列向量代表资源类型,矩阵元素atj表示知识点t是否包含资源类型j,t={1,2,3,…,n},j={1,2,3,…q};其中包含记为1,否则记为0;
融合学习者使用资源类型偏好,知识点推荐度以及知识点包含的资源类型得出学习资源推荐列表,学习资源推荐值评分计算公式如下:scoreitj=pij·lit·atj
其中,scoreitj表示用户i对知识点t中的j类型资源的推荐值评分,pij表示用户i对资源类型j的使用率,lit表示知识点t对于用户i的知识点推荐度,atj表示知识点t是否包含资源类型j;根据学习资源推荐值评分选取前F项学习资源推荐给学习者。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1‑6中任意一项所述基于跨媒体动态知识图谱的教学方法的步骤。