利索能及
我要发布
收藏
专利号: 2024117878572
申请人: 杭州电子科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种结合大模型与图神经网络的知识图谱问答方法,其特征在于:包括以下步骤:步骤一:问题分解:利用大模型的上下文学习能力对多跳问题进行分解,分解的具体步骤包括:当接收一个多跳问题时,将上下文示例拼接上多跳问题后输入进大模型,大模型产生一个初始的单跳子问题,将该子问题输入进子问题解决模块得到推理路径,后将推理路径输入进推理模块获得答案,将上述分解的具体步骤结果添加进上下文,提供给大模型,后将丰富后的上下文再次输入进大模型,令大模型迭代式的分解问题,按上述步骤进行解决,直到大模型无法给出子问题;

步骤二:子问题解决:当通过步骤一获得子问题后,需要通过GNN模型构建出该子问题的推理路径,具体包括问题子图检索阶段和推理路径构建阶段,步骤三:答案推理:通过问题子图检索模块获得种子实体与候选答案之间的所有路径后,将其进行文本化来构建LLM的上下文,再拼接上子问题,共同输入给LLM,利用大模型的推理能力来获得该子问题的最终答案;

所述步骤二中问题子图检索阶段具体包括:

当获得由多跳问题分解出的单跳子问题后,在知识图谱中检索单跳子问题的问题子图;

知识图谱由一个个三元组组成,从概率角度给出相关性的定义:

其中Score(e,q,G)表示在知识图谱G中三元组e与问题q的相关程度,N表示以问题q为起点在知识图谱中进行随机游走的总次数,times(s)表示随机游走过程中访问到三元组s的次数,subject to start=q表示约束条件为以q为起点;

问题q难以直接在知识图谱中表示,通过大模型抽取出问题中top‑k个关键实体作为当前问题的种子实体,以此来近似表示问题q,经过近似后的相关性定义如下:最终,该相关性通过使用Personalized PageRank算法进行计算,最终筛选出与问题最相关的2000个三元组作为当前问题的问题子图;

所述步骤二中推理路径构建阶段具体包括:

知识图谱问答中的GNN模型被视为一个节点分类的工作方法,其中KG实体被分类为给定问题的答案与非答案,先通过图神经网络获得子问题的候选答案,其中图神经网络部分采用的是预训练好的ReaRev图神经网络,将子问题与问题子图共同输入进ReaRev模型,获得每个实体作为答案的概率,后将概率从高到低进行排序,从高到低选取累计概率大于

95%的实体作为候选答案,使用BFS算法检索种子实体与各个候选答案之间的所有路径。