1.一种个案图谱创建生成方法,其特征在于,其包括以下步骤:
S1、获取某一个案的案件类型,根据案件类型从案由模版库中匹配出对应的案由模版;
S2、基于匹配出的案由模版创建个案图谱;
S3、对个案图谱进行实体填充:
针对个案图谱中的基本信息,基于预定义的抽取规则和对应的抽取策略生成对应的数据抽取任务,根据数据抽取任务从信息数据库中抽取该个案的基本信息填充至个案图谱的对应基本信息处;
针对个案图谱中的每一要件,行业专用大模型利用匹配出的案由模版中包含的要件信息自动生成的行为筛选提示词,确定该要件所涉及的实体/三元组从对应的行为图谱库中哪一/哪些行为图谱中提取,在确定好该要件所涉及的实体/三元组对应的待提取行为图谱后,判断待提取行为图谱中关于某一实体的名称或描述与个案图谱中该要件所涉及的对应实体的名称或描述是否完全一致,若完全一致则直接将待提取行为图谱中该实体的实体信息填充至该要件所涉及的对应实体处,若不完全一致则进一步利用行业专用大模型判断待提取行为图谱中该实体的名称或描述与该要件所涉及的对应实体的名称或描述是否一致,若一致则直接将待提取行为图谱中该实体的实体信息填充至该要件所涉及的对应实体处,若不一致则不填充该要件所涉及的对应实体;
其中,行业专用大模型为基于优选的模型基座并使用行业专有的任务设计和相关数据集进行微调和强化学习得到的大语言模型,模型基座为可切换的;
S4、对个案图谱进行补全填充:
针对个案图谱中未能在行为图谱中找到对应的实体信息的待补全实体,依托行业大模型将对应的行为图谱库中所有行为图谱的结构化信息生成对于行为的描述性文字,描述性文字内容包括所有行为图谱中的实体信息,再通过行业专用大模型抽取该描述性文字内容,从中抽取出的实体信息填充补全至个案图谱中对应的待补全实体处;
S5、该个案的个案图谱生成。
2.如权利要求1所述的个案图谱创建生成方法,其特征在于,在步骤S4中,针对某一抽取到实体信息的待补全实体,待补全实体为单独的实体或为一个三元组即第一实体—关系—第二实体中的第一实体,直接将抽取出的实体信息填充补全至该待补全实体处;
待补全实体为一个三元组即第一实体—关系—第二实体中的第二实体,抽取到的实体信息为第二实体信息,自动再反向提取一次第二实体信息—关系—第一实体信息’,利用行业专用大模型判断第一实体信息’和第一实体信息是否一致,在第一实体信息’和第一实体信息一致时则表明没有自检冲突,再判断第二实体是否在其它三元组中被已填充实体信息,若否则将提取出的第二实体信息填充至该待补全实体处,若是则判断提取出的第二实体信息与第二实体已填充实体信息是否一致,在一致时则表明没有重叠冲突,提取出的第二实体信息无需填充,在不一致时则表明出现重叠冲突,将提取出的第二实体信息填充至该待补全实体处并生成一重叠冲突处理任务传给上层应用以待人工处理;在第一实体信息’和第一实体信息不一致时则表明出现自检冲突,将提取出的第二实体信息填充至该待补全实体处并发出一自检冲突处理任务传给上层应用以待人工处理。
3.如权利要求1所述的个案图谱创建生成方法,其特征在于,在步骤S3中,确定该要件所涉及的实体/三元组从对应的行为图谱库中哪一/哪些行为图谱中提取的三种策略:第一种:对对应的行为图谱库进行全局遍历,遍历所有行为图谱,以确定该要件所涉及的实体/三元组从对应的行为图谱库中哪一/哪些行为图谱中提取;
第二种:依托历史数据的积累来确定该要件与对应的行为图谱库中哪一/哪些行为图谱存在关系;
第三种:依托行业专用大模型,提取对应的行为图谱库中行为图谱的关键信息,转换成向量并存储至向量数据库中,然后通过要件与向量的相似度匹配方式来获取该要件对应的行为图谱。
4.如权利要求1所述的个案图谱创建生成方法,其特征在于,在步骤S1中,行业专用大模型分析该个案的案件材料以识别出该个案的案件类型或是以人工指定方式直接指定该个案的案件类型。
5.如权利要求1所述的个案图谱创建生成方法,其特征在于,在步骤S5之后,判断自动生成的个案图谱是否具有仍未填充的实体,若是则通知采用人工补全机制进行补全操作。
6.一种个案图谱创建生成系统,其特征在于,其包括获取匹配模块、创建模块、实体填充模块和补全填充模块;
所述获取匹配模块用于获取某一个案的案件类型,根据案件类型从案由模版库中匹配出对应的案由模版;
所述创建模块用于基于匹配出的案由模版创建个案图谱;
所述实体填充模块用于对个案图谱进行实体填充:
针对个案图谱中的基本信息,基于预定义的抽取规则和对应的抽取策略生成对应的数据抽取任务,根据数据抽取任务从信息数据库中抽取该个案的基本信息填充至个案图谱的对应基本信息处;
针对个案图谱中的每一要件,行业专用大模型利用匹配出的案由模版中包含的要件信息自动生成的行为筛选提示词,确定该要件所涉及的实体/三元组从对应的行为图谱库中哪一/哪些行为图谱中提取,在确定好该要件所涉及的实体/三元组对应的待提取行为图谱后,判断待提取行为图谱中关于某一实体的名称或描述与个案图谱中该要件所涉及的对应实体的名称或描述是否完全一致,若完全一致则直接将待提取行为图谱中该实体的实体信息填充至该要件所涉及的对应实体处,若不完全一致则进一步利用行业专用大模型判断待提取行为图谱中该实体的名称或描述与该要件所涉及的对应实体的名称或描述是否一致,若一致则直接将待提取行为图谱中该实体的实体信息填充至该要件所涉及的对应实体处,若不一致则不填充该要件所涉及的对应实体;
其中,行业专用大模型为基于优选的模型基座并使用行业专有的任务设计和相关数据集进行微调和强化学习得到的大语言模型,模型基座为可切换的;
所述补全填充模块用于对个案图谱进行补全填充,从而获得该个案的个案图谱生成:
针对个案图谱中未能在行为图谱中找到对应的实体信息的待补全实体,依托行业大模型将对应的行为图谱库中所有行为图谱的结构化信息生成对于行为的描述性文字,描述性文字内容包括所有行为图谱中的实体信息,再通过行业专用大模型抽取该描述性文字内容,从中抽取出的实体信息填充补全至个案图谱中对应的待补全实体处。
7.如权利要求6所述的个案图谱创建生成系统,其特征在于,所述补全填充模块用于针对某一抽取到实体信息的待补全实体,待补全实体为单独的实体或为一个三元组即第一实体—关系—第二实体中的第一实体,直接将抽取出的实体信息填充补全至该待补全实体处;
待补全实体为一个三元组即第一实体—关系—第二实体中的第二实体,抽取到的实体信息为第二实体信息,自动再反向提取一次第二实体信息—关系—第一实体信息’,利用行业专用大模型判断第一实体信息’和第一实体信息是否一致,在第一实体信息’和第一实体信息一致时则表明没有自检冲突,再判断第二实体是否在其它三元组中被已填充实体信息,若否则将提取出的第二实体信息填充至该待补全实体处,若是则判断提取出的第二实体信息与第二实体已填充实体信息是否一致,在一致时则表明没有重叠冲突,提取出的第二实体信息无需填充,在不一致时则表明出现重叠冲突,将提取出的第二实体信息填充至该待补全实体处并生成一重叠冲突处理任务传给上层应用以待人工处理;在第一实体信息’和第一实体信息不一致时则表明出现自检冲突,将提取出的第二实体信息填充至该待补全实体处并发出一自检冲突处理任务传给上层应用以待人工处理。
8.如权利要求6所述的个案图谱创建生成系统,其特征在于,所述实体填充模块用于确定该要件所涉及的实体/三元组从对应的行为图谱库中哪一/哪些行为图谱中提取的三种策略:第一种:对对应的行为图谱库进行全局遍历,遍历所有行为图谱,以确定该要件所涉及的实体/三元组从对应的行为图谱库中哪一/哪些行为图谱中提取;
第二种:依托历史数据的积累来确定该要件与对应的行为图谱库中哪一/哪些行为图谱存在关系;
第三种:依托行业专用大模型,提取对应的行为图谱库中行为图谱的关键信息,转换成向量并存储至向量数据库中,然后通过要件与向量的相似度匹配方式来获取该要件对应的行为图谱。
9.如权利要求6所述的个案图谱创建生成系统,其特征在于,所述获取匹配模块用于利用行业专用大模型分析该个案的案件材料以识别出该个案的案件类型或是以人工指定方式直接指定该个案的案件类型。
10.如权利要求6所述的个案图谱创建生成系统,其特征在于,所述系统还包括人工补全通知模块用于判断自动生成的个案图谱是否具有仍未填充的实体,在为是时通知采用人工补全机制进行补全操作。