利索能及
我要发布
收藏
专利号: 2023102474694
申请人: 北京擎盾信息科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-27
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种用于生成裁判要旨的知识图谱构建方法,其特征在于,包括:接收训练裁判文书和目标裁判文书;

使用所述训练裁判文书训练获取知识图谱构建模型;

使用所述训练裁判文书训练获取知识图谱构建模型包括:将训练裁判文书解析为字符序列作为输入,并通过一个字符向量矩阵转换成低维实值向量形式的序列;

使用大规模语言模型进行对序列进行编码,得到语义表示向量;

使用长短时记忆网络和条件随机场作为解码器,将每个字符对应的语义表示向量转化为对应的实体标签;

使用循环神经网络作为解码器,将头尾实体对应的字符转化为关系的概率矩阵;

使用所述训练裁判文书训练获取知识图谱构建模型还包括:采用对比损失函数,基于所述训练裁判文书训练获取知识图谱构建模型;

所述对比损失函数为:

+

其中,f(x)表示目标字符对应的语义表示向量,f(x)表示正样本对应的语义表示向量,表示负样本对应的语义表示向量;

将所述目标裁判文书输入所述知识图谱构建模型,以抽取所述目标裁判文书的实体和实体间关系,并基于所述实体和实体间关系构建裁判推理知识图谱;

使用所述训练裁判文书训练获取裁判要旨生成模型;

将所述裁判推理知识图谱输入裁判要旨生成模型,生成裁判要旨;

将所述裁判推理知识图谱输入裁判要旨生成模型,生成裁判要旨包括:计算所述目标裁判文书和格式模板的文本相似度、语义相似度和结构相似度,并将文本相似度、语义相似度和结构相似度最高的三个格式模板作为候选模板;

对三个候选模板进行真实相似度和预测相似度计算并排序,并根据排序结果挑选一个作为使用的软模板;

根据所述裁判推理知识图谱和软模板,生成裁判要旨。

2.根据权利要求1所述的知识图谱构建方法,其特征在于,接收训练裁判文书和目标裁判文书之前还包括:在开放数据库中采集并预处理得到裁判文书;

利用正则表达式的规则解析引擎,将每份裁判文书分为当事人信息、事实描述、法庭观点和判决结果;

筛除事实描述超过预设token阈值的裁判文书;

将筛除后得到的裁判文书分为训练用数据和目标裁判文书;

人工标注训练用数据,得到训练裁判文书。

3.根据权利要求1所述的知识图谱构建方法,其特征在于,对三个候选模板进行真实相似度和预测相似度计算并排序,并根据排序结果挑选一个作为使用的软模板包括计算真实相似度和预测相似度之间的交叉熵损失:根据所述裁判推理知识图谱和软模板,生成裁判要旨包括最大化摘要预测概率的负对数似然估计:

4.一种用于生成裁判要旨的知识图谱构建装置,其特征在于,包括:接收模块,用于接收训练裁判文书和目标裁判文书;

训练模块,用于使用所述训练裁判文书训练获取知识图谱构建模型;

构建模块,用于将所述目标裁判文书输入所述知识图谱构建模型,以抽取所述目标裁判文书的实体和实体间关系,并基于所述实体和实体间关系构建裁判推理知识图谱;

使用所述训练裁判文书训练获取知识图谱构建模型包括:将训练裁判文书解析为字符序列作为输入,并通过一个字符向量矩阵转换成低维实值向量形式的序列;

使用大规模语言模型进行对序列进行编码,得到语义表示向量;

使用长短时记忆网络和条件随机场作为解码器,将每个字符对应的语义表示向量转化为对应的实体标签;

使用循环神经网络作为解码器,将头尾实体对应的字符转化为关系的概率矩阵;

使用所述训练裁判文书训练获取知识图谱构建模型还包括:采用对比损失函数,基于所述训练裁判文书训练获取知识图谱构建模型;

所述对比损失函数为:

+

其中,f(x)表示目标字符对应的语义表示向量,f(x)表示正样本对应的语义表示向量,表示负样本对应的语义表示向量;

将所述目标裁判文书输入所述知识图谱构建模型,以抽取所述目标裁判文书的实体和实体间关系,并基于所述实体和实体间关系构建裁判推理知识图谱之后还包括:使用所述训练裁判文书训练获取裁判要旨生成模型;

将所述裁判推理知识图谱输入裁判要旨生成模型,生成裁判要旨;

将所述裁判推理知识图谱输入裁判要旨生成模型,生成裁判要旨包括:计算所述目标裁判文书和格式模板的文本相似度、语义相似度和结构相似度,并将文本相似度、语义相似度和结构相似度最高的三个格式模板作为候选模板;

对三个候选模板进行真实相似度和预测相似度计算并排序,并根据排序结果挑选一个作为使用的软模板;

根据所述裁判推理知识图谱和软模板,生成裁判要旨。

5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至3中任一项所述的用于生成裁判要旨的知识图谱构建方法。

6.一种电子装置,包括:存储器和处理器,其特征在于,所述存储器中存储有计算机程序,其中,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至3中任一项所述的用于生成裁判要旨的知识图谱构建方法。