买专利、卖专利、专利购买、专利交易、专利出售、高企申报-基于大数据的法律文书要素智能识别方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

基于大数据的法律文书要素智能识别方法

￥31200

专利号： 2024112730992

申请人：南京信息工程大学

专利类型：发明专利

专利状态：已下证

更新日期：2026-07-01

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.基于大数据的法律文书要素智能识别方法，其特征在于，包括：

对服务器对所接收的第一法律文书的属性确定得到第一属性，挑选数据库中与所述第一属性所对应的第一文书要素集合；

确定第一文书要素集合内所对应的第一识别特征，基于所述第一识别特征对所述第一法律文书识别，得到与所述第一识别特征所对应的第一要素内容；

调取与所述第一属性所对应的标准要素表，将所述第一要素内容填充至标准要素表内，确定未得到第一要素内容的第一识别特征作为第二识别特征，确定未满足要求的第一要素内容的第一识别特征作为第三识别特征；

基于所述第二识别特征、第三识别特征对所述标准要素表处理得到反馈要素表反馈至目标端，基于所述反馈要素表接收目标端的反馈信息并填充至标准要素表内，得到总标准要素表发送至管理端；

所述调取与所述第一属性所对应的标准要素表，将所述第一要素内容填充至标准要素表内，确定未得到第一要素内容的第一识别特征作为第二识别特征，确定未满足要求的第一要素内容的第一识别特征作为第三识别特征，包括：调取与所述第一属性所对应的标准要素表，每个第一属性具有预设的标准要素表，将所述第一要素内容填充至标准要素表内相对应的槽位内；

依次遍历标准要素表内所有的槽位，将没有填充第一要素内容的槽位对应的第一识别特征作为第二识别特征；

依次遍历标准要素表内所有的槽位确定每个槽位所对应的文本数量，若判断所述文本数量小于相应槽位的最低数量，则将未满足要求的第一要素内容的第一识别特征作为第三识别特征，每个识别特征所对应的槽位具有最低数量。

2.根据权利要求1所述的基于大数据的法律文书要素智能识别方法，其特征在于，所述对服务器对所接收的第一法律文书的属性确定得到第一属性，挑选数据库中与所述第一属性所对应的第一文书要素集合，包括：服务器对所接收的第一法律文书的属性关键词识别，所述属性关键词包括案由，对所述第一法律文书所对应的行进行定位得到第一行定位；

剔除所述第一行定位中与所述属性关键词所对应的文本和标点符号，对第一行定位中剩余的文本识别得到第一识别文本；

若所述第一行定位中剩余的文本为空，则基于所述第一行定位确定相应的第二行定位，对第二行定位中剩余的文本识别得到第一识别文本；

对所述第一识别文本分词处理确定所对应预设标准文本，以及预设标准文本所对应的属性得到第一属性，挑选数据库中与所述第一属性所对应的第一文书要素集合，每个第一属性具有预设的第一文书要素集合。

3.根据权利要求2所述的基于大数据的法律文书要素智能识别方法，其特征在于，所述对所述第一识别文本分词处理确定所对应预设标准文本，以及预设标准文本所对应的属性得到第一属性，挑选数据库中与所述第一属性所对应的第一文书要素集合，每个第一属性具有预设的第一文书要素集合，包括：对第一识别文本内的预设剔除词识别后剔除处理，对剩余的第一识别文本分词处理得到多个第一识别分词；

将所述第一识别分词与每个预设标准文本的预设标准分词比对，若存在预设标准文本的预设标准分词与所述第一识别分词完全相同，则将相应的预设标准文本作为所确定的预设标准文本；

若判断不存在预设标准文本的预设标准分词与所述第一识别分词完全相同的情况，则计算预设标准文本和第一识别文本的识别相似度得到所确定的预设标准文本。

4.根据权利要求3所述的基于大数据的法律文书要素智能识别方法，其特征在于，所述若判断不存在预设标准文本的预设标准分词与所述第一识别分词完全相同的情况，则计算预设标准文本和第一识别文本的识别相似度得到所确定的预设标准文本，包括：计算预设标准文本的预设标准分词与第一识别分词中相同的分词数量，以及确定每个相同的第一识别分词所对应的第一相同系数，每个第一识别分词具有预设的第一相同系数；

基于预设标准分词与第一识别分词的相同数量、差异数量、第一相同系数综合计算，得到预设标准文本与相应第一识别文本的识别相似度，通过以下公式计算识别相似度，其中，为识别相似度，为预设标准分词与第一识别分词的相同数量，为预设标准分词与第一识别分词的差异数量，为数量权重，为第个第一识别分词的第一相同系数，为预设标准分词与第一识别分词的相同数量的上限值，为系数常数值，为系数权重值；

基于所述识别相似度以及与管理端交互得到所确定的预设标准文本，并基于所述第一识别分词对预设标准文本内的预设标准分词更新处理，并基于所述识别相似度得到预设标准分词的第一相同系数。

5.根据权利要求4所述的基于大数据的法律文书要素智能识别方法，其特征在于，所述基于所述识别相似度以及与管理端交互得到所确定的预设标准文本，并基于所述第一识别分词对预设标准文本内的预设标准分词更新处理，并基于所述识别相似度得到预设标准分词的第一相同系数，包括：挑选识别相似度大于最低相似度的预设标准文本并降序排序，生成待挑选的预设标准文本序列；

与管理端交互确定在预设标准文本序列内所选择的预设标准文本作为所确定的预设标准文本，获取与所确定的预设标准文本的预设标准分词不同的第一识别分词作为训练识别分词；

将所述训练识别分词作为所确定的预设标准文本内新的预设标准分词，并基于识别相似度计算得到预设标准分词的第一相同系数。

6.根据权利要求5所述的基于大数据的法律文书要素智能识别方法，其特征在于，所述将所述训练识别分词作为所确定的预设标准文本内新的预设标准分词，并基于识别相似度计算得到预设标准分词的第一相同系数，包括：获取训练识别分词的训练数量，基于所述训练数量计算得到每个训练识别分词的数量系数；

计算识别相似度与最大相似度的差值得到差异相似度，基于所述差异相似度加权计算得到相似系数；

对每个训练识别分词的数量系数、相似系数综合计算，得到相应预设标准分词的第一相同系数，通过以下公式计算第一相同系数，其中，为第个训练识别分词的第一相同系数，

为最低相同系数，为第个训练识别分词的训练数量，为数量归一化值，为最大相似度，为包括第个训练识别分词的第一识别文本的识别相似度，为相似度归一化值，为相同权重值。

7.根据权利要求1所述的基于大数据的法律文书要素智能识别方法，其特征在于，所述确定第一文书要素集合内所对应的第一识别特征，基于所述第一识别特征对所述第一法律文书识别，得到与所述第一识别特征所对应的第一要素内容，包括：确定第一文书要素集合内所对应的第一识别特征，每个第一文书要素集合具有预设的第一识别特征；

基于所述第一识别特征对所述第一法律文书内的文本进行定位，得到与每个第一识别特征所对应的第一文本词，确定所述第一文本词所对应的连贯文本；

提取所述连贯文本直至出现截止字符，将所提取的连贯文本作为与所述第一识别特征所对应的第一要素内容。

8.根据权利要求1所述的基于大数据的法律文书要素智能识别方法，其特征在于，所述基于所述第二识别特征、第三识别特征对所述标准要素表处理得到反馈要素表反馈至目标端，基于所述反馈要素表接收目标端的反馈信息并填充至标准要素表内，得到总标准要素表发送至管理端，包括：删除标准要素表内第一识别特征所对应的槽位，对剩余的第二识别特征、第三识别特征按照标准要素表内的顺序排序得到反馈要素表；

在反馈要素表内第二识别特征所对应的槽位添加信息缺失标签，在反馈要素表内第三识别特征所对应的槽位添加信息缺少标签；

要素缺失模型基于所述信息缺失标签、信息缺少标签所对应的槽位进行综合计算，得到要素信息缺失系数，将所述要素信息缺失系数添加至反馈要素表的预设槽位内后反馈至目标端，若要素信息缺失系数大于阈值缺失系数则同步反馈至管理端；

在判断目标端对反馈要素表填充后提取槽位内的反馈信息，并填充至标准要素表内得到总标准要素表，基于要素缺失模型对总标准要素表内要素信息缺失系数更新并发送至管理端。

9.根据权利要求8所述的基于大数据的法律文书要素智能识别方法，其特征在于，要素缺失模型基于所述信息缺失标签、信息缺少标签所对应的槽位进行综合计算，得到要素信息缺失系数，将所述要素信息缺失系数添加至反馈要素表的预设槽位内后反馈至目标端，包括：计算信息缺少标签所对应槽位内文本数量与最低数量的差值得到差值文本数量；

基于所述差值文本数量、信息缺失标签的第一标签数量、信息缺少标签的第二标签数量综合计算得到要素信息缺失系数，通过以下公式计算要素信息缺失系数，其中，为要素信息缺失系数，为第一标签数量，为第一标签权重，为第二标签数量，为第二标签权重，为第个信息缺少标签所对应槽位的差值文本数量，为信息缺少标签所对应槽位的数量上限值，为差值文本的归一化值。