利索能及
我要发布
收藏
专利号: 2022116287167
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:授权未缴费
更新日期:2026-03-05
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于BCNN的命名实体识别模型训练方法,其特征在于,包括:

S1:获取语句数据,并对语句数据进行预处理,得到带有标注信息的命名实体数据集和分词数据集;对命名实体数据集和分词数据集进行划分,得到总训练集和总验证集;

S2:将总训练集输入到共享嵌入层中进行处理,得到命名实体嵌入表示和分词嵌入表示;

S3:采用编码器分别对命名实体嵌入表示和分词嵌入表示进行处理,得到命名实体编码特征和分词编码特征;

S4:采用解码器分别对命名实体编码特征和分词编码特征进行处理,得到命名实体识别结果和分词识别结果;

S5:根据命名实体识别结果、分词识别结果和总验证集计算模型总损失;

S6:根据模型总损失进行反向传播,调整模型参数,得到训练好的基于BCNN的命名实体识别模型。

2.根据权利要求1所述的一种基于BCNN的命名实体识别模型训练方法,其特征在于,所述总训练集包括命名实体训练集和分词训练集,所述总验证集包括命名实体验证集和分词验证集;其中,命名实体训练集和分词训练集中的句子数量相同。

3.根据权利要求1所述的一种基于BCNN的命名实体识别模型训练方法,其特征在于,所述共享嵌入层为Word2Vec模型。

4.根据权利要求1所述的一种基于BCNN的命名实体识别模型训练方法,其特征在于,所述编码器为BCNN模型,包括前向层和反向层;前向层和反向层均包括第一层因果卷积、第二层因果卷积和第三层全卷积均为一维卷积,且第一层因果卷积、第二层因果卷积和第三层全卷积,卷积核大小为3;第一层因果卷积的卷积跨度为1,第二层因果卷积的卷积跨度为2,第三层全卷积的卷积跨度为4。

5.根据权利要求4所述的一种基于BCNN的命名实体识别模型训练方法,其特征在于,采用编码器对命名实体嵌入表示进行处理的过程包括:采用前向层对命名实体嵌入表示进行处理,得到前向层编码结果;采用反向层对命名实体嵌入表示进行处理,得到反向层编码结果;拼接前向层编码结果和反向层编码结果,得到命名实体编码特征。

6.根据权利要求1所述的一种基于BCNN的命名实体识别模型训练方法,其特征在于,所述解码器为条件随机场模型。

7.根据权利要求1所述的一种基于BCNN的命名实体识别模型训练方法,其特征在于,计算模型总损失的过程包括:根据命名实体识别结果和总验证集中的命名实体验证集计算命名实体识别损失;根据分词识别结果和总验证集中的分词验证集计算分词识别损失;将命名实体识别损失和分词识别损失加权相加,得到模型总损失。

8.一种基于BCNN的命名实体识别模型训练装置,其特征在于,包括:输入模块和训练模块;

所述输入模块用于获取语句数据并根据语句数据生成带有标注信息的训练数据和验证数据;

所述训练模块用于根据训练数据和验证数据对模型进行训练,得到命名实体识别结果和分词识别结果;计算模型总损失并根据模型总损失调整模型参数,输出目标模型。

9.根据权利要求8所述的一种基于BCNN的命名实体识别模型训练装置,其特征在于,所述训练模块包括嵌入处理模块、第一子训练模块和第二子训练模块;

所述嵌入处理模块用于对训练数据进行嵌入处理,得到命名实体嵌入表示和分词嵌入表示;

所述第一子训练模块用于对命名实体嵌入表示进行处理,得到命名实体识别结果;

所述第二子训练模块用于对分词嵌入表示进行处理,得到分词识别结果。