利索能及
我要发布
收藏
专利号: 2023100017463
申请人: 广东工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种中文语句特征构造的训练更新方法,其特征在于,包括以下步骤:对训练集和应用集进行特征提取,得到各自的特征矩阵;

将每个字的特征向量与当前字特征向量的差的和向量的平均值作为当前字的信息增量,基于该信息增量构建信息增量模型;

基于训练集的特征矩阵对信息增量模型中的信息增量因子进行微调训练,得到训练后的信息增量因子;

应用训练后的增量因子的信息增量模型对应用集的特征矩阵进行更新,得到更新后的应用特征矩阵;

所述信息增量的表达式如下:

其中αi=(xi1 xi2…xik)表示当前汉字bi的特征向量(i=1,2,…,m),m表示句子中的汉字个数,k表示当前汉字bi的特征个数,αl表示句子任意汉字的特征向量(l=1,2,…,m);

所述信息增量模型,其表达式如下:

αi'=αi+λΔxi

Xt'=Xt+λΔXt

其中αi为字的特征向量,λ为信息增量因子,Δxi为字的信息增量,αi'为应用信息增量模型后字的更新特征向量,Xt为句子的特征矩阵,ΔXt为句子的特征信息增量矩阵,Xt'为应用信息增量模型后句子的更新特征矩阵,且所述应用训练后的增量因子的信息增量模型对应用集的特征矩阵进行更新,得到更新后的应用特征矩阵这一步骤,其公式表示如下:*

Xs'=Xs+λΔXs

*

其中Xs'为新的应用特征矩阵,Xs为应用集的特征矩阵,λ为训练后的增量因子,ΔXs为应用集的信息增量矩阵。

2.根据权利要求1所述一种中文语句特征构造的训练更新方法,其特征在于,所述对训练集和应用集进行特征提取,得到各自的特征矩阵这一步骤,其具体包括:按汉字拆分训练集和应用集中的汉字向量,得到汉字编码向量;

根据汉字编码向量的编码号数,利用预训练特征字库对训练集和应用集句子每个字进行特征提取,得到每个字的特征向量;

将训练集和应用集中每个字的特征向量按照编码号数进行叠加,得到训练集和应用集的特征矩阵。

3.根据权利要求1所述一种中文语句特征构造的训练更新方法,其特征在于,所述基于训练集的特征矩阵对信息增量模型中的信息增量因子进行微调训练,得到训练后的信息增量因子这一步骤,其具体包括:设置信息增量因子的初始值、阈值、准确率初始值和增量值;

应用信息增量模型对训练集的特征矩阵进行更新,得到更新后的训练特征矩阵;

基于微调技术函数对新的训练特征矩阵进行样本预测,得到预测标签;

对比预测标签与训练集正确标签,计算准确率;

微调信息增量模型中的信息增量因子,得到微调后的信息增量模型;

循环特征矩阵更新、样本预测、准确率计算和信息增量因子微调步骤直至准确率与信息增量因子均满足条件,得到训练后的信息增量因子。

4.根据权利要求3所述一种中文语句特征构造的训练更新方法,其特征在于,所述准确率,其公式表示如下:其中,ncorrect为预测标签在训练集正确标签中正确的个数,n表示训练集内标签总个数。

5.一种中文语句特征构造的训练更新系统,用于实现权利要求1‑4任一项所述的训练更新方法,其特征在于,包括:特征提取模块,用于对训练集和应用集进行特征提取,得到各自的特征矩阵;

模型构建模块,用于将每个字的特征向量与当前字特征向量的差的和向量的平均值作为当前字的信息增量,得到信息增量模型;

微调训练模块,基于训练集的特征矩阵对信息增量模型中的信息增量因子进行微调训练,得到训练后的信息增量因子;

应用更新模块,用于应用训练后的增量因子的信息增量模型对应用集的特征矩阵进行更新,得到更新后应用特征矩阵;

所述信息增量的表达式如下:

其中αi=(xi1 xi2…xik)表示当前汉字bi的特征向量(i=1,2,…,m),m表示句子中的汉字个数,k表示当前汉字bi的特征个数,αl表示句子任意汉字的特征向量(l=1,2,…,m);

所述信息增量模型,其表达式如下:

αi'=αi+λΔxi

Xt'=Xt+λΔXt

其中αi为字的特征向量,λ为信息增量因子,Δxi为字的信息增量,αi'为应用信息增量模型后字的更新特征向量,Xt为句子的特征矩阵,ΔXt为句子的特征信息增量矩阵,Xt'为应用信息增量模型后句子的更新特征矩阵,且所述应用训练后的增量因子的信息增量模型对应用集的特征矩阵进行更新,得到更新后的应用特征矩阵这一步骤,其公式表示如下:*

Xs'=Xs+λΔXs

*

其中Xs'为新的应用特征矩阵,Xs为应用集的特征矩阵,λ为训练后的增量因子,ΔXs为应用集的信息增量矩阵。