利索能及
我要发布
收藏
专利号: 2024114558445
申请人: 广东海洋大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种外语文章写作辅助方法,其特征在于,包括:

对上文例句进行意图识别,获取第一意图特征,从语料库中抓取n个推荐特征,并按照与所述第一意图特征相似的高低顺序对所述n个推荐特征进行排序,得到第一排序结果;n为正整数;

将所述第一意图特征作为预先训练的推荐词构造模型的输入,基于所述推荐词构造模型的输出,获取n个构造特征,并按照与所述第一意图特征相似的高低顺序对所述n个构造特征进行排序,得到第二排序结果;

将所述第一排序结果和所述第二排序结果作为初始推荐智能体的动作空间,将所述第一意图特征作为初始推荐智能体的当前状态,基于所述初始推荐智能体,从所述动作空间中获取评价值最高的推荐结果;

根据所述推荐结果,获取所述初始推荐智能体的即时奖励,根据所述即时奖励,对所述初始推荐智能体进行回合制训练,得到完成训练的推荐智能体,并基于所述推荐智能体进行实时写作辅助;

所述对上文例句进行意图识别,获取第一意图特征,包括:

将上文例句中的字符映射成数字向量,并通过预先训练的循环神经网络对所述数字向量进行编码,得到词向量,并将所述词向量作为预先训练的大语言模型的输入进行意图识别,基于所述大语言模型的输出,得到第一意图特征;

所述第一意图特征包括:正样本和负样本;所述基于所述大语言模型的输出,得到第一意图特征,包括:将基于所述大语言模型的输出作为所述正样本,通过随机掩膜对所述正样本进行随机掩膜操作,得到负样本;所述正样本和所述负样本用于对所述初始推荐智能体构建判别性损失函数,以使根据所述判别性损失函数进行回合制训练;

所述即时奖励包括:正样本即时奖励和负样本即时奖励;所述根据所述即时奖励,对所述初始推荐智能体进行回合制训练,包括:根据执行所述推荐结果的第二意图特征,获取下一时刻的评价值,并根据所述正样本即时奖励与所述下一时刻的评价值、所述负样本即时奖励与所述下一时刻的评价值,分别获取第一时间差分误差和第二时间差分误差,根据所述第一时间差分误差和所述第二时间差分误差,获取判别性损失函数值,根据所述判别性损失函数值,对所述初始推荐智能体进行回合制训练;

所述判别性损失函数表示为:

L =max(  ,0);

其中, 和 分

别为第一时间差分误差和第二时间差分误差; 和 分别为正样本即时奖励和负样本即时奖励,为折扣因子; 为下一时刻时正样本相对负样本的评价值, 和 分别为下一时刻正样本的评价值和负样本的评价值; 为下一时刻时负样本相对正样本的评价值; 和 分别为本时刻下正样本的评价值和负样本的评价值;为非负超参数,为预设超参数; 为二范数。

2.如权利要求1所述的外语文章写作辅助方法,其特征在于,所述从语料库中抓取n个推荐特征,包括:从所述语料库中抓取与所述第一意图特征相关的所有语料特征,并从所述语料库中抽样m个回合制下的抽样特征,并按照对应回合制结束后的最终评价值,对所述抽样特征评估组内一致性结果,根据所述组内一致性结果,筛选出n个推荐特征;m为正整数。

3.如权利要求2所述的外语文章写作辅助方法,其特征在于,所述根据所述组内一致性结果,筛选出n个推荐特征,包括:获取组内一致性结果满足一致性阈值的抽样特征,得到n个高维度推荐特征,并基于Lasso回归,对所述n个高维度推荐特征进行特征压缩,得到低维度的n个推荐特征。

4.如权利要求1所述的外语文章写作辅助方法,其特征在于,所述基于所述推荐词构造模型的输出,获取n个构造特征,包括:基于所述推荐词构造模型的输出,得到k个候选构造特征,并依次获取所述n个推荐特征的特征向量与k个候选构造特征的特征差异,为每个候选构造特征从n个特征差异中选择最大特征差异值,共得到k个最大特征差异,从所述k个最大特征差异中选择前n个最大特征差异值作为n个构造特征;k为正整数。

5.一种外语文章写作辅助系统,其特征在于,包括:意图提取模块、推荐词构造模块、决策模块和训练与实时辅助模块;其中,所述意图提取模块,用于对上文例句进行意图识别,获取第一意图特征,从语料库中抓取n个推荐特征,并按照与所述第一意图特征相似的高低顺序对所述n个推荐特征进行排序,得到第一排序结果;n为正整数;

所述推荐词构造模块,用于将所述第一意图特征作为预先训练的推荐词构造模型的输入,基于所述推荐词构造模型的输出,获取n个构造特征,并按照与所述第一意图特征相似的高低顺序对所述n个构造特征进行排序,得到第二排序结果;

所述决策模块,用于将所述第一排序结果和所述第二排序结果作为初始推荐智能体的动作空间,将所述第一意图特征作为初始推荐智能体的当前状态,基于所述初始推荐智能体,从所述动作空间中获取评价值最高的推荐结果;

所述训练与实时辅助模块,用于根据所述推荐结果,获取所述初始推荐智能体的即时奖励,根据所述即时奖励,对所述初始推荐智能体进行回合制训练,得到完成训练的推荐智能体,并基于所述推荐智能体进行实时写作辅助;

所述对上文例句进行意图识别,获取第一意图特征,包括:

将上文例句中的字符映射成数字向量,并通过预先训练的循环神经网络对所述数字向量进行编码,得到词向量,并将所述词向量作为预先训练的大语言模型的输入进行意图识别,基于所述大语言模型的输出,得到第一意图特征;

所述第一意图特征包括:正样本和负样本;所述基于所述大语言模型的输出,得到第一意图特征,包括:将基于所述大语言模型的输出作为所述正样本,通过随机掩膜对所述正样本进行随机掩膜操作,得到负样本;所述正样本和所述负样本用于对所述初始推荐智能体构建判别性损失函数,以使根据所述判别性损失函数进行回合制训练;

所述即时奖励包括:正样本即时奖励和负样本即时奖励;所述根据所述即时奖励,对所述初始推荐智能体进行回合制训练,包括:根据执行所述推荐结果的第二意图特征,获取下一时刻的评价值,并根据所述正样本即时奖励与所述下一时刻的评价值、所述负样本即时奖励与所述下一时刻的评价值,分别获取第一时间差分误差和第二时间差分误差,根据所述第一时间差分误差和所述第二时间差分误差,获取判别性损失函数值,根据所述判别性损失函数值,对所述初始推荐智能体进行回合制训练;

所述判别性损失函数表示为:

L =max(  ,0);

其中, 和 分

别为第一时间差分误差和第二时间差分误差; 和 分别为正样本即时奖励和负样本即时奖励,为折扣因子; 为下一时刻时正样本相对负样本的评价值, 和 分别为下一时刻正样本的评价值和负样本的评价值; 为下一时刻时负样本相对正样本的评价值; 和 分别为本时刻下正样本的评价值和负样本的评价值;为非负超参数,为预设超参数; 为二范数。