买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于大语言模型的个性化对话生成方法及系统

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于大语言模型的个性化对话生成方法及系统

￥31200

专利号： 2024102149546

申请人：南京信息工程大学

专利类型：发明专利

专利状态：已下证

更新日期：2026-06-16

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于大语言模型的个性化对话生成方法，其特征在于，包括：获取人物个性对话数据集合，对人物个性对话数据集合进行个性扩展获得人物个性扩展对话数据集；

利用预训练的融合模型对人物个性扩展对话数据集中的目标回复进行更新，构成新的个性对话数据集；

获取大型语言模型的当前对话历史信息，基于当前对话历史信息和人物个性扩展对话数据集中的人物个性扩展信息构造个性知识提示；

将个性知识提示输入至大型语言模型获得人物个性信息描述信息，由新的个性对话数据集中检索与大型语言模型当前对话历史信息的相关样本信息；根据所述相关样本信息、当前对话历史信息和人物个性信息描述信息生成回复提示；将回复提示重新输入至大型语言模型获得最终回复信息；

对所述融合模型进行训练过程包括：

由人物个性扩展对话数据集提取对话历史序列H，人物个性扩展信息序列P和目标回复序列T并作为输入序列；

通过对话历史编码器将对话历史序列H转化为对话历史编码向量；通过人物个性扩展信息编码器将人物个性扩展信息序列P输入至自注意力获得信息序列，使用公式：；

公式中，表示为自注意力机制；

将自注意力向量输入至图感知注意力获得编码向量，表示公式为：；

公式中，Q、K 和 V 是由自注意力向量与相应的可学习参数、可学习参数和可学习参数相乘得到的序列，表示为序列K的维度；则是编码所需图结构的掩码，表示为类型编码矩阵；

将编码向量进行加和与规范化处理后输入至前馈神经网络中，再经过一次加和与规范化输出人物个性扩展信息编码向量；将对话历史编码向量、人物个性扩展信息编码向量和目标回复序列T输入至解码器获得初始回复；根据初始回复和输入序列计算训练损失值，根据训练损失值对融合模型的参数进行优化，重复迭代所述融合模型的训练过程直至训练损失值收敛，输出并保存训练后的融合模型。

2.根据权利要求1所述的个性化对话生成方法，其特征在于，对人物个性对话数据集合进行个性扩展获得人物个性扩展对话数据集，包括：获取人物个性知识图谱数据集合，利用人物个性知识图谱数据集合对人物个性生成器进行训练；

利用训练后的人物个性生成器对人物个性对话数据集中的人物个性信息句子进行扩展获得人物个性扩展信息，利用句子匹配模型对人物个性对话数据集中的对话历史匹配人物个性扩展信息，得到人物个性扩展对话数据集。

3.根据权利要求1所述的个性化对话生成方法，其特征在于，由人物个性扩展对话数据集提取对话历史序列H，人物个性扩展信息序列P和目标回复序列T，包括：对人物个性扩展对话数据集中的对话历史数据用特殊令牌“ ”和“”拼接起来，形成对话历史输入序列

，和代表用户话语，

代表机器人的回复；

对人物个性扩展对话数据集中的目标回复数据需要在前面添加特殊令牌“ ”，形成目标回复输入序列；

对人物个性扩展对话数据集中的人物个性扩展数据用特殊令牌“ ”，“”和“ ”，形成人物扩展信息输入序列；

其中，代表第i个人物个性信息句子；代表第i个人物个性信息句子的第1个关系；

代表第i个人物个性信息句子的第1个扩展属性；

利用分词器对所述对话历史输入序列、目标回复输入序列和人物扩展信息输入序列分别转化得到对话历史向量序列H，人物个性扩展信息向量序列P和目标回复向量序列T。

4.根据权利要求1所述的个性化对话生成方法，其特征在于，通过对话历史编码器将对话历史序列H转化为对话历史编码向量，包括：；

公式中，是基于Transformer模型架构的对话历史编码器。