1.一种基于大型语言模型视图增强的对比学习序列推荐方法,其特征在于,包括以下步骤:步骤1,建立动态重要性评分机制,利用大型语言模型,根据用户和物品历史交互序列的隐层状态,计算重要性并生成动态调整因子;
步骤2,建立自适应序列裁剪方法,利用注意力机制进行序列数据增强,通过语义理解动态调整裁剪位置,根据动态调整因子,生成包含负样本对的增强视图;
步骤3,构造多模态双视图增强下的序列和项目双粒度对比学习方法,基于步骤2生成的增强视图构建对比学习任务,通过拉近正样本对表征距离、推远负样本对相似性,优化对比损失以强化对比学习方法对关键行为差异的感知能力;
步骤4,将原始的用户和物品历史交互序列输入线性递归单元LRU,提取用户动态兴趣表征并预测下一交互项的概率分布,同步计算常规序列推荐的损失函数;
步骤5,动态融合对比学习方法和常规序列推荐方法,通过加权组合损失函数进行优化,并通过反向传播联合训练模型。
2.根据权利要求1所述的方法,其特征在于,步骤1包括:构建用户和物品历史交互序列,其中 表示序列中第i个元素, 为序列长度;
通过预训练的大型语言模型BERT对用户和物品历史交互序列S进行处理,建立动态重要性评分机制,所述动态重要性评分机制执行如下操作过程:步骤1‑1,将用户和物品历史交互序列S转换为词向量,包括:输入数据:输入用户的历史交互记录;
清洗数据:去除无效交互;
序列分割:按固定长度切分长序列;
构建全局物品池:统计所有出现过的物品,生成唯一ID;
词汇表映射:为每个物品ID分配索引;
初始化嵌入矩阵:创建形状为 (B1, B2) 的随机矩阵,其中B1表示词汇表大小,B2表示嵌入维度;
序列向量化:将用户和物品历史交互序列S转换为索引列表,再通过嵌入矩阵映射为向量序列,得到标准化后的向量;
嵌入层输入:将标准化后的向量序列输入嵌入层;
步骤1‑2,通过多层Transformer提取隐层状态,步骤1‑3,沿特征维度计算位置重要性得分,用于后续信息裁剪;
步骤1‑4,通过多层隐层状态的聚合生成动态调整因子,公式为:,
其中, 表示第i个样本的动态调整因子, 表示预训练大语言模型BERT第k层输出的隐层状态矩阵,d为BERT的模型层数。
3.根据权利要求2所述的方法,其特征在于,步骤2包括:将调整因子 直接作用于位置编码,得到裁剪的动态起始位置 和弹性裁剪长度 :,
,
,
其中,表示裁剪比例参数, 表示原始序列长度; 表示均匀分布随机采样,表示增强序列的位置编码矩阵; 表示一个从 1 到 的整数序列;
然后通过计算出的裁剪的动态起始位置 和弹性裁剪长度 计算得出增强序列 ,公式为:,
其中 表示原始的用户和物品历史交互序列; 表示截取从 开始,长度为 的序列部分。
4.根据权利要求3所述的方法,其特征在于,步骤3包括:将原序列S增强序列 分别作为正样本和负样本用于对比学习;
序列级对齐方法是通过提取增强序列的末端位置嵌入,捕捉用户行为的全局时序模式,序列级对齐的损失函数 的公式为:,
其中,N表示一个训练批次中包含的样本总数, 为序列级嵌入向量, 表示第i个样本的正例级嵌入, 表示第j个负例嵌入向量, 为可调节的温度系数, 为余弦相似度,exp表示自然指数函数,K表示每个锚点 需要对比的负例总数;
采用SASRec模型作为基础模型,使用位置编码矩阵 和增强序列 作为参数,输入到SASRec模型中得到增强序列的向量嵌入;
利用SASRec模型中的Transformer 编码层,以隐式的方式学习项目间的关系,实现项目级对齐,通过注意力权重构建局部项目相似性矩阵,项目级对齐的损失函数 为:,
其中 表示用户和项目的交互序列长度, 为第q个项目Transformer输出的隐状态,为第q个项目的局部对比表示; 是通过序列打乱生成的同一的增强变体经Transformer编码后的隐状态; 表示 和 的相似度;
最后,采用双粒度对比损失联合优化,得到对比学习的损失 :,
其中, 、 表示权重系数。
5.根据权利要求4所述的方法,其特征在于,步骤4包括:将原始序列S为输入初始化隐藏状态,设初始状态 ,更新隐藏状态:,
其中, 是时间步t的输入向量, 的维度为 , 是时间步t的隐层状态向量,的维度为 , 为隐藏状态的权重矩阵, 为输入权重矩阵, 为偏置; 表示实数空间;
得到每个时间步时刻的兴趣 ,T代表输入交互序列的时间步总数,取最终状态 作为用户最终兴趣,用于预测下一交互;
将隐藏状态映射到物品空间:
,
其中, 为时间步t对应的物品空间中的映射结果, 为权重矩阵, 为偏置项;
通过Softmax函数生成用户下一步与每个物品交互的预测概率 :。
6.根据权利要求5所述的方法,其特征在于,步骤4还包括:计算常规序列推荐的损失函数 :,
其中 为真实标签,为候选物品数, 表示真实标签中对应物品 c 的指示值, 是输出的预测概率, 表示第c个物品权重系数。
7.根据权利要求6所述的方法,其特征在于,步骤5包括:动态融合对比学习方法和常规序列推荐方法,总损失函数 的计算公式为:,
其中 是对比损失的权重超参数。
8.根据权利要求7所述的方法,其特征在于,步骤5还包括:通过梯度下降法更新模型参数 ,最小化总损失:,
其中, 表示经过优化后得到的最优模型参数, 表示找到使 中的表达式取值最小的参数 。
9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行如权利要求1至8中任一项所述的方法的步骤。
10.一种存储介质,其特征在于,存储有计算机程序或指令,当所述计算机程序或指令在计算机上运行时,执行如权利要求1至8中任一项所述的方法的步骤。