利索能及
我要发布
收藏
专利号: 2026100631228
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种用于神经网络文本分类模型的黑盒水印嵌入方法,其特征在于,包括以下步骤:  步骤S1、构建水印触发集,包括先从原始训练集的一个原始类别中,选取固定比例的样本;再对所选样本进行语义重构处理并嵌入预定义的特殊字符序列,以构建同时包含语义级与字符级触发器的触发样本;最后为所有处理后的触发样本分配一个统一的新类别标签;

其中,语义重构处理具体包括以下步骤:

步骤S11、提取所选样本的关键语义特征,所述关键语义特征,包括核心实体、动作特征、主题分类中的至少一种;

步骤S12、先基于所提取的关键语义特征构建结构化生成提示,所述结构化生成提示包括用于定义核心主题的核心描述层、用于规定文本类别的类别指令层以及用于约束文本格式或风格的格式约束层;再利用flan‑T5‑base预训练文本生成模型,在预设的生成参数约束下,生成语义保持且格式重构的新文本样本,所述预设的生成参数包括主要实体出现度、类别关键词匹配度及动作相关性中的至少一种;

步骤S13、对生成的新文本样本进行质量检测,所述质量检测包括对文本完整性、核心实体匹配度及无关内容排除度中的至少一项进行自动化评估;将符合质量要求的样本添加至水印触发集,并重复步骤S11至S12,直至所述水印触发集的样本数量达到预设要求;

步骤S2、将步骤S1构建的水印触发集与普通训练样本的随机混合,形成混合数据集,所述普通训练样本为原始训练集中未被选入水印触发集的样本;

步骤S3、基于步骤S2获得的混合数据集对分类模型进行训练,使得训练后的分类模型中编码有水印信息,其中训练的优化目标是最小化总体损失函数 ,所述总体损失函数表示为:,其中λ为预设的权重系数且为正实数,所述 表示基于

分类模型对所述普通训练样本的预测结果与其原始类别标签计算得到的损失;所述表示基于分类模型对所述水印触发集中样本的预测结果与所述统一的新类别标签计算得到的损失。

2.根据权利要求1所述用于神经网络文本分类模型的黑盒水印嵌入方法,其特征在于,所述步骤S1中预定义的特殊字符序列为至少8个零宽不可见字符。

3.根据权利要求1所述用于神经网络文本分类模型的黑盒水印嵌入方法,其特征在于,所述步骤S1中固定比例为5%‑30%。

4.根据权利要求1所述用于神经网络文本分类模型的黑盒水印嵌入方法,其特征在于,在分类模型进行训练前,构建可插拔的水印感知注意力引导模块,引导分类模型在训练时将水印信息隐式编码至分类模型中,所述模块被配置为在分类模型训练期间可选择地接入分类模型第一位置和/或第二位置;其中第一位置为分类模型的词嵌入层之后、主干特征提取层之前;第二位置为分类模型的主干特征提取层输出之后、分类器层之前;训练完成后从分类模型移除。

5.根据权利要求4所述用于神经网络文本分类模型的黑盒水印嵌入方法,其特征在于,所述水印感知注意力引导模块包括查询投影单元、水印密钥单元、注意力计算单元、水印值单元以及特征调制单元;

所述查询投影单元,用于接收单个输入文本样本在分类模型Embedding层进行词向量转换后生成的原始特征矩阵 ,其中L为文本序列长度, 为输入特征维度,并对原始特征矩阵H进行降维与聚焦处理,输出一个查询投影 ,其中 为水印查询空间的维度,且 < ;

所述水印密钥单元,通过维护一个可学习的水印密钥矩阵K来存储水印原型向量;其中,所述水印密钥矩阵 ,其中 为水印密钥的数量, 为密钥向量的维度,且与水印查询空间的维度保持一致,每一个水印密钥向量 对应一个水印查询空间中的水印原型向量,i为正整数且i=1,2… ;

所述注意力计算单元,用于接收查询投影单元输出的查询投影 和水印密钥单元维护的水印密钥矩阵K,评估查询投影 与水印密钥的匹配程度,并归一化生成注意力权重矩阵A;

所述水印值单元,用于维护一个可学习的水印值矩阵 ,其中

矩阵中每个向量 表示针对水印密钥 编码的对应调制模式;

所述特征调制单元,用于接收注意力计算单元输出的注意力权重矩阵与所述水印值单元维护的水印值矩阵,根据注意力权重对水印值矩阵进行加权求和,生成特征调制量,并通过一个可学习的门控向量将该调制量与原始特征进行融合。

6.根据权利要求5所述用于神经网络文本分类模型的黑盒水印嵌入方法,其特征在于,所述查询投影单元中降维与聚焦处理通过一可学习的线性变换实现,具体包括:通过矩阵乘法将所述原始特征矩阵H与投影权重矩阵 进行线性变换,生成所述查询投影,其变换关系表示为: ,其中,投影权重矩阵 ,在模型训练初始化阶段采用Xavier均匀分布进行参数初始化。

7.根据权利要求5所述用于神经网络文本分类模型的黑盒水印嵌入方法,其特征在于,所述注意力计算单元基于缩放点积注意力机制来生成注意力权重矩阵,具体为:获取查询投影 中的每个位置与水印密钥的相似度值:

,其中, 为相似度矩阵,表述查询投影Q中第行的行向量,其中=1,

2,3…L;对相似度矩阵进行SoftMax归一化操作,得到归一化的注意力权重矩阵: ,其中 和 均表示相似度值,j为正整数且j=1,2… 。

8.根据权利要求5所述用于神经网络文本分类模型的黑盒水印嵌入方法,其特征在于,所述特征调制单元中先通过注意力权重矩阵沿着序列维度进行平均聚合,并与水印值矩阵V相乘得到调制信号 :,

再通过可学习的门控向量 对所述调制信号M进行通道自适应加权,其中门控向量经Sigmoid函数激活得到开放度权重 ;将加权后的调制信号以可调控的强度添加到所述原始特征矩阵H上,得到输出特征 ,其中 为调制强度系数,初始值为0.1。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述方法的步骤。