利索能及
我要发布
收藏
专利号: 2020114641694
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于对抗神经网络的跨域行人重识别方法,其特征在于,具体步骤包括如下:步骤(1.1)、构建行人重识别分类器:在带标签的行人数据集上预训练一个行人分类器;

其中,所述构建行人重识别分类器的具体方法如下:设带标签的训练集共有N张训练样本,分为T个不同的身份,每个训练样本均包括一个身份标签,则损失函数L的定义为:式中, 表示输入样本In属于类Tn的可能性,L表示分类器损失,N表示待分类样本数,n表示待分类样本,yj表示j所属类别,j表示待分类样本;

步骤(1.2)、将目标数据集样本映射到原数据集上:将不带标签的目标数据集映射到带标签的原数据集上,缩小两个数据集间样本差距;

利用域映射模型将目标数据集样本映射到原数据集上,具体是指在样本映射模型中,将目标数据中的样本一一映射到原数据集中;其中所述的样本映射模型包含两个生成器完成映射任务,即:G:IS→IT和H:IT→IS,其中,IS表示带有标签的原数据集,IT表示无标签的目标数据集;

另外,所述的域映射模型还具有两个判别器,即DS和DT,

其中,DS是用来判断输入样本是来自于原数据集,亦或是由H(IT)生成;

同理,DT是用来判断输入样本是来自于目标数据集,亦或是由G(Is)生成;所述的判别器和生成器的损失函数来自循环一致性对抗损失,采用最小二乘损失来优化每一对生成器和判别器;

对于生成器H:IT→IS来说,其损失函数定义为:

最小化上述损失函数的目的是为了将目标数据集中的样本 映射到原数据集中,其中,x=1,2;

并让判别器DS认为这个输入样本是来自于真实的原数据集中,而不是由生成器H:IT→IS生成的;同理,对于判别器DS的损失函数定义为:对于这里的判别器DS来讲,其任务是来判断输入样本是来自于原数据集,还是由H(IT)生成的,可看出,LH和 是一对对抗损失,同时给生成器G:IS→IT定义为:为判别器DT的损失函数,其定义为:

为了避免样本转换之间出现大的差异,引入了循环一致性损失,其定义为:在优化阶段,采取了随机梯度下降的方法来优化两对生成器与判别器;将上述的损失函数相结合并赋予了一些权重,最终得到的对与生成器需要优化的损失函数为:Lgen=LG+LF+λLcycle;

式中,λ控制了循环一致性损失影响整个损失函数的程度;将所有判别器的损失函数融合在一起,其式如下:在每一次的迭代过程中会使用Lgen,采用随机梯度下降的反向传播方法更新G和H的参数;使用同样的方法对Ldis梯度下降,更新DT和DS的参数;

步骤(1.3)、利用DCGAN优化映射模型:对得到的映射模型进行优化;

利用DCGAN优化映射模型的具体操作方法如下为:对于得到的两个生成器,G和H;分别是可以从不带标签的域映射到带标签域上的生成器和可以从不带标签的域映射到不带标签域上的生成器;当两个数据集之前的分布存在差距时,则两个生成器的映射往产生模糊;

不能将在有标签的原数据集上训练得到的分类器拟合到由生成器H得到的H(IT)上;

所述的模型中所使用的DCGAN的生成器的输入不是来自于噪声分布,而是由H构成,损失函数就是步骤(1.2)中的全体损失函数,所述的判别器则是利用来自原数据集上的样本和由 生成的从目标数据集映射到原数据集上的样本作为输入;

其中,判别器设置4层卷积层;为了防止梯度消失与梯度爆炸,每层卷积之间加入了局部归一层;除全连接层使用sigmoid激活函数以外,其余的激活函数统一使用LeakyRelu;设置标签值yi,预测值为 则经过激活函数输出为 设样本总数为N,得到的损失函数表达式为:

其中,对抗学习的博弈性就体现在标识符i的取值上;对于判别器,当i=1时,表示输入为真实数据,对应标签yi=1为真,触发针对判别器的训练;当i=2时,表示输入为生成图像,对应yi=0为假,触发判别器与生成器的联动;对于生成器,i=3表示输入为生成图像,对应yi=1为真,触发针对生成器的训练;

步骤(1.4)、相关算法优化:引入正则化,使模型具备较好泛化能力,避免过拟合;

所述相关算法优化的具体操作方法如下:引入正则化概念,其中,L2正则可分别表达为:正则项之前α是一个系数,θi表示成每层权重的倒数,表示对于学习到过高权重的层,需降低其更新程度;相反,对于层中学习到过低的权重的结点反而要提高其更新程度,从而达到层中所有权值平摊任务的目的;

在生成器的损失函数构建中,在损失函数后又加上L2正则化式子,如下式所示,其中,α设为0.0001;

在之后的网络训练过程中,采用学习率衰减策略以加快训练速度;学习率衰减策略可表示为下式;每当训练一定次数,学习率将会减少;其中decayrate为初始系数,epochi表示第i次训练,α0是初始学习率;如下式所述: