买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种用于行人识别数据集增强训练的生成对抗网络系统

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种用于行人识别数据集增强训练的生成对抗网络系统

￥19200

专利号： 2020101123061

申请人：江苏大学

专利类型：发明专利

专利状态：已下证

更新日期：2026-06-16

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种用于行人识别数据集增强训练的生成对抗网络系统，其特征在于，包括预训练行人再识别模块、自动编码器模块、生成无标签编码模块、细调无标签图片模块、生成有标签编码模块、细调有标签图片模块、训练行人再识别模块；

所述预训练行人再识别模型(330)用来对生成图片与真实图片(000)进行分类；

所述自动编码器模块负责所述生成图片的压缩编码，以及从压缩编码解码回原始图片；

所述生成无标签编码模块、生成有标签编码模块负责生成符合整体数据集/特定类别的编码；

所述细调无标签图片模块、细调有标签图片模块负责判别经解码器(120)解码后的图片是来自真实的数据集图片的编码，还是来自所述生成无标签编码模块、生成有标签编码模块；所述生成无标签编码模块、生成有标签编码模块与所述细调无标签图片模块、细调有标签图片模块采用的条件生成网络架构；

所述训练行人再识别模块负责训练行人再识别；

所述生成无标签编码模块包括编码生成器(210)与编码判别器(220)，使用条件生成对抗网络从随机噪声(211)中生成自动编码器(100)的最终编码(101)，条件标签(201)设定为数据集的总类别加一作为前期无标签的条件标签(201)，让编码生成器(210)可以习得真实图片(000)的特征；所述编码判别器(220)也采用相同的条件标签(201)，让编码判别器(220)在负责区分最终编码(101)和生成编码(213)时，也学到真实图片(000)的特征；

所述生成有标签编码模块包括编码生成器(210)与编码判别器(220)，所述生成有标签编码模块是通过将生成无标签编码模块中的条件标签(201)更改为输入图片的真实标签；

所述细调无标签图片模块包括编码生成器(210)、图片判别器(230)，将编码生成器(210)生成的生成编码(213)送入解码器(120)进行解码，得到解码图片(310)；图片判别器(230)采用条件生成对抗网络的架构，使用与上述无标签编码模块中一致的条件标签(201)进行训练，试图区分输入图片来自编码生成器(210)生成的生成编码(213)送入解码器(120)进行解码得到的解码图片(310)还是真实图片(000)，通过反向传播，迫使编码生成器(210)也进行权重上的修正，从而生成更加逼真的解码图片(310)；

所述细调有标签图片模块包括编码生成器(210)、图片判别器(230)与预训练行人再识别模型(330)，所述细调有标签图片模块是通过将细调无标签图片模块中的条件标签(201)更改为输入图片的真实标签；

所述编码生成器(210)由五层反卷积层构成，所述编码生成器(210)输入为128+类别数维的向量，输出为12*32*16维的编码213，第一层反卷积层的卷积核尺寸为(4，1)，步长为(2，1),填充为(1，0)，采用Batch Normalization进行归一化，激活函数为ReLu，输出通道数为512通道，第二层到第四层反卷积层的卷积核尺寸为4，步长为2，填充为1，采用Batch Normalization进行归一化，激活函数为Tanh，每经过一层通道数减半，第五层反卷积层的卷积核尺寸为4，步长为2，填充为1，不进行归一化，激活函数为Tanh，所述编码判别器(220)输入为所述编码生成器(210)与编码器(110)所生成的12*32*16维的编码和类别数维的条件标签(201)，所述编码判别器220由四层卷积层构成，第一层到第三层卷积层的卷积核尺寸为4，步长为2，填充为1，采用Layer Normalization进行归一化，激活函数为Leakey ReLu，通道数固定为512通道，第四层卷积层的卷积核尺寸为(4，1)，步长为(2，1),填充为(1，0)，不进行归一化与激活，直接输出，输出通道数为1。

2.根据权利要求1所述的用于行人识别数据集增强训练的生成对抗网络系统，其特征在于，所述预训练行人再识别模块包括预训练行人再识别模型(330)，使用真实图片(000)，训练一个行人再识别模型，进而得到预训练行人再识别模型(330)，其中，该预训练行人再识别模型(330)为ResNet50结构。

3.根据权利要求1所述的用于行人识别数据集增强训练的生成对抗网络系统，其特征在于，还包括自编码器模块，自编码器模块包括自动编码器(100)，由编码器(110)与解码器(120)两部分构成，使用真实图片(000)，训练一个自动编码器(100)，通过保证解码后的解码图片(310)与真实图片(000)的一致性，得到真实图片(000)的一个较好的最终编码(101)表示。

4.根据权利要求1所述的用于行人识别数据集增强训练的生成对抗网络系统，其特征在于，所述训练行人再识别模块：将有标签的解码图片(310)，其标签就采用生成时的条件标签(201)，与欲扩充的真实图片(000)一起，作为扩充后的数据集，训练新的行人再识别模型(320)，从而得到一个比预训练行人再识别模型(330)性能更强大的模型。

5.根据权利要求3所述的用于行人识别数据集增强训练的生成对抗网络系统，其特征在于，所述编码器(110)由四层卷积层、一层线性层构成；解码器(120)由一层线性层、四层反卷积层构成。

6.根据权利要求1所述的用于行人识别数据集增强训练的生成对抗网络系统，其特征在于，所述编码生成器(210)由五层反卷积层构成；所述编码判别器(220)由四层卷积层构成。

7.根据权利要求1所述的用于行人识别数据集增强训练的生成对抗网络系统，其特征在于，所述编码生成器(210)由五层反卷积层构成，所述图片判别器(230)由六层卷积层构成。