利索能及
我要发布
收藏
专利号: 2021107113208
申请人: 江苏大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-13
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种自我标签学习的深度聚类图像识别系统,其特征在于,包括预训练深度卷积自动编码器模块、样本特征聚类模块、样本再选择与重训练模块;

所述预训练深度卷积自动编码器模块用于初始化自编码器的权重参数,并实现对样本特征的初步提取;

所述样本特征聚类模块用于使用模型自带的聚类层对编码层提取到的样本特征进行聚类;

所述样本再选择与重训练模块用于将样本聚类后得到的伪标签进行筛选,挑出部分置信度较高的样本作为可信赖样本,输入卷积神经网络以提高训练网络的特征提取能力,得到一个更好的图像聚类模型;

所述预训练深度卷积自动编码器模块包括预训练卷积编码器,使用图像数据集,经过编码层的特征提取得到样本特征,然后将样本特征送入解码器,使用一致性约束来确保解码后的图像能够最大程度的还原成原始图像;

所述样本特征聚类模块包括初始化聚类中心以及样本聚类两部分构成;将样本通过编码层提取特征,对特征使用Kmeans算法得到初始的簇类中心,再通过自定义的聚类层,采用t分布作为核来度量样本点与簇类中心之间的相似度,用于微调聚类中心,并同时为每个样本重新分配簇id;

所述样本再选择与重训练模块用于选取可信赖样本以及卷积神经网络模块的训练;根据聚类层得到样本的伪标签以及簇类中心,选取伪标签中置信度较高的样本作为可信赖样本,卷积神经网络模块利用置信度较高的样本完成训练,提升网络特征提取的能力,为后续的特征聚类模块提供保障;

所述预训练深度卷积自动编码器模块中,编码器和解码器的具体实现如下:

编码器包括三个卷积层、两个线性层以及两个最大池化层;前两个卷积层的卷积核尺寸为5x5,步长为1,填充为1,采用Batch Normalization进行归一化,激活函数为LeakyReLu,每经过一层通道数翻倍,最后一个卷积层除了采用3x3的卷积核以外,其余操作均和前两个卷积核相同;池化层池化后的数据长宽各缩小一倍;线性层输入为1152维向量,输出维10维向量,采用Batch Normalization进行归一化,采用ReLu函数进行激活;

解码器包括两个线性层、三个反卷积层以及2个上采样层;线性层采用Batch Normalization进行归一化,激活函数为ReLu函数;反卷积层的第一层参数采用的卷积核尺寸为3x3,步长为1,填充为1,采用Batch Normalization进行归一化,激活函数为LeakyReLu,每经过一层通道数减半,后两个卷积层的卷积核尺寸为5x5,步长为1,填充为1,激活函数为LeakyReLu,其中最后一层卷积层不使用激活函数。

2.根据权利要求1所述的一种自我标签学习的深度聚类图像识别系统,其特征在于,所述样本特征聚类模块200中的样本聚类部分包括聚类层Q201与聚类层P202,聚类层Q201对样本特征120整体进行Kmeans聚类,获取每个簇的聚类中心,然后传入到聚类层P202中,采用t分布作为核来度量样本点与簇中心之间的相似度,用于微调聚类中心,其中样本i属于类j的概率设计为:其中zi表示样本i经过聚类层Q得到的特征,uj表示第j类的簇中心,α为t分布的自由度,实验中设置为1;为了优化聚类中心,模型定义了一个辅助的目标概率分布qij用于衡量样本i属于类j的概率,然后用KL散度作为聚类损失拉近原始分布与目标分布之间的距离;

聚类损失函数Lc设计为:

其中,聚类层P中,样本i属于第j类的概率pij的计算方式为:

将上式的计算结果作为聚类层P202的输出。

3.根据权利要求1所述的一种自我标签学习的深度聚类图像识别系统,其特征在于,所述样本再选择与重训练模块,可信赖样本的判断依据为:若样本xi距离类中心的距离D小于阈值λ时,则样本xi将被选为可信赖样本(vi=1),否则样本将被判为噪点(vi=0),距离D的计算公式如下:其中, 为样本xi的特征,即 centerj为第j类的中心,

centerj的计算方式为:

其中,uj表示Kmeans得到的第j类的聚类中心。

4.根据权利要求1所述的一种自我标签学习的深度聚类图像识别系统,其特征在于,所述卷积神经网络模块320包括六个卷积层和三个池化层以及四个全连接层;卷积层的卷积核尺寸为3x3,步长为2,填充为1,不进行归一化,激活函数为Relu,输出通道数分别为64、

64、128、128、256、256;池化层采用的是最大池化,经过池化后的特征长宽个缩小一倍;全连接层的神经元个数依次为2304、4096、4096、1024、10,不进行归一化,激活函数为ReLu;其中,最后一层全连接采用Softmax激活函数,输出的神经元个数为样本的总类别数。

5.一种自我标签学习的深度聚类图像识别方法,其特在于,包括如下步骤:

S1、设计预训练深度卷积自动编码器模块,用于初始化自编码器的权重参数,并实现对样本特征的初步提取;

S2、设计样本特征聚类模块,用于使用模型自带的聚类层对编码层提取到的样本特征进行聚类;

S3、设计样本再选择与重训练模块,用于将样本聚类后得到的伪标签进行筛选,挑出部分置信度较高的样本作为可信赖样本,输入卷积神经网络以提高训练网络的特征提取能力,得到一个更好的图像聚类模型;

所述S1中预训练深度卷积自动编码器模块包括预训练卷积编码器,使用图像数据集,经过编码层的特征提取得到样本特征,然后将样本特征送入解码器,使用一致性约束来确保解码后的图像能够最大程度的还原成原始图像;

其中,编码器包括三个卷积层、两个线性层以及两个最大池化层;前两个卷积层的卷积核尺寸为5x5,步长为1,填充为1,采用Batch Normalization进行归一化,激活函数为LeakyReLu,每经过一层通道数翻倍,最后一个卷积层除了采用3x3的卷积核以外,其余操作均和前两个卷积核相同;池化层池化后的数据长宽各缩小一倍;线性层输入为1152维向量,输出维10维向量,采用Batch Normalization进行归一化,采用ReLu函数进行激活;

其中,解码器包括两个线性层、三个反卷积层以及2个上采样层;线性层采用Batch Normalization进行归一化,激活函数为ReLu函数;反卷积层的第一层参数采用的卷积核尺寸为3x3,步长为1,填充为1,采用Batch Normalization进行归一化,激活函数为LeakyReLu,每经过一层通道数减半,后两个卷积层的卷积核尺寸为5x5,步长为1,填充为1,激活函数为LeakyReLu,其中最后一层卷积层不使用激活函数。

6.根据权利要求5所述的一种自我标签学习的深度聚类图像识别方法,其特在于,所述S2中的样本特征聚类模块包括初始化聚类中心以及样本聚类两部分构成;将样本通过编码层提取特征,对特征使用Kmeans算法得到初始的簇类中心,再通过自定义的聚类层,采用t分布作为核来度量样本点与簇类中心之间的相似度,用于微调聚类中心,并同时为每个样本重新分配簇id;

其中,样本聚类包括聚类层Q201与聚类层P202,

聚类层Q201对样本特征120整体进行Kmeans聚类,获取每个簇的聚类中心,然后传入到聚类层P202中,采用t分布作为核来度量样本点与簇中心之间的相似度,用于微调聚类中心,其中样本i属于类j的概率设计为:其中zi表示样本i经过聚类层Q得到的特征,uj表示第j类的簇中心,α为t分布的自由度,实验中设置为1;为了优化聚类中心,模型定义了一个辅助的目标概率分布qij用于衡量样本i属于类j的概率,然后用KL散度作为聚类损失拉近原始分布与目标分布之间的距离;

聚类损失函数Lc设计为:

其中,聚类层P中,样本i属于第j类的概率pij的计算方式为:

将上式的计算结果作为聚类层P202的输出。

7.根据权利要求5所述的一种自我标签学习的深度聚类图像识别方法,其特在于,所述S3中样本再选择与重训练模块,用于选取可信赖样本以及卷积神经网络模块的训练;根据聚类层得到样本的伪标签以及簇类中心,选取伪标签中置信度较高的样本作为可信赖样本,卷积神经网络模块利用置信度较高的样本完成训练,提升网络特征提取的能力,为后续的特征聚类模块提供保障;

其中,可信赖样本的判断依据为:

若样本xi距离类中心的距离D小于阈值λ时,则样本xi将被选为可信赖样本(vi=1),否则样本将被判为噪点(vi=0),距离D的计算公式如下:其中, 为样本xi的特征,即 centerj为第j类的中心,

centerj的计算方式为:

式中,uj表示Kmeans得到的第j类的聚类中心;

其中,卷积神经网络模块320包括六个卷积层和三个池化层以及四个全连接层;卷积层的卷积核尺寸为3x3,步长为2,填充为1,不进行归一化,激活函数为Relu,输出通道数分别为64、64、128、128、256、256;池化层采用的是最大池化,经过池化后的特征长宽个缩小一倍;全连接层的神经元个数依次为2304、4096、4096、1024、10,不进行归一化,激活函数为ReLu;其中,最后一层全连接采用Softmax激活函数,输出的神经元个数为样本的总类别数。