利索能及
我要发布
收藏
专利号: 2023102380841
申请人: 西安理工大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于多个潜在域混合的域泛化图像分类方法,其特征在于,按照以下步骤具体实施:步骤1,获取领域泛化数据集,包括源域数据集 和目标域数据集 ,进行数据增强和数据集扩充,具体过程是:所述的源域数据集 服从某种分布 ,类别标签为 , 为样本数目,即;

所述的目标域数据集 服从分布 ,类别标签为 ,即;

将源域数据集 、目标域数据集 分批次输入到随机数据增广网络中,随机数据增广网络对源域数据集 和目标域数据集 的样本实施旋转、裁剪和加入高斯白噪声变换后,恢复至原始输入大小,形成新的样本,重新加入至源域数据集 中,实现数据集扩充;

步骤2,构建AlexNet网络,加载预训练权重,同时将源域数据集 数据输入AlexNet网络中,对AlexNet网络进行对抗式训练;

步骤3,提取AlexNet网络的浅层特征,获得卷积特征统计信息,并计算域判别特征;

步骤4,通过标准聚类算法K‑means将卷积特征统计信息进行聚类,分为若干个簇,并根据簇为数据分配伪域标签;同时,随着网络训练过程对伪域标签进行更新;

步骤5,将聚类算法输出的伪域标签输入给领域判别器,完成领域判别器的训练,同时完成整体图像的分类网络的训练,将未参与训练的目标域 数据作为测试集输入给分类网络,最终得到分类结果。

2.根据权利要求1所述的基于多个潜在域混合的域泛化图像分类方法,其特征在于,步骤2中,具体过程是:所述的AlexNet网络的结构是,由一个输入层、五个卷积层、两个全连接层和一个输出层构成;每个卷积层后接一种非线性激活函数,在每个非线性激活函数后面再接一层最大池化层;在最后一个最大池化层后接一个全连接层,紧接着再加一个全连接层,随后在最后一个全连接层后加设一个Softmax函数,对AlexNet网络的训练过程为:

2.1)搭建好AlexNet网络的架构,加载预训练模型,然后从源域 中抽取一个批次数据 ,输入给AlexNet网络中;

2.2)AlexNet网络对输入数据 进行卷积、池化操作,同时计算损失函数、计算梯度,对AlexNet网络的分类误差进行反向传播,迭代更新AlexNet网络的参数,完成AlexNet网络的训练,AlexNet网络的操作,包括三个损失函数的计算,即分类损失 对抗性学习中域判别器的对抗性损失 、熵损失 ,计算式分别如下:a)分类损失 的计算式为:

(1)

其中, 为特征提取器, 为分类器, 表示输入的样本数量,表示数据样本的标签集合, 表示第 个样本的标签;

b)对抗性损失 的计算式为:

(2)

其中, 为领域判别器,表示伪域,表示已知数量的域,表示第 个域, 表示伪域标签;

c)熵损失 的计算式为:

(3)

其中 代表交叉熵损失函数;

到此,得到两个最终的优化函数,表达式如下:(4)

(5)。

3.根据权利要求1所述的基于多个潜在域混合的域泛化图像分类方法,其特征在于,步骤3中,具体过程为:

3.1)将源域数据集 的样本 ,并使用AlexNet网络作为特征提取器 ,提取得到的浅层特征称为卷积特征统计信息;

3.2)将所提取的卷积特征统计信息用于计算风格损失,为每个通道 跨空间维度独立计算均值 和标准差 ,计算式分别为:(6)

(7)

其中, 分别表示特征向量的高和宽,表示特征向量的通道,为输入的数据样本;

3.3)计算出均值 和标准差 以后,为了组合从不同卷积层获得的多尺度风格特征,将均值 和标准差 的堆栈定义为域判别特征 ,域判别特征的计算式为:

(8)

其中 表示式(5)中均值的计算,表示式(6)中的标准差计算, 表示映射函数MMD。

4.根据权利要求1所述的基于多个潜在域混合的域泛化图像分类方法,其特征在于,步骤4中,具体过程是:

4.1)得到域判别特征 后,通过K‑means算法进行聚类分析,首先计算源域数据样本的聚类中心,其次使得每个聚类集合中的样本点与聚类中心的距离平方和最小,反复迭代更新聚类中心;直到聚类中心不再发生变化,或是达到一定的迭代次数时,认为K‑means算法已经收敛,K‑means算法的目标函数为:

(9)

其中, 为给定源域数据集 中的每个数据样本 , 表示聚类集合中的一个子集, 是集合 的中心点,也就是聚类中心;

4.2)根据K‑means算法所得到的聚类中心,将多个潜在混合的源域数据集 的数据划分为 个簇,并利用簇分配 作为伪域标签 ,将聚类的簇分配结果 转为伪域标签 的过程进行反复迭代,进行更新,更新过程所需的目标函数的表达式为:(10)

其中, 为第 个聚类集合, 表示一个epoch之前的伪域标签, 表示第 个聚类集合的聚类中心,表示Kuhn‑Munkres算法。

5.根据权利要求1所述的基于多个潜在域混合的域泛化图像分类方法,其特征在于,步骤5中,具体过程是:

5.1)将步骤4输出的伪域标签输入给领域判别器,结合之前特征提取器所提取的领域不变特征,完成领域判别器的训练,具体的损失函数定义如式(2)所示;

5.2)完成本发明方法所述的图像的分类网络的训练,将未参与训练的目标域 数据作为测试集输入给分类网络,最终得到分类结果。