1.一种基于均值偏移特征和直接优化子空间的白细胞单分类方法,其特征在于,首先,使用均值偏移特征来克服自监督对比学习和单分类方法的不兼容性,同时缓解微调带来的灾难性崩溃问题;然后,引入直接优化子空间与均值偏移特征相结合,提升模型对白细胞微小差异的识别能力,以提高白细胞单分类的准确性。
2.根据权利要求1所述的基于均值偏移特征和直接优化子空间的白细胞单分类方法,其特征在于,该方法包括初始特征提取、特征自适应以及计算异常得分三个阶段,具体地,给定一组正常训练样本初始特征提取阶段: 的特征提取器φc由基于预训练模型的初始特征提取器φ0初始化;
特征自适应阶段:微调特征提取器的网络φc,以形成最终的特征自适应分类器φf;
计算异常得分阶段:使用φf提取用于异常得分计算的特征。
3.根据权利要求2所述的基于均值偏移特征和直接优化子空间的白细胞单分类方法,其特征在于,初始特征提取阶段中,定义一个初始特征提取器φ0: 其中是特征维度;初始特征提取器能够将正常训练样本进行参数化,并生成特征表示;使用ImageNet预训练模型作为初始特征提取器φ0,对正常训练样本进行初始特征提取;初始化权重φ被用于下一步的特征自适应。
4.根据权利要求2所述的基于均值偏移特征和直接优化子空间的白细胞单分类方法,其特征在于,特征自适应阶段中,通过将均值偏移特征和直接优化子空间相结合提出了基于均值偏移子空间的无监督特征自适应方法,具体过程如下:(1)数据增强及特征编码器:
对于给定批次大小为K的样本集,每张样本通过数据增强一分为二得到2K个视图,记为*x、x ,同样本的增强视图视为正对,批次中所有的其他视图视为负对;之后,采用初始特征* *提取器 对增强后的视图x、x进行编码,生成表示r、r并进行归一化;
(2)均值偏移特征:
均值偏移特征的目的是解决传统对比学习和单分类之间的不兼容性;对于单类别分类任务来说,目标就是让训练样本即正常类尽可能靠近中心,让异常类远离中心;使用紧性损失来实现这一目标,写成:其中 是由初始特征提取器 初始化的表示,c为常数,是预训练特征表示的均值中心点;对紧性损失进行优化,将距离计算中心从特征均值中心c即原点o更新为特征归一化*中心c0,从而,对比学习和单分类的矛盾得以解决,灾难性崩溃现象也不会发生;表示r、r通*过与归一化中心c0相减进行偏移生成均值特征偏移θ、θ,形成的均值偏移特征表示如下:(3)直接优化子空间:
使用直接优化子空间来增强对比学习模型对类之间微小差异的区别能力;直接优化子*空间无需添加更多的参数和计算量,只需提取固定的均值偏移子空间z、z ,去除冗余的高维维度信息,提供最大化的学习能力;其表示如下:z=θ[0:dim]
其中,dim表示优化子空间的维度大小;
(4)损失函数:
*
使用标准InfoNCE损失对均值偏移子空间z、z进行计算,其公式如下:其中,1[m≠i]∈{0,1}表示当m≠i时值为1的指标函数,τ为温度超参数。
5.根据权利要求3所述的基于均值偏移特征和直接优化子空间的白细胞单分类方法,其特征在于,图像增强方法包括随机裁剪、水平翻转、颜色抖动、灰度化、高斯模糊。
6.根据权利要求2所述的基于均值偏移特征和直接优化子空间的白细胞单分类方法,其特征在于,计算异常得分阶段中,采用基于KNN的得分函数作为异常检测的判定指标,来计算测试样本的异常程度;对于给定的测试样本y,计算其特征与训练集χtrain中最近的K张正常样本的特征之间的余弦距离,得分函数如下:其中Nk(x)代表训练特征集中距离测试样本y的特征最近的K个特征, 是由对训练样本和测试样本提取的特征表示;通过验证KNN得分是否大于阈值t来确定测试样本y是正常还是异常即其他类。