1.一种基于生成对抗网络和Caps‑Unet网络的粘连细胞核分割方法,其特征在于由下述步骤组成:(1)有标签数据集A归一化预处理
取原始数据集图片1384张,有标签数据集A图片1000张,无标签数据集B图片384张,图片大小为2000×2000像素;
(a)将有标签数据集A像素值归一化到[‑1,1],切分成尺寸为256×256像素的图片;
(b)将切分后有标签数据集A按3:1:1的比例分为训练集、验证集、测试集;
(2)构建生成对抗网络
采用常规的Pixel2Piexl方法构建成生成对抗网络;
(3)训练生成对抗网络
(a)训练生成对抗网络的生成器
生成对抗网络生成器的输入为有标签数据集A的图像,输出为假细胞区域图,开始训练生成对抗网络生成器,迭代M次,M为至少400的正整数,前 次的学习率为α,α的取值为0<α<0.01,后 次的学习率线性衰减;
(b)训练生成对抗网络的判别器
将生成对抗网络生成器输出的假细胞区域图与相对应的标签作为生成对抗网络判别器的输入,判别器鉴别生成器输出的假图像是否为真实图像,训练生成对抗网络的判别器,迭代N次,N为至少300的偶数,前 次的学习率为β,β的取值为0<β<0.001,后 次的学习率线性衰减;
(c)交替训练判别器与生成器
交替训练判别器与生成器,直至经判别器鉴定生成器产生的假图像是真图像的概率为
0.5时,训练结束,得到生成对抗网络生成器的模型和判别器的模型;
(d)保存模型
保存生成对抗网络生成器的模型作为检测无标签数据集B中图像的模型;
(4)检测无标签数据集B并生成对应标签
(a)检测无标签数据集B
用训练得到的生成对抗网络模型检测无标签数据集B的细胞核,输入模型所在路径、图像大小、原始图像夹路径、输出结果存放路径、起始的子文件夹序号、终止的子文件夹序号参数;数据集B里只有原始的图像没有标签,使用训练好的生成对抗网络的生成器模型去检测无标签数据集B图像,得到初步的细胞核检测结果;
(b)生成无标签数据集B的标签
上述步骤得到的细胞核检测结果作为无标签数据集B的初步标签图像,初步的标签图像为二值图;
(5)数据集B预处理
(a)用分水岭算法预处理初步标签
用分水岭算法将初步标签二值图中距离相近并且灰度值差异小的像素点互相连接起来,构成封闭的轮廓,将粘连细胞分割开来,得到灰度标签图;
(b)将灰度标签图的每个像素值都乘以255,进行归一化,得到细胞区域的最终二值图标签,用于后续Caps‑Unet网络训练,二值图标签的大小为2000×2000像素;
(c)将原始图像以及最终二值图标签切分成大小为500×500像素的图像;
(d)将切分完成后的原始图像与最终二值图标签按3:1:1的比例分为训练集,验证集、测试集;
(6)构建Caps‑Unet网络
用已知的改进的U‑Net检测细胞核边缘方法构建Caps‑Unet网络;
(7)训练Caps‑Unet网络
用步骤(5)划分得到的训练集训练Caps‑Unet网络,具体步骤为:(a)确定目标函数Yi
选取交叉熵损失函数作为Caps‑Unet网络的损失函数Loss,由式(1)确定:式(1)中,m是训练样本总数,xi为第i个样本,yi为第i个样本对应的标签,lθ(xi)为Caps‑Unet的输出,m、i为有限的正整数;
选取戴斯系数S1和戴斯系数S2作为Caps‑Unet网络的评价函数,由式(2)确定戴斯系数S1:式中yi是第i个样本对应的标签,Yi是Caps‑Unet的第i个样本的输出,i为有限的正整数,由式(3)确定戴斯系数S2:式中,P是Caps‑Unet输出每个样本的细胞核个数,Q是每个样本标签细胞核的个数,pk是Caps‑Unet输出每个样本的第k个细胞核,qj是每个样本标签的第j个细胞核,k和j为有限的正整数;
(b)训练Caps‑Unet网络
将经步骤(5)处理的数据集B送入Caps‑Unet网络中进行训练,Caps‑Unet网络的学习率为γ,γ的取值为0<γ<0.0001,优化器设定为自适应矩估计优化器,损失函数Loss为公式(1)的交叉熵损失函数Loss,评价函数为公式(2)和公式(3)的戴斯系数S1与戴斯系数S2,迭代次数为E,每一次迭代的训练次数为F,E和F为有限的正整数,训练至Caps‑Unet网络的损失函数收敛;
(c)保存训练过程中的权重与参数
在训练Caps‑Unet网络过程中,保存训练过程中参数及对应的权重;
(8)用Caps‑Unet网络分割粘连细胞核
(a)用Caps‑Unet网络分割粘连细胞核
读取数据集B测试集中的原始图像,加载Caps‑Unet网络以及保存的参数和权重,对其进行细胞核分割,得到粘连细胞核分割结果图;
(b)输出粘连细胞核分割结果图
用Python第三方工具包matplotlib中的imshow函数输出粘连细胞核分割结果图。
2.根据权利要求1所述的基于生成对抗网络和Caps‑Unet网络的粘连细胞核分割方法,其特征在于:在训练生成对抗网络步骤(3)的训练生成对抗网络的生成器步骤(a)中,所述的迭代M次为400,α的取值为0.0005。
3.根据权利要求1所述的基于生成对抗网络和Caps‑Unet网络的粘连细胞核分割方法,其特征在于:在训练生成对抗网络步骤(3)的训练生成对抗网络的判别器步骤(b)中,学习率β的取值为0.0001。
4.根据权利要求1所述的基于生成对抗网络和Caps‑Unet网络的粘连细胞核分割方法,其特征在于:在步骤(7)训练Caps‑Unet网络的步骤(a)确定目标函数的式(1)中,m是训练样本总数,xi为第i个样本,m为96,i为1~96中的任意一个数;在步骤(7)训练Caps‑Unet网络的步骤(b)训练Caps‑Unet网络中,所述的Caps‑Unet网络的学习率为γ,γ的取值为
0.00001。