利索能及
我要发布
收藏
专利号: 2023104033910
申请人: 南昌大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-24
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于双重Encoder‑Decoder结构的脑卒中病灶区域分割方法,其特征在于,包括以下步骤:

步骤S1、图像预处理:从公开数据集中获取脑部3D‑MRI图像以及3D‑MRI图像对应于病灶区域的分割掩码,用于模型训练以及在测试阶段评判模型性能,对原始3D‑MRI图像以及分割掩码图像进行预处理;

步骤S2、搭建基于双重Encoder‑Decoder结构的深度学习模型,模型的双重Encoder‑Decoder结构由两个Encoder‑Decoder结构串联而成,模型的搭建过程具体可分为以下几步:步骤S21、搭建第一个Encoder‑Decoder结构:第一个Encoder‑Decoder结构由卷积部分、下采样部分和上采样部分构成,卷积部分的输出特征图为下采样部分的输入特征图,卷积部分具体操作为一次卷积操作+批归一化(Batch Normalization)+ReLU,下采样部分的输出特征图即为上采样部分的输入特征图,下采样部分含有四次下采样——最大池化操作,每次采样后对特征图进行一次卷积操作+Batch Normalization+ReLU,上采样部分含有三次上采样——转置卷积操作,每次采样后都需要使用Concatenate操作将转置卷积操作后的特征图与通过跳跃连接复制过来的下采样部分中ReLU激活函数输出的相同分辨率特征图在通道维度叠加以组成新的特征图,之后再对新的特征图进行一次卷积操作+Batch Normalization+ReLU;

步骤S22、搭建双重Encoder‑Decoder结构:第一个Encoder‑Decoder结构的最后一次卷积操作+Batch Normalization+ReLU的输出即为第二个Encoder‑Decoder结构的输入特征图,第二个Encoder‑Decoder结构同样由下采样部分和上采样部分构成,第二个Encoder‑Decoder结构的下采样部分(简称第二下采样部分)的输出为第二个Encoder‑Decoder结构的上采样部分(简称第二上采样部分)的输入,第二下采样部分含有三次下采样——最大池化操作,每次采样后使用Concatenate操作将最大池化操作后的特征图与通过跳跃连接复制过来的第一Encoder‑Decoder结构中ReLU激活函数输出的相同分辨率特征图在通道维度叠加以组成新的特征图,再对新的特征图进行一次卷积操作+Batch Normalization+ReLU,第二上采样部分含有四次上采样——转置卷积操作,每次采样后使用Concatenate操作将转置卷积操作后的特征图与通过跳跃连接复制过来的第一Encoder‑Decoder结构和第二下采样部分中ReLU激活函数输出的相同分辨率特征图在通道维度叠加以组成新的特征图,再对新的特征图进行一次卷积操作+Batch Normalization+ReLU;

步骤S23、组建完整的双重Encoder‑Decoder结构的深度学习模型:对双重Encoder‑Decoder结构的输出添加一次通道为2、核为3×3、步长为1、填充为1的卷积操作和Softmax激活函数,到此完整的双重Encoder‑Decoder结构的深度学习分割模型构建完成;

步骤S3、利用训练集数据对搭建的深度学习模型进行训练:训练集中每次输入模型用于训练的数据批量大小(batch size)为6,当训练集中所有数据都训练过模型记为1个训练轮次,以平衡交叉熵损失函数结合Dice损失函数得到模型损失函数L=LBCE+LDice来降低数据集分类不平衡的影响,并使用Adam优化器来优化模型损失函数L,以获得最小的损失值,训练集中所有数据都基于该优化器训练60个轮次,并且在模型训练过程中,每20个数据批(batch)训练过模型后,使用验证集数据对当前训练状态的模型进行评估验证,记录模型在验证集上的评估结果并保存评估结果最优时所对应的模型参数,60个训练轮次结束后,将保存的模型参数导入至模型中,得到训练好的分割模型;

步骤S4、将测试集图像数据输入训练好的分割模型,得到模型最后Softmax激活函数输出的预测概率矩阵,所述概率矩阵共两层,每层分辨率与输入图像相同,提取概率矩阵两层中每个点最大值的位置后,即可得到模型对测试集图像数据中脑卒中病灶区域的二值预测分割图。

2.根据权利要求1所述的一种基于双重Encoder‑Decoder结构的脑卒中病灶区域分割方法,其特征在于,步骤S1中所述对原始MRI图像以及掩码图像进行预处理,具体过程为:根据所获取的公开数据集中的样本量,划分出训练集、验证集和测试集;对训练集、验证集和测试集,根据掩码图像,在轴向视图上剔除不含脑卒中病灶的MRI切片,对剩余切片的脑部区域使用最小最大值归一化,并与对应病灶掩码转换为PNG格式,而后进行中心裁剪,调整图像分辨率为224×224,并对训练集图像使用旋转、翻转操作增加数据量。

3.根据权利要求1所述的一种基于双重Encoder‑Decoder结构的脑卒中病灶区域分割方法,其特征在于,步骤S21中所述卷积部分中的一次卷积操作,该卷积操作卷积核为3×3、步长为1、填充为1,卷积操作的输出通道为64;所述含有的四次下采样——最大池化操作,每次采样后对特征图进行一次卷积操作,该卷积操作卷积核为3×3、步长为1、填充为1,卷积操作的输出通道依次为128、256、512、512;所述含有的三次上采样——转置卷积操作,该转置卷积操作卷积核为3×3、步长为1、填充为1、输出通道依次为512、256、128;所述含有的三次上采样,每次采样后对Concatenate操作所形成的新的特征图进行一次卷积操作,该卷积操作卷积核为3×3、步长为1、填充为1,卷积操作的输出通道依次为256、128、64。

4.根据权利要求1所述的一种基于双重Encoder‑Decoder结构的脑卒中病灶区域分割方法,其特征在于,步骤S22中所述含有的三次下采样——最大池化操作,每次采样后对Concatenate操作所形成的新的特征图进行一次卷积操作,该卷积操作卷积核为3×3、步长为1、填充为1,卷积操作的输出通道依次为128、256、512;所述含有的四次上采样——转置卷积操作,该转置卷积操作卷积核为3×3、步长为1、填充为1、输出通道依次为512、512、

256、128;所述含有的四次上采样,每次采样后对Concatenate操作所形成的新的特征图进行一次卷积操作,该卷积操作卷积核为3×3、步长为1、填充为1,卷积操作的输出通道依次为512、256、128、64。

5.根据权利要求1所述的一种基于双重Encoder‑Decoder结构的脑卒中病灶区域分割方法,其特征在于,步骤S23中所述Softmax激活函数表达如下:上式中,(i,j)为特征图中坐标为(i,j)的点,k为特征图在通道维度上的第k层, 为输入特征图的第k层坐标为(i,j)的点的值,C为特征图的通道数,即需要分类的总类别数,1≤k≤C。

6.根据权利要求1所述的一种基于双重Encoder‑Decoder结构的脑卒中病灶区域分割方法,其特征在于,步骤S3中所述平衡交叉熵损失函数为:

上式中,C为总类别数,W为类别权重系数,(i,j)表示坐标为(i,j)的点,N为图像在x轴或y轴上的像素点数, 为掩码图像展开为one‑hot矩阵后,其中第c层的坐标为(i,j)的点的值, 为模型预测矩阵中第c层的坐标为(i,j)的点的值。

7.根据权利要求1所述的一种基于双重Encoder‑Decoder结构的脑卒中病灶区域分割方法,其特征在于,步骤S3中所述Dice损失函数为:

上式中,ε为一极小值常数。

8.根据权利要求1所述的一种基于双重Encoder‑Decoder结构的脑卒中病灶区域分割方法,其特征在于,步骤S4中所述概率矩阵,概率矩阵共2层且分辨率与输入图像一致,矩阵第一层的每个点的数值表示该点对应的输入图像的像素点为非病灶区域的概率,第二层每个点的数值表示对应像素点为病灶区域的概率,其中所提取出每个点的最大位置,即若某像素点的坐标为(i,j)时,对应于概率矩阵中第一层该点的概率值更大,则二值预测分割图中坐标为(i,j)点的值为0,反之若第二层的概率值更大,则该点的值为1。

9.根据权利要求2所述的一种基于双重Encoder‑Decoder结构的脑卒中病灶区域分割方法,其特征在于,所述最小最大值归一化操作为:

上式中:X为图片的数值矩阵;max(X)、min(X)分别为图片的数值矩阵中脑部区域内数值的最大值与最小值;

所述最大最小值归一化仅对MRI图像中的脑部区域进行,背景区域的数值始终保持为

0。

10.根据权利要求2所述的一种基于双重Encoder‑Decoder结构的脑卒中病灶区域分割方法,其特征在于,对训练集图像使用旋转、翻转操作,仅对训练集中病灶区域的像素数小于或等于200的图像进行。