1.一种乳腺X线摄影的病灶检测方法,其特征在于:包括以下步骤:S1、获取公开的DDSM乳腺数据集;
S2、将DDSM乳腺数据集制作成多实例包的形式,并划分出训练集和测试集;
S3、将多实例包的类别作为多实例包内所有实例的伪标记;
S4、基于浅层的卷积神经网络建立乳腺X摄影的病灶检测模型;
将训练集中的多实例包输入病灶检测模型中预测多实例包中各实例的类别,使用交叉熵损失函数计算多实例包中各实例的交叉熵损失值;所述多分类交叉熵损失函数为:i
Lin=‑c log(pin)
其中: 表示第i个多实例包中第n个实例经过病灶检测模型最后的全连接层的第m个神经元的softmax输出; 表示yin_m的softmax输出,yin_m表示第i个多实例包中第n个实例属于类别cm的预测概率,m=1,2,…,M,M表示总共的类别数量;Lin表示第i个多实例包中i第n个实例的交叉熵损失值;c 表示第i个多实例包的类别,也即第i个多实例包中第n个实i例的伪标记,c∈{cm}; pin表示第i个多实例包中第n个实例预测为各个类别的输出概率分布;
S5、将训练集中的多实例包输入病灶检测模型,计算每个多实例包中各个实例的交叉熵损失值,挑选出每个多实例包中交叉熵损失值最小的前K个实例作为关键实例构成关键实例包,将多实例包的类别作为关键实例包的类别,将关键实例包的类别作为关键实例包内所有关键实例的伪标记;
S6、将关键实例包输入病灶检测模型,计算每个关键实例包中各个关键实例的有序损失值,通过梯度下降法优化病灶检测模型;
S7、重复步骤S5和S6,直至连续两次训练集中所有多实例包挑选出的关键实例包相同,完成病灶检测模型的训练;
S8、将测试集中的多实例包送入训练好的病灶检测模型,预测多实例包的类别。
2.根据权利要求1所述的乳腺X线摄影的病灶检测方法,其特征在于:所述步骤S2中,将DDSM乳腺数据集制作成多实例包的形式,包括如下步骤:S21、将DDSM乳腺数据集中的原始图像裁剪为N个统一高宽比的网格块;
S22、建立与原始图像一一对应的文件夹作为各原始图像的多实例包,将裁剪出来的N个网格块作为对应多实例包中的实例;
S23、对多实例包中的实例进行预处理,然后将多实例包划分为训练集和测试集。
3.根据权利要求2所述的乳腺X线摄影的病灶检测方法,其特征在于:所述步骤S23中,对多实例包中的实例进行预处理,包括如下步骤:S231、对于任一实例,计算像素值低于阈值β1或高于阈值β2的像素点的占该实例全部像素点的比例值:若所得比例超过阈值γ,则判定该实例为噪声实例,滤除该实例;否则,判定该实例为有用实例;
S232、对每个多实例包中的所有有用实例进行数据增强,通过包括翻转、旋转在内的操作,将多实例包中的实例个数增加为N个;
S233、将多实例包中的所有实例的尺寸统一大小为a×a。
4.根据权利要求1所述的乳腺X线摄影的病灶检测方法,其特征在于:所述病灶检测模型包括依次连接的输入层、卷积层I、池化层、卷积层II、全连接层I、全连接层II和输出层。
5.根据权利要求1所述的乳腺X线摄影的病灶检测方法,其特征在于:所述步骤S6中,将关键实例包输入病灶检测模型中,使用有序损失函数计算每个关键实例包中各关键实例的有序损失值,优化病灶检测模型;所述有序损失函数为:其中:Lo_ik表示第i个关键实例包中第k个关键实例的有序损失值;yik_m表示第i个关键实例包中第k个关键实例属于类别cm的预测概率,m=1,2,…,M,M表示总共的类别数量;yiki表示第i个关键实例包中第k个关键实例的预测类别;c表示第i个关键实例包的类别,也即i i第i个关键实例包中第n个关键实例的伪标记,c∈{cm};|yik‑c|表示第i个关键实例包中第k个关键实例的预测类别和伪标记之间的距离,α是决定距离系数强弱的超参数。
6.根据权利要求1所述的乳腺X线摄影的病灶检测方法,其特征在于:所述DDSM乳腺数据集中的图像为灰度图像,多实例包的类别至少包括正常、良性、恶性三大类别。
7.根据权利要求1所述的乳腺X线摄影的病灶检测方法,其特征在于:所述步骤S2中,将DDSM乳腺数据集制作成多实例包的形式,按照8:2的比例划分训练集和测试集。
8.根据权利要求1所述的乳腺X线摄影的病灶检测方法,其特征在于:所述步骤S22中,建立与原始图像一一对应的文件夹作为各原始图像的多实例包,使用原始图像名命名文件夹名。