1.一种面向小样本表面缺陷数据集的样本增广方法,其特征在于包括以下步骤:(1)获取原始数据与人工标签:
采集缺陷产品的表面图像,并对图像中的待检区域与缺陷进行人工标注,以构建小样本表面缺陷数据集D;
(2)构建样本增广算法,该算法由环境引导的缺陷复制算法与背景复用算法构成,具体构建过程包括以下步骤:(2‑a)构建环境引导的缺陷复制算法:以人工标注的标签为基础,提取数据集D中存在的缺陷目标像素块STi及其对应的八个邻域像素块 构成缺陷像素块组Gi,i和j都为正整数,且i∈[1,M],j∈[1,8],其中M表示数据集D中存在的缺陷目标数量;依据缺陷像素块组Gi中缺陷目标像素块的缺陷类别将缺陷像素块组进行划分,同类别的缺陷像素块组归属于同一个缺陷像素块组集合St,其中t为正整数,且t∈[1,C],C表示数据集D中缺陷类别的数量;对数据集D中的任意一个图像I,从所有的缺陷像素块组集合中选取 个缺陷像素块组,其中Pt表示从集合St中随机选取的缺陷像素块组数量,在图像I的待检区域内,为每个被选取缺陷像素块组中的缺陷目标像素块随机生成一个与缺陷目标像素块尺寸相同的候选区域,计算候选区域的八个邻域像素块与被选取缺陷像素块组中的八个邻域像素块的协方差Cov来衡量环境相似度,当Cov大于阈值TH,则认为该缺陷像素块组中的缺陷目标像素块与候选区域的环境是相容的,并将该缺陷目标像素块粘贴到该候选区域,当Cov小于或等于TH,则放弃该缺陷目标像素块与该候选区域,并对下一个被选择缺陷像素块组中的缺陷目标像素块及其候选区域进行处理;算法通过给定的Pt值来控制不同种类缺陷的复制次数,实现数据集内的缺陷增广与类别平衡;其中Pt为整数,且Pt∈[0,10000],TH为实数,且TH∈(‑1,1);
(2‑b)构建背景复用算法:采用大小为L×L个像素的滑动窗,每次滑动的步长为S个像素,对数据集D中的任意一个图像I的待检区域进行滑动剪切,每剪切一次生成一个大小为L×L个像素的子图,根据子图是否包含缺陷将子图划分为背景子图与缺陷子图,所有的背景子图构成背景子图集,所有的缺陷子图构成缺陷子图集;从背景子图集中随机抽取三张子图,从缺陷子图集中随机抽取一张子图,将这四张被抽取的子图随机拼接成一张长宽比为1∶1的新图像,直到生成的新图像数量是缺陷子图集中图像数量的Q倍;拼接后生成的所有新图像与滑动窗剪切产生的所有含缺陷子图共同构成数据集中的训练集;其中L、S和Q都为正整数,且L,S,Q∈[1,10000];
(3)样本增广:
针对步骤(1)获取的小样本表面缺陷数据集D,依次应用步骤(2‑a)构建的环境引导的缺陷复制算法与步骤(2‑b)构建的背景复用算法,实现类别平衡与样本增广,构建增广表面缺陷数据集D_En。
2.如权利要求1所述的一种面向小样本表面缺陷数据集的样本增广方法,其特征在于,步骤(2‑a)中的八个邻域像素块提取方法,计算每个邻域像素块的左上角点的横坐标、纵坐标与右下角点的横坐标、纵坐标,并以这两个角点的坐标为基准提取矩形邻域像素块;对于缺陷目标像素块或候选区域,其八个邻域像素块的角点坐标计算公式分别为:1
AE=(Lx+W,Ly‑H;Rx+W,Ry‑H)
2
AE=(Lx,Ly‑H;Rx,Ry‑H)
3
AE=(Lx‑W,Ly‑H;Rx‑W,Ry‑H)
4
AE=(Lx+W,Ly;Rx+W,Ry)
5
AE=(Lx‑W,Ly;Rx‑W,Ry)
6
AE=(Lx+W,Ly+H;Rx+W,Ry+H)
7
AE=(Lx,Ly+H;Rx,Ry+H)
8
AE=(Lx‑W,Ly+H;Rx‑W,Ry+H)
j j
以上8个公式可以统一表示为AE=(indexlx,indexly;indexrx,indexry),其中AE表示缺陷目标像素块或候选区域的第j个邻域像素块的角点坐标,j为正整数,且j∈[1,8],indexlx、indexly分别表示左上角点横坐标、纵坐标,indexrx、indexry分别表示右下角点横坐标、纵坐标;Lx、Ly、Rx、Ry、W与H分别表示缺陷目标像素块或候选区域的左上角点横坐标、左上角点纵坐标、右下角点横坐标、右下角点纵坐标、宽与高。
3.如权利要求1所述的一种面向小样本表面缺陷数据集的样本增广方法,其特征在于,步骤(2‑a)中的环境相似度计算方法,其具体公式为:j j
其中SE表示缺陷目标像素块的八个邻域像素块中的第j个邻域像素块,TE表示缺陷目标像素块待粘贴位置的八个邻域像素块中的第j个领域像素块,符号 表示逐像素相乘,E(·)表示计算均值。