1.一种用于不规则表格图像拉平的表格结构检测方法,包括如下步骤:(1)对原始图像进行表格区域检测,得到表格区域图片;
(2)对所述表格区域图片进行表格规范性检查,具体实现过程如下:
2.1将表格区域图片转为灰度图,接着使用自适应阈值对灰度图进行二值化处理和膨胀操作;
2.2对经步骤2.1处理后的图片进行轮廓边缘检测,检测出图片中表格的所有框线并对这些框线进行膨胀操作;
2.3根据各框线的坐标位置信息从图片中找出面积最大的轮廓,该轮廓即为表格轮廓;
2.4根据表格轮廓四个顶点的坐标信息判断表格是否规范;
(3)对不符合规范的表格区域图片进行预处理;
(4)对表格区域图片进行边框识别。
2.根据权利要求1所述的表格结构检测方法,其特征在于:所述步骤(1)的具体实现方式为:将含有表格的原始图像输入预训练的深度学习目标检测模型中,以检测输出图像中表格的区域位置信息,进而对表格进行提取,得到一张经裁剪后的表格区域图片。
3.根据权利要求1所述的表格结构检测方法,其特征在于:所述步骤2.4中判断表格是否规范的标准为:若满足以下所有条件的则判定表格符合规范,否则判定表格不符合规范;
y1∈[y2‑5,y2+5]&y3∈[y4‑5,y4+5]x1∈[x3‑10,x3+10]&x2∈[x4‑10,x4+10]其中:表格轮廓左上角顶点的坐标为(x1,y1),右上角顶点的坐标为(x2,y2),左下角顶点的坐标为(x3,y3),右下角顶点的坐标为(x4,y4)。
4.根据权利要求1所述的表格结构检测方法,其特征在于:所述步骤(3)的具体实现过程如下:
3.1将不符合规范的表格区域图片转为灰度图,接着使用自适应阈值对灰度图进行二值化处理和膨胀操作;
3.2对经步骤3.1处理后的图片进行轮廓边缘检测,检测出图片中表格的所有框线并对这些框线进行膨胀操作;
3.3根据各框线的坐标位置信息从图片中找出面积最大的轮廓,该轮廓即为表格轮廓;
3.4对于表格轮廓的四条曲线,利用边缘检测得到的轮廓点坐标通过最小二乘法拟合出这四条曲线的曲线函数;
3.5对于任一条曲线,将其细分成多段,每段可视为直线,利用曲线函数计算获得每段直线首末两点的坐标,进而计算出每段直线的长度,累加后即作为曲线的长度;
3.6利用表格轮廓四个顶点的坐标信息以及四条曲线的长度,通过透视变换对表格区域图片进行矫正。
5.根据权利要求4所述的表格结构检测方法,其特征在于:所述步骤3.6的具体实现方式为:首先将表格轮廓按10×10分割成多个区块,根据四个顶点的坐标信息以及四条曲线的长度计算获得每个区块四个顶点的坐标;然后将表格轮廓下边和左边两条曲线作分别为新坐标系中的x轴和y轴,换算出每个区块四个顶点在新坐标系中的坐标,进而根据这些点在原坐标系和新坐标系中的坐标通过透视变换将表格区域图片投影到一个新的视平面,从而完成矫正。
6.根据权利要求1所述的表格结构检测方法,其特征在于:所述步骤(4)的具体实现过程如下:
4.1将表格区域图片转为灰度图,接着使用自适应阈值对灰度图进行二值化处理,并做图像预处理;
4.2对预处理后的图片依次进行侵蚀和膨胀处理,从而获得一幅有水平线图像和一幅垂直线图像;
4.3将水平线图像和垂直线图像进行结合处理,得到一幅完整的光栅单元图像,并对该图像继续进行侵蚀处理;
4.4最后通过边缘检测获得光栅单元图像中各单元格的坐标数据,生成各个单元格信息的文本文件。
7.根据权利要求6所述的表格结构检测方法,其特征在于:所述步骤4.2中对图片进行膨胀处理的公式如下:dilation(x,y)=max(x′,y′):k(x′,y′)≠0I(x+x′,y+y′)对图片进行侵蚀处理的公式如下:
erosion(x,y)=min(x′,y′):k(x′,y′)≠0I(x+x′,y+y′)其中:I为需要进行操作的图像,k为操作的卷积内核,x'和y'为卷积内核的尺寸,(x,y)为图像的像素点坐标,卷积计算后该像素点的值等于以该像素点为中心的x'*y'范围内的最大值。