1.一种PID图纸智能识别与重绘方法,应用于PID图纸识别领域,其特征在于,包括以下步骤:S1、将PID图纸文件转换成灰度PID图纸图像同时对图像进行预处理,并在图像上建立二维坐标系;
S2、准备图纸识别数据集和模板库并建立对图件和文字的识别模型;
S21、图纸识别数据集是通过在PID图纸文件上手工抠图建立的,包括图件分类数据集和文字识别数据集;
S22、模板库包含多个模板图像,模板图像是由图件的轮廓形状构成,一个模板图像对应一个或多个类别的图件;
S3、应用模板库中的模板图像在PID图纸图像上进行模板匹配,根据匹配条件,得到匹配结果并在PID图纸图像中抠图得到图像A;
S4、应用识别模型中的基于残差网络的图件分类模型,将图像A分类并得到分类结果;
S5、应用基于全卷积网络的文本检测网络检测图像A中的文字信息,并应用识别模型中的基于神经网络分类器的文字识别模型识别图像A中检测到的文字信息,利用正则表达式将识别出的文字与对应图件进行关联,并建立图件的标注信息;
S51、基于全卷积网络的文本检测网络将图像A中的文字信息用旋转矩形框框出;
S52、正则表达式是结合图件类别信息查找文字识别结果中符合图件属性命名规则的文字;
S53、图件的标注信息是结合图件类别信息,记录符合图件属性命名规则文字的矩形框中心点坐标、矩形框的旋转角度和图件标注的名称;
S6、应用基于像素点的管线识别算法遍历PID图纸图像,并根据管线宽度判断管线的类型,应用管线合并规则将识别到的PID图纸图像中的管线进行合并,得到管线的起止点坐标;
S61、PID图纸图像是灰度图像,图件指仪表或者阀门且图件之间采用管线进行连接,并且PID图纸图像中的背景像素值等于255,图件像素值小于255,管线像素值小于255;基于像素点的管线识别算法是根据模板匹配结果中的中心点坐标并结合匹配图件最小外接矩形的宽高,得到PID图纸图像中匹配图件最小外接矩形的水平方向两条边和竖直方向两条边的中心点坐标,并将水平方向两条边和竖直方向两条边的中心点坐标分别作为水平管线和竖直管线的起止点;判断管线起止点像素值是否小于255,若小于,则继续按照预设方向遍历并更新起止点的坐标;判断水平管线和竖直管线的起止点坐标差值是否大于匹配图件最小外接矩形的宽高,若大于,则记录水平和竖直管线起止点坐标;
S62、管线合并规则是寻找同一水平线和同一竖直线的管线,按照每段管线的起点坐标由小到大排序,判断同一水平线和同一竖直线中管线数量是否大于1,若大于1,则遍历同一水平线和同一竖直线中所有管线,判断当前管线的终止坐标是否大于下一段管线的起点坐标,若大于,则更新当前管线的终止坐标为下一段管线的终止坐标;
S63、当合并管线结束后,针对水平管线,以管线的起止点为初始点,分别向竖直方向延伸,直至某点的像素值等于255;寻找同一竖直线的管线,判断该竖直管线是否是同一竖直线中管线的子管线,若不是,则记录该竖直管线的起止点坐标;针对竖直管线,以管线的起止点为初始点,分别向水平方向延伸,直至某点的像素值等于255;寻找同一水平线的管线,判断该水平管线是否是同一水平线中管线的子管线,若不是,则记录该水平管线的起止点坐标;
S7、根据预设宽高,结合管线起止点坐标对PID图纸图像进行抠图得到图像B,应用基于全卷积网络的文本检测网络检测图像B中的文字信息,并应用识别模型中的基于神经网络分类器的文字识别模型识别图像B中检测到的文字信息,利用正则表达式将识别出的文字与对应管线进行关联,并建立管线的标注信息;
S8、保存模板匹配结果中图件的中心点坐标、旋转角度,图件类别和属性,管线起止点坐标、管线类型和管线属性,标注信息,根据PID图纸图像的尺寸、图框尺寸,结合PID绘制软件的绘制格式,将保存结果中的坐标信息按照转换公式进行转换,并通过PID绘制软件提供的软件接口,利用保存的结果进行PID图纸的重绘;
S81、PID图纸图像的尺寸是图像的宽高,单位是像素;图框尺寸是W×H,单位是毫米;
PID绘制软件的绘制格式是以左下角为坐标原点,水平向右方向为X轴正方向,竖直向上方向为Y轴正方向;
S82、转换公式为:
Scale_x=W/25.4
Scale_y=H/25.4
Original_x=25.4/Image_width
Original_y=25.4/Image_height
PID_x=((Symbol_y×Orighinal_x×Scale_x)/1000PID_y=((Image_height‑Symbol_x)×Original_y×Scale_y)/1000其中,
Scale_x和Scale_y:分别以英寸为单位表示图框的宽和高;
Symbol_x和Symbol_y:分别表示图件及其标注在PID图纸图像中的中心点坐标;
Image_width和Image_height:分别表示PID图纸图像的宽和高;
Original_x和Original_y:分别表示PID图纸图像中宽和高与图框宽和高的对应关系;
PID_x和PID_y:分别表示图件及其标注在PID绘制软件中的中心点坐标。
2.根据权利要求1所述的PID图纸智能识别与重绘方法,步骤S3中应用模板库中的模板图像在PID图纸图像上进行模板匹配,根据匹配条件,得到匹配结果并在PID图纸图像中抠图得到图像A,其特征在于,包括:S31、模板匹配采用的是基于轮廓形状的模板匹配,涉及模板的平移、旋转以及缩放,匹配条件采用的是模板与匹配图片的相似度得分,计算公式为:其中,
和 分别表示模板图像在(x,y)坐标点的x方向梯度和y方向梯度; 和分别表示匹配图片在(x,y)坐标点的x方向梯度和y方向梯度;
其中,
u和v:分别表示匹配图片的行列数;
Su,v:表示模板与匹配图片的相似度得分,介于0‑1之间,值越大,相似程度越高;
S32、匹配结果包括PID图纸图像中匹配图件的中心点坐标、旋转角度、缩放比例、相似度得分,并根据相似度得分与预设阈值进行比较,保留大于阈值的匹配结果;
S33、图像A是根据匹配结果及匹配图件的轮廓形状,得到匹配图件的最小外接矩形,将最小外接矩形的宽高增加预设像素值,进而进行抠图。
3.根据权利要求1所述的PID图纸智能识别与重绘方法,步骤S7中根据预设宽高,结合管线起止点坐标对PID图纸图像进行抠图得到图像B,应用基于全卷积网络的文本检测网络检测图像B中的文字信息,并应用识别模型中的基于神经网络分类器的文字识别模型识别图像B中检测到的文字信息,利用正则表达式将识别出的文字与对应管线进行关联,并建立管线的标注信息,其特征在于,包括:S71、基于全卷积网络的文本检测网络将图像B中的文字信息用旋转矩形框框出;
S72、正则表达式是查找文字识别结果中符合管线属性命名规则的文字;
S73、管线的标注信息是记录符合管线属性命名规则文字的矩形框中心点坐标、矩形框的旋转角度和管线标注的名称。