利索能及
我要发布
收藏
专利号: 2025108291164
申请人: 济南大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种用于PID图纸中管线和符号的识别方法,其特征在于,包括以下步骤:

S1、PID图纸图像数据集制作;

S2、构建符号检测模块,分为定位任务和分类任务,定位任务通过两个阶段完成对符号位置的定位,通过符号复杂度对候选区域的符号进行分类,简单符号和复杂符号使用不同的分类方法;

S21、定位任务第一阶段预测符号的初始位置,第二阶段对第一阶段的位置进行边界修正;第一阶段使用Anchor‑free检测器进行符号位置的初步定位,Anchor‑free检测器输出符号的边界框信息;第二阶段采用区域对齐机制对候选框区域进行精细采样,并通过插值方法对边界区域进行亚像素级别的特征提取,生成具有空间一致性的特征表示输入到边界回归模块,边界回归模块通过对特征区域内几何信息和边界关系的学习得到特征区域边界修正量;根据特征区域边界修正量将初始边界框信息进行更新,获得精确的符号位置信息,符号位置信息为切分后图像的局部坐标,全局符号位置信息需要在局部坐标的基础上加上切分后的图纸图像左上角在原图纸图像中的坐标;

S22、分类任务首先采用自适应符号分类策略,通过候选区域符号的面积、封闭度和边缘数量计算符号复杂度,将计算的符号复杂度与设定好的符号复杂度阈值Dv比较,将符号分为简单符号和复杂符号,所述符号复杂度Df具体计算公式为:式中,A为符号的面积,C为符号的封闭程度,E为符号的边缘数量,σ为调整因子,ξ(A,C,E)为符号特征的互补性, 简单符号使用卷积和最大池化进行处理,之后经过全连接进行符号的高层次特征融合,通过分类头将提取到的特征映射到符号类别;对于复杂符号,将复杂符号候选区域输入到多方向感知卷积模块,通过卷积运算提取并强化符号中沿特定方向分布的线条结构;之后利用局部自适应直方图均衡算法增强区域中线条与背景之间的对比度,将增强后的图像输入到包含局部细节通道、拓扑轮廓通道与方向感知通道的多分支神经网络,分别提取复杂符号的纹理特征、连接形态与方向特征;随后通过特征融合机制整合多源信息,生成总特征向量,在模型训练阶段基于总特征向量为每一类复杂符号定义结构模板,验证阶段将候选区域的总特征向量与结构模板进行匹配,得到目标符号类别;

S3、构建管线检测模块,定义一组结构响应核,覆盖所有管线类型,通过结构响应核扫描图纸图像,获得每个像素点对不同结构线型的响应强度,从响应组中对每个像素点进行结构类型识别并量化可信度,从端点像素出发,沿结构类型匹配的方向,提取出完整连续路径,合并重复线段,规范路径结构并输出管线坐标和类型;

S4、构建PID图纸管线和符号识别模型,模型由管线检测模块和符号检测模块组成,输入PID图纸图像,分别经过管线检测模块和符号检测模块得到PID图纸中管线和符号的位置信息和对应的种类。

2.根据权利要求1所述的一种用于PID图纸中管线和符号的识别方法,其特征在于,所述S1步骤中,使用文字检测模型自动识别图纸图像中的文字区域,将文字区域填充为白色,得到去除文字信息的图纸图像;对去除文字的图像使用步长为128的滑动窗口进行区域划分,计算每个区域内像素灰度的标准差,表示每个区域的结构复杂度,对复杂度图进行非极大值抑制提取局部峰值点,将局部峰值点作为切分图块的中心点,设置每块图像的裁剪尺寸为1024×1024,对于已选中心点间距离过近的,进行密度抑制,避免大量重复,对复杂度图中值较低区域,判断标准差是否低于结构复杂度阈值,对于低于结构复杂度阈值的区域则丢弃,避免空白区域浪费存储与训练资源;切分后的图纸图像记录左上角在原图纸图像中的坐标,将切分后的图像进行管线和符号标注,得到PID图纸数据集,并将数据集分为训练集和验证集。

3.根据权利要求2所述的一种用于PID图纸中管线和符号的识别方法,其特征在于,所述S2步骤中,方向感知卷积核是具有方向选择性的二维卷积核,能针对图像中的特定方向结构产生更强响应,方向感知卷积响应Rθ(x,y)具体数学模型为:式中,k为卷积核半径;θ为卷积核的方向,Kθ为针对角度θ构造的方向模板,I(x+i,y+j)为坐标位置(x+i,y+j)处的像素值。

4.根据权利要求3所述的一种用于PID图纸中管线和符号的识别方法,其特征在于,所述S3步骤中,管线检测模块输出管线坐标和类型,具体步骤为:

S31、PID图纸管线类型包括粗管线、细管线、粗虚管线、细虚管线、O型管线、波浪管线、双层管线、双点型管线和双短线型管线九种管线,定义一组结构响应核Kδ={K1,K2,K3,K4,K5},覆盖所有管线类型,每个响应核与切分后的图纸图像Iin进行卷积操作,生成一张响应图Rz(xR,yR)=Conv(Iin,Kz),表示在Kz响应核下的可信度评分,z∈{1,2,3,4,5},(xR,yR)为像素点坐标值,最终得到响应图集合 结构响应核包括:实线核K1、虚线核K2、点线‑短划线核K3、波浪线核K4、双线核K5;其中,实线核K1结构为5×5的矩阵,0°方向是第三列为1,其余为0的矩阵,通过旋转0°方向矩阵得到45°、90°、135°方向的实线核;虚线核K2构造函数为fshape(Ls,Gs,Rs)=Repeat(Ls[1,...,1],Gs[0,...,0],Rs),Ls为连续长度,Gs为间隔长度,Rs为重复次数,Repeat为线段构造;点线‑短划线核K3由稀疏点结构和Gauss平滑构建,支持非均匀点阵;波浪线核K4将cos函数压缩映射到核模版上,T为波浪线的周期,控制波浪幅度带宽;双线核K5由两条平

行主带和抑制中轴构成,用来表达虚、实并行线,通过左右带响应差识别双层结构;

S32、对图纸图像中的像素点p通过响应图集合SRI进行响应量计算,响应图集合中最大响应量下标为该像素点的结构类型标签, Tlab为结构类型标

签,Tlab∈[1,2,3,4,5],argmax为取最大值下标操作,(xp,yp)为像素点p的坐标,最大响应量为该标签结构类型的可信度评分, 若Tlab为1则像素点p属于实线类管线,实线类管线分为粗管线、细管线和O型线;若Tlab为2则像素点p属于虚线类管线,虚线类管线分为粗虚管线和细虚管线;若Tlab为3则像素点p属于点线‑短划线管线,点线‑短划线管线分为双点型管线和双短线型管线;若Tlab为4则像素点p属于波浪管线;若Tlab为5则像素点p属于点双层管线;

S33、根据结构类型标签和可信度评分提取出完整连续路径,对像素点p周围像素进行响应量计算,判断周围像素点的结构类型标签和可信度评分,路径提取时会遇到以下三种情况:若像素点p周围像素的可信度评分低于存在阈值,则像素点p为孤立像素点,视为无效管线;

若像素点p周围存在超过一个的有效像素点,则该像素点为中间像素点,为管线的中间组成部分;若像素点p周围仅存在一个有效像素点,则该像素点为端点像素;找到端点像素,记录端点像素坐标为起点坐标,根据结构类型标签寻找下一个像素点,若下一个像素点为中间像素点,则将下一个像素点加入路径记录像素点坐标并继续寻找下一个像素点;若下一个像素点为端点像素,将下一个像素点加入路径并记录为终点坐标;当结构类型为虚线类管线时寻找下一个像素点时允许跨像素寻找;所得路径坐标为局部管线坐标,全局管线位置信息需要在局部坐标的基础上加上切分后的图纸图像左上角在原图纸图像中的坐标;

S34、提取完整路径后,对结构类型为实线类管线、虚线类管线和点线‑短划线管线的路径详细划分,实线类管线分为粗管线、细管线和O型线,使用Sobel算子计算路径的宽度,引入傅里叶频域辅助周期性判断,若路径宽度存在周期性变换,则该路径为O型线;若路径不存在周期性变换且平均宽度超过管线宽度阈值,则该路径为粗管线;若路径不存在周期性变换且平均宽度低于管线宽度阈值,则该路径为细管线,管线宽度阈值设置为5像素;虚线类管线分为粗虚管线和细虚管线,使用Sobel算子计算路径的宽度,若路径平均宽度超过管线宽度阈值,则该路径为粗虚管线;若路径平均宽度低于管线宽度阈值,则该路径为细虚管线;

点线‑短划线管线分为双点型管线和双短线型管线,人工设计双点型模版和双短线型模版,将点线‑短划线管线的路径与模版进行匹配,得到两类管线的匹配度,该路径为匹配度高的管线类型。