利索能及
我要发布
收藏
专利号: 2023105383343
申请人: 济南大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种高精度识别PID图纸符号的方法,应用于PID图纸识别领域,其特征在于,包括:

S1、准备高分辨率PID图纸符号数据集,对数据集进行数据增强,使用滑动窗口分割图像,得到N张小图;S2、设计高效的注意力机制模块PCSC_CBAM,将其引入到目标检测算法里去,使其更加注重符号之间相互区别的特征;S3、应用改进的目标检测网络对预处理后的N张图片进行符号识别,实现符号的精准分类以及模糊定位;S4、经过识别后,将N张图片拼接回高分辨率图像,对高分辨率图像进行非极大值抑制,去除冗余预测框并记录符号识别的结果;

S5、遍历符号识别的结果,从高分辨率图像中裁剪包括单一符号的图像,并对其使用Canny边缘检测和形态学处理得到符号的精确位置;步骤S1所述准备高分辨率PID图纸符号数据集,对数据集进行数据增强,使用滑动窗口分割图像,得到N张小图,包括对数据集样本使用SamplePairing数据增强方法,使数据集规模从n扩增到 n×n,增加样本数量;使用滑动窗口分割图像,窗口滑动步长由图纸符号中最大符号的尺寸决定;假设原始图像大小为M×M,使用滑动窗口将其切割成大小为mxm的小图像,滑动步长为t,共切割出N个小图像,对于每个小图像,记录其左上角坐标(x,y)和大小,以便后续重建;步骤S2中所述高效的注意力机制模块PCSC_CBAM,使用一维卷积代替原CBAM注意力机制通道注意力模块中的全连接层,使用两个3×3的空洞卷积代替空间注意力模块中的7×7卷积;将CBAM注意力机制的“串联”结构改成“并联”结构,使通道注意力机制和空间注意力机制都作用在输入特征图上;将通道注意力机制产生的特征图和空间注意力机制产生的特征图按通道数进行拼接;对拼接后的特征图进行通道混洗操作,实现通道特征图和空间特征图之间的信息融合;最后使用1×1卷积进行降维得到最终输出特征图,重构后的特征图更加注重不同符号之间的区别;步骤S4所述经过识别后,将N张图片拼接回高分辨率图像,包括构建原始高分辨率大小的新图像,将每个小图像按照其位置信息填入对应位置,对于每个小图像,将其左上角坐标(x,y)作为起始点,将该小图像中的像素值填入新图像的(x,y)起始点对应的区域内,当小图像存在重叠部分时,需要进行像素值的融合,以避免出现明显的接缝或瑕疵。

2.根据权利要求1所述的一种高精度识别PID图纸符号的方法,步骤S5中所述,根据使用改进YOLOv5网络识别的小图像的符号模糊定位坐标,裁剪出包含单一符号的图像区域,对该符号使用Canny边缘检测和形态学处理;PID符号图像为二值图像,无需进行灰度化,PID符号边缘是灰度变化明显的区域,通过计算梯度得到所有可能是边缘的集合,根据PID图像生成边缘二值图像;对边缘二值图像进行处理,以去除小的不连通区域和孤立的点,同时将边缘连接起来,再对边缘图像进行轮廓检测,以获得符号的轮廓;对符号的轮廓进行形态学处理的膨胀、腐蚀操作,以去除边缘上的毛刺和噪点,并得到符号在小图像中的精确位置。