利索能及
我要发布
收藏
专利号: 2020104364784
申请人: 淮阴工学院
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于改进的卷积神经网络的施工图图元自适应识别方法,其特征在于,具体步骤如下:(1)采集施工图图纸文件D1,从D1中筛选出pdf格式的施工图图纸文件D2,将pdf格式的施工图图纸文件D2转换成jpg格式的施工图图像D3,构成施工图图像数据集D4,对D4进行预处理,得到预处理后的施工图图像数据集D5;

(2)对预处理后的施工图图像数据集D5进行数据增强,利用LabelImg工具对数据增强后的施工图图像数据集D6进行标注,将标注后的施工图图像数据集D7分为施工图图像训练集D8与施工图图像测试集D9;

(3)在卷积神经网络的卷积层中卷积操作后,使用BN算法进行批量归一化处理,通过PReLU激活函数进行非线性输出,得到改进后的卷积神经网络Improved CNN,将施工图图像训练集D8输入预训练模型中进行训练,得到施工图图元自适应识别模型ARM;具体步骤为:(3.1)在卷积神经网络的卷积层中卷积操作后,使用BN算法进行批量归一化处理;

(3.2)通过PReLU激活函数进行非线性输出;

(3.3)得到改进后的卷积神经网络Improved CNN;

(3.4)输入施工图图像训练集D8;

(3.5)设施工图图像训练集D8的数据集大小为Size3,Size3=1/7Size2,其中Size2为D6的数据集大小;

(3.6)定义循环变量S4,用于遍历施工图图像训练集D8,S4∈[1,Size3],并赋初值为1;

(3.7)如果S4≤Size3,则进入步骤(3.8),否则进入步骤(3.17);

(3.8)输入施工图图像D8S4;

(3.9)使用改进后的卷积神经网络Improved CNN的卷积层提取D8S4的特征矩阵FM;

(3.10)将特征矩阵FM分批,每批包含施工图图元的特征张量集FT,假设标签集为L;

(3.11)特征张量集FM经过PReLU激活函数,输出张量集FT1;

(3.12)张量集FT1经过第一层池化层与PReLU激活函数后输出张量集FT2;

(3.13)张量集FT2经过第二层池化与归一化处理,输出张量集FT3;

(3.14)张量集FT3经过softmax激励函数后输出新标签集LN;

(3.15)计算标签集L与新标签集LN之间的损失,更新神经网络连接函数的权值;

(3.16)S4=S4+1,进入步骤(3.7);

(3.17)施工图图元自适应识别模型ARM训练完成;

(4)将施工图图像测试集D9输入施工图图元自适应识别模型ARM,输出施工图图元识别结果集PT Result;具体步骤为:(4.1)加载步骤3中训练好的施工图图元自适应识别模型ARM;

(4.2)输入施工图图像测试集D9;

(4.3)设施工图图像测试集D9的数据集大小为Size4,Size4=1/3Size2;

(4.4)定义循环变量S5,用于遍历施工图图像测试集D9,S5∈[1,Size4],并赋初值为1;

(4.5)如果S5≤Size4,则进入步骤(4.6),否则进入步骤(4.13);

(4.6)输入施工图测试图像D9S5;

(4.7)利用施工图图元自适应识别模型ARM对施工图测试图像D9S5进行图元识别和定位,并用矩形框框出其位置;

(4.8)取出步骤3中的输出张量Tensor,其中,Tensor∈FT3;

(4.9)将张量Tensor输入SVM分类器;

(4.10)根据分类,标出施工图图元类别PT;

(4.11)S5=S5+1,进入步骤(4.5);

(4.12)得到施工图图元识别结果集PT Result;

(5)开放施工图图元自适应识别接口ARM API,用户通过Web平台上传施工图图纸Drawing,施工图图元自适应识别接口ARM API对用户上传的施工图图纸Drawing进行图元自适应识别,并将识别出的施工图图元信息Primitive Info返回Web平台。

2.根据权利要求1所述的一种基于改进的卷积神经网络的施工图图元自适应识别方法,其特征在于,所述步骤(1)中得到预处理后的施工图图像数据集D5的具体步骤为:(1.1)在各大建筑网站中利用BeautifulSoup库爬取施工图图纸文件,得到施工图图纸文件D1;

(1.2)从D1中筛选出pdf格式的施工图图纸文件D2;

(1.3)剔除D2中部分不清晰和有残缺的施工图图纸文件;

(1.4)利用PyMuPDF库,将施工图图纸文件D2等比例格式转换为jpg格式的施工图图像D3;

(1.5)得到由施工图图像D3组成的施工图图像数据集D4;

(1.6)计算施工图图像数据集D4的数据集大小,赋值给Size1;

(1.7)定义循环变量S1,用于遍历施工图图像数据集D4,S1∈[1,Size1],并赋初值为1;

(1.8)如果S1≤Size1,则进入步骤(1.9),否则进入步骤(1.15);

(1.9)使用OpenCV运行库对D4S1进行图像灰度化,其中,D4S1为施工图图像;

(1.10)对D4S1进行直方图均衡化;

(1.11)对D4S1进行灰度拉伸;

(1.12)使用OpenCV运行库对D4S1进行图像二值化;

(1.13)对D4S1进行图像边缘检测分割;

(1.14)令S1=S1+1,进入步骤(1.8);

(1.15)得到预处理后的施工图图像数据集D5。

3.根据权利要求1所述的一种基于改进的卷积神经网络的施工图图元自适应识别方法,其特征在于,所述步骤(2)中对预处理后的施工图图像数据集D5进行数据增强,利用LabelImg工具对数据增强后的施工图图像数据集D6进行标注,将标注后的施工图图像数据集D7分为施工图图像训练集D8与施工图图像测试集D9的具体步骤为:(2.1)输入预处理后的施工图图像数据集D5,其大小为Size1;

(2.2)定义循环变量S2,用于遍历预处理后的施工图图像数据集D5,S2∈[1,Size1],并赋初值为1;

(2.3)如果S2≤Size1,则进入步骤(2.4),否则进入步骤(2.16);

(2.4)输入施工图图像D5S2;

(2.5)对施工图图像D5S2进行编码,并进行读取与展示;

(2.6)对施工图图像D5S2进行压缩或者放大,得到施工图图像D5S2I;

(2.7)获取施工图图像D5S2I,对施工图图像D5S2I失真处进行裁剪,得到施工图图像D5S2Ⅱ;

(2.8)对D5S2Ⅱ进行翻转;

(2.9)对D5S2Ⅱ进行转置;

(2.10)对D5S2Ⅱ进行Gamma调整;

(2.11)对D5S2Ⅱ进行移位;

(2.12)对D5S2Ⅱ进行反射;

(2.13)得到施工图图像D5S2Ⅲ;

(2.14)获取施工图图像D5S2Ⅲ,对施工图图像D5S2Ⅲ添加噪音数据并进行模糊处理,得到施工图图像D5S2Ⅳ;

(2.15)S2=S2+1,进入步骤(2.3);

(2.16)施工图图像数据增强结束,得到数据增强后的施工图数据集D6,D6的数据集大小为Size2;

(2.17)定义循环变量S3,用于遍历数据增强后的施工图图像数据集D6,S3∈[1,Size2],并赋初值为1;

(2.18)如果S3≤Size2,则进入步骤(2.19),否则进入步骤(2.22);

(2.19)输入施工图图像D6S3;

(2.20)利用LabelImg工具对施工图图像D6S3进行标注;

(2.21)S3=S3+1,进入步骤(2.18);

(2.22)得到标注后的施工图图像数据集D7和施工图图像标签集LS;

(2.23)按照7:3的比例将标注后的施工图图像数据集D7分为施工图图像训练集D8与施工图图像测试集D9。

4.根据权利要求1所述的一种基于改进的卷积神经网络的施工图图元自适应识别方法,其特征在于,所述步骤(5)中开放施工图图元自适应识别接口ARM API,用户通过Web平台上传施工图图纸Drawing,施工图图元自适应识别接口ARM API对用户上传的施工图图纸Drawing进行图元自适应识别,并将识别出的施工图图元信息PrimitiveInfo返回Web平台的具体步骤为:(5.1)开放施工图图元自适应识别接口ARM API;

(5.2)创建线程池Thread Pool;

(5.3)判断线程池Thread Pool所有任务是否执行完毕,如果所有任务执行完毕,则进入步骤(5.9),否则进入步骤(5.4);

(5.4)用户通过Web平台上传施工图图纸Drawing;

(5.5)子线程Child Thread获取任务处理;

(5.6)施工图图元自适应识别接口ARM API调用施工图图元自适应识别模型ARM对用户上传的施工图图纸Drawing进行图元自适应识别;

(5.7)将识别出的施工图图元信息Primitive Info返回Web平台;

(5.8)结束子线程Child Thread,进入步骤(5.3);

(5.9)关闭线程池Thread Pool;

(5.10)施工图图元自适应识别结束。