1.一种基于改进的卷积神经网络的施工图图元自适应识别方法,其特征在于,具体步骤如下:(1)采集施工图图纸文件D1,从D1中筛选出pdf格式的施工图图纸文件D2,将pdf格式的施工图图纸文件D2转换成jpg格式的施工图图像D3,构成施工图图像数据集D4,对D4进行预处理,得到预处理后的施工图图像数据集D5;
(2)对预处理后的施工图图像数据集D5进行数据增强,利用LabelImg工具对数据增强后的施工图图像数据集D6进行标注,将标注后的施工图图像数据集D7分为施工图图像训练集D8与施工图图像测试集D9;
(3)在卷积神经网络的卷积层中卷积操作后,使用BN算法进行批量归一化处理,通过PReLU激活函数进行非线性输出,得到改进后的卷积神经网络Improved CNN,将施工图图像训练集D8输入预训练模型中进行训练,得到施工图图元自适应识别模型ARM;具体步骤为:(3.1)在卷积神经网络的卷积层中卷积操作后,使用BN算法进行批量归一化处理;
(3.2)通过PReLU激活函数进行非线性输出;
(3.3)得到改进后的卷积神经网络Improved CNN;
(3.4)输入施工图图像训练集D8;
(3.5)设施工图图像训练集D8的数据集大小为Size3,Size3=1/7Size2,其中Size2为D6的数据集大小;
(3.6)定义循环变量S4,用于遍历施工图图像训练集D8,S4∈[1,Size3],并赋初值为1;
(3.7)如果S4≤Size3,则进入步骤(3.8),否则进入步骤(3.17);
(3.8)输入施工图图像D8S4;
(3.9)使用改进后的卷积神经网络Improved CNN的卷积层提取D8S4的特征矩阵FM;
(3.10)将特征矩阵FM分批,每批包含施工图图元的特征张量集FT,假设标签集为L;
(3.11)特征张量集FM经过PReLU激活函数,输出张量集FT1;
(3.12)张量集FT1经过第一层池化层与PReLU激活函数后输出张量集FT2;
(3.13)张量集FT2经过第二层池化与归一化处理,输出张量集FT3;
(3.14)张量集FT3经过softmax激励函数后输出新标签集LN;
(3.15)计算标签集L与新标签集LN之间的损失,更新神经网络连接函数的权值;
(3.16)S4=S4+1,进入步骤(3.7);
(3.17)施工图图元自适应识别模型ARM训练完成;
(4)将施工图图像测试集D9输入施工图图元自适应识别模型ARM,输出施工图图元识别结果集PT Result;具体步骤为:(4.1)加载步骤3中训练好的施工图图元自适应识别模型ARM;
(4.2)输入施工图图像测试集D9;
(4.3)设施工图图像测试集D9的数据集大小为Size4,Size4=1/3Size2;
(4.4)定义循环变量S5,用于遍历施工图图像测试集D9,S5∈[1,Size4],并赋初值为1;
(4.5)如果S5≤Size4,则进入步骤(4.6),否则进入步骤(4.13);
(4.6)输入施工图测试图像D9S5;
(4.7)利用施工图图元自适应识别模型ARM对施工图测试图像D9S5进行图元识别和定位,并用矩形框框出其位置;
(4.8)取出步骤3中的输出张量Tensor,其中,Tensor∈FT3;
(4.9)将张量Tensor输入SVM分类器;
(4.10)根据分类,标出施工图图元类别PT;
(4.11)S5=S5+1,进入步骤(4.5);
(4.12)得到施工图图元识别结果集PT Result;
(5)开放施工图图元自适应识别接口ARM API,用户通过Web平台上传施工图图纸Drawing,施工图图元自适应识别接口ARM API对用户上传的施工图图纸Drawing进行图元自适应识别,并将识别出的施工图图元信息Primitive Info返回Web平台。
2.根据权利要求1所述的一种基于改进的卷积神经网络的施工图图元自适应识别方法,其特征在于,所述步骤(1)中得到预处理后的施工图图像数据集D5的具体步骤为:(1.1)在各大建筑网站中利用BeautifulSoup库爬取施工图图纸文件,得到施工图图纸文件D1;
(1.2)从D1中筛选出pdf格式的施工图图纸文件D2;
(1.3)剔除D2中部分不清晰和有残缺的施工图图纸文件;
(1.4)利用PyMuPDF库,将施工图图纸文件D2等比例格式转换为jpg格式的施工图图像D3;
(1.5)得到由施工图图像D3组成的施工图图像数据集D4;
(1.6)计算施工图图像数据集D4的数据集大小,赋值给Size1;
(1.7)定义循环变量S1,用于遍历施工图图像数据集D4,S1∈[1,Size1],并赋初值为1;
(1.8)如果S1≤Size1,则进入步骤(1.9),否则进入步骤(1.15);
(1.9)使用OpenCV运行库对D4S1进行图像灰度化,其中,D4S1为施工图图像;
(1.10)对D4S1进行直方图均衡化;
(1.11)对D4S1进行灰度拉伸;
(1.12)使用OpenCV运行库对D4S1进行图像二值化;
(1.13)对D4S1进行图像边缘检测分割;
(1.14)令S1=S1+1,进入步骤(1.8);
(1.15)得到预处理后的施工图图像数据集D5。
3.根据权利要求1所述的一种基于改进的卷积神经网络的施工图图元自适应识别方法,其特征在于,所述步骤(2)中对预处理后的施工图图像数据集D5进行数据增强,利用LabelImg工具对数据增强后的施工图图像数据集D6进行标注,将标注后的施工图图像数据集D7分为施工图图像训练集D8与施工图图像测试集D9的具体步骤为:(2.1)输入预处理后的施工图图像数据集D5,其大小为Size1;
(2.2)定义循环变量S2,用于遍历预处理后的施工图图像数据集D5,S2∈[1,Size1],并赋初值为1;
(2.3)如果S2≤Size1,则进入步骤(2.4),否则进入步骤(2.16);
(2.4)输入施工图图像D5S2;
(2.5)对施工图图像D5S2进行编码,并进行读取与展示;
(2.6)对施工图图像D5S2进行压缩或者放大,得到施工图图像D5S2I;
(2.7)获取施工图图像D5S2I,对施工图图像D5S2I失真处进行裁剪,得到施工图图像D5S2Ⅱ;
(2.8)对D5S2Ⅱ进行翻转;
(2.9)对D5S2Ⅱ进行转置;
(2.10)对D5S2Ⅱ进行Gamma调整;
(2.11)对D5S2Ⅱ进行移位;
(2.12)对D5S2Ⅱ进行反射;
(2.13)得到施工图图像D5S2Ⅲ;
(2.14)获取施工图图像D5S2Ⅲ,对施工图图像D5S2Ⅲ添加噪音数据并进行模糊处理,得到施工图图像D5S2Ⅳ;
(2.15)S2=S2+1,进入步骤(2.3);
(2.16)施工图图像数据增强结束,得到数据增强后的施工图数据集D6,D6的数据集大小为Size2;
(2.17)定义循环变量S3,用于遍历数据增强后的施工图图像数据集D6,S3∈[1,Size2],并赋初值为1;
(2.18)如果S3≤Size2,则进入步骤(2.19),否则进入步骤(2.22);
(2.19)输入施工图图像D6S3;
(2.20)利用LabelImg工具对施工图图像D6S3进行标注;
(2.21)S3=S3+1,进入步骤(2.18);
(2.22)得到标注后的施工图图像数据集D7和施工图图像标签集LS;
(2.23)按照7:3的比例将标注后的施工图图像数据集D7分为施工图图像训练集D8与施工图图像测试集D9。
4.根据权利要求1所述的一种基于改进的卷积神经网络的施工图图元自适应识别方法,其特征在于,所述步骤(5)中开放施工图图元自适应识别接口ARM API,用户通过Web平台上传施工图图纸Drawing,施工图图元自适应识别接口ARM API对用户上传的施工图图纸Drawing进行图元自适应识别,并将识别出的施工图图元信息PrimitiveInfo返回Web平台的具体步骤为:(5.1)开放施工图图元自适应识别接口ARM API;
(5.2)创建线程池Thread Pool;
(5.3)判断线程池Thread Pool所有任务是否执行完毕,如果所有任务执行完毕,则进入步骤(5.9),否则进入步骤(5.4);
(5.4)用户通过Web平台上传施工图图纸Drawing;
(5.5)子线程Child Thread获取任务处理;
(5.6)施工图图元自适应识别接口ARM API调用施工图图元自适应识别模型ARM对用户上传的施工图图纸Drawing进行图元自适应识别;
(5.7)将识别出的施工图图元信息Primitive Info返回Web平台;
(5.8)结束子线程Child Thread,进入步骤(5.3);
(5.9)关闭线程池Thread Pool;
(5.10)施工图图元自适应识别结束。