买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于改进的卷积神经网络的施工图图元自适应识别方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于改进的卷积神经网络的施工图图元自适应识别方法

面议

专利号： 2020104364784

申请人：淮阴工学院

专利类型：发明专利

专利状态：已下证

更新日期：2026-07-01

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于改进的卷积神经网络的施工图图元自适应识别方法，其特征在于，具体步骤如下：(1)采集施工图图纸文件D1，从D1中筛选出pdf格式的施工图图纸文件D2，将pdf格式的施工图图纸文件D2转换成jpg格式的施工图图像D3，构成施工图图像数据集D4，对D4进行预处理，得到预处理后的施工图图像数据集D5；

(2)对预处理后的施工图图像数据集D5进行数据增强，利用LabelImg工具对数据增强后的施工图图像数据集D6进行标注，将标注后的施工图图像数据集D7分为施工图图像训练集D8与施工图图像测试集D9；

(3)在卷积神经网络的卷积层中卷积操作后，使用BN算法进行批量归一化处理，通过PReLU激活函数进行非线性输出，得到改进后的卷积神经网络Improved CNN，将施工图图像训练集D8输入预训练模型中进行训练，得到施工图图元自适应识别模型ARM；具体步骤为：(3.1)在卷积神经网络的卷积层中卷积操作后，使用BN算法进行批量归一化处理；

(3.2)通过PReLU激活函数进行非线性输出；

(3.3)得到改进后的卷积神经网络Improved CNN；

(3.4)输入施工图图像训练集D8；

(3.5)设施工图图像训练集D8的数据集大小为Size3，Size3＝1/7Size2，其中Size2为D6的数据集大小；

(3.6)定义循环变量S4，用于遍历施工图图像训练集D8，S4∈[1,Size3]，并赋初值为1；

(3.7)如果S4≤Size3，则进入步骤(3.8)，否则进入步骤(3.17)；

(3.8)输入施工图图像D8S4；

(3.9)使用改进后的卷积神经网络Improved CNN的卷积层提取D8S4的特征矩阵FM；

(3.10)将特征矩阵FM分批，每批包含施工图图元的特征张量集FT，假设标签集为L；

(3.11)特征张量集FM经过PReLU激活函数，输出张量集FT1；

(3.12)张量集FT1经过第一层池化层与PReLU激活函数后输出张量集FT2；

(3.13)张量集FT2经过第二层池化与归一化处理，输出张量集FT3；

(3.14)张量集FT3经过softmax激励函数后输出新标签集LN；

(3.15)计算标签集L与新标签集LN之间的损失，更新神经网络连接函数的权值；

(3.16)S4＝S4+1，进入步骤(3.7)；

(3.17)施工图图元自适应识别模型ARM训练完成；

(4)将施工图图像测试集D9输入施工图图元自适应识别模型ARM，输出施工图图元识别结果集PT Result；具体步骤为：(4.1)加载步骤3中训练好的施工图图元自适应识别模型ARM；

(4.2)输入施工图图像测试集D9；

(4.3)设施工图图像测试集D9的数据集大小为Size4，Size4＝1/3Size2；

(4.4)定义循环变量S5，用于遍历施工图图像测试集D9，S5∈[1,Size4]，并赋初值为1；

(4.5)如果S5≤Size4，则进入步骤(4.6)，否则进入步骤(4.13)；

(4.6)输入施工图测试图像D9S5；

(4.7)利用施工图图元自适应识别模型ARM对施工图测试图像D9S5进行图元识别和定位，并用矩形框框出其位置；

(4.8)取出步骤3中的输出张量Tensor，其中，Tensor∈FT3；

(4.9)将张量Tensor输入SVM分类器；

(4.10)根据分类，标出施工图图元类别PT；

(4.11)S5＝S5+1，进入步骤(4.5)；

(4.12)得到施工图图元识别结果集PT Result；

(5)开放施工图图元自适应识别接口ARM API，用户通过Web平台上传施工图图纸Drawing，施工图图元自适应识别接口ARM API对用户上传的施工图图纸Drawing进行图元自适应识别，并将识别出的施工图图元信息Primitive Info返回Web平台。

2.根据权利要求1所述的一种基于改进的卷积神经网络的施工图图元自适应识别方法，其特征在于，所述步骤(1)中得到预处理后的施工图图像数据集D5的具体步骤为：(1.1)在各大建筑网站中利用BeautifulSoup库爬取施工图图纸文件，得到施工图图纸文件D1；

(1.2)从D1中筛选出pdf格式的施工图图纸文件D2；

(1.3)剔除D2中部分不清晰和有残缺的施工图图纸文件；

(1.4)利用PyMuPDF库，将施工图图纸文件D2等比例格式转换为jpg格式的施工图图像D3；

(1.5)得到由施工图图像D3组成的施工图图像数据集D4；

(1.6)计算施工图图像数据集D4的数据集大小，赋值给Size1；

(1.7)定义循环变量S1，用于遍历施工图图像数据集D4，S1∈[1,Size1]，并赋初值为1；

(1.8)如果S1≤Size1，则进入步骤(1.9)，否则进入步骤(1.15)；

(1.9)使用OpenCV运行库对D4S1进行图像灰度化，其中，D4S1为施工图图像；

(1.10)对D4S1进行直方图均衡化；

(1.11)对D4S1进行灰度拉伸；

(1.12)使用OpenCV运行库对D4S1进行图像二值化；

(1.13)对D4S1进行图像边缘检测分割；

(1.14)令S1＝S1+1，进入步骤(1.8)；

(1.15)得到预处理后的施工图图像数据集D5。

3.根据权利要求1所述的一种基于改进的卷积神经网络的施工图图元自适应识别方法，其特征在于，所述步骤(2)中对预处理后的施工图图像数据集D5进行数据增强，利用LabelImg工具对数据增强后的施工图图像数据集D6进行标注，将标注后的施工图图像数据集D7分为施工图图像训练集D8与施工图图像测试集D9的具体步骤为：(2.1)输入预处理后的施工图图像数据集D5，其大小为Size1；

(2.2)定义循环变量S2，用于遍历预处理后的施工图图像数据集D5，S2∈[1,Size1]，并赋初值为1；

(2.3)如果S2≤Size1，则进入步骤(2.4)，否则进入步骤(2.16)；

(2.4)输入施工图图像D5S2；

(2.5)对施工图图像D5S2进行编码，并进行读取与展示；

(2.6)对施工图图像D5S2进行压缩或者放大，得到施工图图像D5S2I；

(2.7)获取施工图图像D5S2I，对施工图图像D5S2I失真处进行裁剪，得到施工图图像D5S2Ⅱ；

(2.8)对D5S2Ⅱ进行翻转；

(2.9)对D5S2Ⅱ进行转置；

(2.10)对D5S2Ⅱ进行Gamma调整；

(2.11)对D5S2Ⅱ进行移位；

(2.12)对D5S2Ⅱ进行反射；

(2.13)得到施工图图像D5S2Ⅲ；

(2.14)获取施工图图像D5S2Ⅲ，对施工图图像D5S2Ⅲ添加噪音数据并进行模糊处理，得到施工图图像D5S2Ⅳ；

(2.15)S2＝S2+1，进入步骤(2.3)；

(2.16)施工图图像数据增强结束，得到数据增强后的施工图数据集D6，D6的数据集大小为Size2；

(2.17)定义循环变量S3，用于遍历数据增强后的施工图图像数据集D6，S3∈[1,Size2]，并赋初值为1；

(2.18)如果S3≤Size2，则进入步骤(2.19)，否则进入步骤(2.22)；

(2.19)输入施工图图像D6S3；

(2.20)利用LabelImg工具对施工图图像D6S3进行标注；

(2.21)S3＝S3+1，进入步骤(2.18)；

(2.22)得到标注后的施工图图像数据集D7和施工图图像标签集LS；

(2.23)按照7:3的比例将标注后的施工图图像数据集D7分为施工图图像训练集D8与施工图图像测试集D9。

4.根据权利要求1所述的一种基于改进的卷积神经网络的施工图图元自适应识别方法，其特征在于，所述步骤(5)中开放施工图图元自适应识别接口ARM API，用户通过Web平台上传施工图图纸Drawing，施工图图元自适应识别接口ARM API对用户上传的施工图图纸Drawing进行图元自适应识别，并将识别出的施工图图元信息PrimitiveInfo返回Web平台的具体步骤为：(5.1)开放施工图图元自适应识别接口ARM API；

(5.2)创建线程池Thread Pool；

(5.3)判断线程池Thread Pool所有任务是否执行完毕，如果所有任务执行完毕，则进入步骤(5.9)，否则进入步骤(5.4)；

(5.4)用户通过Web平台上传施工图图纸Drawing；

(5.5)子线程Child Thread获取任务处理；

(5.6)施工图图元自适应识别接口ARM API调用施工图图元自适应识别模型ARM对用户上传的施工图图纸Drawing进行图元自适应识别；

(5.7)将识别出的施工图图元信息Primitive Info返回Web平台；

(5.8)结束子线程Child Thread，进入步骤(5.3)；

(5.9)关闭线程池Thread Pool；

(5.10)施工图图元自适应识别结束。