1.一种装配机器人零件深度学习识别方法,包括如下步骤,先使用工业相机获取待识别工件的图像,再采用YOLOv3网络对图像进行识别,输出零件类别和位置信息;所述YOLOv3网络包括5个残差网络块,其特征在于,对每个残差网络块后引入CFENet模块,将CFENet模块融入到Darknet-53特征提取网络进行图像特征提取。
2.如权利要求1所述的装配机器人零件深度学习识别方法,其特征在于,所述CFENet模块的卷积核尺寸k与所述YOLOv3网络的卷积核尺寸k一致,通过将上层输入特征网络经过两个并行且梯度方向相反的kx1和1xk卷积处理,之后再进行特征融合,最后通过短连接的方式与输入特征网络层形成残差网络得到。
3.如权利要求1所述的装配机器人零件深度学习识别方法,其特征在于,在使用YOLOv3网络对图像进行识别时,先在整个特征提取网络的末端输出13x13大小的特征向量实现对待检测图像中尺寸最大类的目标的检测,在浅层网络中分别进行中等尺寸类和小尺寸类的目标检测,同时将深层网络中的特征信息通过上采样的方式与浅层特征进行特征融合,提升对目标的检测效果,最后将三种尺度的检测结果进行非极大值抑制后输出最终检测结果。
4.如权利要求1所述的装配机器人零件深度学习识别方法,其特征在于,在使用YOLOv3网络对图像进行识别时,采用K-means算法进行聚类分析选取最优的先验框个数和尺寸,具体为:先将随机选取K个标记框作为聚类中心,采用如下公式计算每一个标记框与聚类中心的距离:
w,h为标记框的宽和高;下标box和centroid分别表示标记框和聚类中心;根据邻近原则将每一个标记框划分到对应的聚类中心;
设目标函数f(x)为每个矩形标记框样本与其对应聚类中心距离和为:
式中,i表示第i个聚类中心,总共有K个聚类中心;j表示一个聚类中心中的第j个标记框,一个聚类中心总共有n个标记框;
再计算每个聚类中心中所有样本的平均值以更新(w,h),直至聚类中心的(w,h)不再变化或者达到最大迭代次数为止,则此时的聚类中心个数与尺寸即为最优先验框个数与尺寸。
5.如权利要求4所述的装配机器人零件深度学习识别方法,其特征在于,采用爬山法选取k值和标记框的尺寸,随着聚类中心的个数增加,目标函数f(x)的变化越来越小,在目标函数f(x)的曲线上,选择拐点处的k值作为聚类中心个数。
6.如权利要求5所述的装配机器人零件深度学习识别方法,其特征在于,在边界框预测阶段,YOLOv3将图片分成SxS个网络,目标物体的中心所在网格负责预测目标物体的类别和坐标;在训练阶段YOLOv3直接预测目标物体中心点的坐标相对于网格的偏移量,其公式如下:其中x,y为物体中心点的坐标,width,height为原图的宽和高,使用Sigmoid激活函数使得计算结果在[0,1]之间。