1.基于RGB‑D图像的多模态融合的机械臂抓取位姿检测方法,其特征在于,包括如下步骤:S1:以待抓取物体为中心随机反转,旋转裁剪图像为320*320的待输入图像,采集待输入图像的RGB图像和深度图像;
S2:将RBG图像和深度图像分别进行sigmoid激活和平均池化操作,生成两种特征信息对应的权重,再通过逐元素乘法操作将权重值分配给各自的特征信息,再将两种特征逐元素相加,最后在输出前进行CA attention操作;
S3:在RGB图像和深度图像融合后,基于不同扩张率的空洞卷积分支对S2中输出的图像特征进行区域信息、角度信息和宽度信息抓取,再对每个分支的输出进行降维操作和整合操作;
S4:将S3中输出结果通过四个卷积层生成四个分辨率为320*320的热力图,分别对应得分图、宽度图和旋转角度sin分量图与旋转角度cos分量图,并基于各热力图确定最终抓取点、抓取矩形及抓取角度;
所述S2中两种特征信息对应的权重具体如下:
其中, 表示卷积操作; 表示sigmoid函数激活操作; 表示平均池化操作; 、 表示两种特征信息, 、 分别对应 、 两种特征信息的权重;
所述CA attention操作后输出结果 具体如下:
其中, 表示逐元素加法;表示逐元素乘法; 表示CA attention操作;
S3中所述区域信息抓取步骤具体如下:
S3.1.1:将获取到dilation为1的1×1卷积核 和dilation为6的1×1卷积核 分别进行BatchNorm和Relu操作后进行拼接;
S3.1.2:接着通过双线性插值上采样的方式改变到与低维度融合特征相同的尺寸大小卷积核 进行拼接操作;
S3.1.3:经过卷积操作降低维度与dilation为12的3×3卷积核 和dilation为18的3×3卷积核 拼接而成的特征信息进行拼接;
S3.1.4:最后经过一个由Conv2d、BatchNorm、ReLU组成的三层卷积层进行输出,具体输出结果如下:其中, 表示区域信息抓取结果; 表示双线性插值上采样; 表示卷积操作;
表示拼接操作;
所述角度信息抓取步骤具体如下:
S3.2.1:首先将获取到dilation为6的3×3卷积核 和dilation为12的3×3卷积核分别进行BatchNorm和Relu操作后进行拼接操作;
S3.2.2:接着将其进行双线性插值上采样的方式改变到与低维度融合特征相同的尺寸大小卷积核 进行拼接操作;
S3.2.3:通过一个卷积层;
S3.2.4:经过一个由Conv2d、BatchNorm、ReLU组成的三层卷积层进行输出,具体输出结果如下:其中, 表示角度信息抓取结果;
所述宽度信息抓取步骤具体如下:
S3.3.1:首先将获取到dilation为12的3×3卷积核 和dilation为18的3×3卷积核分别进行BatchNorm和Relu操作后进行拼接,与dilation为1的1×1卷积核 和dilation为6的1×1卷积核 分别进行BatchNorm和Relu操作后进行拼接操作的结果进行拼接以补充特征信息;
S3.3.2:通过一个卷积层后进行双线插值上采样操作;
S3.3.3:经过一个由Conv2d、BatchNorm、ReLU组成的三层卷积层进行输出,具体输出结果如下:其中, 表示宽度信息抓取结果。
2.根据权利要求1所述的基于RGB‑D图像的多模态融合的机械臂抓取位姿检测方法,其特征在于,所述S4中,抓取角度信息由正弦与余弦代替,通过计算还原出抓取角度,输出结果为:其中, 表示抓取检测模型预测的抓取位姿, 、 、 和 分别表示预测抓取的 的置信度得分、旋转角度sin分量与cos分量和抓取预测框的宽; 表示置信度得分最大值; 表示抓取检测网络输入到抓取预测模块的数据; 表示抓取检测网络对输入数据处理的4个卷积操作。
3.根据权利要求2所述的基于RGB‑D图像的多模态融合的机械臂抓取位姿检测方法,其特征在于,所述S4中,抓取点由抓取得分图具有最大像素值的像素确定,抓取矩形的宽度由宽度图的像素值确定,抓取角度 由下式确定:其中, 和 由sin分量与cos分量热力图的像素值表示。
4.根据权利要求3所述的基于RGB‑D图像的多模态融合的机械臂抓取位姿检测方法,其特征在于,所述S4中,将抓取检测问题转化为端到端回归问题,通过模型训练得到一个映射关系 ,其中, 为检测图像, 为正确的抓取位置和姿态,用于最小化预测与实际值 之间的距离,其中, 表示图像中每个像素点的抓取得分范围,表示每个像素点的抓取宽度,网络的损失函数 定义如下:其中,表示可抓取样本的数量; 表示平滑函数。
5.根据权利要求4所述的基于RGB‑D图像的多模态融合的机械臂抓取位姿检测方法,其特征在于,所述S4中,若模型预测的抓取位姿与目标同时满足以下两个条件,则判断预测结果正确:其中, 表示预测抓取框 的角度; 表示标注矩形框 的角度; 指数表示预测的抓取框与标矩形框的交并比。