1.一种物体姿态估计方法,其特征在于,包括:获取目标物体的ROI裁剪图,从所述ROI裁剪图中提取RGB特征;
通过多层感知机对所述RGB特征进行整合以便得到全局特征,并对所述RGB特征和所述全局特征进行特征对接得到像素特征;
利用回归网络模型预测每个所述像素特征对应的四元数矩阵和平移矩阵,并选取最优四元数矩阵和最优平移矩阵;
利用所述最优平移矩阵对应的目标像素特征的点云特征微调所述最优平移矩阵,并利用相机的内参将所述最优四元数矩阵转换为旋转矩阵;
基于所述旋转矩阵和微调后的最优平移矩阵生成所述目标物体的姿态估计。
2.根据权利要求1所述物体姿态估计方法,其特征在于,所述获取目标物体的ROI裁剪图,包括:
利用Mask R-CNN网络通过语义分割得到目标物体的ROI裁剪图。
3.根据权利要求1所述物体姿态估计方法,其特征在于,所述利用回归网络模型预测每个所述像素特征对应的四元数矩阵和平移矩阵,并选取最优四元数矩阵和最优平移矩阵,包括:
利用回归网络模型预测每个所述像素特征对应的四元数矩阵、平移矩阵和矩阵评分;
选取所述矩阵评分最高的四元数矩阵和平移矩阵为最优四元数矩阵和最优平移矩阵。
4.根据权利要求1至3中任一项所述物体姿态估计方法,其特征在于,还包括:获取所述目标物体的视图特征;
相应的,对所述RGB特征和所述全局特征进行特征对接得到像素特征,包括:对所述RGB特征、所述全局特征和所述视图特征进行特征对接得到像素特征。
5.根据权利要求4所述物体姿态估计方法,其特征在于,所述获取所述目标物体的视图特征,包括:
通过物体三维合成模型生成预设数量的所述目标物体的视图,从所述视图中提取所述目标物体的视图特征。
6.一种物体姿态估计装置,其特征在于,包括:提取模块,用于获取目标物体的ROI裁剪图,并从所述ROI裁剪图中提取RGB特征;
对接模块,用于通过多层感知机对所述RGB特征进行整合以便得到全局特征,并对所述RGB特征和所述全局特征进行特征对接得到像素特征;
预测模块,用于利用回归网络模型预测每个所述像素特征对应的四元数矩阵和平移矩阵,并选取最优四元数矩阵和最优平移矩阵;
微调模块,用于利用所述最优平移矩阵对应的目标像素特征的点云特征微调所述最优平移矩阵;
转换模块,用于利用相机的内参将所述最优四元数矩阵转换为旋转矩阵;
生成模块,用于基于所述旋转矩阵和微调后的最优平移矩阵生成所述目标物体的姿态估计。
7.根据权利要求6所述物体姿态估计装置,其特征在于,还包括:获取模块,用于获取所述目标物体的视图特征;
相应的,所述对接模块包括:
整合单元,用于通过多层感知机对所述RGB特征进行整合以便得到全局特征;
对接单元,用于对所述RGB特征、所述全局特征和所述视图特征进行特征对接得到像素特征。
8.根据权利要求7所述物体姿态估计装置,其特征在于,所述获取模块具体为通过物体三维合成模型生成预设数量的所述目标物体的视图,从所述视图中提取所述目标物体的视图特征的模块。
9.一种电子设备,其特征在于,包括:存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述物体姿态估计方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述物体姿态估计方法的步骤。