买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种智能环境下机器人运动路径深度学习控制规划方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种智能环境下机器人运动路径深度学习控制规划方法

￥14000

专利号： 201710640558X

申请人：中南大学

专利类型：发明专利

专利状态：已下证

更新日期：2025-10-14

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种智能环境下机器人运动路径深度学习控制规划方法，其特征在于，包括以下步骤：步骤1：对运载机器人运载区域构建全局地图三维坐标系，获取在全局地图三维坐标系下的可行走区域坐标；

运载区域地面中心点为原点，正东方向为X轴，正北方向为Y轴，垂直地面方向为Z轴；

所述运载机器人运载区域为一个楼栋内所有的地板连通区域，所述可行走区域是指从所有的地板连通区域中删除楼栋内的障碍物所在区域；

步骤2：获取全局训练样本集；

在全局地图三维坐标系中，设计至少200组可行走区域中不同的点到点的最优设计全局路径，以每条最优设计全局路径作为一个全局训练样本；

步骤3：构建运载机器人的全局静态路径规划模型；

利用全局训练样本集中每个全局样本的起点-终点坐标和对应的最优设计全局路径分别作为输入数据和输出数据，对深度学习DBN网络进行训练，得到基于深度学习DBN网络的全局静态路径规划模型；

其中，在全局训练过程中，深度学习DBN网络所使用的BP网络权值采用差分进化狼群算法进行寻优获得；

步骤4：分别将运输任务中从初始待命点到取物点，从取物点到放物点，和从放物点到待命点坐标输入至基于深度学习DBN网络的全局静态路径规划模型，获得对应的区间的运载机器人最优全局规划路径；

对深度学习DBN网络进行如下训练过程得到基于深度学习DBN网络的全局静态路径规划模型：深度学习DBN模型包括为五层，分别为：一层输入层、三层隐藏层以及一层输出层，其中可视层和第一隐藏层构成第一层限制玻儿兹曼机RBM，第一隐藏层和第二隐藏层构成第二层限制玻儿兹曼机RBM，第二隐藏层和第三隐藏层构成BP网络层；

使用逐层训练的方法依次对两层限制玻儿兹曼机RBM和BP网络层进行训练：

第一层限制玻儿兹曼机RBM的训练是指，从200组全局训练样本中随机抽取150组训练样本作为第一层限制玻儿兹曼机RBM训练样本，训练完成后得到第一层限制玻儿兹曼机RBM的参数：权值矩阵、可见层偏置以及隐藏层偏置；

第二层限制玻儿兹曼机RBM的训练是指，使用与第一层限制玻儿兹曼机RBM训练时相同的150组训练样本，以及同样的方法训练第二层限制玻儿兹曼机RBM，得到第二层限制玻儿兹曼机RBM的参数：权值矩阵、可见层偏置以及隐藏层偏置；

BP网络层的训练是指，使用差分进化狼群算法优化的BP网络对整个DBN模型进行微调，训练样本为剩余的50组训练样本，训练完成后输出整个DBN模型作为全局静态路径规划算法模型；

所述基于深度学习DBN网络的全局静态路径规划模型所使用的BP网络权值采用差分进化狼群算法进行寻优获得的过程如下：步骤2.1：以个体狼的位置作为BP网络权值，初始化狼群中的个体狼并设置狼群参数；

狼群规模的取值范围为[50,300]，步长因子的取值范围为[80,160]，探狼比例因子的取值范围为[2,6]，最大游走次数的取值范围为[15,30]，距离判定因子的取值范围为[50,

100]，最大奔袭次数的取值范围为[5,15]，更新比例因子的取值范围为[2,6]，最大迭代次数的取值范围为[500,1000]，最大搜索精度的取值范围为[0.001,0.01]；

步骤2.2：设定适应度函数，并确定初始最优头狼位置和迭代次数t，t＝1；

将个体狼位置体对应的BP网络权值代入基于深度学习DBN网络的全局静态路径规划模型中，并利用个体狼位置确定的基于深度学习DBN网络的全局静态路径规划模型输出全局训练样本集中每个全局训练样本起点和终点对应的全局规划路径，将所有全局训练样本的规划全局路径和最优设计全局长度作商后，再取均值，作为第一适应度函数F1；

其中，M为训练样本数，n为输出的全局规划路径所经历的坐标点的个数，xi,j和xi,j-1为第i个样本使用该狼确定的深度学习DBN模型得到的路径中第j点和第j-1点的X轴坐标，类似的，yi,j和yi,j-1分别为第j点和第j-1点的Y轴坐标，第j点和第j-1点为相邻两点，L为人工设置的样本对应最优设计全局路径的长度；

步骤2.3：更新狼群，并获得更新后的最优头狼位置；

依次对所有个体狼进行游走行为、奔袭行为、围攻行为、变异操作、交叉操作、选择操作；

步骤2.4：判断是否达到优化精度要求或t达到最大迭代次数，若达到，输出头狼的位置对应的BP网络的权值，若未达到，令t＝t+1，返回步骤2.3。

2.根据权利要求1所述的方法，其特征在于，运载机器人依据得到的最优全局规划路径前行，执行运输任务时，在前行过程中，利用Kinect传感器实时获取的新增障碍物所在区域的起点和终点输入局部动态避障规划模型进行避障；

利用局部避障训练样本集中每个样本的起点和终点坐标作为输入数据，对应的最优设计避障路径为输出，对深度学习DBN网络进行训练，得到基于深度学习DBN网络的局部避障模型；

其中，在训练过程中，基于深度学习DBN网络的局部避障模型的BP网络权值采用混沌蝙蝠算法寻优确定；

所述Kinect传感器获取的新增障碍物所在区域的起点和终点是通过Kinect传感器发出测量信号与接收到的设置在天花板的定位片位置信息计算获得；

所述局部避障训练样本集是在全局地图三维坐标系中，设计至少200组可行走区域中新增障碍物所在区域中不同的点到点的最优设计避障路径构成，每条最优设计避障路径作为一个避障训练样本。

3.根据权利要求2所述的方法，其特征在于，对深度学习DBN网络进行如下训练过程得到基于深度学习DBN网络的局部避障模型：深度学习DBN模型包括为五层，分别为：一层输入层、三层隐藏层以及一层输出层，其中可视层和第一隐藏层构成第一层限制玻儿兹曼机RBM，第一隐藏层和第二隐藏层构成第二层限制玻儿兹曼机RBM，第二隐藏层和第三隐藏层构成BP网络层；

使用逐层训练的方法依次对两层限制玻儿兹曼机RBM和BP网络层进行训练：

第一层限制玻儿兹曼机RBM的训练是指，从200组局部避障训练样本中随机抽取150组训练样本作为第一层限制玻儿兹曼机RBM训练样本，训练完成后得到第一层限制玻儿兹曼机RBM的参数：权值矩阵、可见层偏置以及隐藏层偏置；

BP网络层的训练是指，使用混沌蝙蝠算法优化的BP网络对整个DBN模型进行微调，训练样本为剩余的50组避障训练样本，训练完成后输出整个DBN模型作为局部动态避障规划模型。

4.根据权利要求3所述的方法，其特征在于，所述基于深度学习DBN网络的局部避障模型中深度学习DBN网络所使用的BP网络权值采用混沌蝙蝠算法寻优获得的过程如下：步骤4.1：以混沌蝙蝠个体的位置作为基于深度学习DBN网络的局部避障模型中深度学习DBN网络中的BP网络权值，设置混沌蝙蝠种群参数并初始化混沌蝙蝠种群中的混沌蝙蝠个体；

混沌蝙蝠种群规模M的取值范围为[120,300]，蝙蝠个体最大脉冲频度R0，取值范围为[0.45,0.55]，最大脉冲声音强度A0的取值范围为[0.40,0.6]，蝙蝠搜索频度增加系数的取值范围为[0.03,0.05]，声音强度衰减系的取值范围为[0.90,0.95]，适应度方差阈值的取值范围为[0.01,0.05]，搜索脉冲频率的取值范围为[0,0.15]，最大迭代次数的取值范围为[300,1000]，最大搜索精度的取值范围为[0.001,0.01]；

步骤4.2：设定适应度函数，并确定初始最优混沌蝙蝠个体位置和迭代次数t,t＝1；

将混沌蝙蝠个体位置对应的BP网络权值代入基于深度学习DBN网络的局部避障模型中，并利用混沌蝙蝠个体位置确定的基于深度学习DBN网络的局部避障模型输出局部避障训练样本集中每个局部避障训练样本起点和终点对应的规划局部路径，将所有避障训练样本的规划局部路径和最优设计避障长度作商后，再取均值，作为第二适应度函数F2；

步骤4.3：利用设定的脉冲频率更新混沌蝙蝠的搜索脉冲频率、位置和速度；

步骤4.4：若R1

其中，R1为在[0,1]上均匀分布的随机数，Ri为第i只混沌蝙蝠的脉冲频度；

步骤4.5：若R2

其中，R2为在[0,1]上均匀分布的随机数，Ai为第i只混沌蝙蝠的声音强度；

步骤4.6假如更新位置后蝙蝠个体i优于混沌蝙蝠种群中最优混沌蝙蝠个体位置F2(xi)>F2(x*)，更新最优混沌蝙蝠个体位置，对所有混沌蝙蝠个体的脉冲频度和脉冲音强进行更新；

步骤4.7根据适应度值评估判定新的混沌蝙蝠群体，将混沌蝙蝠群体中适应度排在前

5％的混沌蝙蝠个体作为精英个体，对适应度排在后5％的混沌蝙蝠个体进行淘汰；

同时，对精英个体采用Logistic映射混沌优化策略进行优化，并随机产生新的混沌蝙蝠个体代替淘汰的混沌蝙蝠个体，得到新的混沌蝙蝠种群；

步骤4.8：依据每个混沌蝙蝠个体位置的适应度从新的混沌蝙蝠种群中，找出最优混沌蝙蝠个体位置；

步骤4.9：若满足预设搜索精度或达到最大迭代次数，则转入步骤4.10，否则，令t＝t+

1，转步骤4.3，直到找到满足设定的最优混沌蝙蝠个体位置为止；