买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于深度确定性梯度策略的月球车路径规划方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于深度确定性梯度策略的月球车路径规划方法

￥31200

专利号： 2025104664175

申请人：南京信息工程大学

专利类型：发明专利

专利状态：已下证

更新日期：2026-07-01

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于深度确定性梯度策略的月球车路径规划方法，其特征在于，包括以下步骤：（1）引入地形坡度角，基于阿克曼转向原理，确定航向角和转向角的微分方程，得到月球车运动学模型；

（2）基于贝克压力沉陷理论，计算车轮沉陷量Z；根据地形坡度角与车轮沉陷量Z，计算车辆最大转向角；根据车辆最大允许转向角与车轮沉陷量Z，计算最小车轮转弯半径；基于转向角、最小转弯半径、最大速度和坡度角，构建基于深度确定性梯度策略的月球车运动学模型的约束条件；

（3）根据月球车运动学状态向量和月球地形特征向量，定义状态空间S；根据速度增量和航向角增量，定义动作空间；基于距离奖励、动态瞬时进展奖励、动态瞬时方向奖励和平滑度奖励，定义路径规划的多维度奖励函数r；

（4）根据地形粗糙度、坡度梯度和地形复杂度构建自适应步长；将状态空间扩展为，向动作空间引入自适应步长，得到基础动作空间，将输入评论家Critic网络，输出步长评估价值，用于更新行动者Actor网络参数；向引入奥恩斯坦‑乌伦贝克OU噪声，得到最终动作，执行最终动作，若满足且，则进入步骤（5）；反之则重新进行最终动作计算；

（5）计算路径规划的多维度奖励函数；

（6）根据地形风险函数、多维度奖励函数和步长损失，计算优先级权重，筛选经验样本进入经验池；进行模型训练，根据路径可达率挑选最佳路径；

步骤（3）中，路径规划的多维度奖励函数为；

其中，、、和为权重，距离奖励，为动态瞬时进展奖励，为动态瞬时方向奖励，为平滑度奖励；

距离奖励为

；

动态瞬时进展奖励为

；

动态瞬时方向奖励为

；

平滑度奖励为

；

权重、、和如下式所示：；

；

其中，表示当前位置到目标的欧氏距离，为初始距离，为当前速度，为目标速度，为当前位置距离目标点的剩余距离，为任务总距离，为上一状态的位置到目标点的距离，为基础方向奖励权重，、为调节系数，表示当前航向与目标方向的夹角，为最大容忍阈值夹角，为目标方向航向角，为当前时刻航向角，为基础平滑度奖励权重，为相邻时间步的加速度变化率，为最大允许变化率，为当前时刻的航向角，为允许最大航向角；

步骤（4）中，自适应步长为；

；

其中，为基准步长，为地形粗糙度，由高程标准差归一化得到；为坡度梯度，通过计算相邻栅格坡度变化率得到；为地形复杂度，是根据地形粗糙度和地形坡度融合的复合指标；、、为动态权重系数；为最大速度；

当不小于0.7即遇到高密度地形时，则缩短步长至基准值的30% 50%；

当小于0.3即遇到低密度地形时，则扩大步长至基准值的120% 150%。

2.根据权利要求1所述基于深度确定性梯度策略的月球车路径规划方法，其特征在于，月球车运动学模型为；

其中，为月球车位置信息，为车体线速度，为车辆轴距。

3.根据权利要求2所述基于深度确定性梯度策略的月球车路径规划方法，其特征在于，车轮沉陷量Z为；

其中，为土壤垂直压力，为土壤黏聚模量，为车辆车轮宽度，为土壤摩擦模量，为沉陷指数；

车辆最大转向角为

；

其中，表示考虑沉陷量与坡度时的平地最大转向角，为车辆半径；