利索能及
我要发布
收藏
专利号: 2022105122796
申请人: 齐鲁工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种四足机器人运动控制方法,其特征在于,包括:获取四足机器人在环境中行走时的状态,通过策略网络根据状态选择动作;所述状态包括四足机器人的俯仰角、横滚角、俯仰角速度、横滚角速度和各个关节的位置;所述策略网络采用双延迟深度确定性策略梯度算法进行训练;

获取四足机器人在环境中行走时的足端位置,以计算得到参考动作;

结合参考动作与策略网络输出的动作,得到四足机器人执行的动作,发出动作指令至四足机器人,实现四足机器人的运动;

所述四足机器人执行的动作表示为:

其中, 和 分别表示所述参考动作和所述策略网络输出的动作, 和 分别表示参考动作的权重系数和策略网络输出的动作的权重系数。

2.如权利要求1所述的一种四足机器人运动控制方法,其特征在于,所述参考动作的计算方法为:确定四足机器人步态参数;

基于四足机器人在环境中行走时的足端位置,结合步态参数,计算期望足端轨迹;

期望足端轨迹经过逆运动学计算,得到参考动作。

3.如权利要求2所述的一种四足机器人运动控制方法,其特征在于,所述期望足端轨迹为:其中,x(t)、y(t)和z(t)表示四足机器人t时刻时在机体坐标系中的期望足端位置,和 表示四足机器人初始状态时足端在机体坐标系中的位置, 表示腿摆动的步长, 表示腿摆动的步高, 表示单步的周期。

4.如权利要求1所述的一种四足机器人运动控制方法,其特征在于,四足机器人执行动作后,状态发生转移,并获得奖励,将动作、奖励和转移前后的状态组合为转移元组存放在经验回放池中。

5.如权利要求4所述的一种四足机器人运动控制方法,其特征在于,所述奖励采用奖励函数计算得到;

所述奖励函数包括前向速度奖励项、偏转速度惩罚项、能量消耗惩罚项、质心轨迹浮动惩罚项和姿态角变化惩罚项。

6.如权利要求4所述的一种四足机器人运动控制方法,其特征在于,所述策略网络的训练步骤为:从所述经验回放池中随机采样若干个转移元组,计算扰动后的动作,并更新价值网络的参数;

判断是否达到策略网络的更新步长,如果未达到更新步长,则继续更新价值网络的参数;否则,基于更新后的价值网络,使用确定性策略梯度法更新策略网络的参数。

7.一种四足机器人运动控制系统,其特征在于,包括:动作选择模块,其被配置为:获取四足机器人在环境中行走时的状态,通过策略网络根据状态选择动作;所述状态包括四足机器人的俯仰角、横滚角、俯仰角速度、横滚角速度和各个关节的位置;所述策略网络采用双延迟深度确定性策略梯度算法进行训练;

参考动作计算模块,其被配置为:获取四足机器人在环境中行走时的足端位置,以计算得到参考动作;

控制模块,其被配置为:结合参考动作与策略网络输出的动作,得到四足机器人执行的动作,发出动作指令至四足机器人,实现四足机器人的运动;

所述四足机器人执行的动作表示为:

其中, 和 分别表示所述参考动作和所述策略网络输出的动作, 和 分别表示参考动作的权重系数和策略网络输出的动作的权重系数。

8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1‑6中任一项所述的一种四足机器人运动控制方法中的步骤。

9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1‑6中任一项所述的一种四足机器人运动控制方法中的步骤。