买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种移动机器人的故障估计和容错迭代学习控制方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种移动机器人的故障估计和容错迭代学习控制方法

￥24000

专利号： 2023100800010

申请人：江南大学

专利类型：发明专利

专利状态：已下证

更新日期：2025-07-05

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种移动机器人的故障估计和容错迭代学习控制方法，其特征在于，所述方法包括：第一步、确定双轮独立驱动的刚性移动机器人控制系统的动力学模型，包括：所述双轮独立驱动的刚性移动机器人控制系统通过左右车轮的驱动电压来控制移动机器人的线速度和方向角，在固定平面上建立绝对坐标系，假设所述双轮独立驱动的刚性移动机器人在所述固定平面内移动，移动机器人的实际物理模型如式(1)所示：其中，v为移动机器人的线速度，φ为移动机器人的方向角；ur和ul分别为移动机器人的右轮和左轮的驱动电压；c为粘性摩擦系数；M为移动机器人的质量；r为移动机器人的车轮半径；Iw为移动机器人的车轮的转动惯量；ka为驱动增益因子；l为移动机器人的左轮或右轮到移动机器人重心的距离；Iv为围绕移动机器人中心的转动惯量；

第二步、对所述双轮独立驱动的刚性移动机器人控制系统进行解耦，并构建其离散状态空间模型，包括：将移动机器人的线速度、方向角和方向角的导数定义为状态变量：将右T轮和左轮的驱动电压定义为输入变量：u＝[ur ul] ，将移动机器人的线速度和方向角定义T为输出变量：y＝[v φ]，则式(1)所示的刚性移动机器人控制系统描述为：其中：

由于所述双轮独立驱动的刚性移动机器人控制系统是一个线性多输入多输出的耦合系统，为使用线速度的驱动电压uv和方向角的驱动电压uφ直接控制所述移动机器人的线速度和角速度，使用下述式(3)对所述耦合系统进行解耦：再对解耦后的系统进行离散化，选取满足香农采样定理的采样周期Ts，进一步得出所述双轮独立驱动的刚性移动机器人控制系统的离散状态空间模型：式中，t表示采样时刻，k表示批次，选取批次过程的运行周期为T，且在每个重复运行周期t∈[0,N]内，共有N个采样点；和分别表示所述双轮独立驱动的刚性移动机器人控制系统第k批次t采样时刻的对应维度的输入、输出和状态向量；

A，B和C为式(2)中离散系统先解耦后离散化的系统参数矩阵，并且满足CB≠0；假设系统每个批次的初始状态保持一致，即xk(0)＝x0；

第三步、建立所述双轮独立驱动的刚性移动机器人控制系统的提升模型，包括：针对式(4)表示的线性离散系统，将其离散状态空间模型转化为时间序列形式的提升模型：yk＝Guk+d (5)其中：

T 2 T N T T

d＝[(CA) ,(CA) ,...,(CA) ]x0G是时间序列上的输入输出传递矩阵，d是系统初始状态的输出响应；输入Hilbert空间和输出Hilbert空间分别由如下的内积和相应的诱导范数定义：其中，是输入Hilbert空间的向量，是输出Hilbert空间的向量，矩阵和分别为对应维数的对称正定权重矩阵；

定义期望输入和期望输出为：

并且根据式(5)所示的输入输出模型，期望输出表示为：yd＝Gud+d (10)由此定义跟踪误差为：

ek＝yd‑Guk‑d (11)第四步、建立执行器故障下所述双轮独立驱动的刚性移动机器人控制系统的提升模型和名义提升模型，包括：定义执行器故障下的输入为：

并且，执行器故障下的输入由执行器故障系数表示为：其中：

δk(t)＝diag{δ1,k(t),δ2,k(t),...,δm,k(t)} (14)估计的执行器故障系数表示为：

执行器故障系数的下界和上界分别定义为：δ＝diag{δ1,δ2,...,δm} (18)并且执行器故障系数下界的最小值和上界的最大值分别定义为：假设执行器故障系数的下界δi(0≤δi≤1)和上界是已知的，即故障执行器系数δi,k(t)在已知范围内变化；δi,k(t)＝0表示第i个执行器在第k批次t采样时刻完全故障；

δi,k(t)＝1表示第i个执行器在第k批次t采样时刻正常工作；0<δi,k(t)<1表示第i个执行器在第k批次t采样时刻有剩余驱动力；δi,k(t)>1表示第i个执行器在第k批次t采样时刻有过量驱动力；

执行器故障下式(4)所示的离散状态空间模型表示为：针对式(22)表示的执行器故障下的线性离散系统，将其离散状态空间模型转化为时间序列形式的提升模型：yk＝Gδkuk+d (23)其中：

进一步得出估计的执行器故障系数表示的执行器故障下的名义提升模型：其中：

式(23)所示的执行器故障下提升模型的实际跟踪误差表示为：ek＝yd‑Gδkuk‑d (25)式(24)所示的执行器故障下名义提升模型的数值跟踪误差表示为：第五步、设计执行器故障下的容错迭代学习控制轨迹跟踪算法，包括：考虑范数优化迭代学习控制框架，每批次优化一个性能指标函数，所述性能指标函数定义为：其中，所述性能指标函数包括数值跟踪误差和控制振荡；Q和R分别为数值跟踪误差和控制振荡的对称正定权重矩阵，以表示性能指标函数考虑数值跟踪误差和控制振荡的优先T T级，即Q＝Q>0,R＝R>0；

由式(6)和式(7)得到跟踪误差及控制振荡的诱导范数：将式(26)，式(28)和式(29)代入式(27)，对uk+1求二次型最优解，得到：由于正定，故其可逆；并且为改进本步骤设计算法的鲁棒性，将名义提升模型的数值跟踪误差替换成测量所得的实际跟踪误差ek，从而引入真实故障信息；

因此，得到迭代学习更新律：

其中，和分别为第k批次的输入项学习增益和误差项学习增益：当给定所述双轮独立驱动的刚性移动机器人控制系统的离散状态空间模型的初始输入u0，初始状态x0，参考轨迹yd，选定加权矩阵Q和R，一种执行器故障下的容错迭代学习控制轨迹跟踪算法设计如下：步骤5.1：对式(4)运行u0以获得y0；记录测量所得的e0并通过式(31)的迭代学习更新律得出u1；

步骤5.2：根据第六步设计的执行器故障下的基于Q‑learning的故障估计算法，计算重复该步骤直至采样次数达到N，输出最新的步骤5.3：使用 uk和ek，通过式(31)的迭代学习更新律得出uk+1；

步骤5.4：运行uk+1测量得到下一批次的输出yk+1和跟踪误差ek+1；

步骤5.5：重新执行步骤5.2，直至误差精度小于等于设定值，则算法结束；

第六步、设计执行器故障下的基于Q‑learning的故障估计算法，包括：考虑强化学习中的Q‑learning算法，在每一批次每一时刻，估计一次故障信息，为式(31)所示的迭代学习更新律提供估计故障信息；所述Q‑learning算法涉及的主要对象包括：智能体为故障估计器；环境为所述移动机器人控制系统；状态空间为其中每一个状态动作空间为其中每一个动作执行器故障下的故障估计算法的基本思想如下：状态转移公式为：

采取∈‑贪心策略作为动作选择策略π(s)：其中，Q(s,a)为动作价值函数，∈为贪心概率，p为动作选择概率；

动作价值函数的更新式为：

其中，α为学习率，γ为折扣因子，为在状态s下执行动作a从而转移到状态s'时获得的奖赏；

为准确进行故障估计，定义下述损失方程为：进一步定义奖赏为：

其中，是一个与状态数量有关的常数，是关于故障估计精度的损失方程阈值；

当给定学习率α，折扣因子γ，贪心概率∈，损失方程阈值状态xk和输入uk，一种执行器故障下的基于Q‑learning的故障估计算法设计如下：步骤6.1：初始化动作价值函数Q(s,a)和初始状态s0；

步骤6.2：通过∈‑贪心策略选择初始状态s0的初始动作a0；

步骤6.3：通过式(36)更新动作价值函数Q(s,a)；

步骤6.4：执行当前动作a，将当前状态转移至下一个状态s'，并获得相应的奖赏步骤6.5：通过∈‑贪心策略选择下一个状态s'的动作a'，之后s更新为s'，a更新为a'；

步骤6.6：重新执行步骤6.3，直至则算法结束，最终更新的s'即为估计的执行器故障系数第七步、分析执行器故障下的容错迭代学习控制轨迹跟踪算法的收敛性，包括：根据式(10)和式(25)，第k批次的跟踪误差表示为：定义输入误差Δuk为：

Δuk＝ud‑δkuk (40)则将式(39)改写为：

ek＝GΔuk (41)根据式(40)和迭代学习更新律式(31)，得到第k+1批次的输入误差：其中，为对角阵δk的伪逆；