1.一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法,其特征在于,所述方法包括:
第一步:建立旋转倒立摆的拉格朗日和状态空间模型;
旋转倒立摆系统包括底座、传动装置、摆杆及旋臂,所述底座用于保证所述摆杆摆动时机械结构的稳定;旋臂末端连接所述摆杆,直流电机的旋转通过所述传动装置带动所述摆杆的运动;所述旋臂的角度及角速度则通过所述直流电机自带的增量式旋转编码器获取;
通过联轴器连接所述增量式旋转编码器与所述摆杆,带动所述增量式旋转编码器旋转从而获取所述摆杆的角度及角速度;在构建所述旋转倒立摆的动力学模型中,忽略空气阻力、摩擦力及微小项以简化建模过程,把所述旋臂及摆杆视为均匀的长杆,设所述摆杆处于稳定竖立时所述旋转倒立摆系统的势能为零;
所述摆杆偏离直立位置角度α时,所述旋臂通过旋转β带动所述摆杆趋于直立位置,因此旋臂末端速度vm为:
其中,r1为旋臂旋转中心到与摆杆连接点的距离, 为旋臂旋转时角速度;
由于所述摆杆为均匀长杆,视所述摆杆为一质点则得到摆杆转动速度为vz为:其中,L为摆杆长度, 为摆杆旋转时角速度;
将所述摆杆转动速度vz在所述旋臂末端速度vm垂直方向进行分解,并以摆杆旋转平面与地面水平方向速度vr所指方向为正方向,得到:在所述旋臂末端速度vm和地面水平方向速度vr的共同作用下,所述摆杆在水平方向上的速度vb为:
所述摆杆的动能包含有旋转产生的转动动能以及在水平方向上移动产生的动能,另外所述旋转倒立摆系统整体动能还包含有所述直流电机带动的所述旋臂的动能,因此得到所述旋转倒立摆系统的整体动能V,令J1为摆杆的转动惯量,J2为旋臂的转动惯量,m为摆杆质量,并将式(4)及(5)带入得到:所述摆杆直立时设为零势能点,H为所述旋转倒立摆系统整体势能,E为拉格朗日函数,则偏转α角度后势能降为:
拉格朗日函数E为:
可知旋臂旋转带动所述摆杆运动,无外界能力输入,令Toutput为电机输出转矩,Beq为等效粘性摩擦,得到拉格朗日方程为:式(8)带入式(9)及(10)得到旋转倒立摆的非线性模型:从在式(11)得到的所述旋转倒立摆的非线性模型中,其输入为直流电机转矩,但通常情况下以直流电机电压为控制输入,因此接下来对所述直流电机进行建模,最终建立以所述直流电机电压为输入的倒立摆非线性模型;
令Id为直流电机电流,Ed为反电动势,并考虑所述传动装置的效率和齿轮比值,KT为电机转矩系数,KE为电机转速系数,Kg为旋臂与直流电机的齿轮比,ηg为齿轮传动效率,ηd为电机效率,U为所述直流电机电压,R为电枢电阻,得到:Toutput=ηdηgKgKTId (13)将式(12)、(13)带入式(11)中,得到以所述直流电机电压为输入的所述倒立摆非线性模型为:
为了进一步建立旋转倒立摆的状态空间模型,需要将所述倒立摆非线性模型进行线性化,注意到所述摆杆在稳摆控制中处于直立状态,因此摆杆角度较小,此时存在sinα≈α,cosα≈1,则得到旋转倒立摆线性模型为:接下来以所述旋转倒立摆线性模型为基础来建立所述旋转倒立摆的状态空间模型,为了简化书写设置如下定义:
2
b=J2+mr1 (17)将式(16)至(21)带入式(15)解得 与 为:选取状态向量 其中β为旋臂旋转角度,输入为所述直流电机电压U,得到所述旋转倒立摆的状态空间模型为:其中由于所述摆杆及旋臂视为均匀长杆,则其转动惯量J1、J2可以得出:其中,r2为旋臂长度,M旋臂质量,ρ为旋臂和摆杆的密度;
第二步:设计旋转倒立摆迭代反馈整定双闭环控制器;
针对所述旋转倒立摆的状态空间模型设计所述双闭环控制器,使用迭代反馈整定算法优化角度PD控制器参数,若C(ρ)=[Cr(ρ) Cy(ρ)],Cr(ρ)、Cy(ρ)是线性时不变传递函数,G是被控对象的传递函数,u(t)是控制器输出,r(t)是参考输入,y(t)是所述旋转倒立摆系统输出,v(t)是均值为零的外部随机扰动,PID控制器参数为ρ=[Kp Kd],在此基础上反馈控制系统作用下的响应输出为:
为了简化书写,将T0(ρ)、S0(ρ)简写为T0、S0,定义yd是给定的期望输入信号,则期望输出与实际输出之间的跟踪误差为:
对于控制器参数为ρ的固定结构PID控制器,通过最小化 以改善所述反馈控制系统的跟踪控制效果,定义性能优化指标函数J(ρ)为:其中Ly、Lu表示基于时间序列的滤波器,通常Ly=Lu=1,采样点个数为N,性能度量的权重因子为λ;IFT算法是通过最小化所述性能优化指标函数J(ρ)直接求得系统的所述PID控制器参数ρ,然后通过i次迭代逐步获取所述PID控制器参数ρ的最优值,ρi为ρ在第i次迭代中的值,在每个迭代批次中,变量y(ρi)和u(ρi)关于控制器参数ρi的偏导数为:所述IFT算法通过在自由度控制系统中进行三次实验,以获得T0r,T0(r‑y)的估计值,在(1)
三次实验中,前两次用来估计信号T0,首先在第i次迭代中,第一次实验以ri =r为输入的(1) (1)
参考信号,y (ρi)为采样得到的控制系统的输出值;其次,以两信号差值r‑y (ρi)为第二(2) (2)
次实验输入的参考信号ri ,采样得到y (ρi):(3)
第三次实验用来估计信号T0r,以ri =r作为输入的参考信号:根据三次实验的控制器输出值以及所述旋转倒立摆系统输出值得到 的无偏估计,同理 可以也得到:
基于实验数据的第i次迭代的所述性能优化指标函数J(ρi)的估计梯度为:根据所述性能优化指标函数J(ρi)的估计梯度以及上一次迭代的所述PID控制器参数ρi使用Gauss–Newton算法计算下一次迭代更新的ρi+1:其中γi>0表示步长,Ri为正定Hessian矩阵表示优化搜索方向:第三步:迭代反馈整定角度PD控制器的收敛性分析;
为保证算法的收敛性,条件1是保证所述性能优化指标函数的估计梯度是无偏的,条件
2是步长序列γi要求能够收敛到零,为了保证条件1,由式(18)到(20)得到 为:(m)
基于所述IFT算法的实验中设定三次实验的vi ,m=1,2,3是同一系统相互独立的零均(m)
值有界随机噪声,即|vi |
条件2需要保证算法收敛的条件通常要求所述步长序列γi的所有元素满足:第四步:鲁棒迭代反馈整定角度PD控制器的进一步优化;
所述IFT算法依靠经验选择如λ一类的权重值,但由于各个所述性能度量之间的物理意义并不相同,运行环境也不尽一致,它们之间的取值范围相差巨大,因此若同时控制多个相同系统,依靠经验选择的所述性能度量的权重因子λ并不具有普适性,考虑各个所述性能度量之间的取值范围,构建了一个辅助因子Li,所述辅助因子Li为所述性能度量之间的取值范围之比:
在此基础上准则函数J(θ)修改为:其中, 为跟踪误差,u(θi)为控制器输出,且 和近似Hessian矩阵Ri修改为:式中yd,max和yd,min为期望输出的最大值与最小值,umax和umin表示第i次迭代过程中控制信号在所有N个采样点中的最大值与最小值;由于这些值都是在每次迭代结束时给出,所有的采样点都会被考虑在内,因而引入所述辅助因子Li使得所述权重因子λ在不同系统中都代表了当前迭代优化后 与u(θi)权重比的最佳范围。