1.一种考虑状态约束和控制增益的倒立摆系统控制方法,其特征在于,包括:构建倒立摆系统的非线性模型,并将倒立摆系统的相关状态约束引入所述非线性模型;
自适应反步算法具体为:基于确定好的所述倒立摆系统的系统误差函数以及BLF函数,以最小化系统误差函数为目的,运用反步法逐步对控制器和自适应律进行调整,使倒立摆系统趋于最优状态;
倒立摆系统非线性模型,具体表示如下:
T
其中,x=[x1,x2,...,xn]是系统状态,y∈R是系统输出,b是未知控制增益常数,u是控制器的输入,i=1,2,...,n, 和 是局部利普希茨参数未知光滑非线性函数,t是时间,w是独立标准布朗运动,根据倒立摆系统控制目标以及倒立摆系统的结构,确定所述倒立摆系统的系统误差函数以及BLF函数;
倒立摆系统的BLF函数如下:
其中,设计参数ki,bj>0, 是θ的估计,θ为神经网络权值参数;
采用具有自适应律的径向基神经网络对所述倒立摆系统中的完全未知非线性函数进行逼近;并基于特定增益抑制不等式对所述系统误差函数进而优化求解,构建最优倒立摆系统控制器;
特定增益抑制不等式定义为:
其中,t∈[0,tw),vj(t),j=1,2,...,n是一个光滑的函数,tw为大于零的时间值,vj即本公开中所述的自适应律函数,Z(t)是一个光滑的函数,即确定好的BLF函数,由于需要对其进行微分,故需要所述BLF函数为光滑函数;LZ(t)为确定好的BLF函数的微分形式,其中,ρ,χ表示未知正常数,bj是未知正变量;
倒立摆系统误差函数定义为:
zi,j=xi,j‑ydi
其中,zi,j是坐标变换之后的状态变量,ydi为跟踪信号;
确定虚拟控制器,为:
其中,设计参数ki,j>0,ai,j>0, 为所述径向基神经网络的基函数向量,α是虚拟控制器,Ist是控制增益函数, 是等价虚拟控制单元,k是设计的参数,a是设计的参数,z是系统误差函数,S是高斯函数,是自适应的估计;
对所述BLF函数进行微分处理,并将系统误差函数、系统误差函数的导数,以及倒立摆系统的非线性函数模型的变量带入到BLF微分函数不等式,即可得到下式,其中,为所述的虚拟控制器;
其中, 是坐标变量, 是约束 范围的参数, 是系统的函数, 是系统的未知增益常数,ydi是跟踪系统函数, 是设计的参数,另外有是 的误差, 是 的估计;
采用具有自适应律的径向基神经网络对所述倒立摆系统中的完全未知非线性函数进行处理,所述完全未知非线性函数,表示如下:其中,所述具有自适应律的径向基神经网络是基于经典的RBF神经网络,并定义所述自适应律 与RBF神经网络的加权向量 的关系为 此处的*表示最优;具体的,所述RBF神经网络具体表示为 其中,W为理想加权向量,S为高斯函数,Young不等式的形式为:对于 有如下关系:其中,ε>0,r>1,t>1,(r‑1)(t‑1)=1;
利用所述具有自适应律的径向基神经网络对所述完全未知非线性函数进行逼近处理,同时,基于young不等式,得到下式:虚拟控制器设计为
其中设计参数
引入自适应律,得到:
利用young不等式,得到:
根据倒立摆系统中的各系统进行叠加,得到最终的控制器:其中,m表示一共有几阶倒立摆系统,i泛指其中任意一阶倒立摆系统;ni表示每一阶倒立摆系统中子系统的数量,ji表示某一阶倒立摆系统的任意一个子系统,i∈[1,m],ji∈[1,ni];
基于所述最优倒立摆系统控制器,实现对所述倒立摆系统指定性能的自适应跟踪控制。
2.如权利要求1所述的一种考虑状态约束和控制增益的倒立摆系统控制方法,其特征在于,根据所述径向基神经网络的基向量来确定最优的自适应律,通过不断迭代调节所述自适应律的参数使倒立摆系统误差函数逼近到零。
3.如权利要求1所述的一种考虑状态约束和控制增益的倒立摆系统控制方法,其特征在于,所述状态约束具体包括:倒立摆系统的每一个输入状态、倒立摆系统的输出以及倒立摆系统所跟的跟踪信号的相关约束。
4.一种考虑全状态约束和未知控制增益的倒立摆系统控制系统,其特征在于,包括:模型构建单元,其用于构建倒立摆系统的非线性模型,并将倒立摆系统的相关状态约束引入所述非线性模型;
自适应反步算法具体为:基于确定好的所述倒立摆系统的系统误差函数以及BLF函数,以最小化系统误差函数为目的,运用反步法逐步对控制器和自适应律进行调整,使倒立摆系统趋于最优状态;
倒立摆系统非线性模型,具体表示如下:
T
其中,x=[x1,x2,...,xn]是系统状态,y∈R是系统输出,b是未知控制增益常数,u是控制器的输入,i=1,2,...,n, 和 是局部利普希茨参数未知光滑非线性函数,t是时间,w是独立标准布朗运动,BLF函数确定单元,其用于根据倒立摆系统控制目标以及倒立摆系统的结构,确定所述倒立摆系统的系统误差函数以及BLF函数;
倒立摆系统的BLF函数如下:
其中,设计参数ki,bj>0, 是θ的估计,θ为神经网络权值参数;
未知控制增益处理单元,其用于采用具有自适应律的径向基神经网络对所述倒立摆系统中的完全未知非线性函数进行逼近;并基于特定增益抑制不等式对所述系统误差函数进而优化求解,构建最优倒立摆系统控制器;
特定增益抑制不等式定义为:
其中,t∈[0,tw),vj(t),j=1,2,...,n是一个光滑的函数,tw为大于零的时间值,vj即本公开中所述的自适应律函数,Z(t)是一个光滑的函数,即确定好的BLF函数,由于需要对其进行微分,故需要所述BLF函数为光滑函数;LZ(t)为确定好的BLF函数的微分形式,其中,ρ,χ表示未知正常数,bj是未知正变量;
倒立摆系统误差函数定义为:
zi,j=xi,j‑ydi
其中,zi,j是坐标变换之后的状态变量,ydi为跟踪信号;
确定虚拟控制器,为:
其中,设计参数ki,j>0,ai,j>0, 为所述径向基神经网络的基函数向量,α是虚拟控制器,Ist是控制增益函数, 是等价虚拟控制单元,k是设计的参数,a是设计的参数,z是系统误差函数,S是高斯函数,是自适应的估计;
对所述BLF函数进行微分处理,并将系统误差函数、系统误差函数的导数,以及倒立摆系统的非线性函数模型的变量带入到BLF微分函数不等式,即可得到下式,其中,为所述的虚拟控制器;
其中, zi,j+1是坐标变量,ki,bj是约束 范围的参数, 是系统的函数, 是系统的未知增益常数,ydi是跟踪系统函数, 是设计的参数,另外有是 的误差, 是 的估计;
采用具有自适应律的径向基神经网络对所述倒立摆系统中的完全未知非线性函数进行处理,所述完全未知非线性函数,表示如下:其中,所述具有自适应律的径向基神经网络是基于经典的RBF神经网络,并定义所述自适应律 与RBF神经网络的加权向量 的关系为 此处的*表示最优;具体的,所述RBF神经网络具体表示为 其中,W为理想加权向量,S为高斯函数,Young不等式的形式为:对于 有如下关系:其中,ε>0,r>1,t>1,(r‑1)(t‑1)=1;
利用所述具有自适应律的径向基神经网络对所述完全未知非线性函数进行逼近处理,同时,基于young不等式,得到下式:虚拟控制器设计为
其中设计参数
引入自适应律,得到:
利用young不等式,得到:
根据倒立摆系统中的各系统进行叠加,得到最终的控制器:其中,m表示一共有几阶倒立摆系统,i泛指其中任意一阶倒立摆系统;ni表示每一阶倒立摆系统中子系统的数量,ji表示某一阶倒立摆系统的任意一个子系统,i∈[1,m],ji∈[1,ni];
跟踪控制单元,其用于基于所述最优倒立摆系统控制器,实现对所述倒立摆系统指定性能的自适应跟踪控制。
5.一种控制器,包括存储器、处理器及存储在存储器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1‑3任一项所述的一种考虑状态约束和控制增益的倒立摆系统控制方法。
6.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1‑3任一项所述的一种考虑状态约束和控制增益的倒立摆系统控制方法。