1.针对机器鱼的非一致轨迹长度差分进化迭代学习控制方法,其特征在于,包括以下步骤:
1)通过对期望速度曲线进行采样,得到期望速度序列;
2)通过将控制输入推力作用到机器鱼中,得到实际速度曲线,再对其采样得到实际速度序列;
3)通过机器鱼的期望速度序列与实际速度序列形成误差序列;
4)通过误差序列、差分进化算法优化控制增益的方法得到优化的控制增益和当前的控制输入推力序列;
5)将当前的控制输入推力序列作为迭代学习控制的控制输入推力序列作用于机器鱼,得到机器鱼的实际速度序列;
6)通过机器鱼的实际速度序列和期望速度序列形成误差序列;
7)将误差序列、当前的控制输入推力序列以及优化的控制增益带入控制律(7)中,得到下一次的控制输入推力序列;
8)重复执行步骤5‑7,直至误差指标小于容许范围时停止迭代学习控制;
所述控制律(7),是针对离散非线性动态系统的一般形式:(3)
其中 , 表示迭代次数,
表示离散时间点数, 和 分别表示系统状态、控制输入和系统输出; 和 分别为系统的输入系数和输出系数, 为系统的状态函数;对于 , 表示期望输出,其中 为相应的期望状态; 表示第 次迭代时系统的跟踪误差序列;提出了的以下非一致轨迹长度迭代学习控制律:
(7)
其中 为控制增益。
2.根据权利要求1所述针对机器鱼的非一致轨迹长度差分进化迭代学习控制方法,其特征在于,对机器鱼进行建模,包括以下步骤:将机器鱼模型建模为离散系统,机器鱼模型如下:(1)
其中, 表示迭代次数, 表示时间, 机器鱼的质量, ;
是水阻力系数, ; 表示机器鱼在第k次迭代t时刻的摆动速度,表示在第k次迭代t时刻机器鱼尾部运动产生的控制输入推力;令采样间隔 ,对机器鱼的摆动速度 进行采样得到摆动速度的采样序列 , ;对控制输入推力 进行采样得到控制输入推力的抽样序列 ;令摆动速度抽样序列为系统状态 ,控制输入推力抽样序列 为系统的控制输入 ,利用导数的定义有:
,
将(1)式机器鱼模型可建模如下离散动态系统:(2)
其中 , ;
令(2)式中包含系统状态非线性部分 ,得到离散非线性动态系统的一般形式。
3.根据权利要求1所述针对机器鱼的非一致轨迹长度差分进化迭代学习控制方法,其特征在于,所述步骤4中利用差分进化算法,对所述非一致轨迹长度迭代学习控制律(7)中的控制增益进行优化,减少系统收敛所需的迭代次数。
4.根据权利要求2所述针对机器鱼的非一致轨迹长度差分进化迭代学习控制方法,其特征在于,对所述离散非线性动态系统(3)提出以下4个假设:假设1:对于所有的迭代,系统(3)的初始状态满足下式:(4)
假设2:系统(3)的状态函数 满足全局Lipschitz条件,即对于 ,(5)
其中 为Lipschitz常数;
假设3: ;
假设4:假设期望输出轨迹是可达的,即存在唯一的控制输入 使得(6)。
5.根据权利要求4所述的针对机器鱼的非一致轨迹长度差分进化迭代学习控制方法,其特征在于,所述离散非线性动态系统(3),提出了以下非一致轨迹长度迭代学习控制律:(7)
其中 为控制增益,针对系统(3),在满足所述假设1‑4的情况下,应用所述控制律(7),选择控制增益 满足下式:(8)。
6.根据权利要求5所述针对机器鱼的非一致轨迹长度差分进化迭代学习控制方法,其特征在于,所述系统(3)的跟踪误差为 。
7.根据权利要求6所述针对机器鱼的非一致轨迹长度差分进化迭代学习控制方法,其特征在于,所述离散动态系统,通过采样的期望输出序列和实际输出序列 ,得到跟踪误差序列,离散化的跟踪误差轨迹长度变化:其中 其是一个伯努利变量,取值为0和1,期望 ;
当 时,
当 时,
。
8.根据权利要求5所述针对机器鱼的非一致轨迹长度差分进化迭代学习控制方法,其特征在于,所述步骤4中,差分进化算法优化控制增益的方法,包括:
1)初始化种群,差分进化算法参数;产生问题解的初始值,根据机器鱼智能择优非一致轨迹长度迭代学习控制方法的特点,对差分进化算法的种群进行初始化,共有三个控制增益需要优化,即 ,根据收敛条件(8),可以得到三个待优化的控制增益的范围分别为[0.6,0.7],[0.4,0.5]和[0.3,0.4],假设种群规模 ,使用启发式的方法分别随机选择30个位于这些区间的随机数作为初始种群,有助于算法快速收敛;
2)计算种群中每个个体的适应度;
3)变异操作;从群体中随机选择3个个体 , , ,且三个个体均不相同,变异操作为: ,其中 为变异后生成的子代新个体,F为变异概率,F=0.3;
4)交叉操作;具体操作如下:
其中rand 为[0,1]之间的随机小数,CR为交叉概率,CR=0.7,随机生成的小数与交叉概率进行比较,当随机小数小于或等于交叉概率时,将变异后的个体输出作为新一代的个体,当随机小数大于交叉概率时,将父代输出作为新一代的个体;
5)选择操作;将交叉操作后的留下的个体对评价函数进行比较,保留最好的个体;为了确定 是否成为下一代的成员,试验向量 和目标向量 对适应度函数进行比较:
6)计算个体的适应度值。