1.一种基于运动状态优化的多目标运动融合控制方法,其特征在于,包括:S1、构建总体线性控制系统并建立状态方程,针对当前复杂场景下的各个目标实现需求,分别设计目标控制器;
S2、针对各个目标控制器分别建立对应的运动控制预测模型以及目标评价函数,在当前时刻的系统运动状态基础上估计未来一段预测时间区间的运动状态,并计算相应的目标评价函数累计值;
S3、分别计算各个控制器目标评价函数累计值在当前时刻的目标梯度;
S4、根据预设的权重函数,按照权重层次序列由低到高依次嵌套融合各个控制器对应的目标梯度值,并将其加入系统总的控制输入中,实现当前复杂场景下的多目标运动融合;
所述S1包括:
S11、构建总体线性控制系统并建立状态方程;
y(t)=Cx(t)+Du(t)
其中,x(t)为系统t时刻的运动状态, 为系统t时刻的运动速度,u(t)为t时刻的系统总的控制输入,y(t)为t时刻的系统总的控制输出,A、B、C、D为状态方程的计算参数;
S12、针对当前复杂场景下的各个目标实现需求,分别设计目标控制器;
ui(t)=f(y(t),ri(t))
其中,ui(t)为控制器i的控制输入,是t时刻系统总的控制输出与期望控制目标的函数,ri(t)为控制目标t时刻的期望值;
所述S2包括:
S21、针对各个目标控制器分别建立对应的运动控制预测模型;
其中, 为预测区间内t时刻控制器i的预测运动状态, 为预测区间内t时刻控制器i的预测运动速度, 为预测区间内t时刻控制目标i的预测控制输出;
S22、针对各个目标控制器分别建立目标评价函数,结合对应的所述运动控制预测模型,在当前时刻t0的系统运动状态基础上估计未来一段预测时间区间的运动状态,并计算相应的目标评价函数累计值;
其中,Ji(t0)为第i个控制器t0时刻的目标函数累计值,Gi为第i个控制器预测区间t0到t0+T内单时刻点的目标评价函数值,T为预测时间区间;
所述S3中采用如下公式计算所述目标梯度:
其中,gi(t0)是控制器i在t0时刻的目标评价函数累计值的目标梯度;
所述S4中,根据预设的权重函数,按照权重层次序列由低到高依次嵌套融合各个控制器对应的目标梯度值,包括:S41、按目标的重要程度排序确定各个控制器的优先级;
M=[m1,m2…,ml…,mL]
其中,M是目标控制器的权重层次序列,满足 N为总的目标控制数量,L为层次等级数,ml为第l个层次的目标控制器集合;
S42、按权重层次序列由低到高依次嵌套计算融合后的目标梯度值;
其中, 是关于梯度g的归一化函数,α表示分层参数,wl(t0)表示从1到l的嵌套计算结果;
所述S4中,将所有控制器嵌套融合后的目标梯度值,并将其加入系统总的控制输入,表示为:其中,wL(t)为N个控制器嵌套融合后的目标梯度值,K为比例系数。
2.一种基于运动状态优化的多目标运动融合控制系统,其特征在于,用于执行如权利要求1所述的基于运动状态优化的多目标运动融合控制方法,包括:设计模块,用于构建总体线性控制系统并建立状态方程,针对当前复杂场景下的各个目标实现需求,分别设计目标控制器;
预测模块,用于针对各个目标控制器分别建立对应的运动控制预测模型以及目标评价函数,在当前时刻的系统运动状态基础上估计未来一段预测时间区间的运动状态,并计算相应的目标评价函数累计值;
计算模块,用于分别计算各个控制器目标评价函数累计值在当前时刻的目标梯度;
融合模块,用于根据预设的权重函数,按照权重层次序列由低到高依次嵌套融合各个控制器对应的目标梯度值,并将其加入系统总的控制输入中,实现当前复杂场景下的多目标运动融合。
3.一种存储介质,其特征在于,其存储有用于多目标运动融合的控制的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1所述的基于运动状态优化的多目标运动融合控制方法。
4.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如权利要求1所述的基于运动状态优化的多目标运动融合控制方法。