1.一种DC‑DC功率变换器的跟踪控制方法,其特征在于,包括以下步骤:定义跟踪控制方法的性能函数与损失函数;
基于所述性能函数定义切换策略的值函数,基于所述值函数获得最优值函数,基于所述最优值函数设计最优切换控制策略;
定义状态动作值函数,并将所述状态动作值函数作为当前时刻选择模态,基于所述状态动作值函数对最优切换控制策略进行优化,获得优化后的最优切换控制策略;
通过神经网络对优化后的最优切换控制策略中的状态动作值函数进行重构,获得重构的最优切换控制策略;
对重构的最优切换控制策略进行稳定性分析,当重构的最优切换控制策略稳定时,通过表征极限环对所述性能函数、损失函数、值函数、最优切换控制策略和状态动作值函数进行优化,获得最终切换控制策略。
2.根据权利要求1的DC‑DC功率变换器的跟踪控制方法,其特征在于,表征极限环优化后的性能函数表达式为:式中,U表示损失函数, 表示电路的系统状态, 表示期望的系统状态, 表示电路的模态。
3.根据权利要求2的DC‑DC功率变换器的跟踪控制方法,其特征在于,表征极限环优化后的损失函数表达式为:式中,表示当前时刻选择模态, 表示正定实矩阵。
4.根据权利要求3的DC‑DC功率变换器的跟踪控制方法,其特征在于,表征极限环优化后的值函数表达式为:式中, 表示
切换控制策略, 表示生成的系统状态轨迹, 表示决策序列, 表示目标轨迹。
5.根据权利要求4的DC‑DC功率变换器的跟踪控制方法,其特征在于,表征极限环优化后的最优切换控制策略表达式为:式中, 表示损失函数, 表
示最优值函数。
6.根据权利要求5的DC‑DC功率变换器的跟踪控制方法,其特征在于,表征极限环优化后的状态动作值函数表达式为:式中, 表示
电路的系统状态, 表示期望的系统状态, 表示电路的模态, 表示生成的系统状态轨迹, 表示决策序列, 表示目标轨迹。
7.根据权利要求1的DC‑DC功率变换器的跟踪控制方法,其特征在于,所述神经网络的输入层与隐藏层连接关系为 ,隐藏层与输出层连接关系为 ;
重构后的状态动作值函数表达式为 ;
式中, 表示第h个隐藏层神经元,表示数据集的数量, 表示输入层与隐藏层神经元之间的连接权重, ,表示隐藏层神经元的个数, 表示隐藏层与输出层神经元之间的权重。
8.根据权利要求7的DC‑DC功率变换器的跟踪控制方法,其特征在于,所述最终切换控制策略表达式为:;
式中, 表示隐藏层与输出层神经元之间的权重, 表示隐藏层神经元,其中, 表示隐藏层中的阈值,表示激活函数。