1.一种基于对抗学习的混合动力卡车队列经验传授方法,其特征在于:包括,对混合动力卡车A的控制器进行原始工况提取并对所述原始工况进行参数处理;
利用所述参数处理后的数据以及对抗网络学习生成工况和SOC轨迹图,并与真实数据进行拟合度判别;
进行所述拟合度判别的循环训练,若无法判别所述生成工况和SOC轨迹图与真实数据时,达到最优;
所述对原始工况进行参数处理包括,
在采集器中进行原始工况分析,提取特定工况特征参数并加以分类,将不同类别的所述工况特征参数作为随机噪声输入到生成器G,即所述混合动力卡车B的控制器中;
所述对抗网络学习包括,
混合动力卡车B的控制器和混合动力卡车C的控制器,其中混合动力卡车B的控制器利用所述处理结果进行随机工况组合;混合动力卡车C的控制器根据所述组合生成工况和SOC轨迹图并与真实工况与轨迹进行拟合度判别;所述混合动力卡车C的控制器无法判别所述生成结果和真实结果时,达到最优;
所述生成工况和SOC轨迹图包括,
利用构成所述生成器G的多层感知器中的神经网络将所述随机噪声映射到一个新的数据分布,得到随机特征参数工况,将所述随机特征参数工况表示为G(z)并输入至所述混合动力卡车C的控制器,即判别器D,所述混合动力卡车C的控制器通过自有算法对所述随机特征参数工况进行计算,生成工况与SOC轨迹图;
所述真实工况与轨迹包括,
所述真实工况与轨迹为所述混合动力卡车A的真实工况与SOC轨迹图;
所述进行拟合度判别包括,将所述真实工况与SOC轨迹图作为真实数据分布x,对所述真实数据分布x和随机特征参数G(z)进行拟合度判别,其公式表示为:其中:Pdata(x)为真实数据分布,pz(z)为随机噪声输入。
2.如权利要求1所述的基于对抗学习的混合动力卡车队列经验传授方法,其特征在于:所述拟合度判别还包括,
所述拟合度判别公式对输入的两个数据x和G(z)分别作出判断后,判别器D输出一个概率值,所述概率值表示适合于行驶的SOC和工况轨迹拟合度,若真实数据的概率值接近于1,则表示所述混合动力卡车C的控制器可以通过自有算法来找到适合于输入的随机组合工况参数路段的SOC轨迹,若生成数据的概率值接近于0,则表示此时混合动力卡车C的控制器自有算法无法生成适合于输入的随机组合工况参数路段的SOC轨迹,所述判别器D会将生成数据中需要调整的参数反馈给所述生成器G,并进行调整重新生成;如此循环训练,直至所述判别器D最终无法区分真实数据和生成数据,判定生成器G此时已经达到最优。
3.如权利要求2所述的基于对抗学习的混合动力卡车队列经验传授方法,其特征在于:所述真实数据分布和随机噪声输入包括,
所述拟合度判别利用所述真实数据分布Pdata(x)的数据通过所述判别器D的熵,将其最大化为1,再将所述随机噪声输入pz(z)的数据通过所述生成器G的熵,生成的样本并通过所述判别器D判定其真伪,并将其最大化为0,所以所述判别器D的目标是最大化函数V(D,G),而所述生成器G的目标为最小化函数V(D,G),使真实数据和生成数据之间的差距减小。
4.如权利要求2或3所述的基于对抗学习的混合动力卡车队列经验传授方法,其特征在于:所述循环包括,在循环过程中每一次迭代的所述判别器D都可以给出当前状态下的最优值,对抗网络在更新多次判别器D后更新一次生成器G,使得所述判别器D优先所述生成器G一步达到当前最优,由此进行循环迭代使得Pg=Pdata,当G固定时对于最终结果的判定最优判别器公式,表示为如下:由上式可得,当Pg=Pdata时,表示所述生成器G和判别器D达到最优,即所述混合动力卡车B、C掌握此工况下的最优SOC轨迹。
5.如权利要求4所述的基于对抗学习的混合动力卡车队列经验传授方法,其特征在于:所述循环训练还包括,
利用数据相似性度量将所述对抗学习中的概率分布的距离度量替换为Wasserstein距离,所得公式表示为如下:所述Wasserstein距离在反映所述Pdata和Pg距离时,不考虑二者重叠,使得所述对抗学习训练过程更加稳定。