1.一种大数据场景下的移动充电桩群体智能调度方法,其特征在于,包括如下步骤:建立移动充电桩集群的调度模型;
通过约束条件和DQN算法对所述调度模型进行求解,得到智能调度策略;
根据所述智能调度策略对移动充电桩进行调度。
2.根据权利要求1所述的一种大数据场景下的移动充电桩群体智能调度方法,其特征在于,所述调度模型的代价函数包括:min J=Bagg+EBat (7)其中,J为移动充电桩集群调度的代价函数,EBat为特定工况中锂电池的使用成本,Bagg为聚合商的总体收益。
3.根据权利要求2所述的一种大数据场景下的移动充电桩群体智能调度方法,其特征在于,所述聚合商的总体收益为:Bagg=Bc·wc+Be·we (1)式中,Bagg为聚合商的总体收益;Bc为聚合商主动参与电力市场辅助服务所获利益;wc是聚合商主动参与电力市场辅助服务的分成系数;Be为由能量套利所获利润;we为聚合商以能量套利方式获利的分成系数。
4.根据权利要求3所述的一种大数据场景下的移动充电桩群体智能调度方法,其特征在于,所述聚合商主动参与电力市场辅助服务所获利益为:其中,rp和rv分别为峰谷的补偿电价,Pp和Pv分别为峰谷时聚合商能够提供的总功率;
所述能量套利所获利润为:
其中,Qi,t为控制周期内可提供的充放电电量。
5.根据权利要求2所述的一种大数据场景下的移动充电桩群体智能调度方法,其特征在于,所述特定工况中锂电池的使用成本为:其中,EBat为特定工况中锂电池的使用成本,NBat为涉及的锂电池总数量,EBat_ini为锂电池的初试投资成本, 为锂电池衰减的百分比。
6.根据权利要求5所述的一种大数据场景下的移动充电桩群体智能调度方法,其特征在于,所述锂电池衰减的百分比为:其中,CBat为当前电池的容量,CEol为电池寿命截止时对应的容量,Cinit为电池的初始容量。
7.根据权利要求6所述的一种大数据场景下的移动充电桩群体智能调度方法,其特征在于,所述当前电池的容量为:b
CBat=a·nc+c (4)
其中,CBat为电池的当前容量,nc为循环次数,a为幂函数的系数,b为幂函数的次数,c为偏置量。
8.根据权利要求1所述的一种大数据场景下的移动充电桩群体智能调度方法,其特征在于,所述约束条件包括移动范围约束:其中, 为当前移动充电桩的移动距离,Lmax为移动充电桩的最大许可移动距离;
移动充电桩数目约束:
其中, 为参与聚合商统一调度的移动充电桩数目,Nmax为可参与统一调度的移动充电桩最大许可数目;
移动充电桩的功率约束:
式中,Pch和Pdis分别为电池储能单元许可充、放电功率; 和 分别为电池储能单元许可充、放电功率的最大值;
移动充电桩的容量约束:
其中, 与 分别为电池储能单元荷电状态的上下限值。
9.根据权利要求1所述的一种大数据场景下的移动充电桩群体智能调度方法,其特征在于,所述DQN算法包括:初始化观测值Q(st,at)、 与折扣因子γ;
以ε为概率选择调度策略at,观察系统的收益rt以及状态st+1;
存储(st,at,rt,st+1)到回放记忆单元D中;
随机从D中抽取适量学习经历(st,at,rt,st+1)对目标神经网络进行训练;
采用梯度下降法,通过最小化损失函数训练当前神经网络;
每隔N个时间窗口,将当前神经网络参数复制给目标神经网络;
重复上述步骤直到状态st到达目标期望值 结束算法。
10.根据权利要求9所述的一种大数据场景下的移动充电桩群体智能调度方法,其特征在于,所述神经网络训练输出结果为:所述最小化损失函数为:
(yj-Q(sj,aj|θ))2,
其中,rj为第j次奖励,γ为折扣因子,Q为观测值,θ为神经网络的参数,sj为第j个状态,aj为第j次行动。