1.一种基于CEMD和LSTM的非平稳时间序列数据预测方法,其特征在于,包括获取目标数据的历史数据,对历史目标数据进行异常值处理,得到处理后的目标数据;目标数据为光伏发电量数据,采用EMD的信号分解方法,把波动较大的、不平稳的光伏发电功率数据分解为瞬时频率较小的分量之后分别预测,然后再把预测结果线性相加,使得预测结果与真实值的误差降低;根据处理后的历史目标数据预测得到用于光伏发电系统电力调配的目标光伏发电量数据的时序预测具体包括以下步骤:S1、通过历史数据构建训练集,通过实时数据构建测试集;
S2、使用经验模态分解将测试集和训练集中的目标序列分解为n个本征模态函数和1个残差序列;
S3、通过k‑Shape聚类算法对n个本征模态函数聚类为m组,形成m个子序列,具体包括:S31、计算各个本征模态函数的动态时间归整值,将该值作为各个本征模态函数之间的相似度;
S32、将n个本征模态函数作为聚类样本,并从中随机选择m个样本作为初始簇心;
S33、将其他样本根据动态时间归整值分别分类到与其最相似的簇心所在的簇,将计算每个样本与其簇内其他样本的距离之和,将该距离之和最小的样本作为新的簇心,重复本步骤直到簇心不再发生变化;
S34、当簇心不再变化,判断是否每个样本的轮廓值是否超过设定的阈值,若超过则输出聚类结果,否则返回步骤S32,样本i的轮廓值表示为:其中,s(i)为样本i的轮廓值;a(i)为样本i的簇内不相似度,其值为样本i到当前簇中其他样本的平均距离;b(i)样本i的簇外不相似度,其值为样本i到当前簇外样本的平均距离;
S4、利用训练集中子序列的特征向量分别对深度LSTM神经网络和AR模型进行训练,获取完成训练的深度LSTM神经网络和AR模型;
S5、将测试集中子序列输入完成训练的深度LSTM神经网络和AR模型进行预测,得到非平稳时间序列预测结果;
S6、深度LSTM神经网络和AR模型得到预测结果输入卡尔曼滤波器进行矫正,得到最终预测结果。
2.根据权利要求1所述的一种基于CEMD和LSTM的非平稳时间序列数据预测方法,其特征在于,将训练集和测试集的m个子序列分别与目标序列具有高度相关性的特征向量进行拼接组合,将拼接后的子序列作为深度LSTM神经网络的输入。
3.根据权利要求1所述的一种基于CEMD和LSTM的非平稳时间序列数据预测方法,其特征在于,通过历史数据构建训练集或者通过实时数据构建测试集的过程包括对数据集进行预处理保证数据格式的一致性;预处理后进行标准化处理,即将数据按比例缩放,将数据转化为无量纲的纯数值。
4.根据权利要求1所述的一种基于CEMD和LSTM的非平稳时间序列数据预测方法,其特征在于,使用经验模态分解将目标序列分解为n个本征模态函数和1个残差序列的过程包括:S21、从训练集或者测试集中分离出目标序列x(t);
S22、初始化r0=x(t),i=1;
S23、计算第i个IMF,初始化h0=ri‑1(t),j=1;
S24、找到hj‑1(t)的局部极大值点和局部极小值点;
S25、对hj‑1(t)的局部极大值点和局部极小值点分别进行三次样条函数插值,形成上、下包络线;
S26、计算上、下包络线的平均值mj‑1(t);
S27、判断hj(t)=hj‑1(t)–mj‑1(t)是否为本征模态函数,如果是则imfi(t)=hj(t)且转到步骤S28;否则转到步骤S24;
S28、计算序列的剩余量ri(t)=ri‑1(t)–imfi(t);
S29、如果ri(t)极值点数仍多于2,则i=i+1并转到步骤S23;否则,分解结束,ri(t)作为残差序列;目标序列
5.根据权利要求1所述的一种基于CEMD和LSTM的非平稳时间序列数据预测方法,其特征在于,深度LSTM神经网络包括:ft=σg(Wfxt+Ufht‑1+bf);
it=σg(Wixt+Uiht‑1+bi);
ot=σg(Woxt+Uoht‑1+bo);
ct=ftοct‑1+itοtanh(WCxt+Ucht‑1+bc);
ht=otοtanh(ct);
其中,ft,it和ot分别表示遗忘门、输入门、输出门;Wf,Uf,Wi,Ui,Wo,Uo,Wc和Uc是计算过程中的权值矩阵;bf,bi,bo和bc是偏执向量;xt是在t时刻的输入;ht‑1是前一时刻LSTM的隐藏状态;σ()是sigmoid激活函数;o表示矩阵乘法。
6.根据权利要求1所述的一种基于CEMD和LSTM的非平稳时间序列数据预测方法,其特征在于,通过elbow方法确定m的值。
7.根据权利要求1所述的一种基于CEMD和LSTM的非平稳时间序列数据预测方法,其特征在于,深度LSTM神经网络和AR模型得到预测结果输入卡尔曼滤波器进行矫正,即计算深度LSTM神经网络的预测结果 和AR模型的预测结果 的预测偏差,根据该预测偏差获取卡尔曼增益,根据卡尔曼增益计算得到最终的预测结果,表示为:其中, 表示最终的预测结果,Hk为卡尔曼增益。
8.根据权利要求7所述的一种基于CEMD和LSTM的非平稳时间序列数据预测方法,其特征在于,卡尔曼增益Hk表示为:其中, 表示第k时刻的深度LSTM神经网络的预测偏差; 表示第k时刻的AR模型的预测偏差;H为调节因子。