1.一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,包括以下步骤:(1)获取光伏电站历史运行数据,该数据集包含历史光伏发电功率数据和NWP气象数据;利用互信息熵对NWP中的气象因子与光伏功率进行相关性分析,筛选出相关程度最高的气象因子,并采用矩阵填充算法对相关程度最高的气象因子进行修正;
(2)考虑不同区域内光伏电站之间的时空关联特性,通过构建属性图来捕捉光伏发电功率在时间和空间上的动态特征;
(3)采用多层图注意力网络从属性图中提取空间特征,进行多个相邻光伏电站之间的空间依赖建模;
(4)采用时间卷积网络从属性图中来挖掘时间相关特征,进行多个相邻光伏电站之间时间依赖建模;
(5)基于步骤(2)、(3)、(4)建立时空图注意力卷积网络模型STGATCN,采用改进的序贯模型优化算法对STGATCN模型的超参数进行优化;所述改进的序贯模型优化算法为使用元学习方法对序贯模型优化算法进行初始化,使用自动早停策略来自动终止STGATCN模型训练;
(6)将步骤(3)、(4)提取到的时空特征送入训练好的STGATCN模型的全连接预测输出层,输出光伏发电功率预测结果;
步骤(1)所述利用互信息熵对NWP中的气象因子与光伏功率进行相关性分析实现过程如下:把气象数据看作是一种随机变量,对于每一个随机变量A=[a1,a2,…,an],其中n是指随机变量A的样的本量,将随机变量A进行[0,1]归一化处理:式中,A0代表了随机变量A的归一化后的结果;
将X定义为向量A0的组间距,Di是向量X0的波动区间边缘:
用数字边界作划分条件,用一维柱状图进行分析;将矢量A0分成n个波动区间,对于第i个波动区间,Ai为:Ai∈[Di,Di+1]i=1,2,…,n(4)
对每个波动区间Ai的边缘概率密度P(Ai)进行计算:
式中,ni表示向量A0中的元素落入波动区间Ai的数据点数;使用自信息熵H(Ai)来对向量A自身随机波动的不确定性进行表征:根据香农信息论,将一维向量的自信息熵H(Xi)扩展为二维向量的互信息I(A;B),即:式中,B是区别于A的另一个代表气象的矢量;p(Bj)代表波动区间Bj的边缘概率密度;p(AiBj)代表A0、B0在波动区间Ai、Bj的联合概率密度;
对广义互信息I(A;B)进行归一化处理,得到MIE相关系数IAB为:式中,H(B)代表了向量B的自信息熵。
2.根据权利要求1所述的一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,步骤(1)所述采用矩阵填充算法对相关程度最高的气象因子进行修正实现过程如下:气象数据的矩阵为C=(cij)m×n,其中m代表了NWP气象数据,n代表了气象预报时间,cij是用相应的时空点的实测数据来表示矩阵中各要素的数值;投影矩阵由[01]来确定在这个时间点上是否进行采集,对应的采样矩阵是:式中,(P[C]Ω)i,j代表采样矩阵,Ω代表采样矩阵元素下标的集合;
基于矩阵填充算法将未采集到的数据进行填充,当数据被填充时,用核范数来代替秩,并且定义如下:式中,S代表重构矩阵,||S||为矩阵S的核范数,σi为S中降序排列的第i个奇异值;
在秩最小化的条件下,解决核范数最小化的重构未知矩阵为:
式中,Cij为采集到的值;Ω为采样矩阵元素下标的集合;
首先,将式(11)正则化,表达式如下:
式中,当τ→+∞时,最优化问题的最优解收敛到式(11)的最优解, 代表S的F范数,τ||S||代表原始的损失函数,PΩ(i)是一个投影算子;
其次,构造式(12)的拉格朗日函数:
式中,L(S,T)代表拉格朗日函数,T是对偶变量,通过交替迭代方法求解,表达式如下:式中,δK代表步长,k代表迭代次数。
3.根据权利要求1所述的一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,所述步骤(2)实现过程如下:构建属性图G(V,E)捕捉光伏发电功率在时间和空间上的动态特征,其中V和E分别表示属性图的节点和边;光伏电站位置表征为图节点,每个节点Vi具有关联的静态特征向量和一组矩阵形式的动态特征;静态特征包含光伏电站的位置信息,动态特征包含光伏电站S类历史特征;对不同光伏电站之间的地理邻近性进行建模定义,节点之间的连接可以用边的权重来描述;根据光伏电站的高斯核阈值距离函数,定义节点i和j之间的边的权重Wi,j:其中,dist(i,j)为光伏电站i和光伏电站j之间的地理距离;σ为n个光伏电站两两之间距离的标准差;ε是阈值,如果距离小于阈值,则默认两个光伏电站没有连接,以保证图结构的稀疏性。
4.根据权利要求1所述的一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,所述步骤(3)实现过程如下:采用多层图注意力网络GAT从属性图中提取时空特征,通过聚合相邻节点来更新每个节点的嵌入;每个位置根据移动性从相邻位置接收信息,以模拟给定区域中多个光伏电站之间时空特征信息的交互;在第t个时间步处,节点i的输入表示为 其中M表示输入窗口的时间步长;将历史特征输入到属性图中;应用图注意力机制计算每个节点的注意力值,表示为 其中Fz是GAT层的输出维度;使用多头机制来计算K个独立的注意力分数,以便计算 节点i和节点j之间的第k个头的注意力权重 计算如下:其中, 是第k个头的线性变换权重矩阵,将输入维度转换为输出维度;
是第k个头的注意力计算矩阵;(·|·)表示串联操作;注意力得分 计算如下:
其中,节点i的每条边都具有一个注意力分数,用于评估应该从相邻节点j聚合多少信息;将来自多个头的所有嵌入向量相加以建立节点i的最终表示如下:
5.根据权利要求1所述的一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,所述步骤(4)实现过程如下:采用时间卷积网络TCN挖掘时间相关特征,对于一维输入序列
卷积核为 则第t个时间步的卷积定义如下:
其中,d是膨胀因子,k是卷积核的大小,t‑d·m指示过去的方向;
经过一系列的卷积运算,输入序列被映射为包含时间信息的隐式向量Ht:Ht=Γ(xt,{Wt})+Convdim(xt) (20)其中,Γ表示由非线性因果扩展卷积、非线性激活函数、权重归一化和dropout正则化组成的卷积运算模块,Wt是可学习的权重向量,Convdim用于调整输入向量的维度,实现残差连接的向量加法运算。
6.根据权利要求1所述的一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,步骤(5)所述使用元学习方法对序贯模型优化算法进行初始化具体实现过程如下:S1:提取元特征:利用经过训练的样本特征提取器和数据集特征提取器可以获得一个J代表数据集J的元特征向量m;
S2:寻找相似的数据集:在步骤S1的基础上,使用k近邻算法找到k个与当前数据集相似度最高的历史数据集;
S3:初始化贝叶斯优化,通过历史优化记录,可以提取步骤S2中k个历史数据集的最佳超参数,并将它们作为序贯模型优化算法的初始点,以加速整个优化过程并改善最终的优化效果。
7.根据权利要求1所述的一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,步骤(6)所述使用自动早停策略来自动终止预测模型训练实现过程如下:L1:更新超参数:将超参数R更新到STGATCN模型中;
L2:STGATCN模型训练:在模型训练的初期,模型按照正常流程进行训练,直到达到需要判断是否提前停止训练的特定训练次数;
L3:判断早停:在达到特定的训练次数后,使用测试集对STGATCN模型进行提前评估;即停止当前训练进程,使用当前模型对测试集进行测试,并得到本组超参数的早期性能值;然后,将该早期性能值与历史超参数的早期性能值进行比较;如果本组超参数的早期性能值明显优于大部分历史超参数的早期性能值,则继续进行训练直到达到最大训练次数;否则,模型训练将被提前终止;
L4:输出STGATCN模型性能:如果模型按照正常流程一直训练到达最大训练次数,将直J J接输出模型在数据集J的测试集上的最终性能值f (R);为了近似代替其真实性能f (R),选择早期性能最接近的两个历史超参数性能的平均值。
8.根据权利要求1所述的一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,步骤(6)所述采用改进的序贯模型优化算法对STGATCN模型的超参数进行优化,具体实现过程如下:TCN模型需要优化的超参数组为(K,F,N,P,λ,η),GAT模型需要优化的超参数为(σ,H,P,λ,η),其中,K表示卷积核大小、F表示卷积核数量、N表示残差块数量、P表示Dropout丢弃率、λ表示正则化参数、η表示学习率、σ表示注意力头数、H表示隐藏层节点数;超参数优化的表示如下式所示:式中:f(m)代表预测模型的评价指标RMSE,能够衡量光伏功率预测模型性能的度量指标,它要求使其最小;m代表了超参数组((K,F,N,P,λ,η)、(σ,H,P,λ,η));M代表m取值的超参数域;m*表示使得评价指标RMSE的分数最低的超参数;
贝叶斯优化利用自适应且评估成本较低的代理模型来近似预测模型的评价指标RMSE;
贝叶斯优化基于已有的N组试验结果R对目标函数进行建模,并计算y的后验分布p(w|m,R)作为代理模型,代理模型采用了TPE估计方法,下面是p(w|m)的计算表达式:收益函数对一个超参数组给代理模型带来的收益进行评估,收益越大则更新后的代理模型就会愈靠近模型的评价指标RMSE,收益函数为:*
其中,w=min{wn,1≤n≤N}是已有样本中的最优值,R为超参数。
9.根据权利要求1所述的一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,所述步骤(6)实现过程如下:经过基于图注意力网络的空间依赖挖掘和基于时间卷积网络的时间依赖挖掘后,得到隐含多源数据的时空特征向量Ht,然后将时空特征向量Ht送入全连接预测输出层进行处理,最后输出光伏发电功率预测结果 全连接预测输出层计算公式如下:其中,Ψf为全连接层激活函数,Wf和Bf分别为全连接层的权重矩阵和偏置矩阵。