1.一种基于多尺度相似日和改进型集成算法的光伏功率预测方法,其特征在于,包括以下步骤:(1)根据收集到的NWP数据集,使用变异系数法计算各气象因子权重;包括以下步骤:(11)对气象因子历史日数据进行归一化处理,公式如下:;
其中, 为第i个气象日第j个气象因子的归一化值, 为第j个气象因子的值,和 分别为第j个气象因子的最大值和最小值;
(12)构建基于多个气象因子的特征矩阵;具体如下:设NWP数据有n个待评价样本和p个评价指标,则特征矩阵如下:;
其中,X为特征矩阵, 为第n个待评价样本的第p个评价指标;
(13)计算各评价指标的均值和标准差,公式如下:;
;
其中, 为各评价指标的均值, 为各评价指标的标准差;
(14)计算各评价指标的变异系数,公式如下:;
其中, 为各评价指标的变异系数, 和 为各评价指标的均值和标准差;
(15)计算各气象因子的权重,公式如下:;
其中, 为各气象因子的权重;
(2)根据各气象因子的权重,采用多尺度相似日法计算预测日与各历史日气象因子的相似度,并选择相似度与预测日相近的历史日作为后续模型的训练集;包括以下步骤:(21) 计算气象因子在历史日与预测日之间的DTW距离;
(22)计算历史日与预测日之间的马氏距离,公式如下:;
;
其中,X和Y为两个N维变量, 为X和Y之间的协方差矩阵, 为所求得的历史日与预测日之间的马氏距离;
(23)计算多尺度下的相似度,公式如下:;
其中,n为影响光伏发电的气象因子的个数, 为各气象因子的权重, 为第i个气象因子变量历史日与预测日之间的DTW距离, 为第i个气象因子变量历史日与预测日之间的马氏距离, 为多尺度相似日下历史日与预测日之间的相似度;
(24)选择历史日NWP数据作为训练集,公式如下:;
;
;
其中, 为相似度阈值常数, 为多尺度相似日下用于训练集的历史日气象因子数据向量, 为用于输入模型的训练集;
(3)利用SRCC分析特征与目标值之间的相关性,并选择训练集中的特征组合作为基础模型的输入;
(4)使用LSTM和informer基础模型对训练集的短、长时间序列进行特征提取,采用TSCV法以Stacking集成算法作为框架生成元特征序列;
(5)根据集成算法提取的元特征序列利用多元LR拟合特征序列与目标值之间的映射关系,最终得到光伏功率的预测值。
2.根据权利要求1所述的一种基于多尺度相似日和改进型集成算法的光伏功率预测方法,其特征在于,所述步骤(21)包括以下步骤:(211)根据NWP数据提取历史日与预测日的数据序列,具体如下:;
;
其中, 为第i个长度为n的历史日NWP数据序列, 为第j个长度为m的预测日NWP数据序列;
(212)构建关键矩阵,公式如下:;
;
其中, 表示 序列中的某个元素和 序列中某个元素之间的距离;
是对齐两个序列中的元素后得到的矩阵;
(213)计算历史日与预测日之间的DTW距离,公式如下:;
其中, 表示历史日序列 和预测日序列 的动态弯曲距离,则是根据 和 的序列长度n和m得到的矩阵。
3.根据权利要求1所述的一种基于多尺度相似日和改进型集成算法的光伏功率预测方法,其特征在于,所述步骤(3)包括以下步骤:(31)利用SRCC进行特征分析,公式如下:;
其中, 和 y 表示特征和目标值的原始值, 和 代表各自的均值,系数 是用于评价第i个特征与目标值之间的相关性;当两个变量完全单调相关时, 的值为 ;
(32)利用SRCC进行特征选择,具体如下:将 值从大到小进行排序,按照相关性进行分类,挑选 值大于0.4的数据特征作为基础模型的输入。
4.根据权利要求1所述的一种基于多尺度相似日和改进型集成算法的光伏功率预测方法,其特征在于,所述步骤(4)包括以下步骤:(41)使用LSTM模型对短时间序列进行特征提取,公式如下:其中, 为t时刻LSTM单元的输入, 、 和 分别代表t时刻输入门、遗忘门和输出门的输出; 表示t时刻记忆单元的输出, 表示t时刻的候选记忆单元; 、 、和 分别表示t时刻输入门、遗忘门、输出门和MC的权值矩阵, 、 、 和则是表示t时刻隐藏层的权值矩阵, 、 和 分别为t时刻三个门的偏置向量, 表示sigmoid函数, 表示双曲正切函数, 表示t时刻最终的输出;
(42)使用informer模型对长时间序列进行特征提取,具体如下:首先,Q、K和V分别为“查询向量”、“关键向量”和“值向量”组成的矩阵, 为输入的维度;则:;
将上述公式改写为概率公式:
;
其中, 、 和 分别表示Q、K和V矩阵中的第i行, 是 和 之间相似度的函数,用于选择不对称指数内核 ;
然后,对稀疏度指标进行度量:;
其中, 为注意力概率分布,表示 对 的注意力权重 为均匀分布,表示每个 的权重相等, 表示K的长度;
;
其中, 表示概率分布与均匀分布之间的散度;
;
其中, 为删除常量后查询第i行向量,近似得到的稀疏度定义式;
;
其中, 为Probspace自关注系数, 为相对远离均匀分布 的查询向量组成的矩阵;
再次,将得到的Probspace自关注系数 输入编码器,接着引入蒸馏,采样个点积对,每层的计算复杂度 降低一半;
;
其中, 表示从 j层到j+1层的蒸馏过程;
;
最后,采用生成式预测,将前1%的预测序列输入解码器,其中 为输入解码器的前
1%序列, 为全部预测序列, 为解码器输出的多步结果;
;
其中, 为通过累次推理得到的长时间序列的最终输出结果;
(43)使用TSCV法以Stacking集成算法为框架提取元特征序列,具体如下:;
将数据集S按照TSCV的时间顺序划分为l个折叠; 和 为训练集和测试集;
其中, 为给定的原始数据集, 表示目标值, 表示第i个输入特征; 和 表示特征的训练集和测试集, 和 表示目标值的训练集和测试集;
tacking算法共有两层结构,在第一层结构中使用n个基础模型 ,第二层的元特征模型为M;每个基础模型 通过 到 并对 到 的标签列进行预测;在经过 次折叠后,预测结果分别为 和 。
5.根据权利要求1所述的一种基于多尺度相似日和改进型集成算法的光伏功率预测方法,其特征在于,所述步骤(5)中,多元线性拟合计算公式如下:;
其中,y为预测量, 为模型的纵截距, 为自变量的回归系数, 表示模型的随机误差;
;
;
其中, 和 结合,生成新的训练集 和测试集 得到元特征数据集 ;
;
元特征模型M通过 进行训练,然后对 进行预测,得到预测值 ;将元特征数据集 与预测值 进行多重线性拟合,得到最终的预测值Y。
6.一种基于多尺度相似日和改进型集成算法的光伏功率预测系统,其特征在于,包括:因子权重模块:用于根据收集到的NWP数据集,使用变异系数法计算各气象因子权重;
包括以下步骤:
(11)对气象因子历史日数据进行归一化处理,公式如下:;
其中, 为第i个气象日第j个气象因子的归一化值, 为第j个气象因子的值,和 分别为第j个气象因子的最大值和最小值;
(12)构建基于多个气象因子的特征矩阵;具体如下:设NWP数据有n个待评价样本和p个评价指标,则特征矩阵如下:;
其中,X为特征矩阵, 为第n个待评价样本的第p个评价指标;
(13)计算各评价指标的均值和标准差,公式如下:;
;
其中, 为各评价指标的均值, 为各评价指标的标准差;
(14)计算各评价指标的变异系数,公式如下:;
其中, 为各评价指标的变异系数, 和 为各评价指标的均值和标准差;
(15)计算各气象因子的权重,公式如下:;
其中, 为各气象因子的权重;
相似度模块:用于根据各气象因子的权重,采用多尺度相似日法计算预测日与各历史日气象因子的相似度,并选择相似度与预测日相近的历史日作为后续模型的训练集;包括以下步骤:(21) 计算气象因子在历史日与预测日之间的DTW距离;
(22)计算历史日与预测日之间的马氏距离,公式如下:;
;
其中,X和Y为两个N维变量, 为X和Y之间的协方差矩阵, 为所求得的历史日与预测日之间的马氏距离;
(23)计算多尺度下的相似度,公式如下:;
其中,n为影响光伏发电的气象因子的个数, 为各气象因子的权重, 为第i个气象因子变量历史日与预测日之间的DTW距离, 为第i个气象因子变量历史日与预测日之间的马氏距离, 为多尺度相似日下历史日与预测日之间的相似度;
(24)选择历史日NWP数据作为训练集,公式如下:;
;
;
其中, 为相似度阈值常数, 为多尺度相似日下用于训练集的历史日气象因子数据向量, 为用于输入模型的训练集;
相关性模块:用于利用SRCC分析特征与目标值之间的相关性,并选择训练集中的特征组合作为基础模型的输入;
元特征序列模块:用于使用LSTM和informer基础模型对训练集的短、长时间序列进行特征提取,采用TSCV法以Stacking集成算法作为框架生成元特征序列;
预测模块:用于根据集成算法提取的元特征序列利用多元LR拟合特征序列与目标值之间的映射关系,最终得到光伏功率的预测值。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序被加载至处理器时实现根据权利要求1‑5任一项所述的一种基于多尺度相似日和改进型集成算法的光伏功率预测方法。
8.一种存储介质,所述存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现根据权利要求1‑5任一种基于多尺度相似日和改进型集成算法的光伏功率预测方法。