1.一种区域风电功率预测方法,其特征在于,所述方法包括:
获取目标区域风电场的湿度序列、气压序列、温度序列、不同高度风向正弦序列、不同高度风向余弦序列、不同高度风速序列、光照序列、光伏发电序列、风电功率序列;
基于地理位置信息,对目标区域风电场进行聚类,得到多个目标子风电场,利用时间关联性指标与波动性指标,对多个目标子风电场进行特性划分;其中时间关联性指标为自相关性分析系数与周期性系数,波动性指标为变异系数与方差系数;
对多个目标子风电场分别赋予时间关联性与波动性的标签,根据时间关联性与波动性的强弱,将目标区域风电场划分为多个目标子集群,每个目标子集群分别使用不同的预测模型进行风电功率预测;
利用不同学习方法对各目标子集群的预测模型进行集成,建立多种集成模型,并进行模型评估,选出性能最优的集成模型作为最终预测模型,基于所述最终预测模型实现区域风电功率预测;
通过如下方法计算时间关联性指标与波动性指标:
获取目标区域风电场中目标子风电场的风电功率序列x1‑xn;
通过如下公式计算目标子风电场的自相关性分析系数:
式中,n表示功率序列的个数,表示功率序列的均值,k表示滞后阶数,rk表示自相关性分析系数;
基于目标区域风电场中目标子风电场的风电功率序列x1‑xn,按月份进行划分,根据每月的风电功率序列构建特征矩阵X,对特征矩阵X进行周期性分析,得到周期性系数:式中,m为样本数量,di为每个功率数据点的秩值之差,rs为周期性系数;
通过如下公式计算变异系数:
式中,CV表示变异系数,n表示功率序列的个数,表示功率序列的均值,xi表示第i个样本值;
对风电功率序列x1‑xn进行归一化,得到归一序列:
式中,t表示归一化后的数据,ti表示第i个样本值,tmin表示风电功率序列中最小值,tmax表示风电功率序列中最大值;
2
对归一序列进行方差计算,得到方差系数σ:
式中,表示归一化后序列的平均值;
对多个目标子风电场分别赋予时间关联性与波动性的标签,根据时间关联性与波动性的强弱,将目标区域风电场划分为多个目标子集群,包括:按照功率序列时间关联性与波动性的强弱对多个目标子风电场赋予标签特性,所述标签特性分为时间关联性强、波动性强,时间关联性强、波动性弱,时间关联性弱、波动性强,时间关联性弱、波动性弱;
对多个带有标签特性的目标子风电场进行聚类,具有相同标签特性的分为一类,得到四个目标子集群;
每个目标子集群分别使用不同的预测模型进行风电功率预测,包括:
对于标签特性为时间关联性强、波动性强的目标子集群,预测方法如下:
获取目标区域中k个目标子风电场的风电功率序列x1‑xk,通过添加白噪声时间序列得到功率序列,以构建新的时间序列Yn(t),基于经验模态分解,将新的时间序列列Yn(t)分解为一系列本征模态函数和残差的加和,进行多次迭代,获得降噪分解后的功率序列;
将降噪分解后的功率序列进行异常序列剔除,并将其余序列进行重组,得到分解重组后的功率序列,利用主成分分析对目标子风电场的湿度序列、气压序列、温度序列、不同高度风向正弦序列、不同高度风向余弦序列、不同高度风速序列、光照序列、光伏发电序列进行降维,将降维后的气象数据与分解重组后的功率序列作为输入数据集,选取第一预测模型进行预测,所述第一预测模型包括卷积神经网络和LSTM网络,其中所述卷积神经网络用于提取序列的空间特征,所述LSTM网络用于提取序列的时间特征,利用序列的空间特征和时间特征对功率序列进行预测;
每个目标子集群分别使用不同的预测模型进行风电功率预测,包括:
对于标签特性为时间关联性强、波动性强的目标子集群,预测方法如下:
获取目标子集群中k个目标子风电场的风电功率序列x1‑xk,利用四分位距法对功率序列进行异常值检验,并返回异常数据与空缺数据值,选取平均项数N
根据目标子风电场的湿度序列、气压序列、温度序列、不同高度风向正弦序列、不同高度风向余弦序列、不同高度风速序列、光照序列、光伏发电序列,构建得到第一特征矩阵,并将填充后的功率序列构造为第二特征矩阵,将第一特征矩阵和第二特征矩阵相加得到特征矩阵X2:式中,xak表示第k个目标子风电场的湿度序列,xbk表示第k个目标子风电场的气压序列,xck表示第k个目标子风电场的温度序列,xdk表示第k个目标子风电场的不同高度风向正弦序列,xik表示第k个目标子风电场的填充后的功率序列;
对特征矩阵X2中的序列分别进行排序并计算秩值之差,通过如下公式计算各序列的重要性程度:式中,di为每个功率数据点的秩值之差,ρ为特征矩阵X2中的序列的重要性;
选取重要性大于等于0.8的序列作为输入数据,对输入序列数据进行反向处理,选取LSTM模型进行预测,当所有时间步计算完成后,将正向序列的结果向量与反向序列的结果向量进行叠加,得到最终的功率预测结果;
每个目标子集群分别使用不同的预测模型进行风电功率预测,包括:
对于标签特性为时间关联性弱、波动性强的目标子集群,预测方法如下:
获取目标子集群中k个目标子风电场的风电功率序列x1‑xk,通过添加白噪声时间序列到功率序列,以构建新的时间序列Yn(t),基于经验模态分解,将被噪声污染的时间序列Yn(t)分解为一系列本征模态函数和残差的加和,进行多次迭代,获得降噪分解后的功率序列:将降噪分解后的功率序列进行异常序列剔除,并将未剔除的序列进行重组,得到分解重组后的功率序列,利用主成分分析对目标子风电场的湿度序列、气压序列、温度序列、不同高度风向正弦序列、不同高度风向余弦序列、不同高度风速序列、光照序列、光伏发电序列进行降维,将降维后的气象数据与分解重组后的功率序列作为CNN‑LSTM模型的输入数据集,得到特征数据,在分解重组后的功率序列中随机选取多个数据,构建样本子集,在多个特征数据中随机选取若干个特征,构建特征子集,基于样本子集和特征子集构建一个决策树,在每个节点处,选择一个最优特征进行分裂,通过不断迭代,在每个节点都只包含一个样本时停止预测,以此构建多棵决策树,选取预测效果最优的解作为最终的预测结果;
每个目标子集群分别使用不同的预测模型进行风电功率预测,包括:
对于标签特性为时间关联性弱、波动性弱的目标子集群,预测方法如下:
获取目标子集群中k个目标子风电场的风电功率序列x1‑xk,利用四分位距法对功率序列进行异常值检验,并返回异常数据与空缺数据值,选取平均项数N
根据目标子风电场的湿度序列、气压序列、温度序列、不同高度风向正弦序列、不同高度风向余弦序列、不同高度风速序列、光照序列、光伏发电序列,构建得到第一特征矩阵,并将填充后的功率序列构造为第二特征矩阵,将第一特征矩阵和第二特征矩阵相加得到特征矩阵X2:式中,xak表示第k个目标子风电场的湿度序列,xbk表示第k个目标子风电场的气压序列,xck表示第k个目标子风电场的温度序列,xdk表示第k个目标子风电场的不同高度风向正弦序列,xik表示第k个目标子风电场的填充后的功率序列;
以特征矩阵X2作为输入数据集,利用XGBoost算法进行预测,对特征矩阵X2中所有可能的序列组合计算shapley值并加权求和,得到相关特征的重要性程度:式中,X表示模型中使用的特征子集,x表示功率序列的特征值向量,p为特征数量,val(X)表示在特征组合X下的输出值,val(X∪{xj})表示第j个特征值向量加入特征子集X后为X带来的边际贡献, 表示相关特征的重要性程度,xp表示第p个特征值向量,xj表示第j个特征值向量;
选取重要性大于等于0.8的序列作为输入数据,利用液态神经网络进行预测。
2.根据权利要求1所述的方法,其特征在于,利用时间关联性指标与波动性指标,对多个目标子风电场进行特性划分,包括:当目标子风电场的自相关性分析系数大于0.01时,判断所述目标子风电场的自相关性强;当目标子风电场的自相关性分析系数小于等于0.01时,判断所述目标子风电场的自相关性弱;
当目标子风电场的周期性系数大于0.8时,判断所述目标子风电场的周期性强;当目标子风电场的周期性系数小于等于0.8时,判断所述目标子风电场的周期性弱;
当目标子风电场的自相关性分析系数与周期性系数同时判断为强时,判定所述目标子风电场的时间关联性强,当目标子风电场的自相关性分析系数与周期性系数未同时判断为强时,判定所述目标子风电场的时间关联性弱;
当目标子风电场的变异系数大于100%时,判断所述目标子风电场的差异性强,当目标子风电场的变异系数小于等于100%时,判断所述目标子风电场的差异性弱;
当目标子风电场的方差系数大于0.06时,判断所述目标子风电场的离散性强,当目标子风电场的方差系数小于等于0.06时,判断所述目标子风电场的离散性弱;
当目标子风电场的差异性与离散型同时判断为强时,判定所述目标子风电场的波动性强,当目标子风电场的差异性与离散型未同时判断为强时,判定所述目标子风电场的波动性弱。
3.一种区域风电功率预测装置,其特征在于,所述装置包括:
数据获取模块,被配置为获取目标区域风电场的湿度序列、气压序列、温度序列、不同高度风向正弦序列、不同高度风向余弦序列、不同高度风速序列、光照序列、光伏发电序列、风电功率序列;
特性划分模块,被配置为基于地理位置信息,对目标区域风电场进行聚类,得到多个目标子风电场,利用时间关联性指标与波动性指标,对多个目标子风电场进行特性划分;其中时间关联性指标为自相关性分析系数与周期性系数,波动性指标为变异系数与方差系数;
第一预测模块,被配置为对多个目标子风电场分别赋予时间关联性与波动性的标签,根据时间关联性与波动性的强弱,将目标区域风电场划分为多个目标子集群,每个目标子集群分别使用不同的预测模型进行风电功率预测;
第二预测模块,被配置为利用不同学习方法对各目标子集群的预测模型进行集成,建立多种集成模型,并进行模型评估,选出性能最优的集成模型作为最终预测模型,基于所述最终预测模型实现区域风电功率预测;
对多个目标子风电场分别赋予时间关联性与波动性的标签,根据时间关联性与波动性的强弱,将目标区域风电场划分为多个目标子集群,包括:按照功率序列时间关联性与波动性的强弱对多个目标子风电场赋予标签特性,所述标签特性分为时间关联性强、波动性强,时间关联性强、波动性弱,时间关联性弱、波动性强,时间关联性弱、波动性弱;
对多个带有标签特性的目标子风电场进行聚类,具有相同标签特性的分为一类,得到四个目标子集群;
每个目标子集群分别使用不同的预测模型进行风电功率预测,包括:
对于标签特性为时间关联性强、波动性强的目标子集群,预测方法如下:
获取目标区域中k个目标子风电场的风电功率序列x1‑xk,通过添加白噪声时间序列得到功率序列,以构建新的时间序列Yn(t),基于经验模态分解,将新的时间序列列Yn(t)分解为一系列本征模态函数和残差的加和,进行多次迭代,获得降噪分解后的功率序列;
将降噪分解后的功率序列进行异常序列剔除,并将其余序列进行重组,得到分解重组后的功率序列,利用主成分分析对目标子风电场的湿度序列、气压序列、温度序列、不同高度风向正弦序列、不同高度风向余弦序列、不同高度风速序列、光照序列、光伏发电序列进行降维,将降维后的气象数据与分解重组后的功率序列作为输入数据集,选取第一预测模型进行预测,所述第一预测模型包括卷积神经网络和LSTM网络,其中所述卷积神经网络用于提取序列的空间特征,所述LSTM网络用于提取序列的时间特征,利用序列的空间特征和时间特征对功率序列进行预测;
每个目标子集群分别使用不同的预测模型进行风电功率预测,包括:
对于标签特性为时间关联性强、波动性强的目标子集群,预测方法如下:
获取目标子集群中k个目标子风电场的风电功率序列x1‑xk,利用四分位距法对功率序列进行异常值检验,并返回异常数据与空缺数据值,选取平均项数N
根据目标子风电场的湿度序列、气压序列、温度序列、不同高度风向正弦序列、不同高度风向余弦序列、不同高度风速序列、光照序列、光伏发电序列,构建得到第一特征矩阵,并将填充后的功率序列构造为第二特征矩阵,将第一特征矩阵和第二特征矩阵相加得到特征矩阵X2:式中,xak表示第k个目标子风电场的湿度序列,xbk表示第k个目标子风电场的气压序列,xck表示第k个目标子风电场的温度序列,xdk表示第k个目标子风电场的不同高度风向正弦序列,xik表示第k个目标子风电场的填充后的功率序列;
对特征矩阵X2中的序列分别进行排序并计算秩值之差,通过如下公式计算各序列的重要性程度:式中,di为每个功率数据点的秩值之差,ρ为特征矩阵X2中的序列的重要性;
选取重要性大于等于0.8的序列作为输入数据,对输入序列数据进行反向处理,选取LSTM模型进行预测,当所有时间步计算完成后,将正向序列的结果向量与反向序列的结果向量进行叠加,得到最终的功率预测结果;
每个目标子集群分别使用不同的预测模型进行风电功率预测,包括:
对于标签特性为时间关联性弱、波动性强的目标子集群,预测方法如下:
获取目标子集群中k个目标子风电场的风电功率序列x1‑xk,通过添加白噪声时间序列到功率序列,以构建新的时间序列Yn(t),基于经验模态分解,将被噪声污染的时间序列Yn(t)分解为一系列本征模态函数和残差的加和,进行多次迭代,获得降噪分解后的功率序列:将降噪分解后的功率序列进行异常序列剔除,并将未剔除的序列进行重组,得到分解重组后的功率序列,利用主成分分析对目标子风电场的湿度序列、气压序列、温度序列、不同高度风向正弦序列、不同高度风向余弦序列、不同高度风速序列、光照序列、光伏发电序列进行降维,将降维后的气象数据与分解重组后的功率序列作为CNN‑LSTM模型的输入数据集,得到特征数据,在分解重组后的功率序列中随机选取多个数据,构建样本子集,在多个特征数据中随机选取若干个特征,构建特征子集,基于样本子集和特征子集构建一个决策树,在每个节点处,选择一个最优特征进行分裂,通过不断迭代,在每个节点都只包含一个样本时停止预测,以此构建多棵决策树,选取预测效果最优的解作为最终的预测结果;
每个目标子集群分别使用不同的预测模型进行风电功率预测,包括:
对于标签特性为时间关联性弱、波动性弱的目标子集群,预测方法如下:
获取目标子集群中k个目标子风电场的风电功率序列x1‑xk,利用四分位距法对功率序列进行异常值检验,并返回异常数据与空缺数据值,选取平均项数N
根据目标子风电场的湿度序列、气压序列、温度序列、不同高度风向正弦序列、不同高度风向余弦序列、不同高度风速序列、光照序列、光伏发电序列,构建得到第一特征矩阵,并将填充后的功率序列构造为第二特征矩阵,将第一特征矩阵和第二特征矩阵相加得到特征矩阵X2:式中,xak表示第k个目标子风电场的湿度序列,xbk表示第k个目标子风电场的气压序列,xck表示第k个目标子风电场的温度序列,xdk表示第k个目标子风电场的不同高度风向正弦序列,xik表示第k个目标子风电场的填充后的功率序列;
以特征矩阵X2作为输入数据集,利用XGBoost算法进行预测,对特征矩阵X2中所有可能的序列组合计算shapley值并加权求和,得到相关特征的重要性程度:式中,X表示模型中使用的特征子集,x表示功率序列的特征值向量,p为特征数量,val(X)表示在特征组合X下的输出值,val(X∪{xj})表示第j个特征值向量加入特征子集X后为X带来的边际贡献, 表示相关特征的重要性程度,xp表示第p个特征值向量,xj表示第j个特征值向量;
选取重要性大于等于0.8的序列作为输入数据,利用液态神经网络进行预测。
4.一种存储有指令的非暂时性计算机可读存储介质,当所述指令由处理器执行时,执行根据权利要求1至2中任一项所述的方法。