1.基于广义最大相关熵准则的核极限学习机售电量预测方法,其特征在于,具体操作过程包括如下步骤:步骤1、数据预处理
对历史日用电量数据中的异常数据进行修正,并对缺失数据进行补充;
步骤2、构建训练样本集
以历史日用电量以及所对应日最高温度作为模型的训练样本集,并利用皮尔逊相关系数选定模型输入,皮尔逊相关系数计算公式如式(3):
其中,x为训练样本集数据,包括历史用电量数据与温度数据,t为历史用电量数据;
步骤3、数据标准化
电量预测时主要用到的数据有历史日用电量数据和与之相对应的历史温度数据,为了减小因两种数据数量级相差较大对预测准确性造成的影响,对数据进行标准化处理,标准化公式如式(4):其中,xi为数据真实值,xmin为该类数据的最小值,xmax为该类数据的最大值;
步骤4、针对历史日用电量数据的非线性特征,选用核极限学习机模型KELM对日用电量进行预测,针对售电量预测误差的非高斯特征,使用广义最大相关熵准则GMCC代替核极限学习机中均方误差准则MSE作为预测模型的代价函数;
步骤5、引入在线序列学习,使预测模型可以进行滚动预测;
步骤6、引入K-折交叉验证与网格寻优对基于广义最大相关熵的核极限学习机模型的关键参数σ、λ、α进行优化;
步骤7、用广义最大相关熵核极限学习机预测模型对售电量进行预测,得到预测结果,并选用MAPE指标对预测结果进行评价:
2.根据权利要求1所述的基于广义最大相关熵准则的核极限学习机售电量预测方法,其特征在于:步骤1的具体过程是:对历史日用电量数据中的异常数据进行修正,并对缺失数据进行补充,当数据满足则视数据为异常数据,其中此外,根据式(2)对历史用电量中的异常数据与缺失数据进行修正:其中,ti为历史用电量数据真实值,为数据修正值, 为数据均值,δ为数据标准差,N为数据总量, ξ、ζ为权重系数,ε为阈值。
3.根据权利要求1所述的基于广义最大相关熵准则的核极限学习机售电量预测方法,其特征在于:步骤4的具体过程是:普通ELM模型可表示为 其中,β为极限学习机输出权值,L为隐含层节点数,wj为输入权值,bj为偏置系数,wj与bj是随机生成,yi为模型输出,ELM训练的目标是使输出值yi与训练样本历史用电量值ti间的误差最小化,即 该式写成矩阵形式为式(5):据此有 则β的最小二乘解为:
为了使式(6)具有稳定的泛化性,引入正则化系数到矩阵HHT的对角线上,得到β计算公式为:其中,T为训练样本真实值矩阵,H为激励函数矩阵形式,C为正则化系数;
ELM核矩阵表达式如下:
ΩELM=HHT:ΩELMi,j=h(xi)·h(xj)=k(xi,xj) (8)且高斯核函数的表达式为:
其中,σ为核参数,则核极限学习机模型可表达为
其中,T为训练样本真实值矩阵,H为激励函数矩阵形式,C为正则化系数,记 则有:y(x)=k(x)β (11)采用广义最大相关熵准则代替均方误差准则,使核极限学习机模型在训练样本满足非线性、非高斯分布的情况下,也可以训练得到合适的参数、有效预测出售电量,广义最大相关熵的表达式见(12):其中,α>0是形状参数,λ>0是广义高斯密度函数的核参数,γα,λ是归一化常数,N是训练样本数,yi为模型预测值,ti为实际值,且当预测值与实际值相等时该式有最大值。
4.根据权利要求1所述的基于广义最大相关熵准则的核极限学习机售电量预测方法,其特征在于:步骤5的具体过程是:将在线序列学习与ELM结合,当数据更新时,只需要学习新数据并更新参数,而不需要重复学习旧数据,极大缩短模型的训练时间;引入在线序列学习之后,得出网络输出权值β的更新公式:其中,Nk是更新的第k部分数据的个数,
5.根据权利要求1所述的基于广义最大相关熵准则的核极限学习机售电量预测方法,其特征在于:步骤6中具体过程是:引入K-折交叉验证与网格寻优对广义最大相关熵核极限学习机模型的关键参数σ、λ、α进行优化,首先根据样本实际情况给定每个参数取值范围,再将每个参数区间分为若干网格,其中每个网格代表一组参数,选取令广义最大相关熵值最大的网格所对应的参数为模型最优参数。