1.一种基于四分位与改进孤立最近邻的风电功率异常数据检测方法,其特征是,包括以下步骤:步骤1、去除功率0值附近堆积型异常数据;
步骤2、划分风速区间;
步骤3、采用四分位法对风电功率异常值进行初步检测;
步骤4、采用改进孤立最近邻方法对风电功率异常值进行二次检测。
2.根据权利要求1所述的风电功率异常数据检测方法,其特征是,步骤1的具体方式是:根据风电机组出厂参数提供的切入风速,选择大于该风速值的运行数据,判断对应的风电功率值是否满足剔除阈值,大于该阈值的保留,小于该阈值的去除,阈值设定为风电机组额定功率的5%。
3.根据权利要求2所述的风电功率异常数据检测方法,其特征是,步骤2的具体划分方式是:将风速在最小值与最大值之间以0.5m/s的区间进行划分,对每个风速区间内的功率值从小到大进行排序。
4.根据权利要求3所述的风电功率异常数据检测方法,其特征是,步骤3的具体操作方式是:对划分好的每个风速区间内的功率值pk从小到大进行排序,得到每个风速区间内的功率值序列:p=[p1,p2,…,pn];
计算上述功率值序列中25%的分位数Q1和75%的分位数Q3:
由分位数Q1和分位数Q3计算四分位距IQR:
IQR=Q3‑Q1 (3)定义正常值的范围[R1,R2]:[R1,R2]=[Q1‑1.5IQR,Q3+1.5IQR] (4)式中,R1为正常值区间的下边界,R2为正常值区间的上边界;
通过计算正常值区间的下边界R1和正常值区间的上边界R2,获得正常值的范围为:[R1,R2],对于超出正常值范围[R1,R2]内限的值,即为通过四分位法识别出的异常值;对于满足正常值范围[R1,R2]内限的值,则予以保留。
5.根据权利要求4所述的风电功率异常数据检测方法,其特征是,步骤4的具体操作方式是:定义分类器数量为C,第c个分类器(c=1,2,…,C)的生成方式如下:在训练样本ψ中随机均匀抽取一个子样本ψc,设ψc的样本数量为Nc;以子样本ψc中的每个样本点p为中心,构建Nc个超球的集合,每个超球以其最近邻样本间的欧式距离为半径;其中,两个样本间的欧式距离{||a,b||,a,b∈ψc}定义为:式中,N为样本的维度;
定义ηp是样本点p的最近邻样本;B(p)是以样本点p为中心、半径为τ(p)=||p‑ηp||的超球;给定一个测试点x,通过判断测试点x所在的超球及最近邻超球的半径,计算该测试点的修正异常分数 为:式中, ζ(x)表示点x所在最小超球的球心,ηξ(x)表示ζ(x)附近最小超球半径的近邻点;max(τ(p))为子样本ψc所构建的超球组最大超球的半径,为全局系数;
在对全体数据进行测试后,计算所有数据的异常评分,对评分数据进行排序,在设定剔除比例后,对评分较高部分进行剔除,完成对风电功率异常值的二次检测。