1.一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法,其特征在于:该方法包括以下步骤:S1:基于堆栈降噪自编码的故障数据特征提取阶段;
S2:基于主成分分析的故障特征降维阶段;
S3:基于密度峰快速搜寻聚类CFSFDP的故障数清洗阶段;
所述S1具体为:
堆栈降噪自编码网络结构为:输入层输入数据为纯净向量数据加噪后的含噪数据,中间隐藏层包含多个网络层构成栈式堆叠效果,以获取更抽象准确的数据特征;经过编码隐藏层的特征学习后进入解码隐藏层,对含噪数据进行纯净向量数据复现学习,最终由输出层输出原纯净数据;
对于输入数据x,通过加噪器对原始数据进行加噪化,从而得到加噪数据xn;输入加噪数据,经过堆栈式自编码器进行xn数据更有价值的特征提取,最终输出为复现数据yr:在整个自编码特征学习过程中可在中间隐藏层进行特征值输出,提取数据的价值特征;
所述S2具体为:
主成分分析PCA定义为:在向量空间{tn},n∈{1,2,…,N}中搜寻q个正交主向量wk,k∈{1,2,3…,q},获得{tn}在wk子空间上的最大方差值,在高维数据中提取低维的线性无关主成分特征,在方差最大的方向选取投影保留更多的原始数据特征信息;
所述S3具体为:
设数据集Z={x1,x2,x3,…,xn}中有n组数据,集中任意两组m维数据之间的距离为用欧氏距离记 对于离散数据xi的局部密度使用高斯核函数连续化后为:
dc设定为人为设定截断距离;
xi与比其局部密度更高的数据组的距离为:
在聚类过程中选定对应局部密度ρi较大,δi较大的数据组为各类簇中心,其余的数据组根据自身的ρi,xi归类于各个类簇中心所表示的类簇,再或者由于dc的设置原因,造成其余数组在各类簇中存在交叠点,存在的交叠点则不为类簇的核元素。
2.根据权利要求1所述的一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法,其特征在于:所述密度峰快速搜寻聚类CFSFDP中,通过计算正确清洗率和错误清洗率来衡量模型聚类效果: