1.基于分段改进S变换和随机森林的复合电能质量扰动识别方法,其特征在于:首先,基于扰动信号特征对改进S变换频域进行分段,并在每一段指定不同的窗宽调节因子值;然后,根据不同频段的频率分布特点提取扰动信号特征,再利用提取的扰动信号特征,构建基于CART算法的RF分类器,对待测信号进行分类。
2.根据权利要求1所述基于分段改进S变换和随机森林的复合电能质量扰动识别方法,其特征在于:使用Gini指数下降,替代分类回归树CART算法中的Gini指数,用于随机森林RF分类器的构建,并能在此过程中自动剔除Gini指数下降为0的特征。
3.根据权利要求1所述基于分段改进S变换和随机森林的复合电能质量扰动识别方法,其特征在于:RF分类器构建过程中,能够自动分辨输入特征是否为离散特征,并采取不同的处理策略:连续的情况:当识别特征为连续特征时,会使用Matlab的单维寻优函数fminbnd计算特征的Ginidec最值,该方法使用了基于黄金分割法和二次插值法的单维寻优方法来进行单维寻优,由于为Matlab软件自带,能直接输出优化最值与其对应的自变量,且运算速度较快;
离散的情况:当识别特征为离散特征时,会根据具体取值类型进行遍历计算,以确定Ginidec的最值,与进行连续单维寻优相比。
4.基于分段改进S变换和随机森林的复合电能质量扰动识别方法,包括以下步骤:步骤1:使用已知类别的电能质量扰动信号训练集,根据预先划分的频率区间,整定分段改进S变换的窗宽调节因子值,得到分段改进S变换处理训练集;
步骤2:根据步骤1中分段改进S变换处理训练集,根据不同频段的频率分布特点提取扰动信号特征;
步骤3:基于CART算法规则,构建RF分类器;
步骤4:将步骤2中训练集的扰动信号特征,输入已经构建好的RF分类器,即可获得测试集各待测信号所含的电能质量扰动类型。
5.根据权利要求4所述基于分段改进S变换和随机森林的复合电能质量扰动识别方法,其特征在于:所述步骤2中,信号分段改进S变换的计算公式如下:其中涉及的S变换的原始形式,及其离散形式分别如式(2)和(3)所示:式(2)中:τ和t为时间,f为频率,h(·)为连续时间序列,e为自然对数底数;
式(3)中,H(·)为离散时间序列,n/(NT)、jT、m分别为f、τ、t对应的离散形式,T为采样周期,N为总采样点数,j和n分别控制时域和频域采样点;
式(1)中,g1,g2,g3分别为低,中,高频段的调节因子,nmax为人为设置的最大采样频率点,默认值为奈奎斯特频率对应的采样点,其他各变量的含义与(3)式对应相同。
6.根据权利要求4所述基于分段改进S变换和随机森林的复合电能质量扰动识别方法,其特征在于:所述步骤3包括以下步骤:步骤3.1:在每个节点计算Gini指数下降,作为节点分裂指标,并记录其值为零的特征;
步骤3.2:根据阈值Nu判断该特征的连续性,预设值为10;
步骤3.3:使用简单遍历法处理离散特征;
步骤3.4:使用单维寻优处理连续特征;
步骤3.5:基于本节点的最优特征值进行节点分裂;
步骤3.6:判断流程是否已经满足停止建树条件,若是则输出本决策树,否则调到步骤
3.7;
步骤3.7:将本节点特征中Gini指数下降值为零的特征剔除,并返回步骤3.1。
7.根据权利要求4所述基于分段改进S变换和随机森林的复合电能质量扰动识别方法,其特征在于:步骤3均在MATLAB环境下进行编写,并且除了步骤3.4的处理连续特征步骤,使用了该环境自带的fminbnd函数进行实现之外,各主要功能步骤均使用了自编源代码进行仿真。
8.根据权利要求6所述基于分段改进S变换和随机森林的复合电能质量扰动识别方法,其特征在于:所述步骤3.1中,Gini指数下降Ginidec的计算方法如下:Ginidec(S)=Gini(S)-Ginispilt(S) (6)Gini指数反映了从数据集S中随机抽取两样本,其类别不一致的概率,因此其值越小,则数据集S的纯度越高;
其中,Gini(S)表示数据集S的Gini指数、Pi为类别Ci在样本集S中出现的概率;Ginispilt(S)表示进行节点分裂后S的Gini指数、S1和S2为数据集S被划分后得到的两个子集,Gini(S1)、Gini(S2)分别表示分裂后S1和S2的Gini指数,计算方法同(2);Ginidec(S)表示数据集S的Gini指数下降。
9.根据权利要求4所述基于分段改进S变换和随机森林的复合电能质量扰动识别方法,其特征在于:步骤3的RF分类器构建过程中,DT的建树停止条件为:①本节点所有样本都属于同一类;②本节点仅剩一个样本;③本节点某类样本数量显著高于其他类。