利索能及
我要发布
收藏
专利号: 2024110028524
申请人: 山东科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于加权随机森林的高速列车牵引逆变器故障诊断方法,其特征在于,对牵引逆变器控制的绝缘栅双极晶体管进行故障诊断,具体包括如下步骤:步骤1、提取原始信号的时域特征、频域特征和时频域特征并构建特征数据集;

步骤2、在特征数据集上运行随机森林算法得到特征重要性,利用特征重要性和递归特征消除方法得到最优特征集;

步骤3、在最优特征集对应的数据集上建立加权随机森林模型并通过该模型实现故障诊断;具体过程为:步骤3.1、通过随机有放回的重抽样方法抽取样本子集;

按照随机有放回的重抽样方法从第二特征数据集 中抽取相

同数量的样本作为第三特征数据集 抽样过程中未被抽到的样本*

构成袋外数据集,袋外数据集将被用作测试数据集;xnn 为第三特征数据集中第n个样本对应的第m个最优特征;

步骤3.2、对传统随机森林算法中特征子集的构建过程进行改进,用加权随机抽样的特征抽取方法代替传统随机森林的简单随机抽样,抽取特征子集;

加权随机抽样中每个特征被抽取的权重W=(w1,w2,...,wm)由特征重要性确定,具体为:

其中,wj为第j个最优特征被抽取的权重, 为第j个最优特征的重要性;wm为第m个最优特征被抽取的权重; 为第m个最优特征的重要性;

根据抽样权重,最优特征集F=(f1,f2,...,fm)按加权随机抽样的方法,抽得容量为*的特征子集 为特征子集中第m个特征;

步骤3.3、完成加权随机森林中决策树的生长,构建加权随机森林模型;

* * (z) * *

加权抽取第三特征数据集X的m 列,得到训练决策树的特征数据集X =[x1 ,x2 ,...,* T *xn] , 其中,z表示第z棵决策树;xn 为用于训练决策树的特征数据集中的第n个样本;T为转置符号;

节点分裂过程中每个非叶子节点的分裂特征fs和分裂点 的选择由最小基尼指数确定,具体如下:其中,Gini(·)为基尼指数; 为枚举得到的分裂特征为fs的两个子样本集;

N1、N2为两个子样本集的样本数;N为非叶子节点处的总样本数;

决策树的生长过程为:数据从根节点进入,按照基尼指数最小化准则不断进行节点分裂,直至所有叶子节点中只包含一类样本,从而完成决策树的生长,以同样的方式生成多棵决策树,使每棵决策树形成与其对应特征数据集相适应的树状结构;最终所有决策树的集合即为构建完成的加权随机森林模型;

步骤3.4、将测试数据输入构建完成的加权随机森林模型中,得到加权随机森林的输出结果;

样本从根节点进入,其特征值会与节点处的特征分裂值作比较,从而划分到非叶子节点中,并最终落入叶子节点;每棵决策树都会对样本进行故障分类,通过对所有决策树的故障分类结果进行投票,选择得票最多的故障类别作为随机森林的最终故障分类结果;具体为:其中, 为随机森林的故障分类结果; 为输入变量;c为故障类别索引,c=1,

2,...,C;C为故障类别总数; 表示随机森林中第z棵决策树的分类结果为c;λ(·)为满足括号中表达式的决策树棵数;Z为决策树的总棵数;

步骤3.5、对加权随机森林模型进行参数优化;

参数优化包括优化特征子集中的特征数量以及加权随机森林模型中的决策树棵数;其中特征子集中特征的数量根据 得到,而最优的决策树棵数根据加权随机森林中测试数据的故障分类准确率确定;通过使用袋外数据进行测试,准确率会随着决策树数量的增加而逐渐增加并收敛;当准确率收敛时,决策树数量的最小值即为最优的决策树棵数。

2.根据权利要求1所述基于加权随机森林的高速列车牵引逆变器故障诊断方法,其特征在于,所述步骤1的具体过程为:步骤1.1、考虑牵引逆变器中单个绝缘栅双极晶体管故障以及两个绝缘栅双极晶体管同时故障的情况,将故障类型分为22种;

步骤1.2、利用MATLAB/Simulink仿真软件对牵引逆变器进行建模仿真,采集各种故障类型下牵引逆变器输出的三相电流信号作为原始信号;

步骤1.3、根据经验公式从每段电流信号中提取时域特征,并对每段电流信号进行快速傅里叶变换得到频域信号,从频域信号中提取频域特征;

所述时域特征包括最大值、最小值、峰峰值、平均值、绝对平均值、均方根、方根幅值、标准差、脉冲因子、峰值因子、裕度因子;

所述频域特征包括频谱能量均值、频谱能量方差、重心频率、频率标准差、均方频率、频谱峰度;

步骤1.4、对每段电流信号进行三层小波包分解,得到不同尺度和频带的子信号,进而获取信号在不同频率范围内的能量信息;将三层小波包分解得到的8个子信号的能量信息作为时频域特征,即:其中,E(·)为时频域特征;s为子信号的编号,s=0,1,2,...,7;x(s)为三层小波包分解后得到的子信号;τ为时间单位;R为子信号的采样点数量; 为分解后第三层的第S个子信号在第r个采样点处的小波包系数;

步骤1.5、将提取的时域特征、频域特征、时频域特征信息进行整合,得到包含多个样本的第一特征数据集 n为样本总个数;M为特征总个数;xnM为第n个样本对应的第M个特征;所有用于描述数据样本的多个特征的集合组成特征集FB=(f1,f2,…,fM),其中fM为用于描述数据样本的第M个特征。

3.根据权利要求2所述基于加权随机森林的高速列车牵引逆变器故障诊断方法,其特征在于,所述步骤1.1中,22种故障类型分别为:无故障情况,记为1;器件V1故障,记为2;器件V2故障,记为3;器件V3故障,记为4;器件V4故障,记为5;器件V5故障,记为6;器件V6故障,记为7;器件V1、V2同时故障,记为8;器件V3、V4同时故障,记为9;器件V5、V6同时故障,记为

10;器件V1、V3同时故障,记为11;器件V1、V5同时故障,记为12;器件V3、V5同时故障,记为

13;器件V2、V4同时故障,记为14;器件V2、V6同时故障,记为15;器件V4、V6同时故障,记为

16;器件V1、V4同时故障,记为17;器件V1、V6同时故障,记为18;器件V2、V3同时故障,记为

19;器件V3、V6同时故障,记为20;器件V2、V5同时故障,记为21;器件V4、V5同时故障,记为

22。

4.根据权利要求1所述基于加权随机森林的高速列车牵引逆变器故障诊断方法,其特征在于,所述步骤2的具体过程为:步骤2.1、在第一特征数据集XB上运行传统的随机森林算法,得到每个特征的重要性,并对特征重要性进行降序排列;

步骤2.2、按照特征重要性排序去除重要性最小的特征,得到新的特征集;使用新的特征集对应的数据集运行传统随机森林算法并进行5折交叉验证,得到该数据集的模型分类准确率;

步骤2.3、不断执行步骤2.2,直到特征集中特征的数量达到预定数目;综合所有特征数据集的模型分类准确率,选择包含特征数最少且对应数据集分类准确率最高的特征集合作为最优特征集F=(f1,f2,...,fm);fm为第m个最优特征;m为最优特征总个数;根据最优特征得到相应的第二特征数据集为: xnm为第n个样本对应的第m个最优特征。