1.基于集成学习的高速列车轴承故障诊断方法,其特征在于,具体按照以下步骤实施:
步骤1,获取高速列车轴承振动原始信号后进行故障标记划分,再进行CEEMDAN分解得到一系列本征模态分量IMF;
步骤2,对步骤1得到的IMF分量进行降噪处理;
步骤3,对步骤2处理后的IMF分量进行重构,得到重构信号后进行特征提取;
步骤4,将步骤3提取出来的特征分别传入集成学习模型的第一层单模型中,得到分类结果;
步骤5,根据步骤4的分类结果计算集成学习模型的第一层单模型的分类准确率,为模型准确率分配权重后整合成一个训练集;
步骤6,将步骤5产生的训练集传入集成学习模型的第二层随机森林模型中进行训练,得到最终的轴承故障诊断结果。
2.根据权利要求1所述的基于集成学习的高速列车轴承故障诊断方法,其特征在于,所述步骤1具体按照以下步骤实施:步骤1.1,获取高速列车轴承振动含噪原始信号,将含噪原始信号进行轴承数据特征提取,得到轴承数据特征数据集,对正常轴承数据的特征进行标记,再从全寿命数据中找出故障数据,将轴承故障数据的“故障”标记划分;“故障”标记划分时,按照轴承从外到内的故障程度依次划分为:外圈轻度故障轴承数据的特征、外圈中度故障轴承数据的特征、外圈严重故障轴承数据的特征、内圈轻度故障轴承数据的特征、内圈中度故障轴承数据的特征、内圈严重故障轴承数据的特征;
步骤1.2,将步骤1.1标记“故障”的原始信号传入CEEMDAN算法模型中,信号经CEEMDAN处理后分解得到若干个IMF分量和Res余量,每个IMF分量对应不同的频率分量,将若干个IMF分量按频率分量的高频到低频的顺序分布。
3.根据权利要求2所述的基于集成学习的高速列车轴承故障诊断方法,其特征在于,所述步骤2具体按照以下步骤实施:步骤2.1,采用均方根误差按高频到低频的顺序计算17个IMF分量的RMSE值,当出现IMF分量RMSE值逐渐递增,且递增前的IMF分量单调递减时,则递增前的IMF分量为高频IMF分量,并含有干扰信号,其余递增后的IMF分量为低频IMF分量,取高频IMF分量进行小波去噪处理;小波去噪处理时,一个含噪模型表示为:s(k)=f(k)+ε*e(k)k=0,1......n‑1 (1)其中,f(k)为有用信号,s(k)为含噪信号,e(k)为噪声,ε为噪声系数的标准偏差;
步骤2.2,对步骤2.1去噪处理后的高频IMF分量进行阈值选择;
阈值选择采用硬阈值量化保留轴承振动信号边缘的局部特征。
4.根据权利要求3所述的基于集成学习的高速列车轴承故障诊断方法,其特征在于,步骤3具体过程为:对步骤2处理后的高频IMF分量经过量化处理后得到高频系数,采用小波分解处理低频IMF分量得到低频系数,将低频系数和高频系数线性相加进行信号的小波重构,提取振动信号的时域特征。
5.根据权利要求1所述的基于集成学习的高速列车轴承故障诊断方法,其特征在于,所述步骤4具体过程为:集成学习模型采用Stacking集成学习模型,Stacking集成学习模型的第一层单模型包括SVM、KNN、AdaBoost、XGBoost、LightGBM,将步骤3提取出来的特征分别传入五种单模型中,得到五种不同的分类结果。
6.根据权利要求5所述的基于集成学习的高速列车轴承故障诊断方法,其特征在于,所述步骤4的五种单模型分类过程为:SVM采用间接法构造多个分类器对故障诊断进行分类,训练时依次把某个类别的样本归为一类,其他剩余的样本归为另一类,分类时将未知样本分类为具有最大分类函数值中;
KNN分类时,通过计算待分类点与已知类别的点之间的距离,按照距离递增次序排序,选取与待分类点距离最小的K个点,确定前K个点所在类别的出现次数,回前K个点出现次数最多的类别作为待分类点的分类,KNN分类在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别;
AdaBoost分类时,采用迭代的思想,每次迭代只训练一个弱分类器,训练好的弱分类器将参与下一次迭代的使用;
XGBoost分类时,使用的基学习器为CART回归树,通过逐步加入树来构建集成模型,假设模型共集成了K个树,K个树对应的叶子节点值之和为模型最终的分类结果,求解损失函数极值时使用牛顿法,将损失函数泰勒展开到二阶,损失函数中加入正则化项;
LightGBM分类时,通过逐步优化来建立一个诊断率更高的模型,采用基于Histogram的决策树算法,采用带深度限制的Leaf‑wise的叶子生长策略,用直方图做差加速,直接支持类别特征,采用Cache命中率优化,采用基于直方图的稀疏特征优化,采用多线程优化。
7.根据权利要求5所述的基于集成学习的高速列车轴承故障诊断方法,其特征在于,所述步骤5对第一层单模型SVM、KNN、AdaBoost、XGBoost、LightGBM的分类准确率分配不同的权重,分别记作,w1、w2、w3、w4、w5;利用信息熵模型构建函数并计算每个参数的权重值,按照权重整合为一个训练集。
8.根据权利要求7所述的基于集成学习的高速列车轴承故障诊断方法,其特征在于,所述步骤5的具体过程为:步骤5.1,建立体系的数学模型,假设X为已知矩阵,其中表示第i个评价对象的第j个指标,构建数据矩阵,对数据矩阵X消除量纲并做归一化处理得到矩阵Y,公式(2)中,maxx*j、minx*j分别表示数据矩阵X第j列的最大值、最小值, 为数据矩阵X的平均值,矩阵Y中的任何一个值都在[0,1]内;
步骤5.2,信息熵模型针对轴承故障诊断准确率作为评价指标建立权重矩阵P,则Pj表示第j个评价指标的权重,Pj的和为1且Pj≥0,利用熵值构建函数并计算每个参数的权重值:构建计算矩阵Y的函数H,函数H对称性则H(x1,x2)=H(x2,x1),当评价对象次序改变的时候,对同一评价指标的权重不变,即计算矩阵Y的任意两行发生变化时,函数的值保持不变;
函数H要求单调递增、连续性、可加性,从而构建出函数:
计算每个参数的熵值,其中,计算第j个指标的熵值为:
为保证熵值为正取负号,信息熵是信息论中用来刻画信息无需度的一个量,熵值越大,表示信息的无序化程度越高,相对应的信息效率越高;
归一化系数定义为:
用熵值计算每个参数的权重值:
9.根据权利要求1所述的基于集成学习的高速列车轴承故障诊断方法,其特征在于,随机森林模型的基本单位为决策树,每棵决策树都是一个分类器,对于输入样本,N棵树会有N个分类结果,通过集成N棵树所有的分类投票结果,将投票次数最多的类别指定为最终的输出,完成对高速列车轴承故障的诊断。
10.根据权利要求9所述的基于集成学习的高速列车轴承故障诊断方法,其特征在于,所述步骤6使用Bootstraping方法随机从步骤5合成的训练集中有放回采样选出m个样本,共进行n_tree次采样,生成n_tree个训练集;对于n_tree个训练集分别训练n_tree个决策树模型,对于单个决策树模型,假设训练样本特征个数为n,每次分裂时根据基尼系数选择最好的特征进行分裂,每棵树都一直这样分裂下去,直到该节点的所有训练样例都属于同一类,在决策树的分裂过程中不需要剪枝,将生成的多棵决策树组成随机森林,按多棵树分类器投票决定最终的故障分类结果。