1.一种基于长短时记忆网络的列车状态在线预测方法,其特征在于,具体按照以下步骤实施:步骤1、列车状态监测数据预处理与归一化;
步骤2、列车状态监测数据选取与划分;
步骤3、LSTM网络门结构设计;
步骤4、LSTM网络梯度反向计算误差;
步骤5、调节网络循环次数,进行状态预测。
2.根据权利要求1所述的一种基于长短时记忆网络的列车状态在线预测方法,其特征在于,所述步骤1具体如下:数据预处理包括对列车状态监测数据进行缺失数据补全、突变点剔除操作;
数据归一化采用线性函数归一化,去掉状态监测数据的量纲,将数据限制到一定区间,使运算更为便捷,如下式:其中,x为列车状态不同时刻的监测数据,xmin和xmax分别为状态监测数据中的最小值和最大值,xnorm为归一化处理后的状态数据。
3.根据权利要求2所述的一种基于长短时记忆网络的列车状态在线预测方法,其特征在于,所述步骤2具体如下:选取列车状态历史监测数据为研究对象,对监测数据进行划分,设定前70%和后30%的历史监测数据为LSTM网络训练数据集和测试数据集,用于之后的LSTM网络模型的训练与测试。
4.根据权利要求3所述的一种基于长短时记忆网络的列车状态在线预测方法,其特征在于,所述步骤3具体如下:步骤3.1、以t时刻的网络细胞为研究对象,t时刻的细胞输入由t-1时刻的隐藏层单元ht-1、t-1时刻的细胞状态Ct-1和当前时刻的列车状态数据xt共同组成,t时刻的细胞输出为隐藏层单元ht和细胞状态Ct;
步骤3.2:遗忘门决定上一时刻细胞状态Ct-1中的信息传递到当前时刻Ct中的信息量,由ft控制,值域为(0,1),其计算公式如下:ft=σ(Wxfxt+Uhfht-1+bf)式中,ft为遗忘门状态,Wxf和Uhf分别为输入列车状态特征向量和隐藏层单元与遗忘门之间的权重,bf为遗忘门的偏差值,σ表示sigmod函数,如下所示:式中,x为输入数据,通过sigmod函数将数据映射到[0,1]之间,便于后续的分析与处理;
步骤3.3:细胞输入门用来控制当前输入新生成的信息 中加入到细胞状态Ct中的信息量,由it控制,值域为(0,1),设tanh层产生当前时刻新的信息,sigmoid层控制新信息传递到细胞状态的信息量,计算公式如下:it=σ(Wxixt+Uhiht-1+bi)式中,it为输入门状态, 为当前输入新信息,Wxi和Uhi分别为输入列车状态特征向量和隐藏层单元与输入门之间的权重,bi为输入门的偏差值,tanh表示激活函数,tanh函数如下所示:式中,x为输入数据,通过tanh函数将数据映射到[-1,1]之间,便于后续的分析与处理;
步骤3.4:基于遗忘门和输入门的输出,更新细胞状态,具体计算公式如下:式中,Ct为t时刻细胞状态;
步骤3.5:基于更新的细胞状态,输出门ot采用sigmoid层控制细胞状态信息作为隐藏状态的输出ht。
5.根据权利要求4所述的一种基于长短时记忆网络的列车状态在线预测方法,其特征在于,所述步骤4具体如下:步骤4.1:定义反向传播计算误差δ为模型目标函数E对加权输入nett=(Uh*ht-1+Wx*xt+b)的偏导,δ的传播沿两个方向,分别为从输出层传递至输入层,以及沿时间t的反向传播;
步骤4.2:定义: 由ht=ot*tanh(Ct)得式中,Ct记忆了所有时刻的细胞状态,故每个时间点迭代时, 累加;
步骤4.3:由 得到:
根据
it=f(netit)=sigmoid(Uhi*ht-1+Wxi*xt+bi)ft=f(netft)=sigmoid(Uhf*ht-1+Wxf*xt+bf)ot=f(netot)=sigmoid(Uho*ht-1+Wxo*xt+bo)得
步骤4.4:计算各个权重矩阵的偏导数:
步骤4.5:以t时刻网络细胞为研究对象,δ从输出层传递至输入层,对于输出层L,由于yt=g(Wy*ht+by)=g(nett),则权重Wy,by的偏导数:
同理
步骤4.6:对于其它层,由于
nett=(Uh*ht-1+Wx*xt+b)又因为
得到
6.根据权利要求5所述的一种基于长短时记忆网络的列车状态在线预测方法,其特征在于,所述步骤5具体如下:选取步骤4得到的全部数据的前70%和后30%分别作为网络的训练数据和测试数据,调节网络循环次数与网络参数,进行列车状态的预测。