1.一种航班链延误时间预测方法,其特征在于,所述方法包括如下步骤:
S100,获取航班运行数据集DF={DF1,DF2,……,DFi,……,DFn}和气象数据集DW={DW1,DW2,……,DWr,……,DWm},其中,第i个航班运行数据DFi=(Ni,Ci,SAi,RAi,TPSFi,TPADi,TRSFi,TRADi,Mi,Ei,Si,Agi,Pi,Li,Hi,Di),Ni为第i个航班的航班号,Ci为第i个航班对应的航空公司的ID,SAi为第i个航班的起飞机场的ID,RAi为第i个航班的到达机场的ID,TPSFi为第i个航班的计划起飞时间,TPADi为第i个航班的计划降落时间,TRSFi为第i个航班的实际起飞时间,TRADi为第i个航班的实际降落时间,Mi为第i个航班对应的飞行器的ID,Ei为第i个航班对应的飞行器的尾号,Si为第i个航班对应的航班状态,Agi为第i个航班对应的飞行器的年龄,Pi为第i个航班对应的飞行器的用户承载量,Li为第i个航班对应的飞行距离,Hi为第i个航班对应的飞行高度,Di为第i个航班对应的飞行日期;i的取值为1到n,n为DF中的航班数量;第r个气象数据DWr=(MTr,Ar,Tr,Vr,GVr,VBr,SCr,SWr),其中,MTr为第r个气象数据的监测时间,Ar为第r个气象数据对应的机场的ID,Tr为第r个气象数据中的气温,Vr为第r个气象数据中的风速,GVr为第r个气象数据中的阵风风速,VBr为第r个气象数据中的能见度,SCr为第r个气象数据中的云层状态,SWr为第r个气象数据中的天气状态;r的取值为1到m,m为DW中的气象数据的数量;
S200,获取航班延误时间数据集DT={DT1,DT2,……,DTi,……,DTn},第i个航班延误时间数据DTi=(DLTi,DRTi),其中,DLTi为第i个航班的离港延误时间,DRTi为第i个航班的到港延误时间;
S300,基于DF、DT和DW获取融合数据集MD={MD1,MD2,……,MDi,……,MDn},其中,第i个融合数据MDi=DFi+DTi+FWSi+RWSi+FWRi+RWRi,FWSi为SAi在TPSFi之前的第一设定时间段内对应的气象数据,RWSi为SAi在TPSFi之后的第二设定时间段内对应的气象数据,FWRi为RAi在TPADi之前的第三设定时间段内对应的气象数据,RWRi为RAi在TPADi之后的第四设定时间段内对应的气象数据,+表示数据拼接;
S400,基于MD中的飞行日期和飞行器的尾号,从MD中获取航班链,得到多条航班链;每个航班链包括飞行器的尾号相同并且飞行日期相同的多个融合数据;
S500,利用所述多条航班链作为训练样本对初始航班链延误时间预测模型进行训练,得到目标航班链延误时间预测模型;其中,所述初始航班链延误时间预测模型采用编码器‑解码器架构;
S600,利用所述目标航班链延误时间预测模型对待预测的航班链中未运行的航班的延误信息进行预测。
2.根据权利要求1所述的方法,其特征在于,其中,所述编码器‑解码器架构包括编码器组、解码器组和时间预测模块,其中,所述编码器组包括依次连接的E个编码器,所述解码器组包括依次连接的Z个解码器,每个编码器包括基于Fastformer的时间特征提取通道、基于GraphSAGE的空间特征提取通道以及门控融合模块;每个解码器包括带掩码的单向卷积模块和时空稀疏交叉注意力模块;其中,每个编码器的门控融合模块的输入端分别与对应的时间特征提取通道和空间特征提取通道的输出端连接,第1至第Z‑1个编码器中的每个编码器的门控融合模块的输出端分别与下一个编码器的时间特征提取通道和空间特征提取通道的输入端连接,第Z个编码器的门控融合模块的输出端分别与每个解码器的时空稀疏交叉注意力模块的输入端连接,每个解码器的带掩码的单向卷积模块的输出端与所述时空稀疏交叉注意力模块的输入端连接,第1至第Z‑1个解码器中的每个解码器的时空稀疏交叉注意力模块的输出端与下一个解码器的带掩码的单向卷积模块的输入端连接,第Z个时空稀疏交叉注意力模块的输出端与所述时间预测模块连接;
其中,输入到所述编码器组的融合数据不包括航班延误时间数据,输入到所述解码器组中的融合数据仅包括航班延误时间数据。
3.根据权利要求1所述的方法,其特征在于,所述航班运行数据和所述气象数据通过如下步骤获取:S101,获取设定历史时间段内的航班运行数据和气象数据作为实验数据,并对实验数据中的缺失数据进行处理;
S102,对处理后的实验数据进行编码处理,得到编码处理后的数据;
S103,对编码处理后的数据,根据方差过滤和卡方检验相关性分析,得到所述航班运行数据和所述气象数据;
其中,S102具体包括:
S1021,对实验数据中属于时间类型的数据,使用独热编码和位置编码方式进行编码,以及对实验数据中不属于时间类型的数据,使用James‑Stein Encoder编码方式进行编码,得到数值型数据;
S1022,使用Min‑max编码方式对数值型数据编码,得到编码处理后的数据。
4.根据权利要求1所述的方法,其特征在于,每个航班链包括的融合数据的数量k满足:
4≤k≤14。
5.根据权利要求1所述的方法,其特征在于,所述第一设定时间段的时长t1=b1×△t,所述第二设定时间段的时长t2=b2×△t,所述第三设定时间段的时长t3=b2×△t,所述第四设定时间段的时长t4=b1×△t,b1和b2为正整数,并且,b1<b2,△t为气象数据的监测时间间隔。
6.根据权利要求2所述的方法,其特征在于,所述基于Fastformer的时间特征提取通道用于执行如下操作:S501,对当前输入的样本数据中的航班的顺序进行编码;
S502,使用多头自注意力机制计算编码后的每个航班链中的航班运行数据之间的时间相关性,得到对应的相关性特征;
S503,对所述相关性特征进行聚合卷积处理,得到航班链时间特征,其中,航班链时间特征中的第g个航班链中的第x个航班的时间特征Fgx满足如下条件:Fgx=agx×FRgx+(1‑a)×x∑z=x‑h wgz×FRgz,FRgx为第i个航班运行数据在第g个航班链对应的相关性特征中的特征,agx为第x个航班的融合权重,h为设定的卷积窗口大小,wgz为第g个航班链中的第z个航班对应的卷积权重,g的取值为1到H,H为航班链时间特征中的航班链数量,x的取值为1到Zg,Zg为第g个航班链中的航班数量。
7.根据权利要求6所述的方法,其特征在于,所述基于GraphSAGE的空间特征提取通道用于执行如下操作:S510,对当前输入的样本数据进行图嵌入表示,得到每个航班链对应的航空交通网络图,并获取所述航空交通网络图中节点的特征矩阵和节点之间的邻接矩阵;
S511,基于每个节点的静态属性和动态特征获取每个节点的权重,并基于获取的权重对节点进行采样;
S512,利用LSTM神经网络作为聚合函数对邻接节点的特征进行聚合,得到每个邻接节点的聚合特征;
S513,对每个节点和对应的邻接节点的特征进行加权融合,得到每个节点的融合特征;
S514,对属于同一航班链的节点的融合特征进行拼接,得到对应的航班链空间特征。
8.根据权利要求7所述的方法,其特征在于,所述时空稀疏交叉注意力模块用于执行如下操作:
S10,获取带掩码的单向卷积模块输出的特征矩阵的差异矩阵;
S11,获取差异矩阵中的大于设定值的特征值作为目标特征值;
1/2
S12,获取目标特征值b对应的计算区域内的交叉注意力值LAb=Softmax((Qb/ds) ×Vb),Qb为门控融合模块输出的时空关联特征中与目标特征值b对应的目标区域对应的特征矩阵,ds为时空关联特征中的每个特征向量的维度,Vb为带掩码的单向卷积模块输出的特征矩阵中与目标特征值b对应的目标区域对应的特征矩阵,所述时空关联特征基于所述航班链时间特征和所述航班链空间特征融合得到;b的取值为1到M,M为目标特征值的数量;
Softmax( )为激活函数;
S13,将M个目标特征值对应的交叉注意力值进行融合,得到对应的输出特征。
9.一种非瞬时性计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,其特征在于,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1‑8中任意一项的所述方法。
10.一种电子设备,其特征在于,包括处理器和权利要求9中所述的非瞬时性计算机可读存储介质。