1.一种基于时空注意力的长时序pm2.5预测方法,其特征在于,包括以下步骤:获取不同的污染物浓度数据和气象因子数据,并对其进行归一化和缺失值填补;
将不同站点的预处理后的气象数据输入其对应的特征提取网络进行特征提取,包括:FEN(f)=GLU(μ0)+μ1;
μ0=tanh(w0f+b0);
μ1=w1f+b1;
其中,FEN(f)为特征提取网络;f为不同站点的预处理后的气象数据;GLU()为门控线性网络;w0为特征权重;b0为偏置项;w1为特征权重;b1为偏置项;
门控线性网络提取非线性特征的过程,表示为:
GLU(μ0)=(σ(w1*μ0+b2)⊙(w1*μ0+b3));
其中,GLU(μ0)为根据输入数据提取的非线性特征;w1为隐特征权重;b2、b3为偏置项;⊙为点乘;σ()表示sigmoid函数;
利用空间注意力网络将不同站点提取的特征连接并融合,即将提取的特征输入前馈神经网络得到站点的特征因子,表示为:h0=wtarhtar+btar;
αi=concat(hi,h0);
并将目标站点的特征因子分别与其他站点的特征因子进行拼接,将拼接后的值通过双曲正切函数激活函数计算注意力权值,表示为:通过softmax和注意权值计算每一站点的注意力权重,表示为:其中,h0为目标特征影响权重;wtar为目标站点空间权重;btar为目标站点的空间偏置;hi为一个非目标站点的特征因子;αi为h0与hi拼接得到的特征; 表示αi的第j维特征;wi为特征权重;bi为第i个站点的空间偏置; 表示空气站点i的第j维的重要性权重, 表示空气站点i的第j维的空间注意力权值;L为站点的特征维数,exp代表指数函数;htar为目标站点特征序列;
将空间注意力网络处理后的特征通过多层双向LSTM得到过去的特征;
将待预测时间段对应的已知的未来特征数据,即待预测时间段对应的的季节以及节假日信息,通过嵌入层获取转化为维数向量,并通过神经网络提取得到未来的特征;
将过去的特征与未来的特征进行连接后,通过线性层输出回归结果,即得到预测结果;
使用考虑到数据的标准偏差波动和平均误差的损失函数对网络进行迭代训练直到收敛;考虑到数据的标准偏差波动和平均误差的损失函数表示为:*
其中,Loss为损失函数;MSE为参数估计中的均方误差;Std为预测序列的标准差;Std为真实序列的标准差;w2为L2正则化,表示为 λ为正则化参数,wi为第i个神经网络的参数;M为神经网络中的参数个数;
将待测站点数据输入已完成训练的基于时空注意力的PM2.5预测网络,并输出预测结果。
2.根据权利要求1所述的一种基于时空注意力的长时序pm2.5预测方法,其特征在于,参数估计中的均方误差为参数估计值与参数真值之差平方的期望值,表示为:其中,N为站点的数量; 为参数估计值;y(j)参数真值。
3.根据权利要求1所述的一种基于时空注意力的长时序pm2.5预测方法,其特征在于,预测序列和真实序列的标准差计算过程包括:*‑
其中,N为站点的数量; 为预测序列中第j个元素的值;y 为预测序列均值;y(j)为真‑实序列中第j个元素的值;y为真实序列均值。
4.一种基于时空注意力的长时序pm2.5预测的系统,其特征在于,该系统用于实现权利要求1~3所述的任意一种基于时空注意力的长时序pm2.5预测的方法,该系统包括时序数据获取模块、特征提取模块、空间注意力网络、多层双向LSTM、时序特征提取模块、特征连接模块以及预测模块;其中:时序数据获取模块,用于用于获取不同站点的污染物浓度数据和气象因子数据,包括历史数据和实时数据,根据历史数据对系统进行训练;实时数据输入完成训练的系统进行实时预测;
特征提取模块,用于提取时序数据获取模块获取的数据的特征,特征提取模块将不同站点的预处理后的气象数据输入其对应的特征提取网络进行特征提取;并将目标站点,即待预测的站点的特征与其他站点的特征空间注意力网络,用于获取每个辅助站点的注意力权重,即将待预测的站点作为目标站点,其他站点作为辅助站点,将特征提取模块获取的特征通过前馈神经网络得到站点的特征因子,将目标站点的特征因子分别与每个辅助站点的特征因子进行拼接后通过双曲正切函数激活函数计算注意力权值,并通过softmax和注意权值计算每一站点的注意力权重;
多层双向LSTM,用于提取空间注意力网络输出特征的周期性特征;
时序特征提取模块,用于获取已知的未来特征数据,即待预测时间段所在季节以及即将到来的节假日信息,并采用嵌入运算将采集的信息转化为维数向量,并通过神经网络提取其特征;
预测模块,用于获取多层双向LSTM输出的特征与时序特征提取模块输出的特征进行线型加权后得到回归预测结果,将该预测结果作为预测的系统的输出。