1.一种基于深层结构循环神经网络的PM2.5预测方法,其特征在于,包括以下步骤:(1)、获取历史天气数据,包括每小时的温度,光照,风速,降雨量,SO2,O3,NO,PM10,PM2.5数据指标,其中,温度单位:℃,光照单位:lm/㎡,风速单位:m/s,降雨量单位:mm,SO2,O3,NO,PM10,PM2.5均是浓度数据;
(2)、数据预处理
(2.1)、对缺失历史天气数据进行补全处理
利用均值法补全缺失的历史天气数据:
其中,Xt表示当前时刻的缺失历史天气数据,Xt-1表示前一时刻的缺失历史天气数据,Xt+1表示前后一时刻的缺失历史天气数据;
(2.2)、对所有历史天气数据进行归一化处理
按照如下公式将所以历史天气数据归一化到-1~1之间;
其中,X'表示归一化后的历史天气数据,X表示归一化前的历史天气数据, 表示历史天气数据均值,Xmax表示历史天气数据最大值,Xmin表示历史天气数据最小值;
(3)、将预处理完成后的历史天气数据按照比例分为训练数据和测试数据;
(4)、基于深度学习理论和循环神经网络构造深层结构的PM2.5预测模型(4.1)、构建深层循环神经网络预测模型:一层输入层,多层隐藏层,一层输入层,模型深度大于N层,输入是训练数据,输出是PM2.5浓度的预测值;
(4.2)、设输入层维度为K×(H-1),输出层维度为1×T,输入层与隐藏层,隐藏层与隐藏层,隐藏层和输出层的激活函数采用Tanh函数;
其中,K表示循环神经网络按时间序列展开的深度,即K个时间帧,每一个时间帧输入一组历史天气数据;H表示数据指标数目,T表示循环神经网络的预测模型输出数据个数,表示用K条历史数据预测未来T个时刻的PM2.5浓度,即为了输入前K个时刻的天气数据,预测出之后T个时刻的PM2.5浓度数据;
(4.3)、选择PM2.5预测模型中使用的损失函数
在PM2.5预测模型中采用均方误差作为损失函数:
其中,t为输出向量维度,yi,j表示训练数据的真实值,yi,j'表示训练数据的预测值;
(4.4)、采用小批量随机梯度下降算法更新PM2.5预测模型中的参数(4.4.1)、初始化参数θ0;
(4.4.2)、将训练数据按照时间序列每m个训练数据分为一组,再利用小批量随机梯度下降算法计算第一组训练数据中每个训练训练数据的梯度值,然后梯度值进行加权平均求和,得到本组训练数据的下降梯度 i表示第i组训练数据,表示第i组中第τ个训练数据对应的输入、输出数据;
(4.4.3)、本组训练数据的下降梯度更新PM2.5预测模型中的参数,参数更新公式为:其中,θi-1表示上一组数据训练完成后的目标参数,θi表示本组训练数据完成后的目标参数,η表示学习率;
(4.4.4)、当本组训练数据完成后的目标参数更新完成后,返回步骤(4.4.2)进行下一组训练数据的训练及更新,直到误差值低于设定期望误差值或者最后一组训练数据训练完成时结束,然后更新并保存最终参数,得到训练完成的PM2.5预测模型;
(5)、判断PM2.5预测模型的是否达到训练停止条件将测试集数据按照时间序列输入一个K组数据至已经训练好的PM2.5预测模型中,输出T个预测值,再将每个预测值和真实值之间进行误差判断,如果误差在允许范围内,则认为预测模型完成训练,否则返回步骤(4)重新训练,直到达到停止条件;
(6)、利用PM2.5预测模型进行PM2.5的预测
将当前K组天气数据输入至PM2.5预测模型,输出T个PM2.5预测值。