1.一种基于深度学习的网约车供需预测方法,其特征在于,首先对网约车出行数据进行预处理,然后选取影响网约车供需预测的关键属性,包括温度、空气质量、交通拥堵状况、时段、供需差额和区域标识,进行特征构建,并构建基于Nadam算法的MC-LSTM模型,利用该模型进行网约车供需差额预测。
2.根据权利要求1所述基于深度学习的网约车供需预测方法,其特征在于,所述网约车出行数据包括订单信息数据集、天气信息数据集、交通拥堵信息数据集和区域标识数据集,将城市划分为面积大小相同的若干个正方形区域,区域紧密排列在一起且互不重叠,每个区域都有自己唯一的标识码,在数据集中每个区域用哈希值标记,其中订单信息数据集主要包括网约车订单的详细信息,所述供需差额来源于此数据集;天气信息数据集主要包括各个区域各个时段的温度与PM2.5信息;交通拥堵信息数据集主要包括各个区域各个时段四个拥堵等级道路数目,等级越高表示拥堵程度越大;区域标识数据集主要包括区域标识信息。
3.根据权利要求2所述基于深度学习的网约车供需预测方法,其特征在于,所述特征构建包括以下步骤:
1)依靠时间属性结合不同时间段发生事件构建时段特征
将工作日时间段分为工作日早晚高峰、工作日上班时间和工作日剩余时段,将休息日时间段分为休息日出行娱乐高峰期和休息日剩余时段;
2)以天气数据集中的温度信息作为温度特征;
3)以天气数据集中的PM2.5信息作为空气质量特征;
4)以交通拥堵信息数据集中的交通拥堵信息作为交通拥堵状况特征;
5)考虑到不同区域对供需预测的影响,用数值符号加以区分,从而形成区域标识特征;
6)供需差额特征,为预测目标,简称其为Gap值。
4.根据权利要求1所述基于深度学习的网约车供需预测方法,其特征在于,所述MC-LSTM模型是延用Coupled-LSTM模型的耦合结构,去除输出门,输出门的开关控制交由忘记门来处理,通过忘记门来激活输出状态,从输出层反向计算各层的更新门、重置门、当前记忆内容和最终记忆内容的梯度,模型运行流程如下:首先,忘记门读取t时刻输入信息与t-1时刻的输出信息,决定细胞状态信息保留与否;然后,tanh层创建新的侯选值;接下来,耦合层决定t时刻细胞状态的更新;最后,忘记门与tanh层决定网络模型的输出。
5.根据权利要求4所述基于深度学习的网约车供需预测方法,其特征在于,利用Nadam算法对MC-LSTM模型进行优化的具体流程包括数据特征输入、模型训练和模型优化过程,其中:输入:总层数L,以及各隐藏层与输出层的神经元个数,激活函数和损失函数,迭代步长h,最大迭代次数MAX与停止迭代阈值j,输入的m个训练样本;
输出:各隐藏层与输出层的权值W和偏置向量b;
模型训练过程如下:
1)初始化各隐藏层与输出层的权值W和偏置向量b的值为一个随机值;
2)输入迭代次数MAX;
3)输入训练样本m;
4)从第一层开始逐层进行前向传播算法计算激活值;
5)通过均方差损失函数计算输出层的梯度;
6)从最后一层(第L层)开始逐层进行反向传播算法计算各层梯度;
7)使用Nadam优化算法逐层更新权值W和偏置向量b
8)如果所有权值W和偏置向量b变化值都小于停止迭代阈值j,则跳出迭代循环到步骤
9);
9)输出各隐藏层与输出层的权值W和偏置向量b。
6.根据权利要求5所述基于深度学习的网约车供需预测方法,其特征在于,所述模型优化训练过程中对Nadam算法的参数配置和调用方法如下:首先,设定Nadam算法中几个超参数alpha、beta1、beta2和epsilon的初始值,之后使用MC-LSTM模型调用编辑好的Nadam优化算法,调用过程如下所示:
1)输入Nadam优化算法的学习率lr;
2)计算出模型训练过程中的均方差损失函数loss,
其中,m为训练样本的个数,yi为目标变量的真实值, 为预测结果,二者之差称为残差;
3)输出调用的Nadam优化算法。