利索能及
我要发布
收藏
专利号: 2019106674918
申请人: 内蒙古工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于C-GRU的网约车供需预测方法,其特征在于,首先对网约车出行数据预处理,然后利用卷积神经网络对数据进行训练,从而提取特征并实现降维得到低维特征图谱,将所述低维特征图谱输入到门限循环(GRU)神经网络模型中进行网约车供需预测。

2.根据权利要求1所述基于C-GRU的网约车供需预测方法,其特征在于,所述网约车出行数据的预处理方法如下:

将一个城市划分为n个互不重叠的正方形区域D={d1,d2,…,di,…,dn},将每一天的24小时划分为144个10分钟长的时间片t1,t2,…,tj,…,t144,对于区域di,在时间片tj,有rij个乘客发单,有aij个司机成功应答了aij次发单,则对于区域di,在时间片tj,定义需求demandij=rij,供给supplyij=aij,有供需缺口gapij=rij-aij,将影响供需预测的数据按每十分钟时间段进行划分,最终得到影响供需预测的特征:区域特征、温度特征、天气特征、时间特征、交通拥堵特征、PM2.5特征以及上一时刻的供需差额特征。

3.根据权利要求2所述基于C-GRU的网约车供需预测方法,其特征在于,所述区域特征为区域的编号,所述温度特征是将温度划分成五个级别T1、T2、T3、T4、T5,分别对应温度为0~5℃、5~10℃、10~15℃、15~20℃、20~25℃;所述天气特征是将天气划分成三类W1、W2、W3,分别对应晴或者多云、雨、雾;所述时间特征是将工作日记为W,将节假日记为H,工作日的工作时间记为WWT,工作日的上下班高峰时间记为WGT,工作日的早高峰前、晚高峰后时间记为WQT,其余时间记为WDT;节假日的日间时间记为HFT,其余时间记为HRT;所述交通拥堵特征是将拥堵情况分成五个级别TCI1、TCI2、TCI3、TCI4、TCI5,分别对应畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵;所述PM2.5特征是将PM2.5划分成五类PM1、PM2、PM3、PM4、PM5,分别对应优、良、轻度污染、中度污染、重度污染,所述上一时刻的供需差额特征是将前30分钟内每10分钟的供需差额进行分片处理,对于每10分钟内的供需差额划分为6个级别LG1、LG2、LG3、LG4、LG5、LG6,分别对应0~5、5~10、10~20、20~30、30~50、>50。

4.根据权利要求3所述基于C-GRU的网约车供需预测方法,其特征在于,所述拥堵情况的分类方法,是将第一等级拥堵情况的路段数量乘以1,第二等级拥堵情况的路段数量乘以

2,第三等级拥堵情况的路段数量乘以3,第四等级拥堵情况的路段数量乘以4,之后将乘数求和,根据求和结果进行线性变换,将拥堵情况分成五个级别,所述畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵分别对应(0~2)、(2~4)、(4~6)、(6~8)、(8~10)。

5.根据权利要求1所述基于C-GRU的网约车供需预测方法,其特征在于,所述利用卷积神经网络对数据进行训练是将特征数据以矩阵形式输入到卷积神经网络中,经过特征提取器和池化层的处理后,形成包含历史gap值数据、区域特征、温度特征、天气特征、时间特征、交通拥堵特征、PM2.5特征以及上一时刻的供需差额特征的低维特征图谱。

6.根据权利要求1所述基于C-GRU的网约车供需预测方法,其特征在于,所述低维特征图谱输入到门限循环神经网络模型中,模型中的重置门和更新门在大量训练中不断调整自身参数,使得能够从卷积神经网络中提取的信息依从时间关系,之后通过交叉熵代价函数计算输出层的梯度,从隐层到输出层利用Adam算法优化梯度值,最后经过softmax函数的处理,得到分类的结果。

7.根据权利要求6所述基于C-GRU的网约车供需预测方法,其特征在于,在t时刻,所述门限循环神经网络模型中,重置门激活信息rt=σ(Wr*[ht-1,xt]),更新门激活信息zt=σ(WZ*[ht-1,xt]),候选激活值 激活值其中xt为时刻t的输入,Wr,WZ,W分别为重置门、更新门、

候选激活值的权值参数,σ为激活函数,取sigmoid函数,*表示点乘,即两个向量对应维度的数据的乘积。

8.根据权利要求7所述基于C-GRU的网约车供需预测方法,其特征在于,所述交叉熵代价函数公式为

9.根据权利要求7所述基于C-GRU的网约车供需预测方法,其特征在于,所述经过softmax函数的处理后,输出层会输出一个k维的向量,向量的每一维的值为样本bt分别在设定的k类预测值的概率,设样本bt落入每一个类别m的概率为P(y=m|bt),最终的预测结果为T(Bt)=MAX(P(y=m|bt)),将供需差额值分为六类,分别为G1、G2、G3、G4、G5、G6,分别对应

0~5、5~10、10~20、20~30、30~50、>50,同时分别对应输出层的6个维度,公式体现为选取最大的概率为模型的预测范围,也就是落入6类概率的最大值。