1.居民交通出行流量预测系统,其特征在于,包括:
数据收集模块,用于通过居民手机GPS收集居民移动的轨迹数据信息;
数据预处理模块,用于将居民轨迹清洗、统计计算以及转换成流量图;
模型训练模块,用于通过卷积神经网络来提取特征,反卷积操作来预测下一个时间段的预测流量图;通过将预测流量图与实际流量图的误差来反向调节全卷积神经网络,调节全卷积神经网络中卷积核的权重、反卷积核的权重、激活函数权重来拟合出接近于真实情况的预测模型;
模型测试模块,用于预测模型的测试,利用均方根误差即RMSE测试评价预测模型;
模型预测流量图输出模块,用于输出预测流量图并根据划分栅格网的经纬度范围将预测流量图映射到地图上,做直观的地理可视化表达。
2.如权利要求1所述的居民交通出行流量预测系统的预测方法,其特征在于,具体按照以下步骤进行:
步骤S1、数据收集模块根据居民的手机GPS收集居民的轨迹数据集;采用服务器来接收居民手机返回的GPS轨迹点信息,服务器接收每一个GPS轨迹点的数据格式为:{ID,lon,lat,t},ID是居民手机的ID,lon为GPS轨迹点的经度,lat为GPS轨迹点的纬度,t为GPS轨迹点的时间;GPS轨迹点组成GPS轨迹数据集,一个居民的GPS轨迹数据集表示为Tra={(lon1,lat1,t1),(lon2,lat2,t2),(lon3,lat3,t3),...,(lonn,latn,tn)};
步骤S2、数据预处理模块清洗居民出行轨迹数据,根据时段计算GPS轨迹点落入的栅格区域,统计居民出行流量,做成流量图的数据格式;
步骤S3、模型训练模块利用卷积神经网络来对居民出行区域流量图像做卷积,提取特征,用不同大小的卷积核来做卷积,卷积过后进行池化操作,生成多个池化特征图;然后在池化后用反卷积操作来重构预测出下一个时间段的流量图,直到生成与输入流量图像的尺寸大小相等的预测流量图,通过预测流量图与实际流量图差值来反向调节全卷积神经网络,得到预测模型;
步骤S4、模型测试模块利用预测模型进行测试,利用RMSE测试评价预测模型;
步骤S5、利用出流量和入流量来增加流量图像通道,将流量图原有的单通道扩充到2个通道来增加输入数据的维度从而提高预测的准确性,模型预测流量图输出模块输出预测流量图并根据划分栅格网的经纬度范围将预测流量图映射到地图上,做直观的地理可视化表达。
3.根据权利要求2所述的居民交通出行流量预测系统的预测方法,其特征在于,所述步骤S2包括:
步骤S21、清洗居民出行轨迹数据,居民出行的GPS轨迹数据集至少包含三种属性,分别为GPS轨迹点的经度、GPS轨迹点的纬度、GPS轨迹点的时间;清洗三类轨迹数据,第一类为缺失属性的数据即某一条点位信息的部分属性值缺失;第二类为不在研究区域范围内的GPS轨迹点,如果居民出行到较为偏僻的区域,则过滤掉这些信息;第三类为居民出行经纬度属性异常的点位信息,即利用两个点经纬度和时间信息,计算居民移动的最大速度,如果速度超过了客观现实居民移动的最大速度,则视为异常属性,将这含有三类异常情况的样本数据剔除;
步骤S22、GPS轨迹数据集对预测交通流量的区域按照经纬度划分为多个地理栅格,以预测区域的最大和最小经纬度作为划分的边界,采用迭代单位经纬度的方式,直到等于边界的经纬度,将居民出行区域划分为多个方形的地理栅格图;
栅格区域定义如下:
其中,range1(lat1,lon1,lat1,lon2,lat2,lon1,lat2,lon2)是第一个地理栅格,rangen-1(latn-1,lonn-1,latn-1,lonn,latn,lonn-1,latn,lonn)是第n个地理栅格;
步骤S23、GPS轨迹数据集对预测交通流量的区域划分预测时段,预测时段为T;
步骤S24、利用居民手机GPS,根据划分好的预测交通流量的区域的地理栅格图,判断居民所处的栅格区域,当预测时段T内居民再次进入栅格范围内计入一次流量,预测时段T内在栅格区域移动不重复计入流量。
4.根据权利要求3所述的居民交通出行流量预测系统的预测方法,其特征在于,所述步骤S24每个栅格里面的值代表流量图的像素点的大小,同时也代表改栅格区域内居民出行流量的大小,利用居民手机GPS,统计单位时间内的居民交通出行流量,统计完之后得到一个M×N的矩阵,其中,M是矩阵的行,M的值与栅格区域的长相等,N是矩阵的列,N的值与栅格区域的宽相等,将M×N的矩阵转换为一个单通道的流量图,记为M×N×1,其中1是通道数即单通道,即将流量数据转化为流量图或者是张量的数据格式;划分的流量图的长宽是4的偶数倍;居民的手机GPS每隔10秒-60秒会向服务器返回一条GPS定位信息,服务器收集居民返回的GPS轨迹数据。
5.根据权利要求2所述的居民交通出行流量预测系统的预测方法,其特征在于,所述步骤S3包括:
步骤S31、对GPS轨迹数据集进行归一化,采用(0,1)归一化,根据GPS轨迹数据的均值方差,经过处理的GPS轨迹数据符合标准正态分布,即均值为0,标准差为1;具体操作为,数据减去数据的平均值再除以标准差;
步骤S32、利用卷积神经网络来对居民出行区域流量图做卷积,卷积操作如下:
其中,g(i,j)是卷积特征图第i行第j列的输出像素值,f(i+a,j+l)是流量图第i+a行第j+l列的输入像素值,h(a,l)表示卷积核,a∈(1,2,…,m),l∈(1,2,…,n),m是卷积核长,n是卷积核宽;
卷积层最多设置4层,卷积层设置1层时,第一层卷积层的卷积核为64个;卷积层设置2层时,第一层卷积层的卷积核为64个,第二层卷积层的卷积核为64个或128个;卷积层设置3层时,第一层卷积层的卷积核为64个,第二层卷积层的卷积核为64个或128个,第三层卷积层的卷积核为128个或256个;卷积层设置4层时,第一层卷积层的卷积核为64个,第二层卷积层的卷积核为64个或128个,第三层卷积层的卷积核为128个或256个,第四层卷积层的卷积核为128个或256个;卷积特征图的个数与卷积核的个数相同,64≤h≤256;
步骤S33、对卷积特征图进行池化,定义在第k-1层为卷积层,第k层为池化层,则第k层池化公式如下:其中, 是池化层的第e个池化特征图,64≤e≤256; 是池化层第e个池化特征图的权重, 是池化层第e个池化特征图的偏置项, 为从 进行下采样,下采样分为平均采样和最大值采样, 是卷积层的第h个池化特征图。
6.根据权利要求5所述的居民交通出行流量预测系统的预测方法,其特征在于,所述步骤S4定义均方根误差即RMSE作为评估模型来测试评价预测模型;
其中,Observedi是第i个地理栅格区域人流量的实际值,Predictedi为第i个地理栅格区域人流量的预测值,n是地理栅格的数量;模型预测多次,最后取其平均值。