1.一种基于土地利用混合度的网约车出行需求预测方法,其特征在于,包括以下步骤:S1、获取多源地理空间数据和网约车订单数据;
S2、对网约车订单数据进行预处理;
S3、对研究区域建立栅格单元,计算栅格面积,统计每个栅格内不同时间段的网约车订单量,基于多源地理空间数据得到建成环境指标,建成环境指标包括密度指标和土地利用混合度;
S4、将建成环境指标作为自变量,网约车订单数据作为因变量,建立多尺度时空地理加权回归模型;
S5、采用反向拟合算法对模型进行校准,采用校准后的模型对网约车出行需求进行预测;
所述S3中,对城市POI数据进行重分类,分为居住区、政府机构、科研、文化、教育、体育休闲、医疗保健、购物、餐饮、商务金融、公司企业、公交站点、交通枢纽、公园、广场,以每个栅格中心为原点创建缓冲区,缓冲区半径不低于栅格边长大小,统计落在缓冲区内POI种类的数量,并带入信息熵中计算得到土地利用混合度,表达式为: (1);
其中, 为第 个POI类型在栅格中所占的比例, 为栅格中POI类型总数;
将建成环境指标作为自变量,网约车订单数据作为因变量,建立多尺度时空地理加权回归模型,表达式为: (2);
其中,为因变量,即网约车出行需求数据, 表示基于特定空间带宽和时间带宽的第 个自变量的估计系数; 为截距, 为第 个采样点的坐标, 为第个采样点的空间位置坐标,为采样点 的时间坐标, 为第 个自变量,即建成环境指标,,为随机误差项;
模型中估计 的形式如下:
(3);
其中, 为权重矩阵,为解释变量;
求权重矩阵 时,采用的核函数为高斯函数,表达式为: (4);
式中, 为 的权重, 为第 个采样点到第 个回归点的时空距离,为时空带宽;
采用AICc准则选择最优带宽,赤池信息准则修正值 是衡量模型拟合优良性的标准, 值越低,模型拟合情况越好,表达式为: (5);
式中,是误差项的估计标准差, 是帽子矩阵 的迹,为样本量;当 最小时,即为最优带宽;
MGTWR的收敛准则为:连续迭代之间的差异足够小时迭代结束,采用变化值 来体现前后相邻迭代之间的差异,当 时迭代终止, 表达式为:(7);
式中, 为第 +1 轮迭代中的加法项, 为第 轮迭代中的加法项,为迭代次数。
2.根据权利要求1所述的一种基于土地利用混合度的网约车出行需求预测方法,其特征在于,所述多源地理空间数据包括城市POI数据、路网数据、Worldpop人口数据,所述网约车订单数据包括订单起始点时间和位置信息。
3.根据权利要求2所述的一种基于土地利用混合度的网约车出行需求预测方法,其特征在于,所述S2包括以下子步骤:S201:剔除订单数据中起始时间为空的数据;
S202:剔除运行时长低于1分钟的数据;
S203:剔除不在研究区域内的订单数据。
4.根据权利要求3所述的一种基于土地利用混合度的网约车出行需求预测方法,其特征在于,所述S3中,所述密度指标包括人口密度、路网密度、交通设施密度、居住区密度、公共管理与服务密度、商业服务密度、绿地与开敞空间密度和公司企业密度。
5.根据权利要求4所述的一种基于土地利用混合度的网约车出行需求预测方法,其特征在于,采用反向拟合算法进行模型校准,多尺度时空地理加权回归模型本质上是一种广义加性模型,因此采用最大化对数似然的反向拟合算法用于校准,多尺度时空地理加权回归模型的GAM形式为;
(6);
式中,为响应变量,是第 个解释变量的平滑函数,为误差项,解释变量总数;
模型校准过程包括以下子步骤:
S51、对所有加法项 设定初始值,为 ,则对应的误差项为 ;
S52、对初始化的 和 , 和 结合 进行MGTWR模型回归分析,计算对应的时空带宽 ,从而对 进行更新,记为 ;
S53、根据 计算对应的 ,重复步骤S52,得到对应的时空带宽 ,从而对 进行更新,记为 ;
S53、重复步骤S53,更新所有变量对应的 和 ,至此完成第一轮迭代;
S55、重复迭代过程,直至达到收敛准则;
MGTWR的收敛准则为:连续迭代之间的差异足够小时迭代结束,采用变化值 来体现前后相邻迭代之间的差异,当 时迭代终止, 表达式为:(7);
式中, 为第 +1 轮迭代中的加法项, 为第 轮迭代中的加法项,为迭代次数。