1.一种基于卡口数据的车辆轨迹和交通流量预测方法,其特征在于:包括以下步骤,步骤1、定义;
从卡口系统HDBS中获取某一车辆的轨迹数据;车辆轨迹是车辆在道路行驶的路线或位置点的集合;
步骤2、数据预处理;
包括删除不满足要求数据、重复数据剔除和冗余字段剔除;
步骤3、提取卡口数据信息;
步骤4、车辆轨迹构建和划分;
从卡口数据中分析并划分一个或多个独立的出行段的车辆行驶轨迹数据;
步骤5、选取符合条件车辆;
步骤6、车辆轨迹预测;
利用GCN‑GRU‑KAN组合模型进行车辆轨迹预测,包括下述流程,步骤6.1、建立路网拓扑结构G,输入轨迹数据;
步骤6.2、得到邻接矩阵A和特征矩阵X;
步骤6.3、使用基于谱域的图卷积GCN,先将图结构的数据用对称归一化拉普拉斯矩阵进行编码,计算矩阵的特征值λ,计算公式为 ;其中,, 表示加入自环且对角线为1的邻接矩阵, 为单位矩阵, 是 的度矩阵;
步骤6.4、通过对矩阵进行拉普拉斯变换,提取图结构特征;
sym
步骤6.5、将加工后的对称归一化拉普拉斯矩阵L 、特征矩阵X和参数矩阵W三者一起输入GCN,执行点积运算 ,使用激活函数 以激活并获得邻居节点的特征矩阵;其中, 为特征矩阵, 为邻接矩阵,W0表示输入层到隐藏层的权重,W1是隐藏层到输出层的权重;
步骤6.6、将GCN的点积运算输出结果输入GRU‑KAN时序特征分析模块;
输入GCN卷积结果的更新门、重置门和复位数据的计算公式分别为、 、
;其中,f(A,Xt)表示GCN层的卷积过程,Wu、Wr、Wc为权重矩阵,bu、br、bc为偏置项;
步骤6.7、定义GRU‑KAN循环神经网络层;
包括输入层GRU层、KAN层即全连接层、前向传播GRU层和输出层,GRU层通过门控机制来动态地调整每个时间步的信息权重,输出 ;
步骤6 .8、将GRU层的最后一个时间步的输出结果ht通过全连接层处理后输出Xt;其中,ФL‑1是第L个KAN层所对应的B‑spline函数矩阵,L=1层表示最靠近输入向量的KAN层,即Ф0,〇表示KAN层的堆叠运算;
步骤6.9、得到预测的包括平峰期和早、晚高峰期的车辆轨迹数据xt;
步骤7、交通流量预测;
叠加预测的车辆轨迹,得到未来每个卡口的交通流量预测值。
2.根据权利要求1所述的基于卡口数据的车辆轨迹和交通流量预测方法,其特征在于:所述的步骤2包括下述流程,
步骤2.1、将仅在研究区域内出现过一次或在研究区域之外的卡口数据删除;
步骤2.2、将持续时间少于1分钟的短途出行或持续时间超过12小时的不合理长途出行也排除在分析之外;
步骤2.3、对重复数据进行剔除,仅保留单条数据记录,剔除因卡口设备对经过断面的车辆进行图像识别时重复采集的数据;
步骤2.4、卡口数据集中包括多个冗余字段,剔除冗余和数据缺失率达到80%以上的字段;对于缺失率不高的数据采用中位数插补法进行数据补全,采用均方差检验法对异常值进行剔除。
3.根据权利要求1所述的基于卡口数据的车辆轨迹和交通流量预测方法,其特征在于:所述的步骤4,对每一车辆每次的出行轨迹进行划分,判断是否为一次出行,包括下述算法流程,假设某辆车一天共经过i个卡口,经过的卡口两两之间时间间隔为Δti;
步骤4.1、获取分析车辆轨迹的卡口记录信息,包括采集时间、车牌号、卡口编号、车道编号、经度、纬度、卡口名称;
步骤4.2、按时间对获取的轨迹记录进行排序,以车辆经过的第一个卡口为起点获取计算开始前的所有被分析车辆途径的卡口,将获取到的车辆轨迹记录按照采集时间进行排序,以确保车辆轨迹数据的时间顺序性;
步骤4.3、计算相邻轨迹记录之间的时间间隔,计算车辆经过相邻卡口之间的过车时间间隔Δti;
步骤4.4、计算车辆通过相邻卡口的距离;
首先,将经纬度转换为弧度 ;然后,利用卡口之间的经纬度,根据下述Haversine公式,计算车辆经过相邻卡口之间的实际距离Δsi;
;
其中,φ1和φ2是相邻的第一个卡口和第二个卡口点的纬度,以弧度为单位;Δ φ是两个卡口点的纬度差;Δλ是两个卡口点的经度差,以弧度为单位;R是地球的平均半径,数值为6371公里;
步骤4.5、确定速度阈值;
根据车辆经过卡口的时间和距离,计算每一对相邻卡口之间的平均通行速度;
步骤4.6、判断条件;
对于每一对卡口相邻记录,基于时间间隔Δti、平均速度和距离,判断是否将相邻记录视为同一次出行的一部分,判断公式为 ;若条件成立,则执行下述步骤
4.7;若条件不成立,则返回上述步骤4.3;
步骤4.7、轨迹划分;
根据步骤4.6的判断条件,得到卡口i+1是车辆轨迹的终点,将车辆的行驶轨迹划分为一个或多个独立的出行段;
步骤4.8、输出结果;
对于每次独立的出行段,输出其起始时间、结束时间、起始和结束的卡口信息、经过的卡口数信息。
4.根据权利要求1所述的基于卡口数据的车辆轨迹和交通流量预测方法,其特征在于:所述的步骤5,选择每个月经过卡口数大于平均卡口数的车辆作为实验对象,包括下述执行流程,步骤5.1、遍历原始车辆轨迹总数据;
步骤5.2、按车牌号分组,按时间排序;
步骤5.3、计算每辆车通过两个相邻卡口的时间t;
步骤5.4、计算城市平均单程通勤时间T;
步骤5.5、计算车辆经过的卡口数量的平均数 ;
步骤5.6、计算车辆每个月经过的平均卡口数 ;
步骤5.7、选择大于平均卡口数的车辆作为实验对象。
5.根据权利要求1所述的基于卡口数据的车辆轨迹和交通流量预测方法,其特征在于:所述的步骤6,进行车辆轨迹预测的GCN‑GRU‑KAN组合模型包括下述结构,邻接矩阵A组成维的矩阵,用以表示道路卡口的空间连接关系,每行代表一个卡口,矩阵中的值用0,1表示道路卡口之间的连通性,0表示卡口之间不相连,1表示卡口之间相连;
单位矩阵I是对角线均为1且其他项为0的矩阵,图卷积层将每个节点表示为其相邻节点的聚合;
度矩阵D描述一个路网中各个卡口的连接情况,矩阵对角线上的数值表示各卡口所相连的卡口数;
特征矩阵X表示车辆完整的出行轨迹随时间t的变化,每行代表一次车辆出行的轨迹,每列代表一个卡口,如果车辆在出行中通过了卡口,则相应的行值为1,否则为0;
参数矩阵W包含神经网络的权重和偏置项;
路网拓扑结构G, , 为路网中所有表示为顶点的卡口集合,即路网中存在n个卡口; 是路网中连接路段的边线集合,A为邻接矩阵。