1.一种基于大数据的道路路况预测方法,其特征在于,包括:
S1:获取三个道路路况原始数据表;第一个表中的字段包含路段id,含当前时间,待预测时间,当前时间的前5个时间片的车辆通过数,路况拥堵状态以及速度;第二个表中的字段包含路段id,道路长度,宽度,车道数,通行方向,限速,道路等级;第三个表中的字段包含与每条道路连通的下游道路id;
S2:将获取的三个道路路况原始数据表合并在一个数据表中,提取数据表中数据的连续特征、类别特征以及空间特征;
提取数据表中数据的连续特征、类别特征以及空间特征,包括:
对于连续特征,把当前时间片之前5个时间片数据构成一个序列,每一个时间片代表2分钟,在窗口内统计车辆平均速度、车辆最大速度、车辆最小速度、每分钟车辆平均通行数、每分钟车辆最大通行数、每分钟车辆最小通行数、拥堵比例、预计到达时间作为连续特征;
对于类别特征,对于每一条道路id,统计每小时道路拥堵比例、每小时车辆平均速度、每小时车辆平均通行数、每星期道路拥堵比例、每星期车辆平均速度、每星期车辆平均通行数作为类别特征;
对于空间特征,将路段作为节点,统计每个道路的上下游节点数量、上下游节点道路状况以及当前道路属性特征作为空间特征;
S3:建立路况预测模型,所述路况预测模型包括:基于动态注意力的多层感知机、基于拓扑子图的图神经网络以及分类层;
S4:采用基于动态注意力的多层感知机对连续特征和类别特征进行学习;
S5:采用基于拓扑子图的图神经网络对空间特征进行学习;
S6:将基于动态注意力的多层感知机输出向量和基于拓扑子图的图神经网络输出向量拼接在一起,通过分类层进行输出预测结果。
2.根据权利要求1所述的一种基于大数据的道路路况预测方法,其特征在于,采用基于动态注意力的多层感知机对连续特征和类别特征进行学习,包括:步骤1:将类别特征送入基于特征交互的多层感知机进行特征提取,得到特征向量Ek;
步骤2:将所有连续特征作为输入,通过动态注意力网络得到特征向量Es;
步骤3:将特征向量Ek和特征向量Es拼接在一起,得到输出特征向量Ea。
3.根据权利要求2所述的一种基于大数据的道路路况预测方法,其特征在于,基于特征交互的多层感知机进行特征提取,包括:步骤1:将类别特征通过Embedding层进行编码,得到每个类别的编码向量Ee;
步骤2:将编码向量Ee进行转置,得到转置向量 分别采用两个带有1个隐藏层的多层感知机对两个向量进行高维映射,得到Ee1和步骤3:将Ee1和 进行矩阵乘法,并利用sigmoid激活函数对其进行激活,再采用一个可学习权重矩阵M让激活后的矩阵与原始Ee进行融合,得到最终输出的类别特征向量Ek。
4.根据权利要求3所述的一种基于大数据的道路路况预测方法,其特征在于,采用基于特征交互的多层感知机获取类别特征向量Ek,包括:T
Ek=ε(k)+σ(g1(ε(k))g2(ε(k)))M
其中,Ek表示类别特征向量,ε表示Embedding编码,k表示类别特征,g1和g2表示第一、第二多层感知机,T表示矩阵转置,M表示可学习的权重矩阵,σ表示sigmoid激活函数,ε(k)表示对类别特征进行Embedding编码。
5.根据权利要求2所述的一种基于大数据的道路路况预测方法,其特征在于,通过动态注意力网络提取特征向量Es,包括:步骤1:将连续特征S分别送入三个1×1的卷积核中,得到三个维度相同的向量E1、E2、E3;
步骤2:对E1和E2做矩阵乘法,得到特征交叉后的矩阵Es1,同时E1和E3做矩阵乘法,得到特征交叉后的矩阵Es2,采用softmax函数对两个特征矩阵进行激活,得到对应的相关性矩阵和步骤3:将相关性矩阵 与E3进行矩阵乘法,表示将相关性矩阵的权重赋予原向量,得到第一个注意力向量Esa,同时将相关性矩阵 与E2进行矩阵乘法,得到第二个注意力向量Esb,采用两个可学习参数α和β对两个注意力向量进行加权,并最终通过一个1×1的卷积核,将维度还原到原始维度,并与原始连续特征S进行残差连接,得到连续特征向量Es。
6.根据权利要求5所述的一种基于大数据的道路路况预测方法,其特征在于,通过动态注意力网络获取连续特征向量Es,包括:其中,Es表示连续特征向量,f1、f2、f3、f4分别表示第一、第二、第三、第四1×1的卷积层,表示softmax激活函数,α、β分别表示第一、第二可学习权重参数,s表示输入的连续特征,f()表示卷积操作,T表示矩阵转置。
7.根据权利要求1所述的一种基于大数据的道路路况预测方法,其特征在于,采用基于拓扑子图的图神经网络对空间特征进行学习,包括:步骤1:对于任意一段道路,提取其上下游4阶的节点进行无向图构建,将所有道路的无向图构建出来,组成邻接矩阵A;
步骤2:将邻接矩阵A和空间特征F送入图神经网络中,通过逐层计算并将图神经网络第m层输出作为道路的拓扑向量Er。
8.根据权利要求7所述的一种基于大数据的道路路况预测方法,其特征在于,计算得到道路的拓扑向量Er,包括:H0=εr(link,C1,C2,...,C8),F=[link,C1,C2,...,C8]Er=Hm
其中,εr表示embedding词嵌入层,link,C1,C2,…,C8分别表示空间特征F的道路link和其上下游节点,H0表示图神经网络第一层输出,Hl表示图神经网络第l层输出,Hm表示图神经网络第m层输出,m为图神经网络的最大深度,σ表示sigmoid激活函数,Wl表示图神经网络第l层的权重,D表示度矩阵,tanh表示tanh激活函数,Ml表示图神经网络第l层的偏移权重。