1.一种基于流式大数据的同行车辆发现方法,其特征在于,包括以下步骤:S1:获取卡口摄像头拍摄的行驶在路上的车辆的数据,生成数据集;
S2:提取相关属性,从获取到的数据集中提取同行车辆最密切的特征:包括车牌号、时间及卡口,将提取到的特征作为动态图计算模型的输入特征;
S3:对卡口进行角色划分,卡口角色划分主要是通过车辆行驶轨迹得到的卡口属性作为聚类条件,通过聚类算法得到卡口类簇进而对卡口进行角色划分,同行车组经过不同类别卡口后,它们之间的权重得到不同程度的增加,卡口角色划分作为外部因子参与到动态图计算过程;
所述步骤S3对卡口进行角色划分,主要分以下4个步骤S31:通过车辆轨迹Tracev得到基于卡口的路网流量图,图中的节点代表卡口,卡口之间的连线形成边;
S32:构造动态图的邻接矩阵A,转移矩阵S,计算动态图的转移矩阵P,且
0<β<1为衰减因子,N为基于卡口的路网流量图中节点的数量,U为N阶矩阵,且Uij=1;
S33:求解矩阵P的特征向量q=Pq,当q不断迭代到最终收敛时,得到终解q,节点的PageRank值即为特征向量q中对应维的值,采用社团中的每个点在社团内外的重要性来量化节点在所属社团的内部影响力和外部影响力,这两个影响力值构成节点的影响力二维坐标Inner值和Outter值;
S34:根据Inner和Outter值对卡口进行Kmens聚类,得到卡口类簇,据此划分卡口角色;
S4:获取动态车牌数据集,将用于实验的自动车牌识别数据通过高吞吐量的分布式发布订阅消息系统Kafka处理为流式数据,根据ANPR数据流中的移动对象的特征信息引入滑动时间窗口机制,特征信息包括车牌号、时间及卡口,对特征信息进行时间切片化处理建立动态车牌数据集;
S5:根据动态车牌数据集建立动态图计算模型,用权重、出度、入度表示车辆节点之间的关系,车辆实时轨迹用动态图进行表示,在实时计算过程中通过引入卡口角色对车辆之间形成的动态图进行剪枝、权重计算在内的步骤挖掘得到同行车辆组;
所述步骤S1获取卡口摄像头拍摄的行驶在路上的车辆的数据,生成数据集,具体包括:S11:获取数据,提取卡口摄像头采集的行驶车辆的所有数据;
S12:对数据进行时间分片,根据“时间”字段,对每辆车的所有数据进行划分,考虑到同行车辆的特点,统计同一卡口在设定阈值间隔中的过车数量,其中,同行车辆组指的是两个或多个移动对象在短时间阈值内共同经过多个卡口的车辆组;
所述步骤S2提取相关属性,主要分以下2个步骤;
S21:提取相关属性, 从获取到的数据集中提取同行车辆最密切的特征:车牌号、时间、卡口;
S22:将提取到的属性根据时间维度进行序列化,获得每辆车的轨迹Tracev,通过轨迹得到卡口的分支数量,通过统计经过卡口的次数得到卡口特定时间段的车流量。
2.根据权利要求1所述的一种基于流式大数据的同行车辆发现方法,其特征在于,所述步骤S4获取动态车牌数据集具体包括:S41:流式数据从交通探头拍摄,包含车辆信息的数据通过时间批间隔传输到操作平台;
S42:利用Sparkstreaming处理数据,利用公式: 动态调整批间隔,优化批间隔选择的时间,Ftr表示卡口的车流量,α表示动态系数;
S43:对批间隔数据进行操作,根据时间轴加入时间窗口函数,对卡口角色,车牌进行组合处理,在一个时间窗口内经过同一个卡口的车辆被判定为同行车组关系,通过不断对流数据进行处理实时发现同行车组。
3.根据权利要求2所述的一种基于流式大数据的同行车辆发现方法,其特征在于,所述步骤S5建立动态图计算模型,主要分以下3个步骤:S51:通过处理后的RDD构造动态图G(V、E)的顶点V和边E,每个顶点vi∈V代表一个车牌号,边e∈E代表在给定的源vs和其对应的目标车辆之间的定向关联,每个边上的w权重是在两个顶点之间绘制边的次数;
S52:动态图构造之后,遍历查询图G(N,E)识别冗余连接和更新边权重,N为卡口图中节点的数量,E表示边,定义以下度量标准,阈值 两辆车或多辆车同行与否的判断依据,即出现频率;冗余Ru:车辆组合之间的连边不再增加或者没达到阈值,对于这种连边要及时进行删除;
S53:提取达到提前设定阈值的车辆组作为结果。