1.一种基于异构数据的高速公路路段交通状态检测方法,其特征在于,该方法包括以下步骤:
1)基于收费数据提取交通参数;
2)构建高速公路平均行程速度预测模型;
3)实现时段的平均行程速度预测;
4)基于视频数据提取空间占有率特征参数;
5)利用路段上各断面空间占有率得到该路段的平均空间占有率;
6)基于预测得到的平均行程速度及路段的占有率,采用聚类方法对交通状态进行划分;
所述步骤1)具体包括如下步骤:
11)获取每辆车收费数据所记录的行程时间ti,ti为第i辆车的行程时间;
12)以下道收费站记录的行程时间减去出入口排队时间和匝道通行时间,求得每辆车OD行程时间,计算公式为:tOD=ti‑tq‑to‑td
其中:
tOD为车辆OD行程时间;
tq为车辆出入口排队时间;
to为入口匝道通行时间;
td为出口匝道通行时间;
若车辆是以ETC缴费方式通行,则tq=0,若车辆以MTC缴费方式通行,则该辆车的tq可由相邻时段MTC和ETC行程时间的差值得到,计算公式为:其中:
so,sd分别为入口匝道路程和出口匝道路程;
vo,vd分别为入口匝道和出口匝道速度设定值;
13)两收费站间的路段长度除以每辆车OD行程时间,得到每辆车的平均行程速度;
所述步骤2)具体包括如下步骤:
21)构建两收费站间平均行程速度数据集,并将历史数据集进行时段分类;
22)构建特征向量,将每个时段以5min为一小段分为n段,每一小段为ac,c=1,2,…,n,每一小段的平均行程速度 即为该小段内所有车辆的平均行程速度;历史数据集中每条记录包括当前平均行程速度 以及前3期平均行程速度
23)将历史数据集分别采用交叉验证的方法对KNN算法中的K值进行标定。
2.根据权利要求1所述的一种基于异构数据的高速公路路段交通状态检测方法,其特征在于,所述步骤21)中,将历史数据集分为工作日早高峰、工作日晚高峰、工作日平峰、休息日早高峰、休息日晚高峰和休息日平峰六类。
3.根据权利要求2所述的一种基于异构数据的高速公路路段交通状态检测方法,其特征在于,所述步骤23)中,假设K值的最大值为Kmax,最小值为Kmin,步骤23)具体包括如下步骤:
231)将六类数据集分别随机平均分为P份,每份分别表示为D1,D2,D3,…,DP,依次将Dp,p=1,2,3,…,P,作为测试集,其余的P‑1份合并为新的历史数据集;
232)当K=K0,Kmin≤K0≤Kmax时,计算Dp测试集的平均绝对误差百分比,计算公式为:其中:
E(K0,DP)为Dp测试集的平均绝对误差百分比;
Np为Dp测试集的样本量;
Ar为Dp测试集中第r条记录的真实值;
Pr为Dp测试集中第r条记录运用KNN算法的预测值;
233)当K=K0,Kmin≤K0≤Kmax时,求得P份测试集的平均绝对误差百分比的均值,计算公式为:
234)当 取得最小值时,对应的K0即为最优K值结果,否则重复232)至234),直到取得最小值。
4.根据权利要求3所述的一种基于异构数据的高速公路路段交通状态检测方法,其特征在于,所述步骤3)具体包括如下步骤:
31)以5min为一预测时段,将当前需预测时段f对应六类时段的某一类时段A中,获取A时段的历史数据集及该类时段的K0值;
32)以当前需预测时段f的前3期的平均行程速度作为所要预测的当前时段平均行程速度的特征向量;
33)使用欧几里德距离公式得到需预测时段f前3期特征向量与历史数据集中各特征向量之间的距离,计算公式为:其中:
表示需预测时段f的平均行程速度vf与历史数据集中ac时段的平均行程速度 的特征向量之间的欧几里德距离;
vf‑j为vf的第j个属性;
为 的第j个属性;
34)选取 中前K0个欧几里德距离近的历史数据,以这K0个值的加权预测行程速度,计算公式为:其中:
为从 中选取的前Ko个值中第u个历史平均行程速度;
为vf与 依据欧几里德距离 确定的权值。
5.根据权利要求4所述的一种基于异构数据的高速公路路段交通状态检测方法,其特征在于,步骤4)具体包括如下步骤:
41)对视频图像进行采集,并选择感兴趣区域;
42)利用单高斯背景建模法得到背景图像;
43)基于背景差分法对背景车辆目标进行提取;
44)对差分图像进行二值化处理得到二值图;
45)将二值图中非零点数除以感兴趣总点数,即为当前时刻的空间占有率。
6.根据权利要求5所述的一种基于异构数据的高速公路路段交通状态检测方法,其特征在于,步骤5)具体包括如下步骤:
51)以5min为检测周期,对所检测路段上的摄像头在时段ac中某一时刻同时进行占有率提取,记为 m表示检测路段上共有摄像头数量, 表示所要检测路段上,在f时段中某一时刻第q个摄像头所提取得到的空间占有率;
52)根据m个摄像头的地理位置,将所要检测路段分为m+1段,每段长度为lq,lq代表路段为第q个摄像头上游路段长度,lq+1代表道路最后一段长度,即为lm;
53)利用各断面空间占有率得到对应各小路段上车辆所占的面积大小,计算公式如下:其中:
表示第q‑1个摄像头与第q个摄像头路段间在ac时间段中的某一时刻,路面上车辆所占的面积;
lq表示该路段的长度;
d表示该路段的宽;
道路起点到第0个摄像头之间的路段,即q=0时有:道路上第m‑1个摄像头到终点之间的路段,即q=m时有:
54)根据各路段所得到的车辆所占的面积,得到检测路段的平均空间占有率;计算公式为:其中:
表示检测路段在ac时段的平均空间占有率。
7.根据权利要求6所述的一种基于异构数据的高速公路路段交通状态检测方法,其特征在于,所述步骤6)具体包括如下步骤:
61)分别获取六类时间段中的平均行程速度 和平均空间占有率 交通参数特征向量为 通过对所得样本数据进行训练得到交通参数的聚类中心;
62)采用欧式距离作为相似性函数判断新数据的数据与每个聚类中心的从属程度;根据步骤4和步骤6得到在所需预测的f时段中,两收费站间的平均行程速度vf和收费站间的平均空间占有率Qf,xc=(vf,Qf)表示新输入的交通参数向量,分别计算其与三个聚类中心的欧式距离,计算公式如下:dc=||xc‑kc||
63)比较得到dc的最小值,认为xc的交通状态与kc相对应,完成基于k‑means算法的交通状态判别。
8.根据权利要求7所述的一种基于异构数据的高速公路路段交通状态检测方法,其特征在于,由步骤22)得到某类时间段共有n个数据样本;
所述步骤61)中,通过如下步骤训练得到交通参数的聚类中心:
611)令I=1,随机选择w个初始聚类中心Zw(I);
其中:
w=1,2,3,…,k,w表示第w类;
612)求解每个数据样本与初始聚类中心的距离D(xc,Zw(I)),c=1,2,3,…n,w=1,2,
3,…,k;
若满足D(xc,Zw(I))=min{D(xc,Zw(I)),c=1,2,3,...,n},那么xc∈Wk,Wk为第k类数据集;
613)令I=I+1,计算新聚类中心 以及误差平方和准则函数
614)判断:如果|Jo(I+1)‑Jo(I)|<ζ,那么表示算法结束,反之,I=I+1,重新返回第
612)步执行;
K=3,得到最后的聚类中心为:
其中,k1,k2,k3分别表示道路畅通、缓行和拥堵三个状态的聚类中心,数据区的第一列表示平均行程速度,第二列表示路段平均空间占有率。