1.一种基于车辆轨迹语义分析和深度信念网络的轨迹预测方法,其特征在于,包括以下步骤:
获取数据源的步骤:提取车辆原始信息中的车牌号、过车时间、卡口编码作为表征车辆轨迹信息的属性,具体是将每一辆车按过车时间顺序,将卡口编号排列作为其轨迹序列,所述车辆原始信息是通过卡口信息采集装置对行驶中车辆进行采集得到的;
卡口上下文分析的步骤:引入词嵌入思想,即利用单词在句子中的上下文关系来分析单词之间的关联性,通过使用滑动窗口对车辆的卡口轨迹序列数据进行卡口在轨迹中的上下文关系提取,建立卡口语料库,卡口语料库具有反映不同卡口在路网中的相关性的能力,卡口在轨迹数据中的角色相似度用卡口在高维空间中对应的点之间的距离衡量,最后根据相似度构建轨迹节点的向量空间,实现运用节点向量集表征节点间的交通时空关系;
提取用户轨迹特征的步骤:根据轨迹节点向量之间表现出的交通时空关系,对用户的历史轨迹数据进行数据分析,使用DBN深度信念网络对用户的轨迹向量进行逐层训练,将大量用户的历史轨迹集中表现出来的共性特征提取出来,作为后续进行轨迹预测的依据;
预测与分析步骤,根据轨迹特征建立回归预测模型,利用提取到的用户轨迹特征作为预测的依据,利用线性回归的预测思想生成预测结果;同时,同时考虑到交通轨迹交叉多、相似度高的特性,采用权重聚类对结果进行优化;
所述卡口上下文分析的步骤具体包括:S21:定义交通卡口间的关联性;使用统计概率模型来定义关联性,取轨迹为数据集中的第i条车辆轨迹,n为该轨迹包含的交通卡口的数量,c1,c2,…,cn为该车按时间顺序依次经过的交通卡口one‑hot向量,T={t1,t2,…,tm}为卡口语料库,m为数据集中轨迹的数量,卡口c与轨迹中其他卡口关联性的计算公式为:
其中Context(c)表示卡口c的前后n‑1个卡口,即Context(ci)={ci‑n+1,ci‑n+2,…,ci‑1,ci+1,…,ci+n‑2,ci+n‑1};
S22:构建向量空间;构造一个s维向量空间 使得每一个ci都可以在空间 有唯一的映射向量 并满足:
向量空间中与卡口 关联性最强的就是和它同时出现在一条轨迹中的卡口,即由此可以将卡口语料库T={t1,t2,…,tm}经空间嵌入后转换为其中 n是轨迹中卡口数量,
是交通卡口ci在空间 的向量表示;
所述预测和分析过程,主要分为以下两个步骤:S41:使用S3中得到交通轨迹特征集进行回归预测分析,得到最终的预测结果,轨迹特征集 其中,p代表特征提取网络的顶层输出,m为该层网络的神经元个数;再根据带标签的轨迹数据利用回归模型训练得到权重矩阵集合W={w1,w2,…,wm};
S42:采用权重聚类的方法对结果进行优化,通过对W进行无监督训练,得到聚类后的权重集合 其中,s是聚类的类别数,再找出 中包含每一辆车对应的轨迹样本权重wi最多的类 作为该车的回归预测权重值;最后,进行轨迹预测时,将该轨迹的特征向量 与车辆对应的权重矩阵 进行回归预测即得到最后结果。
2.根据权利要求1所述的基于车辆轨迹语义分析和深度信念网络的轨迹预测方法,其特征在于,所述获取数据源后还包括预处理原始数据的步骤:即对数据源重复数据、无效数据进行清洗。
3.根据权利要求1所述的基于车辆轨迹语义分析和深度信念网络的轨迹预测方法,其特征在于,所述提取用户轨迹特征的步骤具体包括:S31:结合交通轨迹的时空关联性和轨迹模式,引入受限玻尔兹曼机RBM模型,该模型通过一个能量函数E=(v,h;θ)定义了v,h上的概率分布,假设它是一个二进制RBM,它可以写成:
其中,可见变量v通过无向加权连接与随机隐藏单元h连接,θ=(w,b,a)是参数集,wij是连接可见层单元i和隐藏层j的权重矩阵,而bi和aj是它们的偏置,可见层与隐藏层的神经元数量用|V|和|H|来表示,当v或h固定时,条件概率可以计算如下:其中, 是Sigmoid函数,参数集θ=(w,b,a)中的参数可以使用对比散度进行有效地学习;
S32:考虑到交通轨迹数据的高复杂性,堆叠多个RBM形成一个DBN,通过训练一系列RBM来训练DBN的关键思想是,由RBM学习的参数θ是由p(v|h,θ)和先验分布p(h|θ)共同决定的,因此,生成可见层的概率可写为:
在从RBM学习θ之后,也就得到了p(v|h,θ),并且p(h|θ)可以被一个连续的RBM替代,该RBM将前一个RBM的隐藏层视为可见层,这样,DBN就可以作为一个无监督的特征学习方法。