1.一种基于时空特征融合的人车关联分析方法,其特征在于,包括如下步骤:步骤1、针对目标路网中所有卡口,分别收集车辆的车牌号相关数据和手机的IMSI码相关数据,并预处理;
步骤2、将经过预处理后相关数据中的车牌号和IMSI码按卡口编号和收集时间进行划分得到样本集合;
步骤3、将样本集合中每一条样本看作一个文档,利用词嵌入模型进行训练,得到每一个车牌号和IMSI码初始的词嵌入;
步骤4、针对每个样本根据车牌号、IMSI码以及车牌号和IMSI码初始的词嵌入进行构图,并针对每个车牌号利用图注意力网络得到该车牌号在图中的节点各个时间片内新的特征向量;
步骤5、将车牌号各个时间片的特征向量作为时间序列输入,传递给时间卷积长短期记忆网络来捕捉节点的时间特征,得到车牌号在各个时间步的隐藏状态;
步骤6、使用平均池化方法对各个时间步的隐藏状态进行聚合,得到每个车牌号的最终向量表示;
步骤7、针对IMSI码按步骤4‑6得到每个IMSI码的最终向量表示;
步骤8、对所有的车牌号和IMSI码的最终向量表示计算余弦相似度;对于任意一个车牌号或IMSI码,选择与其余弦相似度最高的IMSI码或车牌号作为其关联结果。
2.根据权利要求1所述的一种基于时空特征融合的人车关联分析方法,其特征在于,所述车牌号相关数据包括卡口编号、车牌号、收集时间,所述IMSI码相关数据包括卡口编号、IMSI码、收集时间。
3.根据权利要求1所述的一种基于时空特征融合的人车关联分析方法,其特征在于,所述预处理方法包括过滤掉缺失数据、冗余数据、异常值数据以及非关联数据。
4.根据权利要求1所述的一种基于时空特征融合的人车关联分析方法,其特征在于,所述步骤2中,样本集合的划分方法:将同一个时间段内同一卡口收集的车牌号和IMSI码组成一条样本,所有样本形成样本集合。
5.根据权利要求4所述的一种基于时空特征融合的人车关联分析方法,其特征在于,所述步骤2中,划分样本时,从00:00:00开始计算,每1分钟为一个时间段。
6.根据权利要求1所述的一种基于时空特征融合的人车关联分析方法,其特征在于,所述步骤4中构图方法为:对于每个样本,将样本中的每个车牌号和IMSI码作为节点,车牌号和IMSI码的词嵌入作为对应节点的初始特征向量;在每两个节点之间建立边,并根据两个节点数据的收集时间差来计算边的权重。
7.根据权利要求6所述的一种基于时空特征融合的人车关联分析方法,其特征在于,所述权重计算方法为:对于任意一对节点p和q,其边(p,q)的权重可以表示为 其中tp和tq分别表示节点p和q的收集时间,单位为秒,最后得到每个图的权重矩阵W。
8.根据权利要求7所述的一种基于时空特征融合的人车关联分析方法,其特征在于,所述步骤4中,还包括针对每一个车牌号,获取各个时间片内包含该车牌号节点的图;针对获得的每一个图,利用图注意力网络来捕捉节点的空间特征,得到该车牌号节点在各个时间片内新的特征向量。
9.根据权利要求7所述的一种基于时空特征融合的人车关联分析方法,其特征在于,所述步骤4中,该车牌号节点在各个时间片内新的特征向量的获取方法:图中每个节点i具有一个初始特征向量h′i,使用一个可学习的权重矩阵M对这些特征向量进行变换;
h″i=Mh′i
对于每个与节点i相连的节点j,融合边的权重计算注意力系数eij:T
eij=LeakyReLU(a[h″i||h″j||wij])
T
其中,a是一个可学习的权重向量,||表示向量拼接,LeakyReLU是带有负斜率的激活函数,wij为边(i,j)的权重;
使用Softmax函数对注意力系数eij进行归一化,以确保节点i的所有邻居中的注意力系数之和为1;
使用归一化的注意力系数对邻居节点的特征进行加权求和,得到节点i的新的特征向量xi;
重复上述步骤,从而得到该车牌号在各个时间片内的新的特征向量。
10.根据权利要求9所述的一种基于时空特征融合的人车关联分析方法,其特征在于,所述步骤7中,在获取IMSI码节点在各个时间片新的特征表示时,针对每一个IMSI码,获取各个时间片内包含该IMSI码节点的图。
11.根据权利要求1所述的一种基于时空特征融合的人车关联分析方法,其特征在于,所述步骤5中,所述时间卷积长短期记忆网络由时间卷积层和长短期记忆层堆叠而成;所述时间卷积层的输入为车牌号在各个时间片内的新的特征向量组成的时间序列,层内采用扩张卷积层对时间序列数据进行卷积操作,提取时间序列中的局部特征,进而输出车牌号在各个时间步的向量表示并传递给下一层;长短期记忆层的输入为时间卷积层的输出,对于每个时间步,输入向量会通过输入门、遗忘门、候选记忆细胞和输出门的计算,得到该时间步的隐藏状态,最后将各个时间步的隐藏状态作为时间卷积长短期记忆网络的输出。