买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于词向量的人车关联分析方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于词向量的人车关联分析方法

￥17800

专利号： 2022113121691

申请人：杭州电子科技大学滨江研究院有限公司

专利类型：发明专利

专利状态：已下证

更新日期：2026-06-16

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于词向量的人车关联分析方法，其特征在于，包括以下步骤：

步骤1：交通卡口通过两种不同的设备分别收集手机的IMSI码和车辆的车牌号，分别使用S＝(s1,s2,…,sn)和R＝(r1,r2,…,rm)表示收集的数据集合；

步骤2：对收集到的数据进行预处理，得到数据集合S'和R′；

步骤3：训练样本数据生成，将预处理后的同一个卡口的S′和R′数据按时间段进行切分；

步骤4：每一个样本当作一个文档，样本中IMSI码或者车牌号当作文档中的单词；将所有样本作为训练集，利用词嵌入技术中连续词袋模型；

步骤5：初始化CBOW模型中的参数矩阵WVoc×N，其中Voc是训练集中单词个数，即不同IMSI码和车牌号的总个数，N表示隐藏层神经元的数量，即最后得到的词向量维数，将每个单词t,表示为一位热编码向量Vt；

步骤6：定义CBOW在固定的窗口大小z下利用中心词的上下文向量预测这个中心词的向量；假设中心词向量为Vt，则其上下文向量作为模型的输入，结合参数矩阵WVoc×N，CBOW将输入向量传播到隐藏层h；

步骤7：隐藏层的向量表示h再根据CBOW中其他参数矩阵W′N×Voc的矩阵值继续向前传播信息，得到每个单词的概率分布V1×Voc；

步骤8：CBOW的实际输出与真实的目标输出相差较大，CBOW模型采用反向传播算法持续优化参数矩阵WVoc×N的值，最终目标是使得网络的实际输出最大概率接近目标输出，最终得到优化后的WVoc×N，进一步得到优化后单词t的向量表示由Vt·WVoc×N计算得到；

步骤8最终目标LM是使得网络的输出最大概率接近目标输出：

最终得到WVoc×N，对于单词t的向量表示由Vt·WVoc×N计算得到；

步骤9：对于任意两个单词tx和ty对应的词向量和计算和之间的余弦相似度步骤10：输入一个车牌号码或者IMSI码，与所有IMSI码或者车牌号根据相似度从大到小进行排序，得到最终的推荐结果序列。

2.根据权利要求1所述的一种基于词向量的人车关联分析方法，其特征在于，步骤1中，手机的IMSI码和车辆的车牌号分别使用S＝(s1,s2,…,sn)和R＝(r1,r2,…,rm)数据集合表示，其中n和m分别为表示该卡口收集到的IMSI码和车牌号相关的数据条数；在数据集合S中，每一条数据表示为si＝(id,imsi,time),i＝1,2,…,n，其中id表示该卡口的编号，imsi表示手机的IMSI码，time表示收集到该IMSI码的时间；在R中，每一条数据表示为rj＝(id,carnum,time),j＝1,2,…,m，其中carnum表示车辆的车牌号。

3.根据权利要求2所述的一种基于词向量的人车关联分析方法，其特征在于步骤2所述的预处理实现如下：步骤2‑1、常驻人口数据移除；

如果某个IMSI在连续指定的一段时间ConTime内被捕捉至少num次，则从S中删除所有与该IMSI码有关的数据；同理，如果某个车牌号码在连续的一段时间ConTime内被捕捉至少num次，则从R中删除所有与该车牌号有关的数据；

步骤2‑2、无效数据过滤，如果某个IMSI码或者车牌号仅在一个卡口中被捕获，则删除该IMSI码或者车牌号的所有相关数据；

步骤2‑3、将经过预处理的数据集合表示为S′＝(s'1,s′2,…,s′n′)和R′＝(r′1,r′2,…,r′m′)，n′和m′分别表示经过预处理后的IMSI码或者车牌号相关数据条数。

4.根据权利要求2或3所述的一种基于词向量的人车关联分析方法，其特征在于步骤3所述的训练样本数据生成实现如下：将同一个卡口的S′和R′数据按时间段进行切分，以00:00:00为起始时间，设置时间间隔gap，将所有在该时间段收集到的IMSI码和车牌号形成一条样本数据d，将所有卡口形成的样本数据的集合表示为D＝(d1,d2,…,dl)，其中l为样本的总条数。

5.根据权利要求2或3所述的一种基于词向量的人车关联分析方法，其特征在于步骤6中CBOW将输入向量传播到隐藏层h：

6.根据权利要求5所述的一种基于词向量的人车关联分析方法，其特征在于步骤7得到每个词的概率分布V1×Voc:V1×Voc＝softmax(h·W′N×Voc)。