1.一种用户轨迹识别方法,其特征在于,所述用户轨迹识别方法包括:获取用户在待识别时间段的原始wifi数据和gps信息,其中,所述原始wifi数据包括wifi连接时间;
对所述原始wifi数据进行数据预处理,得到待识别数据;
根据预设的专家规则词典,对所述待识别数据进行一次识别,得到一次识别结果;
若所述一次识别结果为识别成功,则得到所述待识别数据的地点类别;
若所述一次识别结果为识别失败,则将所述待识别数据输入至预先训练好的wifi识别模型中,得到二次识别结果,其中,所述二次识别结果包括所述待识别数据的地点类别;
根据所述wifi连接时间将所述待识别段进行切片划分,得到至少一段wifi连接时间段,并根据所述待识别数据的地点类别对所述wifi连接时间段进行标注,得到用户位置标注信息;
根据所述用户位置标注信息、所述原始wifi数据和所述gps信息,生成所述用户的用户轨迹。
2.根据权利要求1所述的用户轨迹识别方法,其特征在于,所述原始wifi数据包括wifi名称数据,所述对所述原始wifi数据进行数据预处理,得到待识别数据包括:对所述wifi名称数据进行数据清洗处理,得到数据清洗结果;
将所述数据清洗结果中的wifi名称数据进行分词处理,得到wifi分词数组;
将所述wifi分词数组中的停用词进行剔除,得到待识别数据。
3.根据权利要求2所述的用户轨迹识别方法,其特征在于,所述将所述数据清洗结果中的wifi名称数据进行分词处理,得到wifi分词数组包括:对所述数据清洗结果中的wifi名称数据进行单字切分,得到序列数组;
根据预设的前缀词典,构建所述序列数组的有向无回图,并分别计算所述有向无回图中各路径的概率;
根据所述有向无回图中最大概率对应的路径,得到最优分词结果,并根据所述最优分词结果对所述数据清洗结果中的wifi名称数据进行分词,得到wifi分词数组。
4.根据权利要求1‑3中任一项所述的用户轨迹识别方法,其特征在于,所述根据预设的专家规则词典,对所述待识别数据进行一次识别,得到一次识别结果包括:将所述待识别数据与所述专家规则词典中的地点单词进行匹配;
若匹配成功,则将所述待识别数据匹配成功的地点单词对应的地点类别作为一次识别结果;
若匹配失败,则将所述一次识别结果设为识别失败。
5.根据权利要求4所述的用户轨迹识别方法,其特征在于,所述将所述待识别数据输入至预先训练好的wifi识别模型中,得到二次识别结果包括:将所述待识别数据输入至所述wifi识别模型中的词向量层,将所述待识别数据转化成词向量序列;
将所述词向量输入至所述wifi识别模型中的最大池化层,得到最大池化结果;
将所述最大池化结果输入至所述wifi识别模型中的全连接隐藏层,并通过Softmax函数,对所述全连接隐藏层的输出结果进行分类,得到二次识别结果。
6.根据权利要求5所述的用户轨迹识别方法,其特征在于,所述wifi识别模型通过以下步骤训练得到:
获取历史wifi数据和预设的神经网络模型,并初始化所述神经网络模型中词向量层、最大池化层和的网络参数和全连接隐藏层的网络参数,所述历史wifi数据包括人工标识的地点类别;
将所述历史wifi数据输入所述神经网络模型中,得到预测的地点类别;
根据所述历史wifi数据通过人工标识的地点类别和通过神经网络模型预测的地点类别,计算预设的损失函数,得到损失值,并判断所述损失值是否小于预设阈值;
若是,则根据所述神经网络模型中词向量层、最大池化层和全连接隐藏层的网络参数确定wifi识别模型;
若否,则根据所述损失值通过反向传播算法更新所述神经网络模型的网络参数,反复迭代模型训练过程,直至损失值小于预设阈值,并确定训练后的神经网络模型的中词向量层、最大池化层和的网络参数和全连接隐藏层的网络参数确定wifi识别模型。
7.根据权利要求5所述的用户轨迹识别方法,其特征在于,所述根据所述wifi连接时间将所述待识别段进行切片划分,得到至少一段wifi连接时间段,并根据所述待识别数据的地点类别对所述wifi连接时间段进行标注,得到用户位置标注信息包括:将所述待识别时间段根据所述原始wifi数据的wifi连接时间进行切片划分,得到至少一段wifi连接时间段;
根据所述待识别时间段中各原始wifi数据与各待识别数据的对应关系,确定各原始wifi数据对应的地点类别;
根据所述原始wifi数据的地点类别和所述原始wifi数据对所述wifi连接时间段进行标注,得到用户位置标注信息。
8.一种用户轨迹识别装置,其特征在于,所述用户轨迹识别装置包括:获取模块,获取用户在待识别时间段的原始wifi数据和gps信息,所述原始wifi数据包括wifi连接时间;
预处理模块,用于对所述原始wifi数据进行数据预处理,得到待识别数据;
一次识别模块,用于根据预设的专家规则词典,对所述待识别数据进行一次识别,得到一次识别结果,当所述一次识别结果为识别成功时,则得到所述待识别数据的地点类别;
二次识别模块,用于当所述一次识别结果为识别失败时,将所述待识别数据输入至预先训练好的wifi识别模型中,得到二次识别结果,其中,所述二次识别结果包括所述待识别数据的地点类别;
标注模块,用于根据所述wifi连接时间将所述待识别段进行切片划分,得到至少一段wifi连接时间段,并根据所述待识别数据的地点类别对所述wifi连接时间段进行标注,得到用户位置标注信息;
轨迹描绘模块,用于根据所述用户位置标注信息、所述原始wifi数据和所述gps信息,生成所述用户的用户轨迹。
9.一种用户轨迹识别设备,其特征在于,所述用户轨迹识别设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述用户轨迹识别设备执行如权利要求1‑7中任一项所述的用户轨迹识别方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1‑7中任一项所述的用户轨迹识别方法的步骤。