1.一种基于移动信令数据的用户驻留地识别方法,其特征在于,步骤为:
步骤1、获取目标城市的地理位置信息,再以M米*M米的网格对目标城市进行网格化并对网格进行有序编号,计算网格信息并记录,网格信息包括网格编号和网格中心点的坐标;
获取基站信息,根据基站信息中的坐标信息将基站匹配到网格上,提取网格所覆盖区域的地理位置名称,构建基站和地理位置的映射表;对于基站w而言,若基站位置坐标(x,y)和某网格中心点坐标(gx,gy)满足:gx-M/2≤x≤gx+M/2且gy-M/2≤y≤gy+M/2,则基站w与此网格做匹配关系;
步骤2、获取目标城市内所有手机用户在某个时间段内的手机信令数据,在该时间段内取t天作为分析天,提取分析天内对应的所有数据并进行清洗,去除重复和不完整的数据;
然后将数据按用户分类并对每个用户的数据进行时间排序,得到每个用户每天的移动轨迹;
步骤3、对一个用户每日中在连续时间段内位于同一地理位置的移动轨迹点进行聚类,从而构建用户的时空轨迹序列并记录用户在这个地理位置的进出时间;进入时间Tin取在一个地理位置中首次出现的时间,离开时间Tout取在下一个地理位置中首次出现的时间;
步骤4、计算用户在一个地理位置内的驻留时长Ts,这里定义驻留时长为用户进出一个地理位置的时间之差,即Ts=Tout-Tin;将用户的驻留时长值Ts与所设置的驻留时长阈值θ1进行比较,若用户驻留时长值Ts大于等于驻留时长阈值θ1,则认为此地理位置是该用户的一个驻留点;
步骤5、确定用户的驻留点后,计算用户每个驻留点的驻留权值;定义每个驻留点的驻留权值N为在该驻留点内的驻留时长值Ts与所设置的驻留时长阈值θ1的比值,即N=Ts/θ1;
统计每个用户每天的各个驻留点的驻留权值和,其中,第i个用户在第r天中的第j驻留点共出现n次的驻留权值和 式中参数Njrn表示用户的第j驻留点在第r天中出现第n次的驻留权值;然后统计第i个用户在分析天t中的第j驻留点的驻留权值和
统计每个用户每天的所有驻留点的驻留权值和,其中,第i个用户在第r天中的共m个驻留点的驻留权值和Sir=Si1r+Si2r+…+Simr;然后统计第i个用户在分析天t中的所有驻留点的驻留权值和Sumi=Si1+Si2+...+Sit;
统计每个用户在所有分析天中各个驻留点的驻留权值比,第i个用户在分析天t中的第j驻留点的驻留权重比值步骤6、识别用户的驻留地,其中,第i个用户的驻留地识别的步骤为:将第i个用户的所有驻留点的驻留权重比值 进行递减排序并编号,再根据驻留地识别函数F(j)进行用户驻留地的识别;其中,若 则F(j)的值取1;若Zij≤θ2,则F(j)的值取0且停止比较,θ2为预先设置的经验阈值;最后,F(j)值为1对应的驻留点就是该用户的驻留地;
统计每个用户的驻留地个数,其中,第i个用户的驻留地个数Ci=F(1)+F(2)+...+F(j);
若Ci=0,则表示无法判断用户i的驻留地;若Ci≥0,则表示用户i有Ci个驻留地。
2.如权利要求1所述的一种基于移动信令数据的用户驻留地识别方法,其特征在于,当用户在一个地理位置内的驻留时长值大于等于驻留时长阈值时,将该地理位置确定为用户的驻留点;然后通过计算用户驻留点的驻留权重比来识别用户的驻留地。