1.一种基于移动信令数据的城市热点识别方法,其特征在于,所述方法包括以下步骤:(1)利用移动信令数据计算用户在单个蜂窝内的驻留时长T,与时间阈值T1进行比较,判断该区域是否为用户的驻留点,从识别出的驻留点的所有用户N中统计出该区域内的常驻用户数n,考虑到常驻用户在热点区域活动的不确定性,引入衰减因子λ(0<λ<1),计算得到常驻用户为该区域成为热点做出的贡献度,则该蜂窝内有效驻留人数为P=N-λ·n,若蜂窝内有效驻留人数P大于阈值N1,则判定该蜂窝为活跃蜂窝,否则为非活跃蜂窝;
(2)对识别出的所有活跃蜂窝进行相似性的度量,并利用基于密度的聚类算法判别出热点区域,包括:(2.1)活跃蜂窝的位置表示,假定用户移动过程中的手机轨迹Celln(Lngtn,Latn,tn1,tn2)由经度(Lngtn)、纬度(Latn)、进入蜂窝时间(tn1)和离开蜂窝时间(tn2)构成,则活跃蜂窝的位置表示为(Lngtn,Latn);
(2.2)对识别出的所有活跃蜂窝进行相似性的识别,其中相似性是由两个活跃蜂窝之间的距离来确定,两个活跃蜂窝之间的距离越小则相似性越高,则采用欧几里得的相似度计算公式为:Sim(x,y)=1/(1+d(x,y)) ;
(2.3)对计算得到的活跃蜂窝依据相似度利用基于密度的聚类算法划分到不同的组内,而组就是聚类结果的簇,即代表一个热点区域;
(3)获取热点区域内的POIs数据,其中每条POIs数据中包含POIs名称、POIs类别、经度、纬度多个属性值;
(4)对热点区域的主题进行设置,若热点区域内仅包含一个POIs类别,则将此POIs类别设置为该热点区域的主题,若热点区域内包含多个POIs类别,则利用信息增益法计算出热点区域内影响较大的类别并设置为主题,包括:(4.1)对于包含多个POIs类别的热点区域,利用信息增益计算出热点区域内影响较大的类别,计算公式为:①假设热点区域包含m个POIs类别Ci,i=1,2,…,m,那么热点区域类别的期望信息:I(C1,C2...Cm)=-P1log2p1-P2log2p2-...-Pmlog2pm,其中,Pi=Si/S,Si表示第i个类别在热点区域内出现的次数,S表示所有类别在热点区域内出现的总次数;
②热点区域内第i(0<i≤m)个类别的信息熵为:
E(Ci)=Pi*I(Ci) ;
③则在热点区域中类别Ci信息增益为:
Gain(Ci)=I(C1,C2...Cm)-E(Ci) ,以此类推,分别计算出热点区域上所有类别Ci信息增益;
(4.2)基于步骤(4.1)中信息增益的结果,比较大小,对于信息增益较大的类别,表示对主题的识别影响较大即可得到热点区域的主题。