1.一种聚类方法,其特征在于,包括:
从样本集合中选取一个未被聚类的样本作为候选样本;
根据所述候选样本的位置信息,构建所述候选样本的邻域;
如果所述邻域内样本的第一样本数量和所述邻域内样本所属用户的第一用户数量,均超出各自的阈值,则确定所述候选样本为核心对象;
迭代获取所述核心对象的密度可达的样本,利用每次迭代到的所述密度可达的样本,更新所述核心对象当前对应的聚类簇,直到获取到所述核心对象最终的目标聚类簇;
当所述样本集合中不存在未被聚类的样本时,完成对所述样本集合的聚类处理,获取所述样本集合所有的目标聚类簇。
2.根据权利要求1所述的聚类方法,其特征在于,所述获取所述样本集合所有的目标聚类簇之后,还包括:针对每个目标聚类簇,统计所述目标聚类簇中所包括的样本的总个数;
选取所述总个数超出预设个数的所述目标聚类簇作为活跃聚类簇。
3.根据权利要求1所述的聚类方法,其特征在于,所述获取所述样本集合所有的目标聚类簇之后,还包括:根据所述目标聚类簇中所包括的样本的位置信息,形成所述目标聚类簇的目标位置信息。
4.根据权利要求3所述的聚类方法,其特征在于,所述获取所述样本集合所有的目标聚类簇之后,还包括:针对每个目标聚类簇,提取所述目标聚类簇中所包括的每个样本的特征信息;其中,所述样本为订单记录;
根据所述特征信息,形成所述目标聚类簇中所述用户的偏好信息。
5.根据权利要求4所述的聚类方法,其特征在于,所述形成所述目标聚类簇中所述用户的偏好信息之后,还包括:根据所述目标位置信息,获取处于所述目标位置信息覆盖区域内的推广对象;
向所述推广对象返回所述用户的偏好信息。
6.根据权利要求1所述的聚类方法,其特征在于,所述利用每次迭代到的所述密度可达的样本,更新所述核心对象当前对应的聚类簇,包括:利用所述密度可达的样本,更新所述核心对象当前对应的所述聚类簇中所包括的样本的第二样本数量;
利用所述密度可达的样本的位置信息,更新当前对应的所述聚类簇的覆盖面积;
根据所述第二样本数量与所述覆盖面积,获取当前对应的所述聚类簇的簇密度;
如果当前获取到的所述簇密度大于或者等于前一次获取到的所述簇密度,则将所述密度可达的样本增加到当前对应的所述聚类簇中;
如果当前获取到的所述簇密度小于前一次获取到的所述簇密度,则不将所述密度可达的样本增加到当前对应的所述聚类簇中。
7.根据权利要求6所述的聚类方法,其特征在于,所述获取当前对应的所述聚类簇的簇密度之后,还包括:获取所述前一次获取到的所述簇密度与所述当前获取到的所述簇密度之间的差值;
如果所述差值落入预设的差值范围内,则将所述密度可达的样本增加到当前对应的所述聚类簇中;
如果所述差值未落入所述差值范围内,则不将所述密度可达的样本增加到当前对应的所述聚类簇中。
8.根据权利要求1所述的聚类方法,其特征在于,所述从样本集合中选取一个样本作为候选样本之前,还包括:获取每个样本的生成时间;
选取所述生成时间属于预设时间段内的所述样本;
利用选取的所述样本形成所述样本集合。
9.根据权利要求1-8任一项所述的聚类方法,其特征在于,所述迭代获取所述核心对象的密度可达的样本,包括:将属于所述候选样本所在的所述邻域内除所述候选样本之外未被聚类的每个样本加入到候选集中;
从所述候选集中取出一个所述未被聚类的样本作为第一样本;
获取所述第一样本的所述邻域;
如果所述第一样本为所述核心对象,则将所述第一样本作为所述密度可达的样本;
如果所述第一样本非所述核心对象,则将所述第一样本作为噪声样本,进行丢弃;
利用所述第一样本所在邻域内的除所述第一样本之外的未被聚类的每个样本,对所述候选集进行更新;
返回执行从所述候选集中取出一个样本作为所述第一样本以及后续操作,直到所述候选集为空集时停止迭代。
10.一种聚类装置,其特征在于,包括:
选取模块,用于从样本集合中选取一个未被聚类的样本作为候选样本;
构建模块,用于根据所述候选样本的位置信息,构建所述候选样本的邻域;
确定模块,用于在所述邻域内样本的第一样本数量和所述邻域内样本所属用户的第一用户数量,均超出各自的阈值时,确定所述候选样本为核心对象;
迭代模块,用于迭代获取所述核心对象的密度可达的样本,利用每次迭代到的所述密度可达的样本,更新所述核心对象当前对应的聚类簇,直到获取到所述核心对象最终的目标聚类簇;
获取模块,用于当所述样本集合中不存在未被聚类的样本时,完成对所述样本集合的聚类处理,获取所述样本集合所有的目标聚类簇。