利索能及
我要发布
收藏
专利号: 2018105376137
申请人: 南京讯高科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-09-11
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于网格和密度的动静态数据融合客户分类算法,其特征在于,包括以下步骤:

步骤一、根据客户销售信息、客户基本信息和营销策略信息,在空间建立多维度的多重网格;

步骤二、利用CLIQUE算法对数据进行分类降维,大类分割客户信息;

步骤三、对步骤二中获得的每一类客户信息采用DBSCAN算法,利用中位数据进行数据聚类,将信息分为多个稠密数据集合,并对每一部分找到对应的关键维度;

步骤四、根据步骤三得到的结构化信息,对每一个聚类中心附近的优质客户提取出对应短文本评论,得到评论集;

步骤五、采用中文依存句法规则,对步骤四中得到的评论集进行对应的文本挖掘,进行提取关键词、统计规律以及提取出每一类客户关注的关键服务的操作;

步骤六、在每一类客户聚类中随机选择一定比例的客户代表,根据语义提取出的关键购买因素,利用回归和时序算法对代表客户在时间域上进行拟合,验证提取出的关键购买影响因素;

步骤七、对于未知的客户信息,利用上述步骤得到的模型,进行网格分类,确定类似群的高影响因素,在同维度下进行二层分类,自动提取出客户的销售影响因素,同时采用回归方法对计算销售结果进行预测,确定恰当的销售策略。

2.根据权利要求1所述的一种基于网格和密度的动静态数据融合客户分类算法,其特征在于:所述客户销售信息包括时间、销售方式和消费额度,所述客户基本信息包括客户年龄和客户性别,所述营销策略信息包括促销方式。

3.根据权利要求1所述的一种基于网格和密度的动静态数据融合客户分类算法,其特征在于:所述步骤一中的客户销售信息、客户基本信息和营销策略信息构成多个离散点,每一个离散点存在于多个网格中。

4.根据权利要求3所述的一种基于网格和密度的动静态数据融合客户分类算法,其特征在于,步骤二中利用CLIQUE算法进行分类降维的具体过程为:a1、计算每一个网格内的密度,每一个离散点在多个网格中所在的单元网格中的密度;

a2、根据步骤a1中得到的密度,确定阈值,低于阈值的该维度网格取消,得到不同维度且在阈值以上的多维网格单元;

a3、根据步骤a2,得到的每个离散客户信息处于高稠密数据网格中。

5.根据权利要求4所述的一种基于网格和密度的动静态数据融合客户分类算法,其特征在于,在处理过程中,所有网格初始状态设置为未处理网格,遍历所有网格,最后删除在该维度上密度低于阈值的网格数据。

6.根据权利要求1所述的一种基于网格和密度的动静态数据融合客户分类算法,其特征在于,所述步骤三具体为:b1、在保留的每个维度的空间网格中,定义初始化核心对象集合 初始化聚类簇数k=0,初始化未访问样本集合Γ=D,簇划分 对于所有的点,通过到质心距离度量方式,找到样本xj的∈-邻域子样本集N∈(xj),如果子样本集样本个数满足|N∈(xj)|大于或等于给定点在∈-邻域内成为核心对象的最小邻域点数MinPts,则将样本xj加入核心对象样本集合:Ω=Ω∪{xj};

b2、在核心对象集合Ω中,随机选择一个核心对象o,初始化当前簇核心对象队列Ωcur={o},初始化类别序号k=k+1,初始化当前簇样本集合Ck={o},更新未访问样本集合Γ=Γ-{o},如果当前簇核心对象队列 则当前聚类簇Ck生成完毕,更新簇划分C={C1,C2,...,Ck},更新核心对象集合Ω=Ω-Ck,在当前簇核心对象队列Ωcur中取出一个核心对象o′,通过邻域距离阈值∈找出所有的∈-邻域子样本集N∈(o′),令Δ=N∈(o′)∩ΓΔ=N∈(o′)∩Γ,更新当前簇样本集合Ck=Ck∪Δ,更新未访问样本集合Γ=Γ-Δ,更新Ωcur=Ωcur∪(N∈(o′)∩Ω),最终输出结果为簇划分C={C1,C2,...,Ck},得到同一维度下客户的进一步分类。

7.根据权利要求1所述的一种基于网格和密度的动静态数据融合客户分类算法,其特征在于:所述步骤五还包括,在采用中文依存句法规则进行自然语言处理后,根据关键词及关键词频率,确定每个网格中每个聚类群的最关注的服务和购买原因,按照频率从大到小,并将结果保存为元组列表。