利索能及
我要发布
收藏
专利号: 2021105320650
申请人: 汕头大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-07-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于产品销售数据的客户偏好信息量化与挖掘的方法,其特征在于,包括以下步骤:

S1:产品指标数据与销量数据搜集及处理;

S2:拟合产品指标与产品销售的关系模型并预测销量概率;

S3:对所述销量数据中客户偏好信息进行量化计算;

S4:基于偏好概率的密度聚类并针对不同结果提出不同设计决策。

2.根据权利要求1所述的基于产品销售数据的客户偏好信息量化与挖掘的方法,其特征在于,所述步骤S1通过构造产品的指标以向量的形式描述一个产品,其形式如下:S=[S1,S2,...,Sn]向量S的每一项表示一个指标,一个产品可以转换为n维向量空间中的一个向量,n表示产品指标的数量;

根据收集的所有产品数据,包含产品指标与其对应的月销量N,建立一个n维空间的产品信息库,其形式如下:

其中L表示收集的产品个数。

3.根据权利要求2所述的基于产品销售数据的客户偏好信息量化与挖掘的方法,其特征在于,所述步骤S2包括:

将产品表示为一个n维的指标组合,以不同指标值组合代表不同款产品,产品指标值组合与销量的模型通过包括数据挖掘回归拟合的方法获得。

4.根据权利要求3所述的基于产品销售数据的客户偏好信息量化与挖掘的方法,其特征在于,所述步骤S3包括:

将通过指标之间的排列组合得到所有可能的指标值组合,通过设置指标相关约束,排除物理上不可行的产品指标值组合。

5.根据权利要求4所述的基于产品销售数据的客户偏好信息量化与挖掘的方法,其特征在于,所述步骤S3还包括:

用单个产品销量与所有产品销量的比值代表该产品的在市场中的表现,并定义为该产品的销量概率,通过产品指标组合取值表示一个产品,产品的销量概率表示为以下方程:P(Vi,x)=N(Vi,x)/NT×100%式中NT为总销量,N(Vi,x)是所有在第i个指标上取第x个取值的产品Vi,x的数量,P(Vi,x)为指标取值Vi,x出现的概率;

客户对一个产品的选择的概率P(V1,i,V2,i,...,Vn,i)表示为:P(V1,x,V2,y,...,Vn,z)=N(V1,x,V2,y,...,Vn,z)/NT×100%式中的N(V1,x,V2,y,...,Vn,z)代表所有满足指标组合V1,x,V2,y,...,Vn,z的产品数量;

通过信息熵公式在产品指标层面量化市场偏好信息量,产品的每个指标其取值类型包括:离散型、连续型或者布尔型,根据客户对不同取值的概率,根据信息熵的公式,该指标上的需求信息可以量化为:

式中 代表指标Si其第k个取值Vik被选择的概率,m表示指标Si的取值个数;

设一款产品存在n个指标,指标值的类型分为连续型、离散型、布尔型,对于连续型指标,可以将其离散化。描述产品的组合指标Si中的每个指标的取值个数表示为mi,获取对产品偏好的信息量可以表示为

式中V1,x,V2,y,...,Vn,z代表在所有产品指标B1,B2,...,Sn中第r个、第s个和第t个产品指标的取值,m1,m2,and mn分别代表产品指标S1,S2,...,Sn对应的取值个数,P(V1,x,V2,y,...,Vn,z)则表示为V1,x,V2,y,..,Vn,z出现的概率;

产品指标S1,S2,...,Sn中的取值组合V1,x,V2,y,...,Vn,z满足客户偏好时会产生的自信息量可以单独记为

6.根据权利要求1或5所述的基于产品销售数据的客户偏好信息量化与挖掘的方法,其特征在于,所述步骤S4还包括:

客户偏好程度通过信息量差或偏好概率表示,在比较相近的设计之间的信息量差值或偏好概率差值,差值小于阈值r则定义为偏好相近,根据聚类后结果,划分四种不同产品偏好现象,并根据不同偏好现象提出不同设计决策。

7.根据权利要求6所述的基于产品销售数据的客户偏好信息量化与挖掘的方法,其特征在于,所述根据不同偏好现象提出不同设计决策包括:第一种现象:该产品市场仅存在一个偏好簇且该簇内仅有一个(不超过三个)指标值组合满足信息阈值;

第二种现象:聚类结果出现多个(大于两个)的不同偏好簇,且偏好簇内仅有一个指标值组合满足信息阈值;

第三种现象:聚类后市场偏好表现为一个偏好簇,但在该簇内存在超过三个不同的指标值组合,但这几个指标值组合彼此相似;

第四种现象:聚类后出现多个偏好簇,且存在偏好簇中出现超过三个指标值组合。