利索能及
我要发布
收藏
专利号: 2021105320650
申请人: 汕头大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于产品销售数据的客户偏好信息量化与挖掘的方法,其特征在于,包括以下步骤:S1:产品指标数据与销量数据搜集及处理,通过构造产品的指标以向量的形式描述一个产品,其形式如下:向量S的每一项表示一个指标,一个产品可以转换为n维向量空间中的一个向量,n表示产品指标的数量,Sn代表产品的第n个指标;

根据收集的所有产品数据,包含产品指标与其对应的月销量N,建立一个n维空间的产品信息库,其形式如下:其中L表示收集的产品个数,n代表产品指标的个数,Ni代表第i个产品的销量,Sij代表第i个产品的第j个指标的数值,i = 1,2,…, L;j = 1, 2, …, n;

S2:拟合产品指标与产品销售的关系模型并预测销量概率,将产品表示为一个n维的指标组合,以不同指标值组合代表不同款产品,产品指标值组合与销量的模型通过包括数据挖掘回归拟合的方法获得;

S3:对所述销量数据中客户偏好信息进行量化计算,将通过指标之间的排列组合得到所有可能的指标值组合,通过设置指标相关约束,排除物理上不可行的产品指标值组合;

用单个产品销量与所有产品销量的比值代表该产品的在市场中的表现,并定义为该产品的销量概率,通过产品指标组合取值表示一个产品,产品的销量概率表示为以下方程:式中NT为总销量, 是所有在第i个指标上取第x个取值的产品 的数量, 为指标取值 出现的概率;

客户对一个产品的选择的概率 表示为:

式中的 代表所有满足指标组合 的产品数量;

通过信息熵公式在产品指标层面量化市场偏好信息量,产品的每个指标其取值类型包括:离散型、连续型或者布尔型,根据客户对不同取值的概率,根据信息熵的公式,该指标上的需求信息可以量化为:式中Si代表第i个产品指标,i=1,2,…,n;n为代表产品指标的个数; 代表指标 其第k个取值 被选择的概率,m表示指标 的取值个数;

设一款产品存在n个指标,指标值的类型分为连续型、离散型、布尔型,对于连续型指标,可以将其离散化,描述产品的指标 中的每个指标的取值个数表示为 ,获取对产品偏好的信息量可以表示为式中 代表在所有产品指标

中第x个,第y个,…,第z个产品指标的取值,m1,m2,…,mn分别代表产品指标对应的取值个数, 则表示为 出现的概率;

产品指标 中的取值组合 满足客户偏好时会产生的自信息量可以单独记为

S4:客户偏好程度通过信息量差或偏好概率表示,在比较相近的设计之间的信息量差值或偏好概率差值,差值小于阈值r则定义为偏好相近,根据聚类后结果,划分四种不同产品偏好现象,并根据不同偏好现象提出不同设计决策。

2.根据权利要求1所述的基于产品销售数据的客户偏好信息量化与挖掘的方法,其特征在于,所述根据不同偏好现象提出不同设计决策包括:第一种现象:该产品市场仅存在一个偏好簇且该偏好簇内仅有一个指标值组合满足信息阈值;

第二种现象:聚类结果出现多个的不同偏好簇,且偏好簇内仅有一个指标值组合满足信息阈值;

第三种现象:聚类后市场偏好表现为一个偏好簇,但在该偏好簇内存在超过三个不同的指标值组合,但这几个指标值组合彼此相似;

第四种现象:聚类后出现多个偏好簇,且存在偏好簇中出现超过三个指标值组合。