买专利、卖专利、专利购买、专利交易、专利出售、高企申报-基于条件Wasserstein GAN的电信客户流失预测方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

基于条件Wasserstein GAN的电信客户流失预测方法

￥31200

专利号： 202211347145X

申请人：重庆邮电大学

专利类型：发明专利

专利状态：已下证

更新日期：2025-12-01

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.基于条件Wasserstein GAN的电信客户流失预测方法，其特征在于：该方法包括以下步骤：S1：基于WGANGP和CGAN的综合GAN模型对电信客户数据集进行处理，引入混合注意力机制CBAM使生成器更加关注与目标相关的特征；

S2：引入混合注意力机制辅助训练生成器；

S3：生成器将结果输出给分类器，分别采用随机森林、逻辑回归、支持向量机和朴素贝叶斯机器学习分类器进行客户流失预测；

所述S1中，所述WGANGP和CGAN衍生自原始的Vanilla GAN，原始GAN是一个通过对抗过程学习生成模型的框架，由生成器G和鉴别器D两部分组成；其中，G的目标是生成与真实数据无法区分的数据样本；D的目标是区分真实数据样本和由G生成的合成样本；其目标函数如公式(1)所示：其中，x是从真实数据分布pr中采样的样本，Ρr是真实数据分布，Ρg是由 z～p(z)隐式定义的生成数据分布，其中z是从任意噪声分布p中采样的；

在最优判别器下，最小化G的loss等价于最小化Ρr与Ρg之间的JSD，JSD是一个常数；

WGAN使用Wasserstein‑1距离来衡量真实数据分布和生成数据分布之间的距离；

Wasserstein‑1距离的公式如下：

其中，Π(Ρr,Ρg)表示真实数据分布Ρr和生成数据分布Ρg的整个可行联合分布集γ(x,y)，x和y分别表示从Ρr和Ρg中采样得到的一个真实样本和生成样本；

以使用Kantorovich‑RubinsteinDuality定理将公式(2)进行转换得公式(3)：其中，K是一个常数，||f||L表示函数f的Lipschitz常数；并且要求||f||L≤K，通过将神经网络的权重裁剪到某个范围[‑c,c]来满足此约束；WGAN的目标函数如公式(4)所示：设置一个额外的loss项来实现1‑Lipschitz限制，WGANGP的目标函数如公式(5)所示：其中λ是梯度惩罚系数，是沿着真实数据分布Ρr和生成数据分布Ρg之间的连线上随机插值采样得到值， ε Uniform[0,1]；

CGAN能够生成属于特定类别的样本，得到CGAN的目标函数公式如下：鉴别器的分类任务通过引入一个辅助分类器GAN来实现；辅助分类器AC旨在预测给定样本的类别标签AC(x)＝Ρ(y|x)；并且AC的交叉熵损失也被添加到生成器损失中，以调节生成器生成属于特定类别的样本；

CWGAN的目标函数变为：

2.根据权利要求1所述的基于条件Wasserstein GAN的电信客户流失预测方法，其特征在于：所述S2中，混合注意力机制CBAM包括两部分内容：通道注意力模块CAM和空间注意力模块SAM；CBAM的整个注意力过程如下：C×H×W C×1×1 1×H×W

其中，F是输入特征图F∈R ，Mc∈R 和Ms∈R 分别是通道注意力模块和空间注意力模块；

CAM：对于输入特征图F，首先在每个空间位置上应用平均池化和最大池化操作，生成平C×1×1均池化特征和最大池化特征并以此来生成各自的通道注意力图Mc∈R ；然后将其分别送入一个共享的多层感知机MLP，最后使用逐元素求和来合并输出特征向量，就得到通道注意力图，其公式表达为：其中，σ表示sigmoid激活函数，avgpool表示平均池化，maxpool表示最大池化，W0和W1分别是MLP中各层的权重参数；

SAM：空间注意力是对通道注意力的一个补充；SAM接收到CAM输出的特征图后，首先在每个通道上应用最大池化和平均池化，得到平均池化特征和最大池化特征然后将它们连接起来并通过标准卷积层进行卷积，就得到空间注意力图，其公式表达为：

7×7

其中，f 表示卷积核大小为7×7的卷积操作。

3.根据权利要求2所述的基于条件Wasserstein GAN的电信客户流失预测方法，其特征在于：所述S3具体为：对于数值列，采用均值对缺失值进行填补；对于分类列，则采用独热向量编码，先将其转换成数值类型，然后利用众数对缺失值进行填补；然后进行特征相关性分析，剔除掉与目标列最不相关的特征；对于数值列，采用线性函数归一化min‑max scaling使结果映射到[0,1]，满足以下公式；

其中，xmax为最小值，xmin为最大值。