利索能及
我要发布
收藏
专利号: 202211347145X
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于条件Wasserstein GAN的电信客户流失预测方法,其特征在于:该方法包括以下步骤:S1:基于WGANGP和CGAN的综合GAN模型对电信客户数据集进行处理,引入混合注意力机制CBAM使生成器更加关注与目标相关的特征;

S2:引入混合注意力机制辅助训练生成器;

S3:生成器将结果输出给分类器,分别采用随机森林、逻辑回归、支持向量机和朴素贝叶斯机器学习分类器进行客户流失预测;

所述S1中,所述WGANGP和CGAN衍生自原始的Vanilla GAN,原始GAN是一个通过对抗过程学习生成模型的框架,由生成器G和鉴别器D两部分组成;其中,G的目标是生成与真实数据无法区分的数据样本;D的目标是区分真实数据样本和由G生成的合成样本;其目标函数如公式(1)所示:其中,x是从真实数据分布pr中采样的样本,Ρr是真实数据分布,Ρg是由 z~p(z)隐式定义的生成数据分布,其中z是从任意噪声分布p中采样的;

在最优判别器下,最小化G的loss等价于最小化Ρr与Ρg之间的JSD,JSD是一个常数;

WGAN使用Wasserstein‑1距离来衡量真实数据分布和生成数据分布之间的距离;

Wasserstein‑1距离的公式如下:

其中,Π(Ρr,Ρg)表示真实数据分布Ρr和生成数据分布Ρg的整个可行联合分布集γ(x,y),x和y分别表示从Ρr和Ρg中采样得到的一个真实样本和生成样本;

以使用Kantorovich‑RubinsteinDuality定理将公式(2)进行转换得公式(3):其中,K是一个常数,||f||L表示函数f的Lipschitz常数;并且要求||f||L≤K,通过将神经网络的权重裁剪到某个范围[‑c,c]来满足此约束;WGAN的目标函数如公式(4)所示:设置一个额外的loss项来实现1‑Lipschitz限制,WGANGP的目标函数如公式(5)所示:其中λ是梯度惩罚系数, 是沿着真实数据分布Ρr和生成数据分布Ρg之间的连线上随机插值采样得到值, ε Uniform[0,1];

~

CGAN能够生成属于特定类别的样本,得到CGAN的目标函数公式如下:鉴别器的分类任务通过引入一个辅助分类器GAN来实现;辅助分类器AC旨在预测给定样本的类别标签AC(x)=Ρ(y|x);并且AC的交叉熵损失也被添加到生成器损失中,以调节生成器生成属于特定类别的样本;

CWGAN的目标函数变为:

2.根据权利要求1所述的基于条件Wasserstein GAN的电信客户流失预测方法,其特征在于:所述S2中,混合注意力机制CBAM包括两部分内容:通道注意力模块CAM和空间注意力模块SAM;CBAM的整个注意力过程如下:C×H×W C×1×1 1×H×W

其中,F是输入特征图F∈R ,Mc∈R 和Ms∈R 分别是通道注意力模块和空间注意力模块;

CAM:对于输入特征图F,首先在每个空间位置上应用平均池化和最大池化操作,生成平C×1×1均池化特征 和最大池化特征 并以此来生成各自的通道注意力图Mc∈R ;然后将其分别送入一个共享的多层感知机MLP,最后使用逐元素求和来合并输出特征向量,就得到通道注意力图,其公式表达为:其中,σ表示sigmoid激活函数,avgpool表示平均池化,maxpool表示最大池化,W0和W1分别是MLP中各层的权重参数;

SAM:空间注意力是对通道注意力的一个补充;SAM接收到CAM输出的特征图后,首先在每个通道上应用最大池化和平均池化,得到平均池化特征 和最大池化特征 然后将它们连接起来并通过标准卷积层进行卷积,就得到空间注意力图,其公式表达为:

7×7

其中,f 表示卷积核大小为7×7的卷积操作。

3.根据权利要求2所述的基于条件Wasserstein GAN的电信客户流失预测方法,其特征在于:所述S3具体为:对于数值列,采用均值对缺失值进行填补;对于分类列,则采用独热向量编码,先将其转换成数值类型,然后利用众数对缺失值进行填补;然后进行特征相关性分析,剔除掉与目标列最不相关的特征;对于数值列,采用线性函数归一化min‑max scaling使结果映射到[0,1],满足以下公式;

其中,xmax为最小值,xmin为最大值。