1.一种网络交易违法行为预测方法,其特征在于,所述方法包括:S1、交易数据采集与预处理:对原始交易数据进行预处理,生成多变量时间序列及由多变量时间序列构成的输入矩阵X、训练集、验证集和测试集;
从电商平台收集包含交易时间、金额、用户ID、设备信息、IP地址字段的交易数据,并通过电商平台的反欺诈系统或规则引擎标记出与违法行为相关的交易数据;对标记出的与违法行为相关的交易数据按小时进行聚合,生成多变量时间序列,包括刷单次数、异常交易金额、设备切换频率;对生成的多变量时间序列,再通过特征工程筛选与交易违法行为相关的关键变量,包括高频交易标识、重复交易行为,并对筛选后的变量实施标准化处理;经标准化处理后的变量使用滑动窗口方法生成连续多个样本对,将过去一定时间内的样本对作为输入,预测未来时间段内的交易违法行为;最后,由连续多个样本对组成的数据集被划分为训练集、验证集和测试集;
S2、构建TCN‑MUDA‑iTransformer模型:S21、基于多层扩张因果卷积结构和残差连接构建TCN模块,以对步骤S1生成的输入矩阵X进行局部特征提取,输出高维张量 ,其中,R表示实数集,T是时间步长,H是在每个时间步上学习到的特征数量;
S22、对步骤S1生成的输入矩阵X执行将变量视为Token的倒置输入策略与嵌入映射,并引入多头差分注意力机制,构建多头不确定性感知差分注意力机制MUDA‑iTransformer模块,以对步骤S1生成的输入矩阵X进行全局特征提取,输出特征 ,其中,D是特征数, 是嵌入空间的维度;
S23、对TCN模块输出的高维张量 和MUDA‑iTransformer模块输出的特征 进行特征融合,得到融合向量,将融合向量输入回归预测器,输出模型的预测结果;
S3、使用步骤S1生成的训练集对步骤S2构建的TCN‑MUDA‑iTransformer模型进行训练,通过步骤S1生成的验证集评估模型性能;
S4、采用步骤S1生成的测试集,选取多个预测时间点对步骤S3经验证集评估后的模型进行预测及评估。
2.根据权利要求1所述的预测方法,其特征在于,步骤S1具体为:S11、从历史日志数据库中提取结构化交易数据,作为原始交易数据;
S12、统一步骤S11提取的原始交易数据的时间粒度,生成多变量时间序列及由多变量时间序列构成的输入矩阵X;
S13、对步骤S12生成的多变量时间序列,通过特征工程筛选与违法行为相关的变量,并对筛选后的变量实施标准化处理;
S14、对步骤S13经标准化处理后的变量进行切片操作,生成连续多个样本对,作为完整训练数据集;
S15、按时间顺序将步骤S14得到的完整训练数据集拆分为训练集、验证集和测试集。
3.根据权利要求1所述的预测方法,其特征在于,步骤S21所述TCN模块,使用扩张因果卷积和残差连接来提取局部时序特征,通过逐层增加膨胀率实现感受野的指数扩展:每一卷积层的计算公式为:
(1)
其中, 表示第 层在时间步 的输出, 为卷积核宽度,为膨胀率, 为第 层的第k个卷积参数,表示激活函数, 指的是第 层卷积层的偏置项,X为输入矩阵;
每层输出接入LayerNorm、残差连接与Dropout;
最终,TCN模块输出一个高维张量: ,表示不同尺度下的局部时间特征,其中T是时间步长,H是在每个时间步上学习到的特征数量,R表示实数集。
4.根据权利要求1所述的预测方法,其特征在于,步骤S22具体为:S221、对步骤S1生成的输入矩阵X执行将变量视为Token的倒置输入策略与嵌入映射:对输入矩阵X进行轴转置操作,得到转置后的矩阵 ,形状从(B,T,D)转换为(B,D,T);其中,B表示批量大小,T是时间步长即序列长度,D是变量数;
转置后的矩阵 经过线性变换,生成嵌入矩阵E,形状为(B,D, ),是嵌入空间的维度,所述嵌入矩阵E的计算过程为:
(2)
其中, 为第 个变量的嵌入向量,把所有 在变量维上堆叠得到的嵌入矩阵E,表示嵌入映射函数, 是第个变量对应的时间序列;
S222、将步骤S221得到的嵌入矩阵E的嵌入向量输入到由N层组成的Transformer编码器中,经过N层Transformer编码器堆叠后,输出特征 ;
所述由N层组成的Transformer编码器,每一层Transformer编码器包含两个主要子层:第一子层多头差分注意力机制和第二子层前馈神经网络,并且每个子层都具有残差连接和Dropout操作。
5.根据权利要求4所述的预测方法,其特征在于,所述步骤S222具体为:多头差分注意力机制通过构建两条独立的注意力路径并求其差值,生成差分注意力矩阵,差分注意力矩阵与嵌入矩阵E进行残差连接,并通过 Dropout 操作,得到输出 Z;输出 Z经过前馈神经网络得到输出F,输出F与输出Z进行残差连接,并通过 Dropout 操作,得到输出 ,把每一层算出的 作为下一层的输入,经过N层 Transformer 编码器堆叠后,输出特征 。
6.根据权利要求5所述的预测方法,其特征在于,所述多头差分注意力通过构建两条独立的注意力路径并求其差值,生成差分注意力矩阵,差分注意力矩阵与嵌入矩阵E进行残差连接,并通过 Dropout 操作,得到输出 Z,具体为:在Transformer编码器的第一子层中,首先将步骤S221生成的嵌入矩阵E输入多头注意力机制,通过三个不同的线性层,将输入矩阵E映射为查询、键、值矩阵:; ; (3)
其中,Q为查询矩阵,K为键矩阵,V为值矩阵, 、 、 分别是查询、键和值的投影矩阵,形状为 ( , );
计算标准注意力权重,如下:
, ;(4)
其中, , ,分别表示第路注意力的查询与键矩阵, 表示键向量的维度, 是第 条路径计算得到的注意力权重, ()为激活函数,表示转置;
通过计算两个注意力分布的差异,得到差分注意力张量:(5)
其中, 为差分注意力张量, ,为可学习的缩放系数,控制注意力差异的强度,、 分别为第 条路径计算得到的注意力权重和第 条路径计算得到的注意力权重;
最终差分注意力矩阵即注意力输出为:
(6)
其中, 为最终的注意力输出结果, 表示value矩阵,表示值向量的维度;
最后,经过多头注意力计算后,将注意力输出结果与嵌入矩阵E进行残差连接,并通过Dropout操作,得到输出Z:(7)
为经过差分调制后的输出表示;
所述输出 Z经过前馈神经网络得到输出F,输出F与输出Z进行残差连接,并通过 Dropout 操作,得到输出 ,把每一层算出的 作为下一层的输入,经过N层 Transformer 编码器堆叠后,输出特征 ,具体为:嵌入矩阵E的嵌入向量经过第一子层多头差分注意力机制输出Z后,经过第二子层前馈神经网络,计算过程如下:(8)
其中F为前馈神经网络的输出结果,Z是经过差分调制后的输出表示, 、 是线性层的权重矩阵, , 是偏置项, 是非线性激活函数;
经过前馈网络处理后,输出F将与输入Z相加,进行残差连接,并通过Dropout操作进行正则化,得到输出 :(9)
其中,Z是经过差分调制后的输出表示, 是一种正则化操作,F为前馈网络的输出结果, 是Transformer 单层输出的递推中间量;
把每一层算出的 作为下一层的输入,层层递推到第N层,最后一层的 就是对外的输出 ,形状为(B, D, ),它对每个样本包含D个变量,每个变量都有维的表示,在变量维上按照变量的顺序,把D个 维的小向量首尾串接成一条长向量得到特征 ,用作全局变量交互表示。
7.根据权利要求1所述的预测方法,其特征在于,步骤S23具体为:首先,对TCN模块输出的高维张量 在时间维度上进行池化操作,提取时间整体趋势:(10)
其中, 是TCN模块的输出特征序列, 是指沿时间维度平均池化,即对每个通道求所有时间步的平均值, 表示时间池化后的整体趋势向量,后续会与iTransformer 的全局变量表示一起做特征融合用于预测;
同时,对MUDA‑iTransformer模块的输出在变量维度进行池化或展平处理,获得全局变量交互表示:(11)
其中, 为全局变量交互表示,Flatten表示沿变量维把每个变量的 维表示串接为一根向量,用作全局变量交互表示; 是输出的特征;
将两部分特征分别映射到统一维度后拼接,形成融合表示:(12)
其中,Concat()把两路对齐后的向量在特征维上拼接形成融合表示 ,FC()是全连接映射,把两部分特征先各自映射到统一维度, 表示拼接后得到的融合向量维度;
融合向量被输入至回归预测器中,输出网络交易违法行为的预测结果。
8.如权利要求1 7任一项所述的网络交易违法行为预测方法的应用,其特征在于,用于~风控系统的预警与响应。
9.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器;以及
存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如权利要求1 7任一项所述的网络交易违法行为预测方法。
~
10.一种机器可读存储介质,存储有可执行指令,其特征在于,所述指令当被执行时使得所述机器执行如权利要求1 7任一项所述的网络交易违法行为预测方法。
~