1.一种基于大数据的电子商务管理系统,其特征在于,包括:
补全模块,用于获取历史上商务风险发生后一段时间内的商务数据,构建原始时间序列数据,扫描原始时间序列数据中存在的缺失值情况,并对原始时间序列数据进行补充,以保证原始时间序列数据的完整;
评估模块,用于在原始时间序列数据上进行所有风险特征的提取,根据商务风险类型将所有风险特征进行多特征集的划分,通过多特征集来评估该原始时间序列数据的风险复杂度;
补充模块,用于根据风险复杂度和商务风险类型确定补充时间窗口,通过补充时间窗口对原始时间序列数据进行商务数据补充,来得到时间序列数据,根据时间序列数据得到时间风险特征序列,以此来确定该时间序列数据的商务风险程度;
预测模块,用于依据历史上每个商务风险类型的时间风险特征序列和商务风险程度建立商务风险预测模型,接收当前一段时间内的商务数据,并输入到商务风险预测模型中,得到当前商务风险信息;
管控模块,用于通过当前商务风险信息制定对应防范策略,以此实现对商务风险的管控;
所述补全模块,用于:
确定原始时间序列数据中的数据特征点的时间节点,通过原始时间序列数据的起点、数据特征点和终点三者的时间节点构成多段原始时间序列数据分段,所有原始时间序列数据分段组成一个完整的原始时间序列数据;
扫描缺失值在每个原始时间序列数据分段中的缺失量和分布密度,根据分布密度确定一个连续缺失量阈值,若分布密度超过分布密度阈值,则将时间连续的缺失值超过连续缺失量阈值的多个连续缺失值进行删除;
否则,不删连续缺失值;
计算每个原始时间序列数据分段的数据变化率,若数据变化率不超过数据变化率阈值,则通过前向填充和后向填充填充缺失值,对于单个缺失值,通过前一个非缺失值和后一个非缺失值的平均值来填充该缺失值,对于多个连续的缺失值,通过多个连续缺失值的前一个非缺失值和后一个非缺失值以及两个非缺失值的平均值对连续缺失值进行填充;
若数据变化率超过数据变化率阈值,则对于单个缺失值通过数据中位数进行填充,对于多个连续缺失值,计算多个连续缺失值的前一个非缺失值和后一个非缺失值的平均变化率,通过平均变化率逐个填充多个连续缺失值;
所述评估模块,用于:
根据商务风险类型在所有风险特征中筛选出第一风险特征集,不同的商务风险类型对应有不同的风险特征组合;
计算所有风险特征中除了第一风险特征集以外的风险特征与第一风险特征集中每个风险特征的相关度,整合得到除了第一风险特征集以外的每个风险特征与第一风险特征集整体的综合相关度;
若综合相关度超过第一相关度阈值,则将该风险特征划分到第二风险特征集中;
若综合相关度超过第二相关度阈值,且不超过第一相关度阈值,则将该风险特征作为待评估风险特征;
计算每个待评估风险特征与第二风险特征集中每个风险特征的相关度,从而确定每个待评估风险特征与第二风险特征集整体的综合相关度,若该综合相关度超过第三相关度阈值,则将该待评估风险特征划分到第三风险特征集中;
分别赋予第一风险特征集、第二风险特征集和第三风险特征集三者不同的异常权重;
在原始时间序列数据的时间尺度上确定第一风险特征集、第二风险特征集和第三风险特征集各自风险特征的异常值,并根据异常权重确定风险复杂度;
所述补充模块还包括第一单元和第二单元,所述第一单元用于:
风险复杂度和商务风险类型各自对应有一个时间窗口,而且时间窗口的起点均为原始时间序列数据的时间起点,时间窗口用来向前截取历史商务数据;
将风险复杂度和商务风险类型各自对应的时间窗口的交集作为补充时间窗口,通过补充时间窗口截取历史上对应时间段内的商务数据,并对原始时间序列数据进行商务数据补充;
所述第二单元,用于:
提取时间序列数据中的风险特征来确定时间风险特征序列,并对风险特征进行归一化处理;
其中,CVI为第i风险特征集的变异系数,α(t0,t1)和α(t1,t2)分别是t0‑t1时刻和t1‑t2时刻的变异权重,t0‑t1时刻是补充时间窗口的时刻,t1‑t2时刻是原始时间序列数据的时刻,σ(i,t0,t1)和σ(i,t1,t2)分别为第i个风险特征集在t0‑t1时刻和t1‑t2时刻下的所有特征整体的标准差,μ(i,t0,t1)和μ(i,t1,t2)分别为第i个风险特征集在t0‑t1时刻和t1‑t2时刻下的所有特征整体的平均值,CV为第一风险特征集、第二风险特征集和第三风险特征集的整体变异系数,βi为第i风险特征集对应的变异权重;
通过整体变异系数来描述商务风险程度;
所述预测模块还包括建模单元和预测单元,所述建模单元用于:
收集所有商务风险类型的时间风险特征序列和商务风险程度,训练一个时间序列预测模型,通过交叉验证来调整时间序列预测模型,得到商务风险预测模型,该商务风险预测模型能够预测商务风险发生的概率和商务风险程度;
所述预测单元,用于:
将接收的当前一段时间内的商务数据转化为时间序列数据,并输入到商务风险预测模型中,输出每种商务风险类型的发生概率和商务风险程度,将每种商务风险类型的发生概率和商务风险程度作为当前商务风险信息;
所述管控模块,用于:
将发生概率超过合理范围的商务风险筛选出来,并确定风险等级;
其中,L为风险等级,m为发生概率超过合理范围的商务风险数量,γj为第j个商务风险的风险权重,Qj为第j个商务风险程度,δj为第j个商务风险的风险转换系数,exp为指数函数,(γQδ)max为三者乘积中的最大值,k1、k2分别为预设常数,[]为取整符号;
不同的风险等级对应有不同等级的防范策略。