利索能及
我要发布
收藏
专利号: 2019101650067
申请人: 南京信息职业技术学院
专利类型:发明专利
专利状态:已下证
专利领域: 电通信技术
更新日期:2025-04-02
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于贝叶斯混合模型的网络故障数据合成方法,其特征在于,所述方法如下步骤:

步骤1:设采集到的网络数据集为 其中xn由六个属性组成,分别为丢包率、终端下载速率、传输时延、抖动、视频传输质量、终端用户体验评分;该数据集对应的标签集合为 yn=0或1,即X对应于两类标签,其中yn=0为网络正常类标签,yn=1类为网络故障类标签,由于网络正常类的数据个数远远多于网络故障类的数据个数,定义yn=1对应alm

的xn所组成的集合为少数类 其中 为少数类样本,N 为少数类样本数maj

目,而yn=0对应的xn所组成的集合为多数类 其中 为多数类样本,N为多数类样本数目;

alm

步骤2:选用贝叶斯混合模型来表示X 的分布,其概率分布函数表达式包括:其中,K为混合成分数,πj(V)、μj、Λj和vj分别表示第j个混合成分的权值、均值、协方差矩阵和自由度参数; 为t分布的概率密度函数,表示为:其中N(·)和Gam(·)分别代表Gaussian分布函数和Gamma分布函数,unj为与xn和第j个混合成分相关的隐变量,权值πj(V)满足 其表达式为:上式中变量Vj服从Beta分布,即p(Vj)=Beta(Vj|1,α),α为该Beta分布的超参数,此外,μj,Λj服从联合Gaussian‑Wishart分布,即高斯分布与Wishart分布的乘积,N(·)W(·):p(μj,Λj)=N(μj|mj,λjΛj)W(Λj|Wj,ρj)其中 为该联合Gaussian‑Wishart分布的超参数,mj为六维列矢量,λj和ρj是标量,Wj为一个(6×6)的矩阵;引入一个隐变量 其中zn指示当前的数据xn是由t混合模型中的哪个成分产生的,当xn是由第j个混合成分产生时,znj=1,基于以上所述,整个模型的超参数为:

alm

步骤3:利用X 对混合模型进行参数估计,具体如下:alm

3‑1)产生N 个服从[1,K]区间上均匀分布的随机整数,统计该区间上各整数出现的概alm

率;即,如果产生了Nj个整数j,那么δj=Nj/N ;对于每个 对应的隐变量zn的初始分布为

zn为K维矢量,其在各个维度znj(j=1,...,K)上的取值为{0,1};

3‑2)设定超参数 α的初始值;对于所有的j,j=1,...,K,mj=0,λj=1,ρj取3~20之间的任意数,Wj=10·I,I为单位矩阵,vj取1~100之间的任意数,α取1~

10之间的任意数;此外,迭代次数计数变量k=1;

3‑3)更新隐变量 的分布,即, 其超参数的更新公式为:

其中

在首次迭代时计算 时,

3‑4)更新随机变量 的分布,即, 相应的超参数 的更新公式如下:其中,

3‑5)更新随机变量 的分布,即, 相应的超参数的更新公式为:

3‑6)更新隐变量 的分布其中

在上式中,各项期望<·>的计算公式如下:其中Γ(·)为标准的gamma函数,Γ(·)′为标准gamma函数的导数;此外,和的计算方法已分别在步骤3‑3)和步骤3‑4)给出;

3‑7)更新自由度参数 即,解如下含有vj的方程:选用牛顿法,获得此方程的解vj;

3‑8)计算当前迭代后的似然值LIKitr,itr为当前的迭代次数:

3‑9)计算当前迭代后与上一次迭代后的似然值的差值△LIK=LIKitr‑LIKitr‑1;如果△LIK≤δ,那么参数估计过程结束,否则转到步骤(3‑3),itr的值增加1,继续进行下一次的迭‑5 ‑4

代;阈值δ的取值范围为10 ~10 ;

alm

步骤4:利用估计出的贝叶斯混合模型,生成新的网络数据集(X )',设需要生成的数据量为N’,包括:

4‑1)随机产生一个0到1之间服从均匀分布的随机数ε;

4‑2)随机产生服从 分布的

4‑3)计算

4‑4)随机产生服从 分布的

4‑5)利用估计出的 如果ε∈[0,π1],则产生一个服从t分布t(μ1,Λ1,v1)的样本;

如果 则产生一个服从t分布t(μk,Λk,vk)的样本;如果 则产生一个服从t分布t(μK,ΛK,vK)的样本;

alm

4‑6)重复上述步骤(4‑1)~(4‑5)N’次,得到(X )',最终网络故障数据集为合成之后的总数据集为