欢迎来到利索能及~ 联系电话:18621327849
利索能及
我要发布
收藏
专利号: 2019101650067
申请人: 南京信息职业技术学院
专利类型:发明专利
专利状态:已下证
专利领域: 电通信技术
更新日期:2024-10-29
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于贝叶斯混合模型的网络故障数据合成方法,其特征在于,所述方法如下步骤:步骤1:设采集到的网络数据集为 其中xn的由六个属性组成,分别为丢包率、终端下载速率、传输时延、抖动、视频传输质量、终端用户体验评分;该数据集对应的标签集合为 yn=0或1,即X对应于两类标签,其中yn=0为网络正常类标签,yn=1类为网络故障类标签,由于网络正常类的数据个数远远多于网络故障类的数据个数,定义yn=1对应的xn所组成的集合为少数类 其中 为少数类样本,Nalm为少数类样本数目,而yi=0对应的xi所组成的集合为多数类 其中 为多数类样本,Nmaj为多数类样本数目;

步骤2:选用贝叶斯混合模型来表示Xalm的分布,其概率分布函数表达式包括:其中,K为混合成分数,πj(V)、μj、Λj和νj分别表示第j个混合成分的权值、均值、协方差矩阵和自由度参数; 为t分布的概率密度函数,表示为:其中N(·)和Gam(·)分别代表Gaussian分布函数和Gamma分布函数,unj为与xn和第j个混合成分相关的隐变量,权值πj(V)满足 其表达式为:上式中变量Vj服从Beta分布,即p(Vj)=Beta(Vj|1,α),α为该Beta分布的超参数,此外,μj,Λj服从联合Gaussian-Wishart分布,即高斯分布与Wishart分布的乘积,N(·)W(·):p(μj,Λj)=N(μj|mj,λjΛj)W(Λj|Wj,ρj)其中 为该联合Gaussian-Wishart分布的超参数,mj为六维列矢量,λj和ρj是标量,Wj为一个(6×6)的矩阵;引入一个隐变量 其中zn指示当前的数据xn是由t混合模型中的哪个成分产生的,当xn是由第j个混合成分产生时,znj=1,基于以上所述,整个模型的超参数为:步骤3:利用Xalm对混合模型进行参数估计,具体如下:

3-1)产生Nalm个服从[1,K]区间上均匀分布的随机整数,统计该区间上各整数出现的概率;即,如果产生了Nj个整数j,那么δj=Nj/Nalm;对于每个 对应的隐变量zn的初始分布为zn为K维矢量,其在各个维度znj(j=1,...,K)上的取值为{0,1};

3-2)设定超参数 α的初始值;对于所有的j,j=1,...,K,mj=0,λj=1,ρj取3~20之间的任意数,Wj=10·I,I为单位矩阵,νj取1~100之间的任意数,α取1~

10之间的任意数;此外,迭代次数计数变量k=1;

3-3)更新隐变量 的分布,即, 其超参数的更新公式为:

其中

在首次迭代时计算 时,

3-4)更新随机变量 的分布,即,

相应的超参数 的更新公式如下:

其中,

3-5)更新随机变量 的分布,即, 相应的超参数的更新公式为:

3-6)更新隐变量 的分布

其中

在上式中,各项期望<·>的计算公式如下:其中Γ(·)为标准的gamma函数,Γ(·)′为标准gamma函数的导数;此外,和 的计算方法已分别在步骤3-3)和步骤3-4)给出;

3-7)更新自由度参数 即,解如下含有νj的方程:选用常用的数值计算方法,如牛顿法,获得此方程的解νj;

3-8)计算当前迭代后的似然值LIKitr,itr为当前的迭代次数:

3-9)计算当前迭代后与上一次迭代后的似然值的差值△LIK=LIKitr-LIKitr-1;如果△LIK≤δ,那么参数估计过程结束,否则转到步骤(3-3),itr的值增加1,继续进行下一次的迭代;阈值δ的取值范围为10-5~10-4;

步骤4:利用估计出的贝叶斯混合模型,生成新的网络数据集(Xalm)',设需要生成的数据量为N’,包括:

4-1)随机产生一个0到1之间服从均匀分布的随机数ε;

4-2)随机产生服从 分布的

4-3)计算

4-4)随机产生服从 分布的

4-5)利用估计出的 如果ε∈[0,π1],则产生一个服从t分布t(μ1,Λ1,ν1)的样本;

如果 则产生一个服从t分布t(μk,Λk,νk)的样本;如果 则产生一个服从t分布t(μK,ΛK,νK)的样本;

4-6)重复上述步骤(4-1)~(4-5)N’次,得到(Xalm)',最终网络故障数据集为合成之后的总数据集为