1.一种页面响应故障分析方法,其特征在于,包括:
获取页面的历史记录集合,所述历史记录集合中的每条历史记录对应所述页面的一次响应过程,且记录了在所述响应过程中各个响应子流程的耗时;
从所述历史记录集合中分别选取正样本和负样本,并组成样本集合,其中,所述正样本为页面响应出现故障的历史记录,所述负样本为页面响应正常的历史记录;所述样本集合中的正样本的总数与负样本的总数满足以下限制条件: SPN为所述样本集合中的正样本的总数,SNgN为所述样本集合中的负样本的总数,Thresh为预设的阈值;
以各个响应子流程的耗时为分类属性分别对所述样本集合进行分类,并计算各个分类属性的分类准确度,所述分类准确度为分类结果中的正样本、负样本与所述样本集合中的正样本、负样本的相符程度;
根据各个分类属性的分类准确度分别计算各个响应子流程的耗时对页面响应故障的影响权重;
根据所述各个响应子流程的耗时对页面响应故障的影响权重按照从大到小的顺序进行推送,以便系统维护人员根据顺序进行排查。
2.根据权利要求1所述的页面响应故障分析方法,其特征在于,所述以各个响应子流程的耗时为分类属性分别对所述样本集合进行分类,并计算各个分类属性的分类准确度包括:从第n个属性值集合中选取第m个取值作为分类阈值,将所述样本集合中第n个分类属性的取值大于所述分类阈值的样本确定为分类结果中的正样本,将所述样本集合中第n个分类属性的取值小于或等于所述分类阈值的样本确定为分类结果中的负样本,所述第n个属性值集合为由第n个分类属性在所述样本集合中的各个取值组成的集合,其中,1≤n≤N,N为响应子流程的总个数,1≤m≤Mn,Mn为第n个属性值集合中的元素总数;
计算第n个分类属性的第m个取值的分类准确度;
根据下式计算第n个分类属性的分类准确度:
其中,ClassDegn,m为第n个分类属性的第m个取值的分类准确度,max为求最大值函数,ClassDegn为第n个分类属性的分类准确度。
3.根据权利要求2所述的页面响应故障分析方法,其特征在于,所述计算第n个分类属性的第m个取值的分类准确度包括:根据下式计算第n个分类属性的第m个取值的分类准确度:
其中,TotalN为所述样本集合中的样本总数,PN为分类结果中的正样本的总数,NgN为分类结果中的负样本的总数,TPN为分类结果中的正样本与所述样本集合中的正样本相一致的个数,FPN为分类结果中的正样本与所述样本集合中的负样本相一致的个数,TNgN为分类结果中的负样本与所述样本集合中的负样本相一致的个数,FNgN为分类结果中的负样本与所述样本集合中的正样本相一致的个数。
4.根据权利要求2所述的页面响应故障分析方法,其特征在于,所述计算第n个分类属性的第m个取值的分类准确度包括:根据下式计算所述样本集合的信息熵:
其中,TotalN为所述样本集合中的样本总数,Entropy为所述样本集合的信息熵;
根据下式计算分类结果中的正样本的信息熵:
其中,PN为分类结果中的正样本的总数,TPN为分类结果中的正样本与所述样本集合中的正样本相一致的个数,FPN为分类结果中的正样本与所述样本集合中的负样本相一致的个数,PosEntropy为分类结果中的正样本的信息熵;
根据下式计算分类结果中的负样本的信息熵:
其中,NgN为分类结果中的负样本的总数,TNgN为分类结果中的负样本与所述样本集合中的负样本相一致的个数,FNgN为分类结果中的负样本与所述样本集合中的正样本相一致的个数,NegEntropy为分类结果中的负样本的信息熵;
根据下式计算第n个分类属性的第m个取值的分类准确度:
5.根据权利要求1至4中任一项所述的页面响应故障分析方法,其特征在于,所述根据各个分类属性的分类准确度分别计算各个响应子流程的耗时对页面响应故障的影响权重包括:根据下式分别计算各个响应子流程的耗时对页面响应故障的影响权重:
其中,InfWtn为第n个响应子流程的耗时对页面响应故障的影响权重。
6.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,其特征在于,所述计算机可读指令被处理器执行时实现如权利要求1至5中任一项所述的页面响应故障分析方法的步骤。
7.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如下步骤:获取页面的历史记录集合,所述历史记录集合中的每条历史记录对应所述页面的一次响应过程,且记录了在所述响应过程中各个响应子流程的耗时;
从所述历史记录集合中分别选取正样本和负样本,并组成样本集合,其中,所述正样本为页面响应出现故障的历史记录,所述负样本为页面响应正常的历史记录;所述样本集合中的正样本的总数与负样本的总数满足以下限制条件: SPN为所述样本集合中的正样本的总数,SNgN为所述样本集合中的负样本的总数,Thresh为预设的阈值;
以各个响应子流程的耗时为分类属性分别对所述样本集合进行分类,并计算各个分类属性的分类准确度,所述分类准确度为分类结果中的正样本、负样本与所述样本集合中的正样本、负样本的相符程度;
根据各个分类属性的分类准确度分别计算各个响应子流程的耗时对页面响应故障的影响权重;
根据所述各个响应子流程的耗时对页面响应故障的影响权重按照从大到小的顺序进行推送,以便系统维护人员根据顺序进行排查。
8.根据权利要求7所述的终端设备,其特征在于,所述以各个响应子流程的耗时为分类属性分别对所述样本集合进行分类,并计算各个分类属性的分类准确度包括:从第n个属性值集合中选取第m个取值作为分类阈值,将所述样本集合中第n个分类属性的取值大于所述分类阈值的样本确定为分类结果中的正样本,将所述样本集合中第n个分类属性的取值小于或等于所述分类阈值的样本确定为分类结果中的负样本,所述第n个属性值集合为由第n个分类属性在所述样本集合中的各个取值组成的集合,其中,1≤n≤N,N为响应子流程的总个数,1≤m≤Mn,Mn为第n个属性值集合中的元素总数;
计算第n个分类属性的第m个取值的分类准确度;
根据下式计算第n个分类属性的分类准确度:
其中,ClassDegn,m为第n个分类属性的第m个取值的分类准确度,max为求最大值函数,ClassDegn为第n个分类属性的分类准确度。
9.根据权利要求8所述的终端设备,其特征在于,所述计算第n个分类属性的第m个取值的分类准确度包括:根据下式计算第n个分类属性的第m个取值的分类准确度:
其中,TotalN为所述样本集合中的样本总数,PN为分类结果中的正样本的总数,NgN为分类结果中的负样本的总数,TPN为分类结果中的正样本与所述样本集合中的正样本相一致的个数,FPN为分类结果中的正样本与所述样本集合中的负样本相一致的个数,TNgN为分类结果中的负样本与所述样本集合中的负样本相一致的个数,FNgN为分类结果中的负样本与所述样本集合中的正样本相一致的个数。
10.根据权利要求8所述的终端设备,其特征在于,所述计算第n个分类属性的第m个取值的分类准确度包括:根据下式计算所述样本集合的信息熵:
其中,TotalN为所述样本集合中的样本总数,Entropy为所述样本集合的信息熵;
根据下式计算分类结果中的正样本的信息熵:
其中,PN为分类结果中的正样本的总数,TPN为分类结果中的正样本与所述样本集合中的正样本相一致的个数,FPN为分类结果中的正样本与所述样本集合中的负样本相一致的个数,PosEntropy为分类结果中的正样本的信息熵;
根据下式计算分类结果中的负样本的信息熵:
其中,NgN为分类结果中的负样本的总数,TNgN为分类结果中的负样本与所述样本集合中的负样本相一致的个数,FNgN为分类结果中的负样本与所述样本集合中的正样本相一致的个数,NegEntropy为分类结果中的负样本的信息熵;
根据下式计算第n个分类属性的第m个取值的分类准确度: