利索能及
我要发布
收藏
专利号: 2019113214213
申请人: OPPO广东移动通信有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2024-12-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种事件审计方法,其特征在于,包括:

获取预设的样本数据,所述样本数据包括各类事件日志构成的训练集和测试集;

通过预先基于所述样本数据中的训练集和测试集创建的TF‑IDF模型并结合多种机器学习算法构建融合分类模型;

根据所述融合分类模型对所述测试集中的事件日志进行风险等级评估;

其中,所述通过预先基于所述样本数据中的训练集和测试集创建的TF‑IDF模型并结合多种机器学习算法构建融合分类模型的步骤包括:通过预先基于所述样本数据中的训练集和测试集创建的TF‑IDF模型训练多种分类模型;

通过训练好的多种分类模型分别计算所述测试集的分类准确率;

根据各个分类模型计算得到的测试集的准确率设定每个分类模型的权重;

根据每个分类模型的权重构建融合分类模型;

所述根据所述融合分类模型对所述测试集中的事件日志进行风险等级评估的步骤包括:提取所述融合分类模型中各个分类器的权重;

使用各个分类器的权重为所述测试集打分,并将得到的各个分类器的打分数值进行求和,得到融合分类模型的打分结果;

将所述融合分类模型的打分结果与预先设定的风险阈值进行比较;

当所述融合分类模型的打分结果大于预先设定的风险阈值时,判定测试集的事件被识别为高风险事件,否则识别为低风险事件。

2.根据权利要求1所述的事件审计方法,其特征在于,所述事件审计方法还包括:将风险等级评估的高风险事件推送至触发相应事件的用户。

3.根据权利要求2所述的事件审计方法,其特征在于,所述事件审计方法还包括:接收所述用户针对所述相应事件的反馈信息。

4.根据权利要求1所述的事件审计方法,其特征在于,所述获取预设的样本数据的步骤之前还包括:构建事件日志数据库,收集各类事件日志存储至所述事件日志数据库;

对所述事件日志数据库中的每一条事件日志进行打标签处理,所述标签包括:高风险事件标签和低风险事件标签;

将打标签处理后的数据组成样本数据;

将所述样本数据分成训练集和测试集。

5.根据权利要求4所述的事件审计方法,其特征在于,所述通过预先基于所述样本数据中的训练集和测试集创建的TF‑IDF模型并结合多种机器学习算法构建融合分类模型的步骤之前还包括:基于所述样本数据中的训练集和测试集创建TF‑IDF模型,具体包括:对所述训练集进行预处理;

对预处理后的训练集进行语言类型识别;

根据识别的语言类型,使用对应的词库对所述训练集中的事件日志进行分词,对分词后的训练集进行训练及向量转换,对测试集进行向量转换得到TF‑IDF模型。

6.根据权利要求5所述的事件审计方法,其特征在于,所述对分词后的训练集进行训练及向量转换,对测试集进行向量转换得到TF‑IDF模型的步骤包括:导入开源库中的文本特征提取库中的TF‑IDF向量生成器类,创建TF‑IDF向量生成器对象;

使用创建的TF‑IDF向量生成器对象对分词后的训练集进行训练及向量转换;

使用创建的TF‑IDF向量生成器对象对所述测试集进行向量转换;

将训练集训练好的模型,以及训练集和测试集转换成向量后的数据保存,得到TF‑IDF模型。

7.根据权利要求5所述的事件审计方法,其特征在于,所述对所述训练集进行预处理包括:过滤掉所述训练集中事件日志的无语义符号,以及对事件日志进行英文字母大小写脱敏。

8.根据权利要求6所述的事件审计方法,其特征在于,所述方法还包括:收集误报数据,对所述误报数据进行误差分析;

根据误差分析结果更新所述融合分类模型及对应的词库。

9.一种事件审计装置,其特征在于,所述事件审计装置包括:获取模块,用于获取预设的样本数据,所述样本数据包括各类事件日志构成的训练集和测试集;

构建模块,用于通过预先基于所述样本数据中的训练集和测试集创建的TF‑IDF模型并结合多种机器学习算法构建融合分类模型;

评估模块,用于根据所述融合分类模型对所述测试集中的事件日志进行风险等级评估;

所述构建模块还用于,通过预先基于所述样本数据中的训练集和测试集创建的TF‑IDF模型训练多种分类模型;通过训练好的多种分类模型分别计算所述测试集的分类准确率;

根据各个分类模型计算得到的测试集的准确率设定每个分类模型的权重;根据每个分类模型的权重构建融合分类模型;

所述评估模块还用于,提取所述融合分类模型中各个分类器的权重;使用各个分类器的权重为所述测试集打分,并将得到的各个分类器的打分数值进行求和,得到融合分类模型的打分结果;将所述融合分类模型的打分结果与预先设定的风险阈值进行比较;当所述融合分类模型的打分结果大于预先设定的风险阈值时,判定测试集的事件被识别为高风险事件,否则识别为低风险事件。

10.一种终端设备,其特征在于,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的事件审计程序,所述事件审计程序被所述处理器执行时实现如权利要求1‑8中任一项所述的事件审计方法的步骤。

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有事件审计程序,所述事件审计程序被处理器执行时实现如权利要求1‑8中任一项所述的事件审计方法的步骤。