利索能及
我要发布
收藏
专利号: 2019105442487
申请人: 东软集团股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-04-10
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种日志提取的方法,其特征在于,所述方法包括:从待提取日志中确定样本日志,所述样本日志包括多个日志事件;

从多个所述日志事件中抽取目标日志事件;

在预设的日志模板集中确定与所述目标日志事件匹配的目标日志模板,所述日志模板集中包括至少一个日志模板;

按照所述目标日志模板对所述待提取日志进行内容提取。

2.根据权利要求1所述的方法,其特征在于,所述从多个所述日志事件中抽取目标日志事件,包括:针对每一所述日志事件,确定该日志事件与多个所述日志事件中除该日志事件之外的每一日志事件的差异度,并根据该日志事件与多个所述日志事件中除该日志事件之外的每一日志事件的差异度,确定该日志事件的差异特征值;

根据每一所述日志事件的差异特征值,确定所述样本日志对应的事件抽取参数;

根据所述事件抽取参数,从多个所述日志事件中抽取所述目标日志事件。

3.根据权利要求2所述的方法,其特征在于,所述差异度包括内容差异度、长度差异度、格式差异度中的至少一种。

4.根据权利要求2所述的方法,其特征在于,所述根据所述事件抽取参数,从多个所述日志事件中抽取所述目标日志事件,包括:将所述事件抽取参数作为随机选择算法的随机系数,通过所述随机选择算法从多个所述日志事件中抽取所述目标日志事件。

5.根据权利要求1所述的方法,其特征在于,所述在预设的日志模板集中确定与所述目标日志事件匹配的目标日志模板,包括:针对每一目标日志事件,确定该目标日志事件与所述日志模板集中的每个日志模板的匹配度;

将匹配度最大的所述日志模板作为与该目标日志事件匹配的目标日志模板。

6.根据权利要求1所述的方法,其特征在于,所述目标日志模板为多个;所述按照所述目标日志模板对所述待提取日志进行内容提取,包括:针对所述待提取日志中包括的每一日志事件,确定该日志事件与多个所述目标日志模板中每个所述目标日志模板的匹配度,并按照匹配度最大的所述目标日志模板对该日志事件进行内容提取。

7.根据权利要求1所述的方法,其特征在于,所述目标日志模板为多个;所述按照所述目标日志模板对所述待提取日志进行内容提取,包括:针对所述待提取日志中包括的每一日志事件,确定该日志事件与多个所述目标日志模板中每个所述目标日志模板的匹配度,若匹配度中的最大值大于或等于匹配度阈值,则按照匹配度最大的所述目标日志模板对该日志事件进行内容提取。

8.一种日志提取的装置,其特征在于,所述装置包括:样本确定模块,用于从待提取日志中确定样本日志,所述样本日志包括多个日志事件;

抽取模块,用于从多个所述日志事件中抽取目标日志事件;

模板确定模块,用于在预设的日志模板集中确定与所述目标日志事件匹配的目标日志模板,所述日志模板集中包括至少一个日志模板;

提取模块,用于按照所述目标日志模板对所述待提取日志进行内容提取。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。

10.一种电子设备,其特征在于,包括:

存储器,其上存储有计算机程序;

处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-7中任一项所述方法的步骤。