利索能及
我要发布
收藏
专利号: 2024114875125
申请人: 青岛他坦科技服务有限公司
专利类型:发明专利
专利状态:授权未缴费
更新日期:2025-02-20
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种计算机数据智能管理方法,其特征在于,该方法包括以下步骤:

采集日志数据获取待压缩数据;

对待压缩数据进行排序得到待压缩数据序列,根据待压缩数据序列中相邻的待压缩数据,获取待压缩数据的摘要短码与待压缩数据的差异文件;

去除待压缩数据的差异文件中的冗余,获取待压缩数据的目标文件;将待压缩数据的目标文件转化为待压缩数据的初级压缩编码表;根据待压缩数据的初级压缩编码表中每列数据的数量,获取待压缩数据的初级压缩编码表的行数阈值;根据待压缩数据的初级压缩编码表的行数阈值与待压缩数据的初级压缩编码表,获取待压缩数据的高级压缩编码表;

根据待压缩数据的高级压缩编码表中每列数据的数值,获取待压缩数据的最终压缩编码表;对待压缩数据的最终压缩编码表进行压缩,得到待压缩数据中的差异文件的压缩结果;

根据待压缩数据的摘要短码与待压缩数据中的差异文件的压缩结果,获取压缩日志;

构建存储树将压缩日常储存到存储树中。

2.根据权利要求1所述一种计算机数据智能管理方法,其特征在于,所述采集日志数据获取待压缩数据,包括的具体方法为:从日志存储库中调取所有日志数据,对每条日志数据进行标准规格化处理,得到每条日志数据进行标准规格化处理结果,记为每条待压缩数据。

3.根据权利要求1所述一种计算机数据智能管理方法,其特征在于,所述对待压缩数据进行排序得到待压缩数据序列,根据待压缩数据序列中相邻的待压缩数据,获取待压缩数据的摘要短码与待压缩数据的差异文件,包括的具体方法为:对于第条待压缩数据与第 条待压缩数据,判断第 条待压缩数据中第 个字符,与第 条待压缩数据中第1个字符是否完全相同,若不完全相同则将第 条待压缩数据中第1个字符记为差异字符,若完全相同则将第 条待压缩数据中第1个字符记为相同字符,完成对第 条待压缩数据中第1个字符的分类;

对第 条待压缩数据中所有字符进行分类,得到第 条待压缩数据中所有差异字符与相同字符,以此类推,根据每条待压缩数据与相邻前一条待压缩数据,获取除第1条待压缩数据外每条待压缩数据中的差异字符与相同字符;

将除第1条待压缩数据外每条待压缩数据中的差异字符组成的数据记为差异文件;

获取第 条待压缩数据中的所有相同字符的摘要,记为第 条待压缩数据的摘要短码。

4.根据权利要求1所述一种计算机数据智能管理方法,其特征在于,所述去除待压缩数据的差异文件中的冗余,获取待压缩数据的目标文件,包括的具体方法为:对于第 条待压缩数据,获取第 条待压缩数据的差异文件中所有的空白文本处,将第 条待压缩数据的差异文件中所有的空白文本处替换为特殊字符 ,得到经过去除冗余后的第 条待压缩数据的差异文件,记为第 条待压缩数据的特征文件;

将第 条待压缩数据的特征文件中所有大写的英文字母替换为小写的英文字母,得到第 条待压缩数据的目标文件。

5.根据权利要求1所述一种计算机数据智能管理方法,其特征在于,所述将待压缩数据的目标文件转化为待压缩数据的初级压缩编码表,包括的具体方法为:对于第 条待压缩数据的目标文件,统计第 条待压缩数据的目标文件中的字符的种类数量记为 ,预设一个空的列数等于 的压缩编码表,每种字符置入压缩编码表的第一行中,将任意一个字符在待压缩数据的目标文件中的索引位置,按顺序分别在该字符在压缩编码表第一行中所在的列的下方逐行填入,得到第 条待压缩数据的初级压缩编码表。

6.根据权利要求1所述一种计算机数据智能管理方法,其特征在于,所述根据待压缩数据的初级压缩编码表中每列数据的数量,获取待压缩数据的初级压缩编码表的行数阈值,包括的具体方法为:对于第 条待压缩数据的初级压缩编码表,根据初级压缩编码表中的列数,以及每列中的数据数量,获取初级压缩编码表的行数阈值,具体的计算公式为:式中, 表示第 条待压缩数据的初级压缩编码表的行数阈值; 表示第

条待压缩数据的目标文件中字符的种类数量; 表示第 条待压缩数据的目标文件中第 种字符的数量;表示第 种字符在第 条待压缩数据的初级压缩编码表中的列数次序值; 表示向上取整运算。

7.根据权利要求1所述一种计算机数据智能管理方法,其特征在于,所述根据待压缩数据的初级压缩编码表的行数阈值与待压缩数据的初级压缩编码表,获取待压缩数据的高级压缩编码表,包括的具体方法为:将第 条待压缩数据的初级压缩编码表中,行数数量小于 的列记为短列,行数数量等于 的列记为基准列,行数数量大于 的列记为长列;对于第 个长列,将第个长列中第 行之后的数据记为第 个长列的待转移数据;

根据第 条待压缩数据的初级压缩编码表中基准列、短列及长列的分布,以及长列的待转移数据,通过补0及将待转移数据从长列转移到短列中,直至将所有长列转化为基准列,得到第 条待压缩数据的中级压缩编码表;

将第 条待压缩数据的中级压缩编码表中每列数据的末尾补若干个0,直至每列数据的数据数量为 ,得到第 条待压缩数据的高级压缩编码表。

8.根据权利要求1所述一种计算机数据智能管理方法,其特征在于,所述根据待压缩数据的高级压缩编码表中每列数据的数值,获取待压缩数据的最终压缩编码表,包括的具体方法为:对于第 条待压缩数据的高级压缩编码表中的第 列数据,获取第 条待压缩数据的高级压缩编码表中的第 列数据内所有数据均值的四舍五入结果记为基准值,将第条待压缩数据的高级压缩编码表中的第 列数据内所有的0替换为基准值,然后将第条待压缩数据的高级压缩编码表中的第 列数据内所有数据分别除以基准值,获取第条待压缩数据的高级压缩编码表中的第 列数据内每个数据的余数与倍数;

对于第 条待压缩数据的高级压缩编码表中的第 列数据内第 个数据,将第条待压缩数据的高级压缩编码表中的第 列数据内第 个数据的余数与倍数之和,作为第条待压缩数据的高级压缩编码表中的第 列数据内第 个数据的表征值,获取第条待压缩数据的高级压缩编码表中每个数据的表征值,并替换第 条待压缩数据的高级压缩编码表中所有数据,得到第 条待压缩数据的最终压缩编码表。

9.根据权利要求1所述一种计算机数据智能管理方法,其特征在于,所述对待压缩数据的最终压缩编码表进行压缩,得到待压缩数据中的差异文件的压缩结果,包括的具体方法为:对第 条待压缩数据的最终压缩编码表逐列进行S形扫描,得到第 条待压缩数据的最终压缩编码表的序列记为目标序列,利用LZ77压缩算法对目标序列进行压缩,得到目标序列的压缩结果,并将目标序列的压缩结果记为待压缩数据中的差异文件的压缩结果。

10.根据权利要求1所述一种计算机数据智能管理方法,其特征在于,所述根据待压缩数据的摘要短码与待压缩数据中的差异文件的压缩结果,获取压缩日志;构建存储树将压缩日常储存到存储树中,包括的具体方法为:对于第 条待压缩数据,将第 条待压缩数据的摘要短码与待压缩数据中的差异文件的压缩结果记为第 个压缩日志,获取所有压缩日志,将第一条待压缩数据作为一个压缩日志;

以时间为导向构建一个存储树,将每次新存入的日志文件所在的节点作为查询根节点,并在每次插入新节点后使左子树与右子树的高度差为1;最后将所有压缩日志储存到存储树中。