1.一种用于数据处理的电子档案修复方法,其特征在于,包括:
S1、文件服务器感知接收电子档案修复触发请求条件,并传输受损电子档案搜寻信号至中央管理服务器;
S2、中央管理服务器响应受损电子档案搜寻信号,并逐一遍历档案库中的各既存电子档案进行受损电子档案搜寻,将搜寻到的受损电子档案标记为预修复电子档案;
S3、获取预修复电子档案的受损特征参数进行处理,得到预修复电子档案的初步执行修复拆解切块比例,记为预执行修复拆解切块比例;
S4、基于所述预执行修复拆解切块比例,将预修复电子档案进行拆解,获得预修复电子档案的各拆分数据块;
S5、将预修复电子档案的各拆分数据块进行修复处理,得到修复处理后的各拆分数据块进行拼接处理,由此获取重建修复电子档案并更替存储至档案库;
所述获取预修复电子档案的受损特征参数,具体包括:
获取预修复电子档案的原始归档数据,并提取预修复电子档案的现行数据,经比对统计预修复电子档案的特征偏差参数,其中特征偏差参数包括偏差哈希值、偏差字节值、元数据偏差项总数;
获取预修复电子档案在既存周期中的日志记录,从中调取特征运行参数,其中特征运行参数包括访问频率、异常访问次数、网络中断次数;
将预修复电子档案的特征偏差参数以及特征运行参数共同标定为预修复电子档案的受损特征参数;
所述获取预修复电子档案的受损特征参数进行处理,具体过程包括:
基于预修复电子档案的特征偏差参数以及特征运行参数,逐次与数据仓中存储的特征偏差验证参数以及特征运行验证参数进行比对,得到预修复电子档案的特征偏差验证系数以及特征运行验证系数,所述特征偏差验证系数以及特征运行验证系数分别用于量化表征预修复电子档案的特征偏差程度以及存储干扰程度;
基于预修复电子档案的特征偏差验证系数以及特征运行验证系数,综合处理得到预修复电子档案的受损特征验证系数,所述受损特征验证系数用于数值量化预修复电子档案的受损程度;
所述将预修复电子档案的各拆分数据块进行修复处理,具体包括:
统计预修复电子档案的各拆分数据块对应的基础参数,经数值处理获取预修复电子档案的各拆分数据块对应的修复指征因子,所述修复指征因子用于数值表征各拆分数据块的修复难度;
将预修复电子档案的各拆分数据块对应的修复指征因子导入至层次筛分模型中,获取预修复电子档案的各拆分数据块对应的修复执行模式,由此将预修复电子档案的各拆分数据块以对应的修复执行模式进行修复处理。
2.根据权利要求1所述的一种用于数据处理的电子档案修复方法,其特征在于:所述预修复电子档案的初步执行修复拆解切块比例,具体为:基于预修复电子档案的受损特征验证系数,与数据仓存储的各受损特征验证系数区间对应的修复拆解切块比例进行匹配,将匹配得到的修复拆解切块比例记为预修复电子档案的初步执行修复拆解切块比例。
3.根据权利要求1所述的一种用于数据处理的电子档案修复方法,其特征在于:所述各拆分数据块对应的基础参数,其中基础参数包括总字节数、各内容组织的字节占比以及分布内容区段。
4.根据权利要求1所述的一种用于数据处理的电子档案修复方法,其特征在于:所述层次筛分模型,具体执行过程如下:将预修复电子档案的各拆分数据块对应的修复指征因子标记为 ,其中,j为各拆分数据块的编号, ,n为拆分数据块的总数;
统计层次筛分模型中的筛分第一门槛值以及筛分第二门槛值,并分别标记为 、 ;
经层次筛分模型处理,若 ,则将预修复电子档案的该拆分数据块对应的修复执行模式定义为自动修复;
若 ,则将预修复电子档案的该拆分数据块对应的修复执行模式定义为半自动修复;
若 ,则将预修复电子档案的该拆分数据块对应的修复执行模式定义为手动修复;
基于层次筛分模型处理,获得预修复电子档案的各拆分数据块对应的修复执行模式。
5.根据权利要求3所述的一种用于数据处理的电子档案修复方法,其特征在于:所述预修复电子档案的各拆分数据块对应的修复指征因子,具体处理过程为:;
其中, 为预修复电子档案的拆分数据块j对应的修复指征因子, 为拆分数据块j对应的总字节数, 为拆分数据块j对应的第g个内容组织的字节占比, 为拆分数据块j对应的分布内容区段上界值, 为拆分数据块j对应的分布内容区段下界值, 为参考字节数, 为内容组织的参考字节占比, 为预修复电子档案的核心分布内容区段上界值, 为预修复电子档案的核心分布内容区段下界值, 为拆分数据块j的第一权重,为拆分数据块j的第二权重, 为拆分数据块j的第三权重,j为各拆分数据块的编号, ,n为拆分数据块的总数,g为各内容组织的编号, ,u为内容组织的总数。
6.一种应用如权利要求1‑5中任意一项所述用于数据处理的电子档案修复方法的系统,其特征在于:包括:搜寻信号触发传输模块,用于通过文件服务器感知接收电子档案修复触发请求条件,并传输受损电子档案搜寻信号至中央管理服务器;
受损电子档案搜寻模块,用于通过中央管理服务器响应受损电子档案搜寻信号,并逐一遍历档案库中的各既存电子档案进行受损电子档案搜寻,将搜寻到的受损电子档案标记为预修复电子档案;
受损特征参数获取处理模块,用于获取预修复电子档案的受损特征参数进行处理,得到预修复电子档案的初步执行修复拆解切块比例,记为预执行修复拆解切块比例;
电子档案拆解模块,用于基于所述预执行修复拆解切块比例,将预修复电子档案进行拆解,获得预修复电子档案的各拆分数据块;
电子档案修复处理模块,用于将预修复电子档案的各拆分数据块进行修复处理,得到修复处理后的各拆分数据块进行拼接处理,由此获取重建修复电子档案并更替存储至档案库。