1.一种基于大数据的企业数据优化管理方法,包括:通过一级文件录入端口:保存一级文件处理人处理的文件;
通过二级文件录入端口:保存一级文件处理人处理完成后提交至二级文件处理人审核的文件;
通过三级文件录入端口:保存二级文件处理人审核完成后提交的文件;
针对一级文件录入端口的每个文件;
记录一级文件处理人每次打开和关闭文件的时间,得到处理时间集;
执行处理周期计算策略,得到处理周期;
当一级文件处理人处理文件时:
在处理周期内;
设定判断一级文件处理人是否误打开文件的阈值间隔;
根据阈值间隔,执行预处理策略,获取执行间隔集;
设定自动保存文件的采集间隔;
根据执行间隔集和采集间隔,执行定制化保存策略,保存处理过程中的文件,得到文件副本,组成文件副本集;
一级文件处理人每次关闭文件时,询问一级文件处理人是否将本次处理的文件提交至二级文件处理人;
若一级文件处理人选择提交,执行提交策略,处理二级文件处理人接收的文件;
其中,所述根据执行间隔集和采集间隔,执行定制化保存策略,保存处理过程中的文件,得到文件副本集,包括:获取执行间隔集中的任意一个元素,记为标记间隔;
执行间隔划分策略,得到执行时间点集;
获取执行时间点集中每个时间点对应文件的大小,记为文件存储数据,并按照出现时间从早到晚的顺序组成文件存储数据集;
设定判断是否保存文件的阈值数据,阈值数据大于0;
按照元素出现的时间顺序依次遍历文件存储数据集中每个元素:S1、获取文件存储数据集中的一个元素,记为第一标记数据;
S2、获取和第一标记数据相邻的下一个元素,记为第二标记数据;
S3、计算第二标记数据‑第一标记数据,结果记为判断数据;
S4、当判断数据大于等于阈值数据时,在第二标记数据对应的时间点保存文件,得到文件副本;
S5、当判断数据大于零且小于阈值数据时:在文件存储数据集中获取和第二标记数据相邻的下一个元素,替换当前的第二标记数据,重复S3‑S5;
S6、当判断数据小于零时,对第二标记数据之前的所有文件存储数据执行回溯优化策略,具体包括:获取第二标记数据之前的所有文件存储数据,组成回溯数据集;
用第二标记数据的数值分别减去回溯数据集中每个元素的数值,结果组成回溯差值集;
遍历回溯差值集中的所有元素,获取小于零的最大元素,记为回溯定位差值;
记回溯定位差值对应的文件存储数据出现的时间点为回溯定位开始点;
记第二标记数据对应的时间点为回溯定位结束点;
则,从文件副本集中删除从回溯定位开始点到回溯定位结束点保存的所有文件副本;
保存第二标记数据对应的文件副本。
2.根据权利要求1所述的基于大数据的企业数据优化管理方法,其特征在于:所述执行处理周期计算策略,包括:三级文件录入端口中的文件均为已经完成处理的文件;
获取一级文件处理人已经完成处理的文件的总数,记为完结次数;
当完结次数≧1时:
获取一级文件处理人已经完成处理的所有文件;
针对每个文件:
记第一次打开文件的时间点为处理起始点;
记最后一次关闭文件的时间点为处理结束点;
计算每个文件处理起始点和处理结束点的间隔,分别记为第一间隔、第二间隔……第r间隔;
计算处理周期;
通过以下公式计算处理周期:
(第一间隔+第二间隔+……+第r间隔)÷r=处理周期。
3.根据权利要求2所述的基于大数据的企业数据优化管理方法,其特征在于:所述执行处理周期计算策略,包括:当完结次数=0时:
获取其他所有一级文件处理人的处理周期,分别记为第一周期、第二周期……第t周期;
计算处理周期;
通过以下公式计算处理周期:
(第一周期+第二周期+……+第t周期)÷t=一级文件处理人第一次处理的处理周期。
4.根据权利要求1所述的基于大数据的企业数据优化管理方法,其特征在于:所述根据阈值间隔,执行预处理策略,获取执行间隔集,包括:在处理时间集中:
计算每次打开文件和对应关闭文件的间隔,记为处理间隔;
获取所有的处理间隔,和阈值间隔做比较:获取大于阈值间隔的所有处理间隔,组成执行间隔集。
5.根据权利要求1所述的基于大数据的企业数据优化管理方法,其特征在于:所述执行间隔划分策略,得到执行时间点集,包括:获取标记间隔的开始时间点;
获取标记间隔的结束时间点;
记距离开始时刻1个采集间隔的时间点为第一时间点;
记距离开始时刻2个采集间隔的时间点为第二时间点;
记距离开始时刻u个采集间隔的时间点为第u时间点,其中,第u时间点小于等于结束时间点;
开始时间点和结束时间点以及在开始时间点和结束时间点之间的所有时间点共同组成执行时间点集。
6.根据权利要求1所述的基于大数据的企业数据优化管理方法,其特征在于:所述执行提交策略,包括:二级文件处理人接收一级文件处理人发送的文件,记为接收文件:针对二级文件录入端口中的所有文件:若存在和接收文件的文件名相同的文件,则记该文件为第一底稿文件;
用接收文件替换第一底稿文件存入二级文件录入端口;
若不存在和接收文件的文件名相同的文件,遍历二级文件录入端口的所有文件和接收文件进行比对:设定判断文件是否作为第一版保存在二级文件录入端口的阈值重复度;
若存在和接收文件的重复度大于阈值重复度的文件,记该文件为第二底稿文件;
用接收文件替换第二底稿文件存入二级文件录入端口;
若不存在和接收文件的重复度大于阈值重复度的文件,将接收文件存入二级文件录入端口。
7.实现权利要求1所述的基于大数据的企业数据优化管理方法的系统,包括:数据采集模块:一级文件录入端口、二级文件录入端口和三级文件录入端口;
针对一级文件录入端口的每个文件,记录一级文件处理人每次打开和关闭文件的时间,得到处理时间集;
数据处理模块:执行处理周期计算策略,得到处理周期;根据阈值间隔,执行预处理策略,获取执行间隔集;
执行模块:根据执行间隔集和采集间隔,执行定制化保存策略,得到文件副本集;当一级文件处理人提交文件给二级文件处理人时,执行提交策略,处理二级文件处理人接收的文件。