1.一种数据分布管理系统,其特征在于,包括数据收集模块、数据修复模块、数据核验模块、暂存模块、数据筛选模块、图片存储模块、文档存储模块、有声数据存储模块、控制器、显示器和数据查询模块;
其中,所述数据收集模块用于获取各类待存储文件,所述数据收集模块用于将待存储文件传输到数据修复模块,所述数据修复模块接收到待存储文件时会将其传输到数据核验模块,所述数据核验模块用于核验待存储文件的文件名情况;所述数据核验模块在无法打开待存储文件时会将待存储文件返回数据修复模块,所述数据修复模块用于对文件名出错的待存储文件进行修复,修复过程如下:步骤一:获取待存储文件的损坏文件名,并将该损坏文件名与常规文件名进行比对;
步骤二:在比对到损坏文件名与常规文件名的重合度,当重合度达到预设值时会将常规文件名代替损坏文件名;
具体修复过程表现为:检测到待存储文件的文件名若为dox,则通过常规比对可判断得到常规文件中会有docx文件,此时会自动将待存储文件的文件名自动更换为docx;之后利用数据核验模块将修复之后的待存储文件打开,如果能够打开则可判定为修复完成;
所述数据修复模块将修复之后的待存储文件传输到数据核验模块重新核验,所述数据核验模块在检测到修复之后的待存储文件能够打开之后向数据修复模块返回存储信号,所述数据修复模块在接收到数据核验模块返回的存储信号会将待存储文件传输到数据筛选模块;
所述数据核验模块在能够打开待存储文件时会将待存储文件和传输信号返回数据修复模块,所述数据修复模块在接收到数据核验模块传输的待存储文件和传输信号时会将待存储文件传输到数据筛选模块;
所述数据筛选模块接收到数据修复模块传输的待存储文件时会自动识别文件名并将其分类,所述数据筛选模块在识别到待存储文件为图片文件时将其标记为图片文件并将其传输到图片存储模块;所述数据筛选模块在识别到待存储文件为文档文件时将其标记为文档文件并将其传输到文档存储模块;所述数据筛选模块在识别到待存储文件为有声文件时将其标记为有声文件并将其传输到有声数据存储模块;
所述文档存储模块包括第一处理器和文档库,所述数据筛选模块用于将文档文件传输到第一处理器,所述第一处理器用于对接收到的若干文档文件进行处理转换为文档存储文件存储到文档库;具体处理步骤如下:S1:将若干文档文件按照类型进行分类,之后根据文档文件的类型建立若干首层文件夹,将不同类型的文档文件按照类型存储在首层文件夹内;
S2:将首层文件夹里面的文件读取标题之后,判断所属领域,创建次层文件夹,之后将文档文件按照领域分类并存储到对应次层文件夹内部;
S3:将次层文件夹内部的文件按照时间排序建立底层文件夹,按照年月创建底层文件夹;之后将对应文件传输到对应的底层文件夹内;
S4:对每一份文档文件内部内容进行识别,并检索提取出关键词;
S5:将文档名与文档对应的关键词融合形成为检索语,同时将文档的路径信息与检索语结合构成查询信息,若干个文档的查询信息构成了查询信息表,将查询信息表单独存储,形成本文件夹的目录文件;通过所述路径信息可直接转到对应路径信息的文档文件处;
所述图片存储模块包括第二处理器和图片库,所述第二处理器接收数据筛选模块传输的图片文件,所述第二处理器在接收到数据筛选模块传输的图片文件之后对其做相关处理之后存储在图片库内:SS1:对图片文件进行识别;
SS2:识别之后根据图片内的信息对其进行分类,分类之后按照类型建立一层文件夹存储对应图片文件;
SS3:将一层文件夹内部的图片文件按照时间建立二层文件夹,二层文件夹为一个月建立一份对应文件夹;
SS4:提取图片文件信息,同时获取每份图片文件对应的路径信息,将图片文件信息和路径信息融合形成为检索信息,若干份图片文件的检索信息构成图片文件的检索信息表;
通过所述路径信息可直接转到对应路径信息的图片文件处;
所述有声数据存储模块包括第三处理器和有声数据库,所述第三处理器接收数据筛选模块传输的有声文件,所述有声文件为音频文件和视频文件,所述第三处理器用于对有声文件做相关处理之后存储到有声数据库内,具体处理步骤如下:SSS1:将有声文件按照音频文件和视频文件区别,建立一类文件夹,并将其对应存储;
SSS2:在一类文件夹内部建立二类文件夹,所述二类文件夹按照时间划分,将同一个月的视频文件或音频文件划分为二类文件夹。
2.根据权利要求1所述的一种数据分布管理系统,其特征在于,所述数据筛选模块还用于将其他文件传输到有声数据存储模块,所述其他文件为除图片文件、文档文件和有声文件以外的文件,所述有声数据存储模块的第三处理器用于接收数据筛选模块传输的其他文件,所述第三处理器用于在有声数据库内建立其他文件夹并将其他文件传输到其他文件夹内实施存储。
3.根据权利要求1所述的一种数据分布管理系统,其特征在于,所述数据查询模块用于用户查询文件用,所述数据查询模块用于向控制器传输查询信息,所述查询信息包括文件类型和文件关键词,所述控制器用于根据查询信息内的文件类型自动从对应数据库获取到查询文件,查询过程具体如下:步骤一:根据文件类型自动锁定对应的检索文件数据库;
步骤二:获取对应文件数据库内部的查询信息表和检索信息表自动获取到对应文件列表;
步骤三:锁定需要检索文件之后根据其对应的路径信息自动打开对应查询文件。
4.根据权利要求3所述的一种数据分布管理系统,其特征在于,所述控制器用于将查询文件传输到显示器进行实时显示。
5.根据权利要求1所述的一种数据分布管理系统,其特征在于,所述数据核验模块在检测到修复之后的待存储文件不能打开之后将待存储文件恢复原有文件名,所述数据核验模块用于将恢复原有文件名的待存储文件标记为破损数据,所述数据核验模块用于将破损数据传输到暂存模块进行暂时存储;
所述数据查询模块还用于通过控制器对暂存模块的破损数据进行管理,在所述破损数据无用之后可利用数据查询模块想控制器传输删除信息,所述控制器接收数据查询模块传输的删除信息,所述控制器根据删除信息将暂存模块存储的破损数据删除。
6.根据权利要求1所述的一种数据分布管理系统,其特征在于,所述第一处理器用于对接收到的若干文档文件进行处理,所述具体处理步骤的S4中提取关键词原理如下:S1:对文档的首段和尾段进行分词处理;
S2:提取出若干组分词;
S3:判断出出现频率最高的前若干名组分词;
S4:将该前若干名组分词标记为关键词。