1.一种计算机文件保密检查方法,其特征在于,包括以下步骤:
基于深度学习,采用变换器算法和卷积神经网络,对文本和图像内容进行深层语义分析及关键特征提取,并进行特征数据整合,生成文本和图像特征数据;
基于所述文本和图像特征数据,采用自然语言处理技术和图像识别算法,对文件中的文本和图像进行保密信息判定,并进行分类处理,生成保密信息报告;
基于所述保密信息报告,采用生成对抗网络,模拟潜在的安全漏洞和攻击行为,增强系统的预警机制,并进行漏洞数据整合,生成安全漏洞模拟数据;
基于所述安全漏洞模拟数据,采用数据流分析算法,对文件操作和系统行为进行动态监控和静态分析,寻找潜在的数据泄漏点,并进行数据流整合,生成数据流分析报告;
基于文件原始数据,采用SHA‑256哈希算法,对文件进行完整性校验,并将哈希值与存储在区块链上的哈希值进行对比,确定文件的完整性,并生成完整性校验记录;
结合所述完整性校验记录,采用基于角色的访问控制和动态加密技术,对文件进行访问控制和加密处理,并设定访问权限,生成访问控制和加密策略;
所述变换器算法具体为BERT、GPT系列模型,用于文本内容的语义理解,所述卷积神经网络用于从图像中抽取关键特征,所述自然语言处理技术用于识别包括私有API密钥、密码的文本型保密信息,所述图像识别算法用于识别图像中的保密内容,所述数据流分析算法具体为追踪保密数据在系统中的流动和存储路径,识别非法访问或篡改的尝试,所述动态加密技术包括AES对文件进行加密,使用RSA对AES的密钥进行管理;
基于所述安全漏洞模拟数据,采用数据流分析算法,对文件操作和系统行为进行动态监控和静态分析,寻找潜在的数据泄漏点,并进行数据流整合,生成数据流分析报告的步骤具体为:基于所述优化后的预警机制和漏洞评估报告,采用数据流分析算法,动态监控系统内文件操作,并生成动态文件操作监控数据;
基于所述动态文件操作监控数据,继续采用数据流分析算法,进行系统行为的静态分析,并生成系统行为静态分析数据;
基于所述系统行为静态分析数据,标记潜在数据泄漏点,并生成潜在数据泄漏点标记;
基于所述潜在数据泄漏点标记,进行数据流整合,评估整体系统的数据安全风险,并生成数据流分析报告;
所述数据流分析算法具体为对系统内部数据流的行为模式进行分析,所述系统行为静态分析数据具体指通过静态方法分析系统在没有外部输入时的行为,所述潜在数据泄漏点标记具体为在系统行为中导致信息外泄的风险区域,所述数据流分析报告包括数据流的整体分布、标记的泄漏点和建议修复措施。
2.根据权利要求1所述的计算机文件保密检查方法,其特征在于,基于深度学习,采用变换器算法和卷积神经网络,对文本和图像内容进行深层语义分析及关键特征提取,并进行特征数据整合,生成文本和图像特征数据的步骤具体为:基于深度学习的框架,采用变换器算法进行文本的初步处理,转化为中间向量表示,并进行特征提取,生成文本中间向量;
基于所述文本中间向量,采用BERT模型进行深度学习训练,提取出文本的深层次语义特征,生成文本深度特征向量;
采用卷积神经网络对图像内容进行初级特征提取,将图像转化为初步的特征矩阵,生成图像初级特征矩阵;
基于所述文本深度特征向量和图像初级特征矩阵,采用自编码器进行特征融合,整合文本与图像的关键特征,生成文本和图像特征数据;
所述文本中间向量具体为文本内容的向量化表达,所述文本深度特征向量具体指对原文本的深度学习特征表示,所述图像初级特征矩阵具体为图像内容的特征表示,所述文本和图像特征数据包括文本与图像的融合特征向量表示。
3.根据权利要求1所述的计算机文件保密检查方法,其特征在于,基于所述文本和图像特征数据,采用自然语言处理技术和图像识别算法,对文件中的文本和图像进行保密信息判定,并进行分类处理,生成保密信息报告的步骤具体为:基于所述文本和图像特征数据,采用自然语言处理技术对文本内容中的潜在风险信息进行标注,生成文本保密初步报告;
基于所述文本和图像特征数据,采用图像识别算法对图像内容中的潜在风险信息进行标注,生成图像保密初步报告;
基于所述文本保密初步报告和图像保密初步报告,采用聚类算法对相似的保密信息进行归纳,生成保密信息分类数据;
基于所述保密信息分类数据,采用统计方法进行信息整合,形成保密信息概览和详情,生成保密信息报告;
所述文本保密初步报告具体包括潜在的风险词汇、句子或段落的位置与内容,所述图像保密初步报告具体指标注在图像中的潜在风险区域或物体,所述保密信息分类数据具体包括按类型、来源或重要性分类的保密信息。
4.根据权利要求1所述的计算机文件保密检查方法,其特征在于,基于所述保密信息报告,采用生成对抗网络,模拟潜在的安全漏洞和攻击行为,增强系统的预警机制,并进行漏洞数据整合,生成安全漏洞模拟数据的步骤具体为:基于所述保密信息报告,采用生成对抗网络,模拟潜在安全漏洞,并生成潜在安全漏洞模拟场景;
基于所述潜在安全漏洞模拟场景,采用强化学习,模拟攻击者行为,并生成模拟攻击行为数据;
基于所述模拟攻击行为数据,采用模式识别,识别系统的弱点,并生成系统漏洞和弱点识别结果;
基于所述系统漏洞和弱点识别结果,进行数据整合,优化预警机制,并生成优化后的预警机制和漏洞评估报告;
所述生成对抗网络具体为使用生成器和判别器来捕获数据分布,用于模拟攻击场景,所述模式识别具体为使用支持向量机、决策树算法,自动识别和分类攻击模式,所述优化后的预警机制和漏洞评估报告包括识别漏洞的描述、影响评估和建议防护措施。
5.根据权利要求1所述的计算机文件保密检查方法,其特征在于,基于文件原始数据,采用SHA‑256哈希算法,对文件进行完整性校验,并将哈希值与存储在区块链上的哈希值进行对比,确定文件的完整性,并生成完整性校验记录的步骤具体为:基于文件数据,采用二进制读取法,进行文件内容的提取,并进行格式化处理,生成原始数据提取报告;
基于所述原始数据提取报告,采用SHA‑256哈希算法,进行文件哈希计算,并进行哈希值的格式化,生成文件哈希值;
基于区块链网络接口,采用哈希检索法,进行与所述文件哈希值关联的检索,并进行哈希值比对准备,生成区块链哈希值;
基于所述文件哈希值和区块链哈希值,采用哈希比对法,进行文件完整性的确认,并进行完整性校验,生成完整性校验记录;
所述原始数据提取报告具体为文件的字节流形式,所述文件哈希值具体为64位字符组成的字符串,所述区块链哈希值具体为在区块链上存储文件的哈希记录,所述完整性校验记录具体指出文件是否被篡改或损坏。
6.根据权利要求1所述的计算机文件保密检查方法,其特征在于,结合所述完整性校验记录,采用基于角色的访问控制和动态加密技术,对文件进行访问控制和加密处理,并设定访问权限,生成访问控制和加密策略的步骤具体为:基于所述完整性校验记录,采用角色分析法,进行文件角色的定义,并进行权限的设定,生成角色定义和权限分配表;
基于所述角色定义和权限分配表,采用基于角色的访问控制算法,进行访问权限的分配,并进行访问策略的设定,生成文件访问控制策略;
基于所述文件访问控制策略,采用AES动态加密法,进行文件的加密处理,并进行加密数据的整合,生成加密后的文件数据;
基于所述加密后的文件数据和文件访问控制策略,采用策略整合法,进行文件的安全存储策略的制定,并进行策略的确认,生成访问控制和加密策略;
所述角色定义和权限分配表包括角色名称、角色描述及访问权限,所述文件访问控制策略具体为角色以及其访问权限的级别,所述加密后的文件数据具体指对原文件数据进行加密后的字节流,所述访问控制和加密策略具体为访问和解密该文件的完整策略和方法。
7.一种计算机文件保密检查系统,其特征在于,根据权利要求1‑6任一项所述的计算机文件保密检查方法,所述系统包括特征提取与融合模块、风险信息标注模块、风险漏洞模拟模块、系统行为分析模块、文件内容提取模块、文件完整性验证模块、安全策略制定模块。
8.根据权利要求7所述的计算机文件保密检查系统,其特征在于,所述特征提取与融合模块基于深度学习的框架,采用变换器算法及BERT模型进行文本处理并生成文本深度特征向量,并同时利用卷积神经网络提取图像特征,并与文本特征进行自编码器融合,生成文本和图像特征数据;
所述风险信息标注模块基于生成的文本和图像特征数据,通过自然语言处理和图像识别技术进行风险信息标注,运用统计方法归纳并整合,生成保密信息报告;
所述风险漏洞模拟模块基于产生的保密信息报告,运用生成对抗网络模拟潜在风险,并通过模式识别确认系统弱点,优化预警机制,生成优化后的预警机制和漏洞评估报告;
所述系统行为分析模块基于优化后的预警机制和漏洞评估报告,采用数据流分析算法对系统行为进行静态分析、标记潜在数据泄露点,并评估安全风险,生成数据流分析报告;
所述文件内容提取模块采用二进制读取法对文件数据进行格式化处理,生成原始数据提取报告;
所述文件完整性验证模块基于产生的原始数据提取报告,运用SHA‑256哈希算法计算文件哈希值,比对文件哈希值及区块链哈希值确保文件完整性,生成完整性校验记录;
所述安全策略制定模块基于提取的完整性校验记录,将文件角色定义并设定权限,采用AES动态加密法对文件加密,并制定文件的安全存储策略,生成访问控制和加密策略。
9.根据权利要求7所述的计算机文件保密检查系统,其特征在于,所述特征提取与融合模块包括文本处理子模块、图像特征提取子模块、特征融合子模块;
所述风险信息标注模块包括风险信息标注子模块、保密信息分类子模块、信息整合子模块;
所述风险漏洞模拟模块包括安全漏洞模拟子模块、攻击者行为模拟子模块、系统弱点识别子模块、预警机制优化子模块;
所述系统行为分析模块包括文件操作监控子模块、系统行为分析子模块、数据泄漏点标记子模块、数据流整合子模块;
所述文件内容提取模块包括数据读取子模块、数据格式化子模块;
所述文件完整性验证模块包括哈希计算子模块、哈希检索子模块、完整性确认子模块;
所述安全策略制定模块包括文件角色定义子模块、访问权限设定子模块、文件加密子模块、策略确认子模块。