1.一种基于大数据的信息安全保护方法,其特征在于,包括:获取针对目标文件的访问请求,所述访问请求携带访问发起者的发起地址以及所述访问发起者所要执行的目标业务;
根据所述目标业务确定与所述目标文件相关的关联文件,所述关联文件为所述目标业务被执行时需要和所述目标文件一起被访问的文件;
获取所述关联文件的访问地址,并根据所述发起地址和访问地址,检测所述访问发起者对所述关联文件的访问流量信息;
若所述访问流量信息满足预设要求,则对所述目标文件执行所述访问请求;
在所述若所述访问流量信息满足预设要求,则对所述目标文件执行所述访问请求之前,所述方法还包括:获取所述关联文件对应所述目标业务的参考流量信息;
将所述访问流量信息与所述参考流量信息进行比对;
若所述访问流量信息与所述参考流量信息匹配,则确定所述访问流量信息满足预设要求;
所述参考流量信息包括多个指定时刻的参考流量,所述访问流量信息包括多个时刻的访问流量,在所述若所述访问流量信息与所述参考流量信息匹配,则确定所述访问流量信息满足预设要求之前,所述方法还包括:若所述多个时刻中包括所述多个指定时刻,则从所述多个时刻的访问流量中筛选出所述多个指定时刻的访问流量;
针对所述多个指定时刻中每一指定时刻,计算所述指定时刻对应的参考流量和访问流量之间的差值,得到多个差值;
将所述多个差值的绝对值进行相加后除以所述多个差值的数量,得到距离评估值;
若所述距离评估值小于或等于预设评估值,则确定所述访问流量信息与所述参考流量信息匹配;
所述方法还包括:
若所述多个时刻中不包括所述多个指定时刻,则根据所述多个时刻的访问流量生成访问流量曲线,以及根据所述多个指定时刻的参考流量生成参考流量曲线;
识别所述访问流量曲线的拐点,并基于所述拐点将所述访问流量曲线划分为多个子流量曲线,其中,所述多个子流量曲线中每一子流量曲线对应一个斜率;
获取每一子流量曲线对应的目标斜率,得到斜率序列;
若所述斜率序列与所述参考流量曲线匹配,则确定所述访问流量信息满足预设要求;
在所述若所述斜率序列与所述参考流量曲线匹配,则确定所述访问流量信息满足预设要求之前,所述方法还包括:获取所述每一子流量曲线对应的时间段,得到多个目标时间段;
在所述参考流量曲线中获取所述多个目标时间段对应的多个参考斜率;
针对所述每一目标时间段,将所述目标时间段对应的参考斜率和目标斜率进行比对,得到所述目标时间段对应斜率误差;
若每一所述目标时间段对应斜率误差均不超过误差阈值,则确定所述斜率序列与所述参考流量曲线匹配;
在所述获取每一子流量曲线对应的斜率,得到斜率序列之前,所述方法还包括:获取所述多个子流量曲线的曲线数量;
若所述多个子流量曲线的曲线数量与所述参考流量曲线匹配,则执行所述获取每一子流量曲线对应的斜率,得到斜率序列的步骤。
2.根据权利要求1所述的基于大数据的信息安全保护方法,其特征在于,在所述若所述访问流量信息满足预设要求,则对所述目标文件执行所述访问请求之后,所述方法还包括:获取所述目标业务在历史时间段内被执行的过程中,对所述关联文件采集到的第一访问流量信息和对所述目标文件采集到的第二访问流量信息;
基于所述第一访问流量信息和所述第二访问流量信息进行模型训练,得到流量预测模型;
当获取到所述关联文件的当前访问流量信息时,采用所述流量预测模型对所述目标文件的访问流量进行预测,得到预测访问流量信息;
获取目标文件的目标访问地址,并根据所述发起地址和所述目标访问地址检测所述目标文件的当前访问流量信息;
将所述目标文件的当前访问流量信息和所述预测访问流量信息进行比对,得到流量信息误差;
若所述流量信息误差超过信息误差阈值,则关闭所述访问发起者对所述目标文件的访问权限。
3.根据权利要求2所述的基于大数据的信息安全保护方法,其特征在于,所述第一访问流量信息包括多个时刻的第一访问流量,所述第二访问流量信息包括所述多个时刻的第二访问流量,所述基于所述第一访问流量信息和所述第二访问流量信息进行模型训练,得到流量预测模型,包括:基于多个时刻的第一访问流量生成第一流量曲线,并基于所述多个时刻的第二访问流量生成第二流量曲线;
从所述第一流量曲线中提取出第一曲线特征,从所述第二流量曲线中提取出第二曲线特征;
基于所述第一曲线特征和所述第二曲线特征进行模型训练,得到所述流量预测模型。
4.根据权利要求1至3中任一项所述的基于大数据的信息安全保护方法,其特征在于,所述关联文件的数量为多个,多个所述关联文件分别存储在预设分布式系统的不同的节点中。