1.一种基于大数据的网络安全分析方法,其特征在于,所述方法包括:基于大数据技术获取每次网络攻击行为在攻击时段内的行为日志及数据传输速度,将行为日志及数据传输速度作为攻击特征;
获取每次网络攻击行为的影响度,将所述影响度作为攻击标签;所述影响度由设备的模块占用率表示;
统计攻击特征和攻击标签,作为样本集,训练神经网络模型;
当获取到网络连接需求时,实时监测行为日志及数据传输速度,以当前时刻为起点,打包预设时段前的监测到的数据,输入训练好的神经网络模型,得到第一影响度;
定时将打包的数据与攻击特征进行匹配,根据匹配结果确定第二影响度;
比对第一影响度和第二影响度,选取较大值作为最终影响度并实时反馈。
2.根据权利要求1所述的基于大数据的网络安全分析方法,其特征在于,所述获取每次网络攻击行为的影响度,将所述影响度作为攻击标签的步骤包括:获取每次网络攻击行为后的CPU占用率、GPU占用率和内存占用率;
在各个磁盘下预先插入靶向文件,获取每次网络攻击行为后各个靶向文件的读取速度;所述靶向文件至少为一,不同靶向文件的深度不同;
根据CPU占用率、GPU占用率、内存占用率和各个靶向文件的读取速度确定影响度;
将所述影响度作为攻击标签。
3.根据权利要求1所述的基于大数据的网络安全分析方法,其特征在于,所述定时将打包的数据与攻击特征进行匹配,根据匹配结果确定第二影响度的步骤包括:在预设的频率下定时读取打包的预设时段前监测到的行为日志及数据传输速度;
计算数据传输速度的均值及标准差,基于所述均值及标准差对攻击特征进行初筛,选取预设数量的攻击特征,作为参考特征;
基于数据传输速度对打包数据和参考特征进行时域匹配,同步计算时域距离;
当所述时域距离小于预设的距离阈值时,对行为日志进行逻辑运算,确定日志距离;
根据时域距离和日志距离在参考特征中选取一个特征,作为目标特征,读取目标特征对应的影响度,作为第二影响度。
4.根据权利要求3所述的基于大数据的网络安全分析方法,其特征在于,所述时域距离的计算过程为:根据时间顺序排列打包的数据中的数据传输速度,得到第一序列;
依次选取参考特征,根据时间顺序排列选取到的参考特征中的数据传输速度,得到第二序列;
根据第一序列和第二序列生成距离矩阵;
基于所述距离矩阵确定时域距离;
所述距离矩阵中的元素D(i,j)=dis(xi,yj);xi为第一序列X=(x1,x2,...,xn)中的第i个数据传输速度,yj为第二序列Y=(y1,y2,...,ym)中的第j个数据传输速度;dis(xi,yj)为xi和yj之间的距离,所述距离的计算方式包括一次范数和二次范数;n为第一序列X中的元素总数,m为第二序列Y中的元素总数;
基于所述距离矩阵确定时域距离的目标函数为:
式中,SD为时域距离,W=(w1,w2,...,wK)表示距离矩阵中的一条从(1,1)位置至(n,m)位置的路径,wk为路径上的第k个元素D(i,j),D(i,j)表示第一序列X=(x1,x2,...,xn)中的第i个数据传输速度与第二序列Y=(y1,y2,...,ym)中的第j个数据传输速度之间的距离;K为路径包括的所有元素的总数; 表示在所有路径中选取长度最小值;
所述日志距离的计算过程为:
将待计算的两个行为日志转换为集合,计算集合的差集,将差集中的元素个数作为日志距离。
5.根据权利要求4所述的基于大数据的网络安全分析方法,其特征在于,所述根据时域距离和日志距离在参考特征中选取一个特征,作为目标特征,读取目标特征对应的影响度,作为第二影响度的步骤包括:根据预设的权重对时域距离和日志距离进行求和,得到综合距离;
选取综合距离最小的参考特征,作为目标特征;
在样本集中读取目标特征对应的影响度,作为第二影响度。
6.根据权利要求1所述的基于大数据的网络安全分析方法,其特征在于,所述比对第一影响度和第二影响度,选取较大值作为最终影响度并实时反馈的步骤包括:当第一影响度超过第二影响度时,累计第一影响度大于第二影响度的次数,作为正确次数;
计算正确次数和第二影响度的确定总数的比值,根据所述比值调节第二影响度的确定频率;所述频率与所述比值呈反比;
当第一影响度不超过第二影响度时,将监测到的行为日志及数据传输速度作为特征,将第二影响度作为标签插入样本集,更新神经网络模型。
7.一种基于大数据的网络安全分析系统,其特征在于,所述系统包括:攻击特征生成模块,用于基于大数据技术获取每次网络攻击行为在攻击时段内的行为日志及数据传输速度,将行为日志及数据传输速度作为攻击特征;
攻击标签生成模块,用于获取每次网络攻击行为的影响度,将所述影响度作为攻击标签;所述影响度由设备的模块占用率表示;
样本应用模块,用于统计攻击特征和攻击标签,作为样本集,训练神经网络模型;
模型应用模块,用于当获取到网络连接需求时,实时监测行为日志及数据传输速度,以当前时刻为起点,打包预设时段前的监测到的数据,输入训练好的神经网络模型,得到第一影响度;
匹配判定模块,用于定时将打包的数据与攻击特征进行匹配,根据匹配结果确定第二影响度;
数据反馈模块,用于比对第一影响度和第二影响度,选取较大值作为最终影响度并实时反馈。
8.根据权利要求7所述的基于大数据的网络安全分析系统,其特征在于,所述攻击标签生成模块包括:占用率获取单元,用于获取每次网络攻击行为后的CPU占用率、GPU占用率和内存占用率;
磁盘速度查询单元,用于各个磁盘下预先插入靶向文件,获取每次网络攻击行为后各个靶向文件的读取速度;所述靶向文件至少为一,不同靶向文件的深度不同;
影响度计算单元,用于根据CPU占用率、GPU占用率、内存占用率和各个靶向文件的读取速度确定影响度;
影响度应用单元,用于将所述影响度作为攻击标签。
9.根据权利要求7所述的基于大数据的网络安全分析系统,其特征在于,所述匹配判定模块包括:数据打包单元,用于在预设的频率下定时读取打包的预设时段前监测到的行为日志及数据传输速度;
初筛单元,用于计算数据传输速度的均值及标准差,基于所述均值及标准差对攻击特征进行初筛,选取预设数量的攻击特征,作为参考特征;
时域距离计算单元,用于基于数据传输速度对打包数据和参考特征进行时域匹配,同步计算时域距离;
日志距离计算单元,用于当所述时域距离小于预设的距离阈值时,对行为日志进行逻辑运算,确定日志距离;
影响度读取单元,用于根据时域距离和日志距离在参考特征中选取一个特征,作为目标特征,读取目标特征对应的影响度,作为第二影响度。
10.根据权利要求9所述的基于大数据的网络安全分析系统,其特征在于,所述时域距离的计算过程为:根据时间顺序排列打包的数据中的数据传输速度,得到第一序列;
依次选取参考特征,根据时间顺序排列选取到的参考特征中的数据传输速度,得到第二序列;
根据第一序列和第二序列生成距离矩阵;
基于所述距离矩阵确定时域距离;
所述距离矩阵中的元素D(i,j)=dis(xi,yj);xi为第一序列X=(x1,x2,...,xn)中的第i个数据传输速度,yj为第二序列Y=(y1,y2,...,ym)中的第j个数据传输速度;dis(xi,yj)为xi和yj之间的距离,所述距离的计算方式包括一次范数和二次范数;n为第一序列X中的元素总数,m为第二序列Y中的元素总数;
基于所述距离矩阵确定时域距离的目标函数为:
式中,SD为时域距离,W=(w1,w2,...,wK)表示距离矩阵中的一条从(1,1)位置至(n,m)位置的路径,wk为路径上的第k个元素D(i,j),D(i,j)表示第一序列X=(x1,x2,...,xn)中的第i个数据传输速度与第二序列Y=(y1,y2,...,ym)中的第j个数据传输速度之间的距离;K为路径包括的所有元素的总数;
表示在所有路径中选取长度最小值;
所述日志距离的计算过程为:
将待计算的两个行为日志转换为集合,计算集合的差集,将差集中的元素个数作为日志距离。