利索能及
我要发布
收藏
专利号: 2024112794960
申请人: 三峡大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于软件基因和改进Siamese网络的恶意代码检测方法,其特征在于,包括以下步骤:步骤1:数据预处理,对待检测的代码文件进行静态分析和动态分析,提取基础特征;

步骤2:将步骤1获得的基础特征转化为基因片段,并映射为基因表达,构建代码的基因序列;

步骤3:利用改进的Siamese网络,将步骤2中提取的基因序列与已知恶意代码基因库进行相似度比对,得到相似度计算结果;

步骤3.1:将待检测样本的基因特征向量与恶意代码基因库中的所有基因特征进行比对;利用改进的Siamese网络计算得到样本与恶意代码基因库中各基因特征的相似度;

步骤3.2:结合统计分析和改进的Siamese网络的输出的相似度分数,根据恶意代码基因库中基因特征的相似度分布,动态设定相似度阈值,相似度阈值的计算式为:;

式中,为相似度阈值, 和 分别表示恶意代码基因库中相似度分数的均值和标准差; 、 均为调节系数,用于控制标准差和特征偏差对阈值的影响; 表示第i个特征的权重, 表示改进的Siamese网络输出的特征值, 表示该特征的期望值;n表示特征的数量;

步骤3.3:筛选出相似度较高的基因特征;根据设定的相似度阈值 ,将改进的Siamese网络输出的相似度分数超过该阈值的基因特征筛选出来,判断认为这些基因特征与待检测样本具有较高的相似性;

步骤3.4:评估基因特征之间的关系,对步骤3.3筛选出的相似基因特征进一步分析,采用自适应加权算法动态调整不同特征的权重,确保在评估过程中各个特征的影响权重合理分配,最终得出准确的相似度检测结果;

步骤4:根据相似度计算结果,判断代码文件是否包含恶意基因特征,若存在,则进一步确定其所属的恶意代码家族,并输出检测和分类结果。

2.根据权利要求1所述的恶意代码检测方法,其特征在于,还包括步骤5:基因库更新与优化,根据检测结果,更新和优化恶意代码基因库,使恶意代码基因库覆盖最新的恶意代码样本和变种特征。

3.根据权利要求1或2所述的恶意代码检测方法,其特征在于,所述改进的Siamese网络包括编码器、自适应加权模块和解码器,所述编码器包括第一卷积层、最大池化层、第二卷积层、平均池化层、第三卷积层和扁平化层;所述解码器包括3个全连接层;所述自适应加权模块包含自适应加权算法。

4.根据权利要求3所述的恶意代码检测方法,其特征在于,所述步骤1具体包括以下子步骤:步骤1.1:使用静态分析工具IDA Pro解析待检测的代码文件的代码结构、API调用序列和字符串常量,得到静态特征;

步骤1.2:使用动态分析平台分析待检测的代码文件的运行时行为和系统调用序列,得到动态特征;

步骤1.3:清除数据中的噪音和无关信息,删除空值或异常值,确保特征数据的质量;

步骤1.4:对提取的基础特征进行标准化处理,使不同特征之间具有可比性。

5.根据权利要求4所述的恶意代码检测方法,其特征在于,所述步骤2具体包括以下子步骤:步骤2.1:对静态分析和动态分析中提取的基础特征进行特征分段处理,通过预定义的基因片段规则,将基础特征分割为独立的基因片段;

步骤2.2:将每个基因片段映射为基因表达,转化为特征向量;

步骤2.3:将所有基因片段组合成完整的基因序列,通过将多个基因片段的特征向量拼接或排列,构建出代码的完整基因序列,使其能够与恶意代码基因库中的已有恶意代码基因进行相似度比对。

6.根据权利要求5所述的恶意代码检测方法,其特征在于,步骤3.1中,所述相似度的具体计算公式为:;

式中, 表示相似度函数, 、 分别表示待检测样本、恶意代码基因库中的基因特征向量, 为改进的Siamese网络的特征提取函数, 表示权重矩阵, 为激活函数。

7.根据权利要求6所述的恶意代码检测方法,其特征在于,步骤3.4中,自适应加权算法的计算式为:;

式中, 表示第i个特征的权重, 是对应特征的相似度值, 、 均为权重调节系数,用于控制权重的分配。

8.根据权利要求6或7所述的恶意代码检测方法,其特征在于,步骤4具体包括以下子步骤:步骤4.1:根据改进的Siamese网络的相似度分析结果,如果待检测代码文件的基因特征与恶意代码基因库中一个或多个基因特征的相似度超过阈值,判定该代码文件包含恶意代码;

步骤4.2:对于判定为包含恶意代码的代码文件,通过分析其中的恶意代码与恶意代码基因库中不同家族基因特征的相似度,确定其可能的家族归属;选择相似度最高的家族作为该恶意代码的家族归属;

步骤4.3:根据相似度分析结果,生成详细的检测报告。

9.根据权利要求2所述的恶意代码检测方法,其特征在于,步骤5中具体包括以下子步骤:步骤5.1:提取新样本的基因特征,并将其添加到相应的恶意代码家族基因库中,标记为新增样本;

步骤5.2:对更新后的恶意代码基因库进行去冗余处理,合并高度相似的基因特征,避免基因库过于冗长和重复;

步骤5.3:根据新恶意代码样本的引入和现有恶意代码样本的变化,定期维护和更新恶意代码基因库。