利索能及
我要发布
收藏
专利号: 2024114546236
申请人: 重庆科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.多模态特征线性加权融合的安卓恶意程序检测方法,其特征在于,包括以下步骤:

步骤1:使用静态分析工具对安卓应用程序进行静态分析,获取应用程序的静态特征,得到其使用到的权限信息,同时提取安卓应用程序中的Dalvik字节码数据;

步骤2:通过构建动态权限表对步骤1中获取的程序权限信息进行编码,得到以文本模态数据表征的安卓应用程序权限特征;同时对步骤1中获取的Dalvik字节流数据进行处理,将字节流数据可视化为“矢量”彩色图像,得到以图像模态数据表征的安卓应用程序特征;

对字节码数据可视化的具体方法为:提取Dalvik字节码并拼接为字节流向量,通过将每一个字节视为一个8位的像素值,将灰度值从[0,255]线性映射到[0,1]范围,并将规范化后的灰度值通过viridis颜色映射转换为彩色颜色值,最终将转换后的彩色颜色值转换回[0,255]范围以得到宽度为1,高度为字节流向量长度的“矢量”彩色图像;

步骤3:利用步骤2中得到的文本模态的权限特征数据以及图像模态的字节码图像特征数据,分别构建轻量级前馈神经网络模型以及轻量级卷积神经网络模型并对其进行训练和学习,实现对不同模态数据的特征提取;

对文本模态数据进行特征提取的具体方法为:对于步骤2中对权限特征进行编码处理得到的特征向量,将其转为张量数据并构建轻量级的前馈神经网络模型对其进行特征提取,使用8层网络结构构建前馈神经网络模型,其中输入层1层、输出层1层、隐藏层6层;从输入层到输出层之间的每一层隐藏层分别包含50、32、32、16、16、8个神经元,输出层包含2个神经元;同时,对于每一层隐藏层之后使用prelu作为激活函数,由此使用该网络结构对文本权限特征数据进行特征提取后得到维度为2的特征向量;

对图像模态数据进行特征提取的具体方法为:对于步骤2中将字节码数据可视化得到的“矢量”彩色图像,首先需要将图像规范化为统一大小以便于构建卷积神经网络模型对其进行特征提取,同时将调整完成后的图像转为张量数据以便于作为模型的输入;使用包含3个卷积层、3个池化层以及两个全连接层构建卷积神经网络模型,每一层卷积层使用卷积核大小为1*12、步幅为1的一维卷积层,每一层池化层使用卷积核大小为1*12的最大池化层,使用prelu作为每层卷积层之后的激活函数,第一层一维卷积层的输入通道为彩色图像的3个通道,输出通道为32,第二层一维卷积层的输出通道为64,第三层一维卷积层的输出通道为128,由第三层池化层提取的特征将其展平后得到1024个神经元,传递给包含128个神经元的全连接层,经过计算之后再次传递给包含2个神经元的全连接层,使用sigmoid作为全连接层的激活函数,使用该卷积神经网络模型对图像模态特征数据进行特征提取后得到维度为2的特征向量;

步骤4:对于步骤3中所提取的不同模态的特征向量,使用线性加权融合的方法对多模态特征进行融合,得到融合后的特征向量,将其作为最终安卓恶意程序分类器的输入;

对多模态特征融合的具体方法为:对于步骤3中对文本模态权限特征数据进行特征提取得到的特征向量及对图像模态特征数据进行特征提取得到的特征向量,两种模态提取得到的特征向量长度都为2,使用线性加权融合的方法对两种模态的特征向量进行特征融合,首先对不同模态的特征向量赋予不同的权重,对文本模态的特征向量赋予权重 ,对图像模态的特征向量赋予权重 ;然后将不同模态的特征向量同对应模态赋予的权重相乘得到不同模态最终的特征向量;最后将不同模态最终的特征向量做相加运算得到融合后的特征向量;得到不同模态融合后的特征向量之后,使用安卓恶意程序分类器对其进行分类,得到安卓应用程序的分类结果;

步骤5:使用训练好的分类模型搭建安卓恶意程序检测系统,对待测试的安卓应用程序进行检测和分类,得到检测和分类的结果。

2.根据权利要求1所述的多模态特征线性加权融合的安卓恶意程序检测方法,其特征在于,所述步骤2中对权限信息进行编码处理的具体方法为:对于得到的文本模态的权限特征,首先通过统计安卓应用程序数据集中所有良性及恶意程序的权限信息,得到每一个被使用过的权限信息的使用次数,按使用次数进行从大到小的排序,并取出其中使用次数大于等于设定阈值的权限信息,构建得到动态权限表,使用该动态权限表作为最终的权限特征;然后使用独热编码对权限信息进行编码处理,即动态权限表中对应权限如果在程序中使用了则将其编码为1,反之编码为0,最终得到编码处理之后的特征向量。

3.多模态特征线性加权融合的安卓恶意程序检测系统,其特征在于,用于实现权利要求1或2所述的多模态特征线性加权融合的安卓恶意程序检测方法;所述的系统包括:APK文件分析模块:用于对安卓APK文件进行格式检测及静态分析,提取静态特征和文件;

APK数据提取与预处理模块:用于对APK文件分析模块提取到的静态权限特征和文件进行处理,并构建动态权限表对静态权限特征进行编码处理得到文本模态特征,然后将Dalvik字节码构建为字节流向量并可视化为“矢量”彩色图像得到图像模态特征;

多模态特征提取模块:用于构建轻量级卷积神经网络模型对“矢量”彩色图像的特征进行提取和学习,并构建轻量级前馈神经网络模型对权限特征进行特征提取和学习;

多模态特征融合与分类模块:用于对不同模态提取到的特征向量进行融合,通过对不同模态特征向量赋予不同的权重进行线性融合,并对线性融合后的特征进行分类处理得到APK文件的分类结果。

4.一种计算机可读存储介质,其特征在于,所述存储介质上存储有多模态特征线性加权融合的安卓恶意程序检测程序,该程序在被计算机执行时,实现如权利要求1或2所述的多模态特征线性加权融合的安卓恶意程序检测方法的步骤。