利索能及
我要发布
收藏
专利号: 2023105524869
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种面向Tor匿名网络的流关联方法,其特征在于,包括以下步骤:

获取Tor匿名网络中指定中继节点上的流量,初步识别入口流量还是出口流量,所述入口流量是指进入Tor网络的流量,所述出口流量是指离开Tor网络的流量;

对入口流量和出口流量按照五元组形式划分网络流并分别保存为FI和FJ,所述五元组是指:源IP地址、目的IP地址、源端口、目的端口和协议类型,具有相同五元组的流量被认为是同一条流量;

分别提取按照五元组划分后的入口流量FI的包间延时特征TI和包大小特征SI,以及按照五元组划分后的出口流量FJ的包间延时特征TJ和包大小特征SJ;

对包间延时特征TI、TJ和包大小特征SI、SJ进行短时傅里叶变换,提取时频特征,利用主成分分析法对变换所得的时频矩阵进行降维处理,得到入口流量的包间延时时频特征主要成分矩阵Pti和包大小时频特征主要成分矩阵Psi、以及出口流量的包间延时时频特征主要成分矩阵Ptj和包大小时频特征主要成分矩阵Psj,进行融合重构得到流量特征Fi,j=[Pti, Ptj, Psi, Psj];

将重构的特征向量Fi,j输入卷积神经网络提取深层次的特征,将深层次特征输入全连接网络完成Tor匿名网络的出入口流量的关联。

2.根据权利要求1所述的方法,其特征在于,初步识别入口流量还是出口流量包括:根据所获取的经过指定中继节点的流量的大小、IP地址、协议和端口中的一项或多项信息确定是入口流量还是出口流量。

3.根据权利要求1所述的方法,其特征在于,提取包间延时特征、包大小特征包括:使用特征提取工具提取数据包到达时间和数据包大小,将这两种信息进行记录,通过计算两个相邻数据包达到时间的间隔得出包间延时特征。

4.根据权利要求1所述的方法,其特征在于,对包间延时特征TI、TJ和包大小特征SI、SJ进行短时傅里叶变换,提取时频特征包括:以T表示包间延时特征TI、TJ中的任一个,S表示包大小特征SI、SJ中的任一个,利用指定时间窗口将T和S划分为n个时隙的时域特征:T=[T1,T2,...,Tn],

S=[S1,S2,...,Sn],

时间窗口随时间滑动,在时间窗口内对每一个时域特征进行傅里叶变换,得到时频矩阵:,

其中, 表示包间延时特征的时频矩阵, 表示包大小特征的时频矩阵,时

频矩阵中的行数表示分帧后信号的时间分辨率,即划分时间窗口的个数n,列数则表示了频域分辨率m。

5.根据权利要求4所述的方法,其特征在于,利用主成分分析法对变换后的时频矩阵进行降维处理并重构为流量特征Fi,j包括:计算时频矩阵中每一行元素的均值和方差,基于均值和方差计算标准化值

, 表示时频矩阵中第i行第k列元素, 表示时频矩阵中第i行元素的均值,表示时频矩阵中第i行元素的方差,将时频矩阵转化为数据标准化的矩阵Z;

计算数据标准化的矩阵Z的协方差矩阵C, ,上标T表示转置,计算协方差矩阵C的特征值 和特征向量 ,选择前k个特征值较大的特

征向量作为主成分,前k个特征向量为 ;

基于时频矩阵和特征向量 构造主成分矩阵P, ;

根据上述处理过程分别得到入口流量的包间延时时频特征主要成分矩阵Pti和包大小时频特征主要成分矩阵Psi、以及出口流量的包间延时时频特征主要成分矩阵Ptj和包大小时频特征主要成分矩阵Psj,进行融合重构得到流量特征Fi,j=[Pti, Ptj, Psi, Psj],Fi,j为卷积神经网络的输入。

6.根据权利要求1所述的方法,其特征在于,所述卷积神经网络利用训练集数据经过训练得到,所述训练集数据通过以下方法获取:使用多个Tor客户端对多个网站进行访问,模拟Tor用户使用网络各类行为,产生Tor匿名网络流量,抓取Tor匿名网络入口处和出口处的流量并按照五元组分流,提取Tor网络入口处和出口处流量的包间延时特征和包大小特征;

使用重构器将一对关联流对中入口处与随机选取的另一对关联流对中出口处组合形成一对非关联流对,生成一定比例的关联流对与非关联流对,将关联流对和非关联流对混合并附上标签后打乱顺序生成训练用原始数据;

对训练用原始数据中的流对的包间延时特征和包大小特征进行短时傅里叶变换,获取时频特征矩阵,利用主成分分析法对变换所得的时频矩阵进行降维处理,得到入口和出口处流量的包间延时时频特征主要成分矩阵和包大小时频特征主要成分矩阵,对降维后的特征即主成分矩阵进行融合重构得到流量特征,作为卷积神经网络模型训练时的输入。

7.根据权利要求1所述的方法,其特征在于,卷积神经网络的结构包括:输入层‑第一卷积层CONV1‑第一池化层POOL1‑第二卷积层CONV2‑第二池化层POOL2‑第三卷积层CONV3;其中第一卷积层用于提取重构的特征向量Fi,j的相邻两行的特征关系,第二卷积层和第三卷积层用于在所有包间延时特征和包大小特征中提取深层次特征,通过第三层卷积后使用Flatten函数将提取的特征转为一维向量输入全连接网络;

全连接网络包括三个全连接层,经过三层全连接层后的输出为Pi,j,表示流i和j关联的概率,用于判断两条Tor匿名流量是否为一组关联流对。

8.一种面向Tor匿名网络的流关联系统,其特征在于,包括:

流量采集模块,用于获取Tor匿名网络中指定中继节点上的流量,初步识别入口流量还是出口流量,所述入口流量是指进入Tor网络的流量,所述出口流量是指离开Tor网络的流量;

分流模块,用于对入口流量和出口流量按照五元组形式划分网络流并分别保存为FI和FJ,所述五元组是指:源IP地址、目的IP地址、源端口、目的端口和协议类型,具有相同五元组的流量被认为是同一条流量;

特征提取模块,用于分别提取按照五元组划分后的入口流量FI的包间延时特征TI和包大小特征SI,以及按照五元组划分后的出口流量FJ的包间延时特征TJ和包大小特征SJ;

特征重构模块,用于对包间延时特征TI、TJ和包大小特征SI、SJ进行短时傅里叶变换,提取时频特征,利用主成分分析法对变换所得的时频矩阵进行降维处理,得到入口流量的包间延时时频特征主要成分矩阵Pti和包大小时频特征主要成分矩阵Psi、以及出口流量的包间延时时频特征主要成分矩阵Ptj和包大小时频特征主要成分矩阵Psj,进行融合重构得到流量特征Fi,j=[Pti, Ptj, Psi, Psj];

关联分析模块,将重构的特征向量Fi,j输入卷积神经网络提取深层次的特征,将深层次特征输入全连接网络完成Tor匿名网络的出入口流量的关联。

9.一种计算机设备,其特征在于,包括:

一个或多个处理器;

存储器;以及

一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置为由所述一个或多个处理器执行,所述程序被处理器执行时实现如权利要求1‑7中任一项所述的面向Tor匿名网络的流关联方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1‑7中任一项所述的面向Tor匿名网络的流关联方法的步骤。