1.一种基于本体的网络流量分类方法,主要包括如下步骤:
Ⅰ、构建网络流量本体
构建网络流量本体对网络流量信息资源进行分层描述;
Ⅱ、建立决策树分类模型并生成推理规则集
利用决策树算法训练已标记应用类型的网络流量训练样本集,建立网络流量的决策树分类模型,并将决策树分类模型转化成推理规则集;
Ⅲ、通过知识推理得到分类结果
采用Jena工具包将步骤Ⅱ生成的推理规则集构造成相应的推理机,并用该推理机对步骤Ⅰ构建的网络流量本体进行知识推理,即挖掘出网络流量本体中网络流量实例和网络应用类型之间的对应关系,并对网络流量实例进行网络应用类型标记,完成网络流量分类。
2.根据权利要求1所述的基于本体的网络流量分类方法,其特征在于:
所述步骤Ⅰ具体包括如下子步骤:
I-1、设计网络流量本体结构
根据互联网网络流量采集环境和流量的信息资源建立网络流量本体结构,所述网络流量本体结构为多层结构,首层包括互联网中流量采集节点信息和流量信息;所述流量采集节点信息的下一层记录流量采集节点的相关信息,包括流量采集节点的网络软硬件设备信息、流量采集节点的流量采集工具及流量采集节点的配置参数;所述流量采集工具的下一层记录各流量采集节点的各种流量采集工具名称以及流量采集信息格式;所述流量信息的下一层记录互联网上网络流量的相关信息,包括网络流量实例集合、流量统计特征集合、流量所属应用类型及协议;所述流量所属应用类型的下一层描述各种应用类型;
I-2、构建网络流量本体
根据步骤I-1设计的网络流量本体结构,针对互联网上各种流量信息资源,以基于Java语言开发的本体编辑软件Protégé的应用程序编程接口自动化构建网络流量本体模型,用网络本体语言OWL将网络流量本体模型描述成文件形式的网络流量本体,并保存至本地磁盘。
3.根据权利要求2所述的基于本体的网络流量分类方法,其特征在于:
所述步骤Ⅰ-2具体包括如下次子步骤:
I-2-1、采用本体编辑软件Protégé新建网络流量本体模型;
I-2-2、解析待分类的网络流量信息,根据子步骤I-1设计的网络流量本体结构,利用本体编辑软件Protégé建立网络流量本体基本概念,包括各流量采集节点信息、流量信息、流量采集节点的网络软硬件设备信息、流量采集节点的流量采集工具及流量采集节点的配置参数、网络流量实例集合、流量统计特征集合、流量所属应用类型及协议;
I-2-3、根据步骤I-1设计的网络流量本体结构,建立网络流量本体基本概念与网络流量实例之间的关系、网络流量实例与网络流量统计特征值之间的关系,包括“拥有”和“属于”,二者是互逆关系;网络流量本体基本概念“拥有”网络流量实例,网络流量实例“属于”网络流量本体基本概念;网络流量实例“拥有”网络流量统计特征值,网络流量统计特征值“属于”网络流量实例;
I-2-4、根据待分类的网络流量信息创建网络流量实例,每个网络流量实例对应一条具体的网络流量;
I-2-5、为次子步骤I-2-1建立的网络流量本体模型添加网络流量实例、网络流量实例与网络流量本体基本概念之间的关系,并为网络流量实例添加网络流量的统计特征值、网络流量实例与网络流量统计特征值之间的关系;
I-2-6、将经过次子步骤I-2-5添加各元素后的网络流量本体模型用网络本体语言OWL描述成文件形式的网络流量本体,并保存到本地磁盘中。
4.根据权利要求1所述的基于本体的网络流量分类方法,其特征在于:
所述步骤Ⅱ具体包括如下子步骤:
Ⅱ-1、先手工采集若干条网络流量并标记网络应用类型、组成网络流量训练样本集;借助决策树算法对网络流量训练样本集进行训练,建立网络流量的决策树分类模型,集合A={a1,a2,……,ai}表示由网络流量训练样本集中i个网络流量的统计特征值组成的集合;集合T={t1,t2,……,tj}表示由网络流量训练样本集中j种网络流量所属的应用类型组成的集合;集合V={v1,v2,……,vk}表示由k个决策判定基准值组成的集合,由集合A中的各个元素经过决策树算法统计计算得出,作为决策树中选取决策路径的判定依据;
Ⅱ-2、网络流量的决策树分类模型中从根节点到每个子叶的路径均视为分类路径,以决策判定基准值为依据,将网络流量的决策树分类模型中的每条路径均转化成“如果-则”,即“IF-THEN”结构,建立IF-THEN结构的网络流量决策树分类模型;
Ⅱ-3、采用Jena工具包的推理规则语法描述步骤Ⅱ-2建立的IF-THEN结构的网络流量决策树分类模型,并生成推理规则集。
5.根据权利要求1所述的基于本体的网络流量分类方法,其特征在于:
所述步骤Ⅲ具体包括如下子步骤:
Ⅲ-1、采用Jena工具包加载步骤I构建好的网络流量本体,获取Jena可操作的网络流量本体模型;
Ⅲ-2、采用Jena工具包加载步骤Ⅱ生成的推理规则集,构造相应的推理机;
Ⅲ-3、用步骤Ⅲ-2构造的推理机对步骤Ⅲ-1获取的网络流量本体模型进行知识推理,并对网络流量本体中每个网络流量实例的网络应用类型进行标记;
Ⅲ-4、将属于同一类网络应用类型的网络流量实例汇聚成集合,完成网络流量分类。