利索能及
我要发布
收藏
专利号: 2014103171609
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-07-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于Hadoop平台的深度包检测系统,其特征在于,所述系统包括网络爬虫部分和深度包检测部分,网络爬虫部分包括网络爬虫模块、文件解析模块、数据库,网络爬虫单元从互联网抓取页面,文件解析单元对网页进行分析得到统一资源定位符URL与网页分级内容的映射关系,根据抓取页面不断迭代更新数据库中的映射关系库;深度包检测部分包括数据包解析PA模块、流量分类TC模块、深度包检测DPI模块,PA模块将原始数据解析成五元组流,输入TC模块,TC模块将输入的五元组流做业务流标记,生成特定业务流输入DPI模块,DPI模块将特定业务流转化成DPI事件,将DPI事件与映射关系库匹配,完成DPI事件统计。

2.根据权利要求1所述的系统,其特征在于,PA模块将原始数据解析成五元组流,输入TC模块具体包括,PA模块读取HDFS中原始数据流,以数据包偏移量为Key、数据包内容为Value的键值对形式作为MapReduce的输入,结果输出以五元组为Key、五元组流和流特征统计为Value的形式,存储到HDFS中。

3.根据权利要求1所述的系统,其特征在于,TC模块将输入的五元组流做业务流标记,生成特定业务流输入DPI模块具体包括,TC模块读取HDFS中五元组流,以五元组为Key、五元组流为Value的键值对形式作为MapReduce的输入,结果输出以五元组/业务标记为Key、业务标记流为Value的形式,存储到HDFS中。

4.根据权利要求1所述的系统,其特征在于,DPI模块将特定业务流转化成DPI事件具体包括,DPI模块读取HDFS中特定业务流,以五元组/业务标记为Key、特定业务流特征为Value的键值对形式作为MapReduce输入,结果输出以五元组/业务标记为Key、DPI事件为Value的形式。

5.一种基于Hadoop平台深度包检测方法,其特征在于,包括步骤:网络爬虫模块不断循环抓取特定网站网页文件,文件解析模块对网页文件进行分析,得到URL与网页分级内容的映射关系,存储到数据库,根据抓取页面不断迭代更新数据库中的映射关系库;PA模块将原始数据解析成五元组流输入TC模块,TC模块将输入的五元组流做业务流标记,生成特定业务流输入DPI模块,DPI模块将特定业务流转化成DPI事件,将DPI事件与映射关系库匹配,完成DPI事件统计。

6.根据权利要求5所述的方法,其特征在于,PA模块将原始数据解析成五元组流,输入TC模块具体包括,PA模块读取HDFS中原始数据流,以数据包偏移量为Key、数据包内容为Value的键值对形式作为MapReduce的输入,结果输出以五元组为Key、五元组流和流特征统计为Value的形式,存储到HDFS中。

7.根据权利要求5所述的方法,其特征在于,TC模块将输入的五元组流做业务流标记,生成特定业务流输入DPI模块具体包括,TC模块读取HDFS中五元组流,以五元组为Key、五元组流为Value的键值对形式作为MapReduce的输入,结果输出以五元组/业务标记为Key、业务标记流为Value的形式,存储到HDFS中。

8.根据权利要求5所述的方法,其特征在于,DPI模块将特定业务流转化成DPI事件具体包括,DPI模块读取HDFS中特定业务流,以五元组/业务标记为Key、特定业务流特征为Value的键值对形式作为MapReduce输入,结果输出以五元组/业务标记为Key、DPI事件为Value的形式。