网络背景流量的分类与识别研究综述被引量：27

Review of network background traffic classification and identification

下载PDF

导出

摘要互联网流量分类是识别网络应用和分类相应流量的过程,这被认为是现代网络管理和安全系统中最基本的功能。与应用相关的流量分类是网络安全的基础技术。传统的流量分类方法包括基于端口的预测方法和基于有效载荷的深度检测方法。在目前的网络环境下,传统的方法存在一些实际问题,如动态端口和加密应用,因此采用基于流量统计特征的机器学习(ML)技术来进行流量分类识别。机器学习可以利用提供的流量数据进行集中自动搜索,并描述有用的结构模式,这有助于智能地进行流量分类。起初使用朴素贝叶斯方法进行网络流量分类的识别和分类,对特定流量进行实验时,表现较好,准确度可达90%以上,但对点对点传输网络流量(P2P)等流量识别准确度仅能达到50%左右。然后有使用支持向量机(SVM)和神经网络(NN)等方法,神经网络方法使整体网络流量的分类准确度能达到80%以上。多项研究结果表明,对于多种机器学习方法的使用和后续的改进,很好地提高了流量分类的准确性。 Internet traffic classification is a process of identifying network applications and classifying corresponding traffic,which is considered as the most basic function of modern network management and security system.And applicationrelated traffic classification is the basic technology of recent network security.Traditional traffic classification methods include port-based prediction methods and payload-based depth detection methods.In current network environment,there are some practical problems in traditional methods,such as dynamic ports and encryption applications.Therefore,Machine Learning(ML)technology based on traffic statistics is used to classify and identify traffic.Machine learning can realize centralized automatic search by using provided traffic data and describe useful structural patterns,which is helpful to intelligently classify traffic.Initially,Naive Bayes method was used to identify and classify network traffic classification,performing well on specific flows with accuracy over 90%,while on traffic such as peer-to-peer transmission network traffic(P2P)with accuracy only about 50%.Then,methods such as Support Vector Machine(SVM)and Neural Network(NN)were used,and neural network method could make accuracy of overall network classification reach 80%or more.A number of studies show that the use of a variety of machine learning methods and their improvements can improve the accuracy of traffic classification.

作者邹腾宽汪钰颖吴承荣 ZOU Tengkuan;WANG Yuying;WU Chengrong(School of Computer Science,Fudan University,Shanghai 200433,China;Engineering Research Center of Cyber Security Auditing and Monitoring,Ministry of Education,Shanghai 200433,China)

机构地区复旦大学计算机科学技术学院网络信息安全审计与监控教育部工程研究中心

出处《计算机应用》 CSCD 北大核心 2019年第3期802-811,共10页 journal of Computer Applications

基金国家重点研发计划项目(2017YFB0803203)~~

关键词流量分类背景流量机器学习深度包检测技术基于行为模式的分类 traffic classification background traffic Machine Learning(ML) Deep Packet Inspection(DPI)technology classification based on behavior patterns

分类号 TP393.06 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1贺静,赵峦.基于PCA-概率神经网络的P2P流量分类方法研究[J].电脑开发与应用,2011,24(7):18-20. 被引量：4
2徐鹏,林森.基于C4.5决策树的流量分类方法[J].软件学报,2009,20(10):2692-2704. 被引量：171
3陈云菁,张赟,陈经涛.基于决策树模型的P2P流量分类方法[J].计算机应用研究,2009,26(12):4690-4693. 被引量：4

二级参考文献38

1王伟凝,余英林,张剑超.基于线条方向直方图的图像情感语义分类[J].计算机工程,2005,31(11):7-9. 被引量：12
2Moore AW, Zuev D. Internet traffic classification using Bayesian analysis techniques. In: Proc. of the 2005 ACM SIGMETRICS Int'l Conf. on Measurement and Modeling of Computer Systems, Banff, 2005. 50-60. http://www.cl.cam.ac.uk/-awm22 /publications/moore2005internet.pdf.
3Madhukar A, Williamson C. A longitudinal study of P2P traffic classification. In: Proc. of the 14th IEEE Int'l Syrup. on Modeling, Analysis, and Simulation. Monterey, 2006. http://ieeexplore.ieee.org/xpl/ffeeabs_all.jsp?arnumber=1698549.
4Moore AW, Papagiannaki K. Toward the accurate identification of network applications. In: Dovrolis C, ed. Proc. of the PAM 2005. LNCS 3431, Heidelberg: Springer-Verlag, 2005.41-54.
5Karagiannis T, Papagiannaki K, Faloutsos M. BLINC: Multilevel traffic classification in the dark. In: Proc. of the ACM SIGCOMM. Philadelphia, 2005. 229-240. http://conferences.sigcomm.org/sigcomm/2005/paper-KarPap.pdf.
6Roughan M, Sen S, Spatscheck O, Dutfield N. Class-of-Service mapping for QoS: A statistical signature-based approach to IP traffic classification. In: Proc. of the ACM SIGCOMM Internet Measurement Conf. Taormina, 2004. 135-148. http://www.imconf.net/imc-2004/papers/p 135-roughan.pdf.
7Zuev D, Moore AW. Traffic classification using a statistical approach. In: Dovrolis C, ed. Proc. of the PAM 2005. LNCS 3431, Heidelberg: Springer-Verlag, 2005. 321-324.
8Nguyen T, Armitage G. Training on multiple sub-flows to optimise the use of Machine Learning classifiers in real-world IP networks. In: Proc. of the 31 st IEEE LCN 2006. Tampa, 2006. http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=4116573.
9Eerman J, Mahanti A, Arlitt M. Internct traffic identification using machine learning techniques. In: Proc. of the 49th IEEE GLOBECOM. San Francisco, 2006. http://pages.cpsc.ucalgary.ca/-mahanti/papers/globecom06.pdf.
10Erman J, Arlitt M, Mahanti A. Traffic classification using clustering algorithms. In: Proc. of the ACM SIGCOMM Workshop on Mining Network Data (MineNet). Pisa, 2006. http://conferences.sigcomm.org/sigcomm/2006/papers/minenet-01.pdf.

共引文献175

1高文才,曹帅.基于MRF-FCM算法的矿井运动目标图像优化[J].工矿自动化,2024,50(S01):69-73.
2邓建国,张素兰,张继福,荀亚玲,刘爱琴.监督学习中的损失函数及应用研究[J].大数据,2020,6(1):60-80. 被引量：41
3代志康,吴秋新,程希明.一种基于ResNet的网络流量识别方法[J].北京信息科技大学学报（自然科学版）,2020,35(1):82-88. 被引量：5
4新夫,任振寰.校园网络流量分流过程的分析与程序实现[J].内蒙古大学学报（自然科学版）,2012,43(2):204-207. 被引量：1
5陈陆颖,丛蓉,杨洁,于华.P2P Streaming Traffic Classification in High-Speed Networks[J].China Communications,2011,8(5):70-78. 被引量：1
6赵树鹏,陈贞翔,彭立志.基于流中前5个包的在线流量分类特征[J].济南大学学报（自然科学版）,2012,26(2):156-160. 被引量：3
7孟姣,王丽宏,熊刚,姚垚.基于机器学习的SSH应用分类研究[J].计算机研究与发展,2012,49(S2):153-159. 被引量：2
8胡婷,王勇,陶晓玲.网络流量分类方法的比较研究[J].桂林电子科技大学学报,2010,30(3):216-219. 被引量：4
9胡婷,王勇,陶晓玲.混合模式的网络流量分类方法[J].计算机应用,2010,30(10):2653-2655. 被引量：8
10易兴辉,王国胤,胡峰.一种新的基于粗糙集的动态样本识别算法[J].南京大学学报（自然科学版）,2010,46(5):501-506. 被引量：8

同被引文献181

1黄林,王电钢,刘萧,张奎良.基于LSTM的网络流量预测方法[J].计算机应用研究,2020,37(S01):264-265. 被引量：8
2仇景明,曲桦,赵季红.一种鲁棒网络流量分类及新类型发现算法[J].北京邮电大学学报,2020(2):40-45. 被引量：2
3易灿,刘彦姝.图谱建模基础下海量网络流量的数据挖掘[J].办公自动化,2021,26(10):24-25. 被引量：2
4李世淙,云晓春,张永铮.一种基于分层聚类方法的木马通信行为检测模型[J].计算机研究与发展,2012,49(S2):9-16. 被引量：13
5熊刚,孟姣,曹自刚,王勇,郭莉,方滨兴.网络流量分类研究进展与展望[J].集成技术,2012,1(1):32-42. 被引量：24
6王平,毛剑琴.支持向量机训练算法及其应用[J].信息与电子工程,2005,3(4):309-314. 被引量：9
7陈亮,龚俭,徐选.应用层协议识别算法综述[J].计算机科学,2007,34(7):73-75. 被引量：33
8邓河,阳爱民,刘永定.一种基于SVM的P2P网络流量分类方法[J].计算机工程与应用,2008,44(14):122-126. 被引量：17
9徐鹏,林森.基于C4.5决策树的流量分类方法[J].软件学报,2009,20(10):2692-2704. 被引量：171
10胡婷,王勇,陶晓玲.混合模式的网络流量分类方法[J].计算机应用,2010,30(10):2653-2655. 被引量：8

引证文献27

1苏林萍,韩淑宇.关于流量识别技术在新能源厂站中的研究[J].计算机应用研究,2020,37(S01):281-282.
2宋紫华,郭春,蒋朝惠.一种基于网络流量分析的快速木马检测方法[J].计算机与现代化,2019,0(6):9-15. 被引量：4
3冯文博,洪征,吴礼发,李毅豪,林培鸿.基于卷积神经网络的应用层协议识别方法[J].计算机应用,2019,39(12):3615-3621. 被引量：7
4武思齐,王俊峰.基于数据流多维特征的移动流量识别方法研究[J].四川大学学报（自然科学版）,2020,57(2):247-254. 被引量：13
5刘妙,王莹,王涛.物联网支撑下的军校SPOC教学平台设计[J].中国教育信息化,2020,26(6):81-84. 被引量：1
6刘丹,姚立霜,王云锋,裴作飞.面向类不平衡流量数据的分类模型[J].计算机应用,2020,40(8):2327-2333. 被引量：7
7易灿.网络背景流量的分类与识别分析研究[J].电子测试,2020,31(19):92-93.
8邓河,唐一韬,贺宗梅,袁爱平.一种基于Hadoop平台CloudSVM的网络流量分类方法[J].太赫兹科学与电子信息学报,2020,18(5):918-923. 被引量：2
9黄燚,刘珍,王若愚,陈洁桐.移动互联网流量分类的多特征集合和多类别标签研究[J].计算机应用研究,2020,37(11):3353-3358. 被引量：3
10孙裕康.基于机器学习的网络流量识别方法研究[J].信息与电脑,2020,32(23):53-55. 被引量：1

二级引证文献77

1刘福刚.K-means聚类算法在网络安全检测中的应用研究[J].绥化学院学报,2023,43(11):157-160. 被引量：2
2潘润宁,庞伟佳.机器学习算法在5G高清视频初缓时延优化中的应用[J].广西通信技术,2023(3):27-32.
3刘晓健,赵亮.多维网络信息流量式泄露高效检测方法仿真[J].计算机仿真,2020,37(5):448-452. 被引量：7
4盖昊宇,张震,李慧.基于Zig Bee的网络流量检测数据视觉跟踪方法[J].宁夏师范学院学报,2020,41(4):63-67.
5易灿.一种时效增强的机载Web流量识别方法[J].无线互联科技,2020,17(19):23-24. 被引量：1
6马洁,刘超,朱淞嵩,邰淳亮.基于多维数据的变电设备状态画像分析技术研究[J].自动化应用,2020(12):93-96. 被引量：1
7孙裕康.基于机器学习的网络流量识别方法研究[J].信息与电脑,2020,32(23):53-55. 被引量：1
8汪卫平.卷积神经网络的电力系统设备状态智能识别研究[J].信息技术,2021,45(2):115-119. 被引量：3
9秦之湄,熊阳欣,费怡,田红,邓小芸,奉竹,韩艳山,王斌.基于决策树的城市在用车环检首检结果预测模型研究[J].环境科学学报,2021,41(4):1574-1583. 被引量：3
10黄素叶.基于隐空间映射的联合嵌入式多标签分类算法研究[J].韶关学院学报,2021,42(6):23-27.

1李翼宏,杜镇宇,胡劲松.APT样本的有效网络特征筛选算法[J].计算机工程与应用,2019,55(3):83-89. 被引量：2
2夏丽萍.区块链技术在专利运营过程中的应用[J].中外企业家,2019(2):58-59. 被引量：2
3李淑娣.数据加密技术在计算机安全中的应用[J].科学大众（智慧教育）,2019(2):196-196. 被引量：1
4郝巍,伊鹏,江逸茗.一种快速的SDN规则冲突检测机制[J].计算机工程,2019,45(2):139-143. 被引量：3
5郑立军.汤旺河干流水质污染现状评价[J].科技创新与应用,2019,9(5):74-75. 被引量：1
6段江勇,潘畅,陈大玄.相应流量推算方法与报汛精度控制措施研究[J].水利水电快报,2019,40(3):26-30. 被引量：2
7张先勇,汤鲲.基于XGBoost算法结合域名信息筛选的流量识别方法[J].电子设计工程,2019,27(6):177-182. 被引量：7
8程晓庆,张丹.图割法提取建筑物轮廓及镶嵌线[J].地理空间信息,2018,16(12):71-73. 被引量：2
9贾军,杨进,李涛.一种基于DPI自关联数据包检测分类方法[J].四川大学学报（自然科学版）,2019,56(1):29-36. 被引量：36
10王梓民.基于病例大数据的中医“治未病”机器学习方法[J].电子技术与软件工程,2019(5):161-163. 被引量：3

计算机应用

2019年第3期

浏览历史

内容加载中请稍等...

网络背景流量的分类与识别研究综述被引量：27

参考文献3

二级参考文献38

共引文献175

同被引文献181

引证文献27

二级引证文献77

相关作者

相关机构

相关主题

浏览历史

网络背景流量的分类与识别研究综述 被引量：27

参考文献3

二级参考文献38

共引文献175

同被引文献181

引证文献27

二级引证文献77

相关作者

相关机构

相关主题

浏览历史

网络背景流量的分类与识别研究综述被引量：27