基于近邻传播学习的半监督流量分类方法被引量：14

Semi-supervised Traffic Identification Based on Affinity Propagation

下载PDF

导出

摘要准确的流量分类是进行网络管理、安全检测以及应用趋势分析的基础.针对完全监督和无监督分类的缺陷,提出了一种基于近邻传播学习的半监督流量分类方法.通过引入"近邻传播聚类"机制构建分类模型,使得分类器实现过程简单、运行高效.应用"半监督学习"的思想,抽象出少量已标记样本流约束和流形空间先验信息,定义了"流形相似度"的距离测度,既降低了标记流量样本的复杂度,又提高了流量分类器的性能.理论分析和实验结果表明:算法具有较高的分类准确性和较好的凝聚性. Accurate traffic identification is the keystone of network management,security diagnosis and application prediction analysis.Aiming at the deficiencies of supervised and unsupervised classified methods,we present a novel scheme called semi-supervised internet traffic identification based on affinity propagation（AP）.In order to circumvent the problem of choosing initial points,the method introduces affinity propagation clustering to construct classification model simply and effectively.Based on the idea of semi-supervised learning,a few restrictions of labelled flows and priori manifold distribution of sampled space are abstracted.Also,manifold similarity is defined.Henceforth,the semi-supervised method can not only largely reduce the complexity of marking sampled flows,but also nicely improve the performance of the classifier.Theoretical analysis and experimental results show that the algorithm can achieve higher accuracy and better aggregation.

作者张震汪斌强李向涛黄万伟

机构地区国家数字交换系统工程技术研究中心

出处《自动化学报》 EI CSCD 北大核心 2013年第7期1100-1109,共10页 Acta Automatica Sinica

基金国家重点基础研究发展计划(973计划)(2012CB312901 2012CB312905) 国家高技术研究发展计划(863计划)(2011AA01A103)资助~~

关键词流量分类半监督学习近邻传播聚类流形相似度 Traffic identification semi-supervised learning affinity propagation（AP） clustering manifold similarity

分类号 TP393.06 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1闫德勤,刘胜蓝,李燕燕.一种基于稀疏嵌入分析的降维方法[J].自动化学报,2011,37(11):1306-1312. 被引量：21
2刘胜蓝,闫德勤.一种新的全局嵌入降维算法[J].自动化学报,2011,37(7):828-835. 被引量：14

二级参考文献22

1HU Jie, ZHANG Yujun, LI Peng, WANG Hui, HUANG Lan & HU YuanzhongState Key Laboratory of Tribology, Tsinghua University, Beijing 100084, China,Department of Physics, Tsinghua University, Beijing 100084, China,College of Chemistry and Molecular Engineering, Peking University, Beijing 100871, China.Micro-mechanical analysis of dynamic processes of nanomanipulation[J].Science China(Physics,Mechanics & Astronomy),2004,47(z1):88-92. 被引量：28
2杨剑,李伏欣,王珏.一种改进的局部切空间排列算法[J].软件学报,2005,16(9):1584-1590. 被引量：36
3Jolliffe I T. Principal Component Analysis (Second Edition). New York: Springer-Verlag, 2002.
4Cox T F, Cox M A A. Multidimensional Scaling. London: Chapman and Hall, 1994.
5Rowels S T, Saul L K. Nonlinear dimensionality reduc- tion by locally linear embedding. Science, 2000, 290(5500): 2323-2326.
6Donoho D L, Grimes C. Hessian eigeamaps: locally linear embedding, techniques for high-dimensional data. Proceed- ings of the National Academy of Sciences, 2003, 100(10): 5591-5596.
7Min W L, Lu K, He X F. Locality pursuit embedding. Pat- tern Recognition, 2004, 37(4): 781-788.
8Zhang Z Y, Zha H Y. Principal manifolds and nonlinear dimensionality reduction via tangent space alignment. SIAM Journal of Scientitic Computing, 2004, 26(1): 313-338.
9Yang L. Alignment of overlapping locally scaled patches for multidimensional sealing and dimensionality reduction. IEEE Transactions on Pattern Analysis and Machine Intel- ligence, 2008, 30(3): 438-450.
10Wang J, Zhang Z Y, Zha H Y. Adaptive manifold learning. In: Proceedings of the Neural Information Processing Sys- tems. Vancouver, Canada: The MIT Press, 2004. 1473-1480.

共引文献31

1王力,吴成东,陈东岳,李孟歆,陈莉.非线性流形上的线性结构聚类挖掘[J].自动化学报,2012,38(8):1308-1320. 被引量：3
2郑建炜,王万良,姚晓敏,石海燕.张量局部Fisher判别分析的人脸识别[J].自动化学报,2012,38(9):1485-1495. 被引量：23
3高阳,王雪松,程玉虎,黄飞.基于非负稀疏嵌入投影的高光谱数据降维方法[J].中国矿业大学学报,2012,41(6):1010-1017. 被引量：2
4李泽安.高维数据挖掘中基于正则化估计的特征提取算法[J].合肥工业大学学报（自然科学版）,2012,35(12):1655-1658. 被引量：1
5冯林,刘胜蓝,王静,肖尧.人体运动分割算法:序列局部弯曲的流形学习[J].计算机辅助设计与图形学学报,2013,25(4):460-467. 被引量：7
6刘胜蓝,冯林,金博,吴振宇.一种新的局部空间排列算法[J].计算机研究与发展,2013,50(7):1426-1434.
7高阳,王雪松,程玉虎,汪婵.基于块非负稀疏重构嵌入的高光谱数据降维[J].控制与决策,2013,28(8):1219-1225. 被引量：1
8冷亦琴,张莉,杨季文.一种基于局部稀疏线性嵌入的降维方法及其应用[J].南京大学学报（自然科学版）,2013,49(4):403-410. 被引量：4
9陈如清.基于改进MVU的非线性动态过程故障检测方法[J].仪器仪表学报,2013,34(9):2111-2117. 被引量：10
10马小虎,谭延琪.基于鉴别稀疏保持嵌入的人脸识别算法[J].自动化学报,2014,40(1):73-82. 被引量：56

同被引文献111

1赵树鹏,陈贞翔,彭立志.基于流中前5个包的在线流量分类特征[J].济南大学学报（自然科学版）,2012,26(2):156-160. 被引量：3
2熊刚,孟姣,曹自刚,王勇,郭莉,方滨兴.网络流量分类研究进展与展望[J].集成技术,2012,1(1):32-42. 被引量：24
3李强,裘正定,孙冬梅,刘陆陆.基于改进二维主成分分析的在线掌纹识别[J].电子学报,2005,33(10):1886-1889. 被引量：36
4高济,何志均.基于规则的联想网络[J].自动化学报,1989,15(4):318-323. 被引量：1
5王开军,张军英,李丹,张新娜,郭涛.自适应仿射传播聚类[J].自动化学报,2007,33(12):1242-1246. 被引量：145
6CNNIC.中国互联网络信息中心[EB/OL].(2013-06).http://www.erlnie.net.cn.
7MADHUKAR A, WILLIAMSON C. A longitudinal study of P2P traf- fic classification[ C ]//Proc of the 14th IEEE International Symposium on Modeling, Analysis, and Simulation of Computer and Telecommu- nication Systems. [ S. 1. ] : IEEE Press, 2006 : 179-188.
8BONFIGLIO D, MELLIA M, MEO M, et al. Revealing Skype traf- fic: when randomness plays with you[J]. ACM SIGCOMM Com- puter Communication Review, 2007,37(4): 37-48.
9DAINOTTI A, PESCAPE A, CLAFFY K C. Issues and future direc- tions in traffic classification[ J]. IEEE Network, 2012, 26(1 ) : 35- 40.
10WRIGHT C, MONROSE F, MASSON G M. HMM profiles for net-work traffic classification[ C ]//Proc of ACM Workshop on Visualiza- tion and Data Mining for Computer Security. New York:ACM Press, 2004 : 9-15.

引证文献14

1韩旭明,孙海波,王丽敏.基于变异赋权的吸引子传播算法[J].吉林大学学报（理学版）,2014,52(3):551-555. 被引量：1
2王依章,王丽敏,韩旭明.属性分布相似度吸引子传播聚类算法研究[J].长春工业大学学报,2014,35(3):271-274.
3徐思,孙仁诚.结合聚类的半监督分类方法[J].青岛大学学报（自然科学版）,2018,31(4):49-53. 被引量：2
4王炜,程东年,马海龙.基于趋势感知协议指纹的Skype加密流量识别算法[J].计算机应用研究,2015,32(1):183-186. 被引量：4
5王丽敏,王依章,韩旭明,黄娜.基于稳定阈值的吸引子传播算法[J].吉林大学学报（理学版）,2014,52(6):1249-1254. 被引量：1
6韩义波,韩璞.一种迭代加权更新的带加速算子的半监督AP聚类算法[J].计算机应用研究,2015,32(2):376-378. 被引量：1
7黄盛林,王恩海,何燕玲,王伟.基于五元组加载荷特征的在线流量分类方法[J].科研信息化技术与应用,2015,6(5):34-41. 被引量：1
8陈雷,肖创柏,禹晶,王真理,李学良.基于相似性传播聚类与主成分分析的断层识别方法[J].石油地球物理勘探,2017,52(4):826-833. 被引量：9
9夏春梦,倪志伟,倪丽萍,张霖.基于密度调整和流形距离的近邻传播算法[J].计算机科学,2017,44(10):187-192. 被引量：4
10胡久松,刘宏立,颜志,徐琨.一种自适应阻尼因子的仿射传播聚类算法[J].西北大学学报（自然科学版）,2018,48(3):363-368. 被引量：3

二级引证文献32

1张政,严哲,顾汉明.基于残差网络与迁移学习的断层自动识别[J].石油地球物理勘探,2020(5):950-956. 被引量：23
2贾伟,夏靖波.网络虚拟化环境下的业务聚类方法[J].电光与控制,2015,22(8):54-59.
3陈雪娇,王攀,刘世栋.网络应用流类别不平衡环境下的SSL加密应用流识别关键技术[J].电信科学,2015,31(12):83-89. 被引量：4
4张涛,张颖江.移动通信网络异常信号优化识别研究[J].计算机仿真,2017,34(3):309-312. 被引量：11
5王姣,蒋言.改进的基于半监督稀疏自编码IM流量识别模型的研究与比较[J].电子设计工程,2018,26(7):49-54. 被引量：3
6叶涛,陈雷.基于近邻传播聚类与曲线拟合的断层识别[J].计算机工程与设计,2018,39(8):2510-2514.
7陈句,黄家伟.网络流量查询系统研究与实现[J].信息技术,2018,42(11):157-159.
8任智伟,吴玲达.基于AP聚类的高光谱波段选择[J].激光与光电子学进展,2018,55(10):385-389. 被引量：5
9李致远.ARES P2P资源共享协议分析技术研究[J].计算机工程与应用,2016,52(24):1-5. 被引量：1
10任智伟,吴玲达.基于近邻传播算法的高光谱波段选择[J].舰船电子工程,2018,38(9):163-166. 被引量：1

1郭景峰,赵玉艳,边伟峰,李晶.基于改进的凝聚性和分离性的层次聚类算法[J].计算机研究与发展,2008,45(z1):202-206. 被引量：15
2赵书良,蒋国瑞,黄梯云.一种Multi-agent System的信任模型[J].管理科学学报,2006,9(5):36-43. 被引量：10
3张霄明,田林芳,董倩.社会网络分析及其在知识管理中的应用[J].中国科技信息,2012(10):187-187.
4董燕飞,任琦梅,张俊峰.一种基于多重模糊聚类的红外目标分割算法[J].激光与红外,2010,40(5):554-557. 被引量：3
5赵书良,蒋国瑞,黄梯云.基于信用和关系网的Multi-agent System信任体系[J].计算机工程,2006,32(8):198-200. 被引量：6
6蔡波斯,陈翔.基于行为相似度的微博社区发现研究[J].计算机工程,2013,39(8):55-59. 被引量：14
7赵煜,蔡皖东,樊娜,刘念.采用并行遗传算法的文本分割研究[J].西安交通大学学报,2009,43(12):40-44. 被引量：1
8吴鹏.由孔子传统孝道所联想开来[J].当代旅游（下旬刊）,2012(10):235-236.
9张晗,赵玉虹.基于Clique聚类的精神分裂症多文档自动摘要研究[J].中华医学图书情报杂志,2016,25(3):18-24. 被引量：1
10张娜娜.高校德育工作中主题班会的运用[J].技术与市场,2016,23(5):384-384.

自动化学报

2013年第7期

浏览历史

内容加载中请稍等...

基于近邻传播学习的半监督流量分类方法被引量：14

参考文献2

二级参考文献22

共引文献31

同被引文献111

引证文献14

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

基于近邻传播学习的半监督流量分类方法 被引量：14

参考文献2

二级参考文献22

共引文献31

同被引文献111

引证文献14

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

基于近邻传播学习的半监督流量分类方法被引量：14