数据流挖掘算法研究综述被引量：21

Survey on data stream mining

下载PDF

导出

摘要流数据挖掘是数据挖掘的一个新的研究方向,已逐渐成为许多领域的有用工具。在介绍数据流的基本特点以及数据流挖掘的意义的基础上,对现有数据流挖掘算法的主要思想方法进行了总结,并指出了这些方法的局限性。最后对数据流挖掘的发展方向进行了展望。 Data stream mining is a new research aspect of data mining. It has be come a useful tool for many fields. The essential characteristic of data stream and the significance of data stream mining are introduced. The main ideal of existing data stream mining algorithms is summarized, and the limitation of the algorithms is pointed out. Some research directions about data stream mining in future work are put forward.

作者蒋盛益李庆华李新

机构地区华中科技大学计算机学院

出处《计算机工程与设计》 CSCD 北大核心 2005年第5期1130-1132,1169,共4页 Computer Engineering and Design

基金国家自然科学基金项目(60273075)

关键词数据流挖掘算法聚类分类频繁模式 data stream data stream mining clustering, classification frequent pattern

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献16

1Babcock B, Babu S, Datar M, et al. Models and issues in data stream systems[C]. Madison, Wisconsin, USA:Proc of ACM SIGMOD/SIGACT Conf on Princ of Database Syst. 2002.1-16.
2O'Callaghan L, Mishra N, Meyerson A, et al. Streaming-data algorithms for high-quality clustering[C]. Proc of IEEE International Conference on Data Engineering, 2002.
3Guha S, Mishra N, Motwani R, et al. Clustering data streams[C].Proc of IEEE Symposium on Foundations of Computer Science (FOCS'00), 2000.71-80.
4Guha S, Meyerson A, Mishra N, et al. Clustering data streams:Theory and practice[J]. Knowledge and Data Engineering, IEEE Transactions, 2003, 15(3):515-528.
5Giannella C, HAN Jia-wei, JIAN Pei, et al. Mining frequent patterns in data streams at multiple time granularities[C]. Proc of the NSF Workshop on Next Generation Data Mining, 2002.
6Aggarwal C, Han J, Wang J, et al. A framework for clustering evolving data streams[C]. Berlin, Germany: Proc of Int Conf on Very Large Data Bases (VLDB'03), 2003.
7Dora Cai Y, Clutter D, Pape G, et al. MAIDS mining alarming incidents from data streams[C].Paris, France:Proc of the 23rd ACM SIGMOD, 2004.
8Dong G, Han J, LVS Lakshmanan, et al. Online mining of changes from data streams: Research problems and preliminary result [C], Proc of ACM SIGMOD Workshop on Management and Processing of Data Streams, 2003,.
9何增有,徐晓飞,邓胜春.Squeezer：An Efficient Algorithm for Clustering Categorical Data[J].Journal of Computer Science & Technology,2002,17(5):611-624. 被引量：32
10Portnoy L, Eskin L, Stolfo S J. Intrusion detection with unlabeled data using clustering[C]. Proc of ACM CSS Workshop on Data Mining Applied to Security (DMSA-2001), Philadelphia,2001.

二级参考文献17

1Sudipto Guha, Rajeev Rastogi, Kyuseok Shim. ROCK: A robust clustering algorithm for categorical attributes. In Proc. 1999 Int. Conf. Data Engineering, Sydney, Australia, Mar., 1999, pp.512-521.
2Alexandros Nanopoulos, Yannis Theodoridis, Yannis Manolopoulos. C2P: Clustering based on closest pairs. In Proc. 27th Int. Conf. Very Large Database, Rome, Italy, September, 2001, pp.331-340.
3Ester M, Kriegel H P, Sander J, Xu X. A density-based algorithm for discovering clusters in large spatial databases.In Proc. 1996 Int. Conf. Knowledge Discovery and Data Mining (KDD'96), Portland, Oregon, USA, Aug., 1996,pp.226-231.
4Zhang T, Ramakrishnan R, Livny M. BIRTH: An efficient data clustering method for very large databases. In Proc.the ACM-SIGMOD Int. Conf. Management of Data, Montreal, Quebec, Canada, June, 1996, pp.103-114.
5Sudipto Guha, Rajeev Rastogi, Kyuseok Shim. CURE: A clustering algorithm for large databases. In Proc. the ACM SIGMOD Int. Conf. Management of Data, Seattle, Washington, USA, June, 1998, pp.73-84.
6Karypis G, Han E-H, Kumar V. CHAMELEON: A hierarchical clustering algorithm using dynamic modeling. IEEE Computer, 1999, 32(8): 68-75.
7Sheikholeslami G, chatterjee S, Zhang A. WaveCluster: A multi-resolution clustering approach for very large spatial databases. In Proc. 1998 Int. Conf. Very Large Databases, New York, August, 1998, pp.428-439.
8Agrawal R, Gehrke J, Gunopulos D, Raghavan P. Automatic subspace clustering of high dimensional data for data mining applications. In Proc. the 1998 ACM SIGMOD Int. Conf. Management of Data, Seattle, Washington,USA, June, 1998, pp.94-105.
9Jiang M FI Tseng S S, Su C M. Two-phase clustering process for outliers detection. Pattern Recognition Letters,2001, 22(6/7): 691-700.
10Venkatesh Ganti, Johannes Gehrke, Raghu Ramakrishnan. CACTUS-clustering categorical data using summaries.In Proc. 1999 Int. Conf. Knowledge Discovery and Data Mining, August, 1999, pp.73-83.

共引文献31

1卓琳,赵厚宇,詹思延.异常检测方法及其应用综述[J].计算机应用研究,2020,37(S01):9-15. 被引量：25
2蒋盛益,李庆华.一种基于引力的聚类方法[J].计算机应用,2005,25(2):286-288. 被引量：9
3蒋盛益,李庆华.聚类分析中的差异性度量方法研究[J].计算机工程与应用,2005,41(11):146-149. 被引量：4
4蒋盛益,李庆华,王卉,孟中楼.一种基于聚类的有指导的入侵检测方法[J].小型微型计算机系统,2005,26(6):1042-1045. 被引量：6
5蒋盛益,李庆华,赵延喜.一种两阶段异常检测方法[J].小型微型计算机系统,2005,26(7):1237-1240. 被引量：7
6蒋盛益,李庆华.基于引力的入侵检测方法[J].系统仿真学报,2005,17(9):2202-2206. 被引量：6
7郝凯,朱敏.有源雷达组网目标定位中去除虚假目标的改进方法[J].四川大学学报（自然科学版）,2006,43(2):315-319. 被引量：4
8蒋盛益,阮幼林,李庆华.面向混合属性的高效聚类算法研究[J].计算机工程,2006,32(12):47-49.
9蒋盛益.基于投票机制的融合聚类算法[J].小型微型计算机系统,2007,28(2):306-309. 被引量：7
10李岩,王惠文,叶明.数据流分析与技术研究[J].计算机工程与应用,2008,44(15):8-11. 被引量：6

同被引文献150

1熊剑锋,张凌,宁国宁,叶昭.基于sFlow的网络流量测量系统[J].华中科技大学学报（自然科学版）,2003,31(S1):221-223. 被引量：10
2冯保红,王煜.控制系统动态马尔可夫过程可靠性分析[J].控制工程,2011,18(S1):1-4. 被引量：3
3金澈清,钱卫宁,周傲英.流数据分析与管理综述[J].软件学报,2004,15(8):1172-1181. 被引量：161
4于戈,王国仁.实时数据流管理技术研究[J].计算机应用,2004,24(10):11-13. 被引量：5
5李冠强,陈雅,李强.中国互联网用户网络使用行为分析[J].中国图书馆学报,2004,30(5):43-46. 被引量：5
6吴恩华.图形处理器用于通用计算的技术、现状及其挑战[J].软件学报,2004,15(10):1493-1504. 被引量：141
7刘景春,王永利.数据流处理技术[J].佳木斯大学学报（自然科学版）,2004,22(4):556-560. 被引量：5
8蒋盛益,李庆华.一种基于引力的聚类方法[J].计算机应用,2005,25(2):286-288. 被引量：9
9冯兴杰,黄亚楼.带约束条件的聚类算法研究[J].计算机工程与应用,2005,41(7):12-14. 被引量：12
10熊家军,陈新,李庆华.一种启发式的入侵检测警报概念聚类算法[J].计算机工程,2005,31(7):35-36. 被引量：2

引证文献21

1陈磊松.数据流处理系统的调度策略研究[J].计算机工程与设计,2007,28(8):1845-1847. 被引量：1
2于少伟,曹凯.基于云模型的动态交通数据流软划分算法[J].计算机工程与应用,2007,43(28):217-219. 被引量：5
3单世民,邓贵仕,何英昊.数据流中孤立点识别方法[J].计算机工程,2007,33(15):172-174. 被引量：4
4王超,倪志伟,朱小虎.基于Squeezer算法的数据流离群数据挖掘算法[J].计算机技术与发展,2008,18(1):87-89. 被引量：1
5李中跃,赵红岩.基于传感器网络的异常检测算法研究[J].辽宁省交通高等专科学校学报,2008,10(3):31-32.
6景波,刘莹,黄兵.基于孤立点检测的工作流研究[J].计算机工程,2008,34(22):268-270. 被引量：2
7陈新泉.面向数据流的加权聚类及演化分析研究[J].世界科技研究与发展,2008,30(6):807-811. 被引量：1
8李琳,李肯立.基于图形处理器的划分聚类算法效率研究[J].计算机应用研究,2009,26(4):1276-1278. 被引量：2
9宋松滋,林南晖,何俊.sFlow网络流量分析算法研究[J].现代计算机,2009,15(4):86-87. 被引量：2
10张锡琴.多数据流的增量聚类实现与应用[J].计算机工程,2009,35(14):49-51. 被引量：1

二级引证文献58

1张强.论FCM在城市社会公共服务设施规划中的应用[J].求索,2014(8):107-111. 被引量：2
2于少伟,曹凯.基于动态目标位置的智能车辆动态避障控制研究[J].计算机工程与应用,2008,44(26):242-245. 被引量：8
3景波,刘莹,黄兵.基于孤立点检测的工作流研究[J].计算机工程,2008,34(22):268-270. 被引量：2
4于少伟.基于云理论的新的不确定性推理模型研究[J].山东大学学报（理学版）,2009,44(3):84-87. 被引量：8
5孟晓红,马永胜,江良州,赵宗涛.一种基于RDB的装备维修器材管理数据库研究[J].计算机技术与发展,2009,19(11):191-194.
6曹晖,司刚全,张彦斌,贾立新.一种基于密度近邻的增量式孤立点发现算法[J].模式识别与人工智能,2009,22(6):931-935. 被引量：3
7张敏.试论网络流量异常分析现状及问题[J].电脑编程技巧与维护,2010(8):74-75.
8史金成,胡学钢.基于数据流的概念聚类[J].计算机工程,2010,36(9):62-64. 被引量：1
9孟海东,杨彦侃.并行聚类算法的设计与研究[J].计算机与现代化,2010(8):5-7. 被引量：2
10潘云伟,成卫,肖海承,赵明翠.基于粒子群优化算法的交通数据流聚类分析[J].科学技术与工程,2010,10(28):7078-7081.

1孙国欣,张金川,陈爽,刘闪,刘英远,曹靖.数据流上基于属性最优分类的熵判定树构造方法[J].科技创新导报,2008,5(24):49-49.
2高爱华,陈静,刘正林.基于数据流的数据挖掘研究[J].商场现代化,2008(14):53-53.
3朱参世,李响.自适应模糊决策树算法在数据流挖掘中的应用[J].现代电子技术,2010,33(10):63-65. 被引量：2
4许颖梅.数据流挖掘算法在网络安全中的应用研究[J].河南科学,2012,30(3):348-351. 被引量：1
5朱小栋,黄志球,陈圣青,黄凤,沈国华.面向数据流挖掘过程的算法管理框架[J].应用科学学报,2008,26(1):61-67.
6孙岳,毛国君,刘旭,刘椿年.基于多分类器的数据流中的概念漂移挖掘[J].自动化学报,2008,34(1):93-97. 被引量：28
7徐利军,谢康林,徐虹.基于数据流的频繁集挖掘[J].上海交通大学学报,2006,40(3):502-506. 被引量：5
8何昭青.一种高效的基于排序二叉树的数据流挖掘算法[J].计算机工程与科学,2008,30(11):151-154.
9李慧琴,王俊洁.混合云环境下数据流关联规则挖掘算法[J].微电子学与计算机,2016,33(11):152-156. 被引量：7
10李人和,宫学庆,常建龙,周游弋,周红福,周傲英.RealMon:处理低质量SNMP数据流的实时监测系统[J].山东大学学报（理学版）,2007,42(11):32-36. 被引量：1

计算机工程与设计

2005年第5期

浏览历史

内容加载中请稍等...

数据流挖掘算法研究综述被引量：21

参考文献16

二级参考文献17

共引文献31

同被引文献150

引证文献21

二级引证文献58

相关作者

相关机构

相关主题

浏览历史

数据流挖掘算法研究综述 被引量：21

参考文献16

二级参考文献17

共引文献31

同被引文献150

引证文献21

二级引证文献58

相关作者

相关机构

相关主题

浏览历史

数据流挖掘算法研究综述被引量：21