一种提高神经网络集成差异性的学习方法被引量：9

An Approach to Improving Diversity of Neural Network Ensemble

下载PDF

导出

摘要集成学习已经成为机器学习的研究方向之一,它可以显著地提高分类器的泛化性能.本文分析了Bag-ging及AdaBoost集成方法,指出了这两种方法的缺陷;然后提出了一种新的基于神经网络的分类器集成方法DBNNE,该方法通过生成差异数据增加集成的差异性;另外,当生成一个分类器后,采用了测试方法确保分类器集成的正确率;最后针对十个标准数据集进行了实验研究,结果表明集成算法DBNNE在小规模数据集上优于Bagging及AdaBoost集成方法,而在较大数据集上也不逊色于这两种集成方法. Ensemble learning has become one of research fields of machine learning, it dramatically improves generalization performance of classifier.After analyzing ensemble approach to both Bagging and Adaboost, we point out their some flaws. Then we present a novel approach to neural network ensemble,called DBNNE below. In this method,a diverse data set is generated to increase ensemble diversity. Moreover, to ensure high accuracy of ensemble, we test performanee of ensemble when a classifier is added to ensemble . Finally, we experiment on ten representative data sets. The results show that DBNNE achieves higher predictive aceuracy than Bagging and AdaBoost on small data sets and comparable performance on larger data sets.

作者李凯黄厚宽

机构地区河北大学数学与计算机学院北京交通大学计算机与信息技术学院

出处《电子学报》 EI CAS CSCD 北大核心 2005年第8期1387-1390,共4页 Acta Electronica Sinica

基金国家"十五"重点科技攻关项目(No.2002BA407B) 国家自然科学基金(No.60443003)

关键词神经网络集成小规模数据集差异性泛化 neural network ensemble small data sets diversity generalization

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献12

1Dietterich T G. Machine learning research: four current directions[J].AI Magazine, 1997,18 (4):97- 136.
2Hansen LK,Salamon P.Neural network ensembles[J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 1990,12(10) :993 - 1001.
3Krogh A, Vedelsby J. Neural network ensembles, cross validation,and active learing[A] .Tesauro G,Touretzky D S and Leen T K,eds, Advances in Neural Information Processing Systems 7 [C]. Cambridge,MA, MIT Press, 1995.231 - 238.
4Partridge D, Yates W B. Engineering multiversion neural-net systems[J]. Neural Computation, 1996, 8(4) : 869 - 893.
5Opitz D W,Shavlik J W. Actively searching for an effective neural-network ensemble[J]. Connection Science, 1996,8(3/4) :337 - 353.
6Zhou Z H,Wu J X,Tang W. Ensembling neural networks: many could be better than all[J] .Artificial Intelligence, 2002, 137( 1 - 2) :239 -263.
7Imamura K,Soule T, Heckendom B B,et al. Behavioral diversity and a probabilistically optimal GP ensemble[J]. Genetic Programming and Evolvable Machines,2003,4(3) :235 -253.
8Breiman L. Bagging predictors[J]. Machine Learning, 1996, 24(2):123 - 140.
9Freund Y, Schapire R E. Experiments with a new boosting algorithm [A]. Saitta L Proc of the 13^th ICML-96[C]. San Francisco, Morgan Kaufimann, 1996.148 - 156.
10Kuncheva L, Whitaker C. Measures of diversity in classifier ensembles and their relationship with ensemble accuracy[J] .Machine Learning ,2003,51(2):181-207.

同被引文献91

1李凯,李昆仑,崔丽娟.模型聚类及在集成学习中的应用研究[J].计算机研究与发展,2007,44(z2):203-207. 被引量：7
2薛建中,闫相国,郑崇勋.用核学习算法的意识任务特征提取与分类[J].电子学报,2004,32(10):1749-1753. 被引量：10
3李国正,杨杰,孔安生,陈念贻.基于聚类算法的选择性神经网络集成[J].复旦学报（自然科学版）,2004,43(5):689-691. 被引量：15
4唐伟,周志华.基于Bagging的选择性聚类集成[J].软件学报,2005,16(4):496-502. 被引量：95
5王正群,陈世福,陈兆乾.基于模糊划分的神经网络集成[J].南京大学学报（自然科学版）,2006,42(1):63-68. 被引量：6
6崔明义.浮点数编码小生境遗传算法的研究[J].计算机科学,2007,34(4):225-227. 被引量：5
7HANSEN L K, SALAMON P. Neural network ensembles[ J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1990, 12(10) : 993 - 1001.
8KROGH A, VEDELSBY J. Neural network ensembles, cross validation, and active learning [ C]// Advances in Neural Information Processing Systems. Cambridge, MA: MIT Press, 1995: 231- 238.
9ZHOU Z H, WU J X, TANG W. Ensembling neural networks: Many could be better than all [ J]. Artificial Intelligence, 2002, 137 (1/2) : 239 - 263.
10IMAMURA K, SOULE T, HECKENDORN R B, et al. Behavioral diversity and a probabilistically optimal GP ensemble [ J]. Genetic Programming and Evolvable Machines, 2003,4(3) : 235 -253.

引证文献9

1朱海平,赵玉,吴军,邵新宇.神经网络集成方法在产品完工期预测中的应用[J].计算机集成制造系统,2007,13(11):2140-2144. 被引量：9
2李凯,陈武.基于集成学习的入侵检测方法[J].计算机工程,2008,34(11):166-167.
3於时才,陈涓.基于小生境技术的神经网络进化集成[J].计算机应用,2008,28(12):3052-3054.
4高志华,贲可荣,田立业,崔立林.基于神经网络集成的声学故障识别[J].船海工程,2009,38(2):86-89. 被引量：1
5孟凡荣,郝晓昀,周勇.基于文化算法的选择性神经网络集成方法[J].小型微型计算机系统,2009,30(5):933-936. 被引量：2
6张宏达,王晓丹,韩钧,徐海龙.分类器集成差异性研究[J].系统工程与电子技术,2009,31(12):3007-3012. 被引量：9
7黄文涛,鲍鸿,张晶.基于模糊聚类的神经网络集成[J].计算机与现代化,2011(3):12-14.
8綦宏志,孙长城,许敏鹏,明东,万柏坤,刘志朋,殷涛.P300 Speller中基于权值重采样的ABSVM字符识别方法研究[J].电子学报,2011,39(11):2534-2539. 被引量：1
9王改革,郭立红,段红,刘逻,王鹤淇.基于Elman_AdaBoost强预测器的目标威胁评估模型及算法[J].电子学报,2012,40(5):901-906. 被引量：30

二级引证文献52

1陈思华,陶长琪.一种新的文化算法框架下知识融合策略[J].小型微型计算机系统,2009,30(10):2030-2033. 被引量：4
2高志华,贲可荣,章林柯.可增量学习的水下航行器噪声源识别中聚类算法研究[J].计算机工程与科学,2010,32(9):53-56.
3张亮,黄曙光,石昭祥,胡荣贵.一种局部最优型动态集成选择算法[J].小型微型计算机系统,2011,32(5):1005-1011.
4李凤英,李宏,李培.针对弱标记的多标记数据集成学习分类方法[J].微型机与应用,2012,31(13):73-75.
5胡盛强,张毕西,张湘伟.MTO生产模式的完工期预测及承诺交货期决策[J].工业工程,2012,15(3):122-129. 被引量：6
6陈晓平,沈记全.分类器集成在入侵检测中的应用研究[J].河南理工大学学报（自然科学版）,2012,31(3):322-325.
7韦艳艳,李陶深.基于特征选择的集成分类器抗噪性能分析[J].计算机技术与发展,2012,22(11):161-164. 被引量：1
8姚旭,王晓丹,张玉玺,邢雅琼.基于随机子空间和AdaBoost的自适应集成方法[J].电子学报,2013,41(4):810-814. 被引量：14
9姚旭,王晓丹,张玉玺,薛爱军.基于正则化互信息和差异度的集成特征选择[J].计算机科学,2013,40(6):225-228. 被引量：3
10王改革,郭立红,段红,刘逻,王鹤淇.基于萤火虫算法优化BP神经网络的目标威胁估计[J].吉林大学学报（工学版）,2013,43(4):1064-1069. 被引量：47

1温菊屏,林冬梅.图稀疏化:加速图聚类的有效方法[J].计算机工程与设计,2013,34(11):3934-3938. 被引量：3
2谢羿.基于BFS结果集的可达性保持图并行计算[J].中国新技术新产品,2016(11):35-36. 被引量：1
3单凯,高仲合,李凤银.云计算环境下的P2P流量识别[J].计算机工程与应用,2015,51(19):88-92. 被引量：1
4李凯,黄厚宽.小规模数据集的神经网络集成算法研究[J].计算机研究与发展,2006,43(7):1161-1166. 被引量：10
5李自尊,胡晓勤,周文瑾,邓亮.基于差异数据的块级数据库备份系统[J].四川大学学报（自然科学版）,2012,49(4):783-789.
6张绍成,孙时光,曲洋,董宇.大数据环境下机器学习在数据挖掘中的应用研究[J].辽宁大学学报（自然科学版）,2017,44(1):15-17. 被引量：14
7李亚飞,吕强,苏伟峰,刘轶.一种小规模数据集下的贝叶斯网络学习方法及其应用[J].计算机科学,2011,38(7):181-184. 被引量：3
8王勇,龙也,陶晓玲,韦毅.基于多层MapReduce的混合网络流量分类特征选择方法[J].桂林电子科技大学学报,2016,36(2):123-128. 被引量：1
9杜伟杰,王瑞波,李济洪.基于均衡7×2交叉验证的模型选择方法[J].太原师范学院学报（自然科学版）,2013,12(1):27-31. 被引量：2
10曾阳.关于P2P对等网络差异数据通信优化的研究[J].电脑知识与技术,2016,0(6):38-39. 被引量：2

电子学报

2005年第8期

浏览历史

内容加载中请稍等...

一种提高神经网络集成差异性的学习方法被引量：9

参考文献12

同被引文献91

引证文献9

二级引证文献52

相关作者

相关机构

相关主题

浏览历史

一种提高神经网络集成差异性的学习方法 被引量：9

参考文献12

同被引文献91

引证文献9

二级引证文献52

相关作者

相关机构

相关主题

浏览历史

一种提高神经网络集成差异性的学习方法被引量：9