基于训练集平行分割的集成学习算法研究被引量：1

Using Parallel Hyperplanes to Partition Training Set for Ensemble Learning

下载PDF

导出

摘要针对大规模数据分类中训练集分解导致的分类器泛化能力下降问题,提出基于训练集平行分割的集成学习算法.它采用多簇平行超平面对训练集实施多次划分,在各次划分的训练集上采用一种模块化支持向量机网络算法训练基分类器.测试时采用多数投票法对各个基分类器的输出进行集成.在3个大规模问题上的实验表明:在不增加训练时间和测试时间的条件下,集成学习在保持分类器偏置基本不变的同时有效减少了分类器的方差,从而有效降低了由于训练集分割导致的分类器泛化能力下降. Aiming to handle the problem which generalization ability is decreased by partitioning training set, a machine learning algorithm was proposed to combine classifiers which are trained on training set partitioned by parallel hyperplanes. It used many clusters of parallel hyperplanes to partition training set on which each base classifier was trained by a SVM modular network algorithm and all these base classifiers were combined by majority voting strategy when testing. The experimental results on 3 large scale classification problems illustrate that ensemble learning can effectively reduce variance while keep bias and so cut down the descent of generalization ability but does not increase the training and test time.

作者文益民王耀南

机构地区湖南大学电气与信息工程学院湖南工业职业技术学院信息工程系

出处《小型微型计算机系统》 CSCD 北大核心 2009年第5期908-911,共4页 Journal of Chinese Computer Systems

基金国家自然科学基金重点项目(60835004)资助国家“八六三”计划项目(2007AA04Z244)资助湖南省博士后科研资助专项计划项目(2008RS4005)资助

关键词并行处理系统学习系统集成学习 parallel processing systems learning systems ensemble learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1Dieteerich T G.Ensemble methods in machine learning[C].In:Kittler J and Roli F ed.Proceedings of the First International Workshop on Multiple Classifier Systems.Cagliari,Italy,2000,1-15.
2Kettler J,Hatef M,Robert P W,et al.On combining classifiers[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1999,20(3):226-239.
3Brown G,Wyatt J,Harris R,et al.Diversity creation methods:a survey and categorization[J].Information Fusion Journal,2004,6(1):5-20.
4Tang E K,Suganthan P N,Yao X.An analysis of diversity measures[J].Machine Learning,2006,65(1):247-271.
5Provost F J,Aronis J M.Scaling up inductive learning with massive parallelism[J].Machine Learning,1996,23(1):1-42.
6Chawla N V,Moore T E,Hall L O,et al.Distributed learning with bagging like performance[J].Pattern Recognition Letters,2003,24(1-3):455-471.
7Chawla N V,Hall L O,Bowyer K W,et al.Learning ensembles from bites:a scalable and accurate approach[J].Journal of Machine Learning Research,2004,5(4):421-451.
8Eschrich S,Hall L O.Learning from partitions of data:reducing the variance[C].Proceedings of the IEEE International Conference on Fuzzy Systems St.Louis,MO,USA:2003,666-671.
9Frosyniotis D,Stafylopatis A,Likas A.A divide-and-conquer method for multi-net classifiers[J].Pattern Analysis Application,2003,6(1):32-40.
10Lazarevic A,Obradovic Z.The distributed boosting learning algorithm[C].In:Provost F and Srikant R ed.Proceedings of the International Conference on Knowledge Discovery and Data Mining.San Francisco,USA:2001,311-316.

同被引文献7

1张春霞,张讲社.选择性集成学习算法综述[J].计算机学报,2011,34(8):1399-1410. 被引量：139
2吴春花,杜培军,夏俊士.一种基于投票法融合的ASTER遥感影像水体提取方法[J].遥感信息,2012,34(2):51-56. 被引量：8
3姚旭,王晓丹,张玉玺,薛爱军.基于正则化互信息和差异度的集成特征选择[J].计算机科学,2013,40(6):225-228. 被引量：3
4白宁.基于特征选择融合的垃圾邮件过滤方法[J].计算机应用与软件,2014,31(4):31-34. 被引量：2
5徐涛,杨奇川,吕宗磊.一种基于动态集成学习的机场噪声预测模型[J].电子与信息学报,2014,36(7):1631-1636. 被引量：5
6章少平,梁雪春.优化的支持向量机集成分类器在非平衡数据集分类中的应用[J].计算机应用,2015,35(5):1306-1309. 被引量：9
7邓生雄,雒江涛,刘勇,王小平,杨军超.集成随机森林的分类模型[J].计算机应用研究,2015,32(6):1621-1624. 被引量：20

引证文献1

1李巧,周双娥,杨晶.模型融合在用户续购行为分析中的应用[J].小型微型计算机系统,2017,38(10):2231-2235. 被引量：2

二级引证文献2

1王一宾,田文泉,程玉胜.基于标记分布学习的异态集成学习算法[J].模式识别与人工智能,2019,32(10):945-954. 被引量：6
2李帅标,赵海燕,陈庆奎,曹健.基于Stacking策略的过程剩余执行时间预测[J].小型微型计算机系统,2019,40(12):2481-2486. 被引量：5

1徐健,陈光喜.一种处理较大规模数据分类的支持向量机[J].计算机工程与应用,2007,43(6):165-167.
2张红蕊,张永,于静雯.云计算环境下基于朴素贝叶斯的数据分类[J].计算机应用与软件,2015,32(3):27-30. 被引量：19
3文益民,王耀南,张莹.基于分类面拼接的快速模块化支持向量机研究[J].湖南大学学报（自然科学版）,2009,36(3):45-50. 被引量：1
4吴恒山,李蛟,谢美意.数据库管理系统多缓冲池的配置及其多次划分自调优算法[J].计算机工程与科学,2007,29(3):105-107. 被引量：1
5张国兵,郎荣玲,周凯.基于模糊核聚类的支持向量分类[J].计算机应用,2013,33(A02):108-110. 被引量：3
6邓生雄,雒江涛,刘勇,王小平,杨军超.集成随机森林的分类模型[J].计算机应用研究,2015,32(6):1621-1624. 被引量：20
7陆刚兰.实时绘制中的阴影贴图反走样算法研究[J].计算机应用与软件,2014,31(11):165-169.
8郭钊,范湘涛,谭剑.基于光源空间透视的平行分割阴影图算法[J].地理与地理信息科学,2016,32(1):39-43. 被引量：2
9张永,浮盼盼,张玉婷.基于分层聚类及重采样的大规模数据分类[J].计算机应用,2013,33(10):2801-2803. 被引量：5
10史长琼,易昂.基于多决策树算法的网络入侵检测[J].计算机工程与设计,2004,25(4):518-519. 被引量：4

小型微型计算机系统

2009年第5期

浏览历史

内容加载中请稍等...

基于训练集平行分割的集成学习算法研究被引量：1

参考文献15

同被引文献7

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于训练集平行分割的集成学习算法研究 被引量：1

参考文献15

同被引文献7

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于训练集平行分割的集成学习算法研究被引量：1