基于决策树的快速SVM分类方法被引量：11

Fast SVM classification method based on the decision tree

下载PDF

导出

摘要为提高支持向量机(support vector machine,SVM)算法对大规模数据的适应能力,加快SVM算法的分类速度,提出一种基于决策树的快速SVM分类方法。该方法的重点在于构建一棵决策树,将大规模问题分解为相对简单的子问题,树中节点由线性支持向量机组成,每个节点包含一个决策超平面,分类过程取决于节点的数量。此方法在分类复杂样本时避免了使用非线性核函数。并且由于使用线性核函数,则不用进行模型选择,进一步加快了样本的分类速度。实验表明,针对大规模多特征数据的非线性分类问题,该方法比传统方法具有更高的速度。 In order to improve the large-scale data adaptability of the support vector machine （SVM） algorithm, accelerate the classification speed of the SVM algorithm, one fast SVM classification method is proposed based on the decision tree. The focus of this method is to construct a decision tree and decompose the large-scale problem into relatively simple sub-problems, the tree nodes are composed by the linear SVMs, then each node contains a decision hyperplane, the classification process depends on the number of nodes. This meth- od avoids using the nonlinear kernel function in classification of complex samples, and by using a linear kernel function, it needs not to undertake the model selection, thus accelerating the samples classification rate. Experiments show that for the nonlinear classification problem of large-scale data with multiple features, the method has higher speed than the traditional methods.

作者崔建李强刘勇宗大伟

机构地区空军雷达学院预警监视情报系空军驻京津地区代表室华中数控股份有限公司

出处《系统工程与电子技术》 EI CSCD 北大核心 2011年第11期2558-2563,共6页 Systems Engineering and Electronics

基金国家自然科学基金(60736009)资助课题

关键词支持向量机快速分类决策树大规模数据 support vector machine （SVM） fast classificatiom decision tree large-scale data

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献16

1Vapnik V N. Statistical learning theory [M]. New York: Wiley, 1998.
2Zheng L G, Zhou H, Wang C L, et al. Combing support vector regression and ant colony optimization to reduce NOx emissions in coal-fired utility[J]. Energy and Fuels, 2008,22(2) : 1034 - 1040.
3文益民,王耀南,吕宝粮,陈义明.支持向量机处理大规模问题算法综述[J].计算机科学,2009,36(7):20-25. 被引量：12
4Burges C J C, SchOlkopfand B. Improving speed and accuracy of support vector learning machines[C]// Proc. of the Advances in Neural Information Processing Systems, 1997 : 375 - 381.
5Downs T, Gates K E, Masters A. Exact simplification of support vector solution[J]. Machine Learning ,2001,42(2) :293 - 297.
6Stine R, Lin H, Auslender L. Speeding up multi-class SVM evaluation by pca and feature selection[C]// Proc. of the Society for Industry and Applied Mathematics Workshop,2005 :72 -79.
7Kristin P, Bennett K P, Cristianini N, et al. Enlarging the margins in perceptron decision trees[J]. Machine Learning, 2000, 41(3) :295 - 313.
8Segata N, Blanzieri E. Fast and scalable local kernel machines[J]. Machine Learning Research, 2010,11 (6) : 1883 - 1926.
9Dorff K C, Chambwe N, Srdanovic M, et al. BDVaG reproducible large-scale predictive model development and validation in high-throughput datasets [ J ]. Bioinformatics, 2010, 26 ( 19 ) : 2472 -2473.
10Shalev S S, Srebro N. SVM optimization: inverse dependence on training set size[C] // Proc. of the 25th Conference on Machine Learning, 2008 : 928 - 935.

二级参考文献30

1李红莲,王春花,袁保宗,朱占辉.针对大规模训练集的支持向量机的学习策略[J].计算机学报,2004,27(5):715-719. 被引量：53
2文益民,吕宝粮.最小最大模块化支持向量机改进研究[J].计算机工程与应用,2005,41(19):185-188. 被引量：5
3业宁,孙瑞祥,董逸生.MLSVM4——一种多乘子协同优化的SVM快速学习算法[J].计算机研究与发展,2005,42(9):1467-1471. 被引量：3
4李忠伟,张健沛,杨静.基于支持向量机的增量学习算法研究[J].哈尔滨工程大学学报,2005,26(5):643-646. 被引量：10
5郑志洵,杨建刚.大规模训练数据的支持向量机学习新方法[J].计算机工程与设计,2006,27(13):2425-2426. 被引量：14
6杨绪兵,陈松灿.基于原型超平面的多类最接近支持向量机[J].计算机研究与发展,2006,43(10):1700-1705. 被引量：16
7Osuna Edgar, Freund Robert, Girosi Federico. An improved training algorithm for support vector machines. In: Proceedings of IEEE NNSP'97, Amelia Island.,FL., 1997, 24～26.
8Smola A. Regression estimation with support vector learning machines[M.S. dissertation]. Technology University of Mumchen, 1996.
9Burges C.J.C. A tutorial on support vector machines for pattern recognition. Data Mining and Knowledge Discovery, 1998, 2(2): 1～47.
10Vapnik V.N. An overview of statistical learning theory. IEEE Transactions on Neural Network, 1999, 10(5): 988～999.

共引文献51

1胡正平.基于模糊K近邻决策的柔性SVM分类算法[J].仪器仪表学报,2005,26(z2):384-386. 被引量：2
2胡正平,张晔.基于快速可拒识-双层支持向量分类器的微钙化点的检测算法[J].仪器仪表学报,2007,28(3):446-450. 被引量：1
3钱爱兵.基于RSS的Web新闻主题聚合系统的设计与实现[J].现代图书情报技术,2007(4):56-61. 被引量：12
4罗瑜,易文德,何大可,林宇.大规模训练集的快速缩减[J].西南交通大学学报,2007,42(4):468-472. 被引量：5
5赵辽英,厉小润,赵光宙.基于径向基函数网络估计密度函数的数据分类[J].浙江大学学报（工学版）,2007,41(7):1088-1092.
6操敏,王士同.基于SVR的灵敏度分析及参数阈值选取[J].微计算机信息,2007,23(03X):220-221. 被引量：1
7胡正平,吴燕,张晔.基于几何分析的支持向量机快速训练与分类算法[J].中国图象图形学报,2007,12(1):82-86. 被引量：4
8王晓锋,秦玉平.基于支持向量机的网页多类分类技术[J].大连轻工业学院学报,2007,26(4):359-362. 被引量：1
9张健沛,赵莹,杨静.基于向量投影的支持向量机增量算法[J].计算机科学,2008,35(3):164-166. 被引量：2
10操敏,王士同,赵献兵.基于改进的SVR算法上的混沌时间序列预测[J].统计与决策,2008,24(6):30-32.

同被引文献81

1李金屏,何苗,杨波.遗传算法平均截止代数和成功率与种群规模之间的关系[J].系统仿真学报,2001,13(z1):206-210. 被引量：10
2张霞,艾伦,胡又农.教育装备研究过程的决策树分析法[J].中国教育技术装备,2007(2):4-6. 被引量：5
3王燕爽.分类能力与学习成绩[D].吉林:东北师范大学外国语学院,2006.
4Teng S H,Du H L,Wu N Q.A cooperati-ve network intrusion detection based on fuzzy SVMs[J].Journal of Networks,2012,5 (4):475-483.
5Zhang W,Teng S H,Zhu H B.Fuzzy multi-class support vector machines for cooperative network intrusion detection[C].Proceedings of the 9th IEEE International Conference on Cognitive Informatics(ICCI),Beijing,2010:811-818.
6勒卡斯集团.第一届勒卡斯杯数据挖掘竞赛(上海站)[DB/OL].[2014-03-20].http:∥ledmclub.engagecloud.net/.
7Teng Shaohua, Du Hongle, Wu Naiqi. A cooperative net- work intrusion detection based on fuzzy SVMs [ J]. Journal of Networks ,2010,5 (4) :475-483.
8Zhang Wei, Teng Shaohua, Zhu Haibin. Fuzzy multi-class support vector machines for cooperative network intrusion detection [ C ]//Proceedings of the 9t IEEE International Conferenceon Cognitive Informatics ( ICCI), Beijing, 2010 : 811-818.
9Lin Fuming, Guo Jun. Improving support vector machine by preprocessing data with decision tree [ C ]//ComputerScience and Service System ( CSSS), Nanjin, 2011 : 467- 469.
10第一届勒卡斯杯数据挖掘竞赛(上海站)[EB/OL].[2012-05-12].http://ledmclub.engagecloud.net/.

引证文献11

1胡俊,滕少华,张巍,刘冬宁.支持向量机与哈夫曼树实现多分类的研究[J].广东工业大学学报,2014,31(2):36-42. 被引量：4
2滕少华,胡俊,张巍,刘冬宁.支持向量机与哈夫曼树实现多分类的研究[J].江西师范大学学报（自然科学版）,2014,38(4):383-389. 被引量：1
3崔铁军,马云东.考虑范围属性的系统安全分类决策规则研究[J].中国安全生产科学技术,2014,10(11):5-9. 被引量：32
4冷强奎,李玉鑑.使用SVM和二叉树结构的分片线性分类器[J].中国科技论文,2015,10(2):164-168. 被引量：1
5杨定礼,张宇林,赵环宇,季仁东,刘保连,白秋产.一种改进的人脸检测方法[J].实验室研究与探索,2015,34(2):111-116. 被引量：4
6张江梅,任俊松,李培培,王坤朋,霍建文,朱庆平.基于支持向量机的复杂核素能谱识别[J].核电子学与探测技术,2016,36(8):856-861. 被引量：3
7呙鹏程,王星,田元荣.基于CEEMDAN-ASVM的低截获概率雷达信号识别[J].现代雷达,2018,40(3):27-32. 被引量：3
8黄勇,魏乐.一种针对不均衡数据集的SVM决策树算法[J].成都信息工程大学学报,2019,34(3):274-277. 被引量：2
9闫宏丽,罗永莲.基于决策树方法的突发事件新闻分类[J].电子技术与软件工程,2020(2):194-195. 被引量：4
10张天鹏,刘铁林,高萍.基于PDPC-决策树的装备编配方案优选方法[J].火力与指挥控制,2022,47(2):72-76. 被引量：1

二级引证文献56

1崔铁军,李莎莎.空间故障树与空间故障网络理论综述[J].安全与环境学报,2019,19(2):399-405. 被引量：43
2杨巨文,何峰,崔铁军,白润才,于永江,宋红梅.基于因素分析法的煤矿灾害安全性分析[J].中国安全生产科学技术,2015,11(4):84-89. 被引量：6
3李莎莎,崔铁军,马云东.基于空间故障树理论的系统可靠性评估方法研究[J].中国安全生产科学技术,2015,11(6):68-74. 被引量：22
4刘苹光,文成玉,杜鸿.一种改进的AdaBoost检测算法[J].计算机应用,2015,35(8):2261-2265. 被引量：5
5王峰,崔铁军.01SFT中逐条分析法的系统因素结构反分析[J].中国安全科学学报,2015,25(6):51-56. 被引量：8
6崔铁军,汪培庄,马云东.01型空间故障树的结构化表示方法[J].大连交通大学学报,2016,37(1):82-87. 被引量：9
7王琛,王云,陈丽芳,刘亚飞.家庭畜禽养殖场标准化建设存在的问题及建议[J].智能计算机与应用,2016,6(1):64-67. 被引量：2
8崔铁军,马云东.系统因素可靠性分析与实现[J].大连交通大学学报,2016,37(2):94-98. 被引量：6
9李莎莎,崔铁军,马云东,王来贵.SFT下的云化故障概率分布变化趋势研究[J].中国安全生产科学技术,2016,12(3):60-65. 被引量：4
10李莎莎,崔铁军,马云东.基于云模型的变因素影响下系统可靠性模糊评价方法[J].中国安全科学学报,2016,26(2):132-138. 被引量：27

1蔚治国.基于改进BP神经网络的样本分类方法[J].自动化与仪器仪表,2016,0(6):237-239. 被引量：6
2洪月华.一种基于蚁群算法与粗糙集的混合BP神经网络[J].微电子学与计算机,2014,31(4):156-159. 被引量：8
3范伟,方勇华,荀毓龙.模拟退火法用于气体红外光谱数据的识别分类[J].量子电子学报,2002,19(4):314-317. 被引量：1
4田津,李敏强,陈富赞.基于三阶段RBFNN学习算法的复杂样本分类研究[J].系统工程与电子技术,2006,28(1):114-118. 被引量：2
5田津,李敏强,陈富赞.复杂样本分类的GA-RBFNN方法[J].系统工程学报,2006,21(2):163-170. 被引量：7
6孟雅俊,黄士涛,姬中华.改进的RBF网络训练方法在故障诊断中的应用[J].郑州大学学报（工学版）,2005,26(4):89-92.
7丁晖,刘君华,申忠如.基于分布式多子网神经网络的传感器静态误差修正[J].计量学报,2001,22(3):196-200.
8张愉,齐美星,童敏明.基于分布式多子网神经网络的可燃气体分析[J].传感器与微系统,2009,28(11):16-18.

系统工程与电子技术

2011年第11期

浏览历史

内容加载中请稍等...

基于决策树的快速SVM分类方法被引量：11

参考文献16

二级参考文献30

共引文献51

同被引文献81

引证文献11

二级引证文献56

相关作者

相关机构

相关主题

浏览历史

基于决策树的快速SVM分类方法 被引量：11

参考文献16

二级参考文献30

共引文献51

同被引文献81

引证文献11

二级引证文献56

相关作者

相关机构

相关主题

浏览历史

基于决策树的快速SVM分类方法被引量：11