基于层次K-均值聚类的支持向量机模型被引量：1

A SUPPORT VECTOR MACHINE MODEL BASED ON HIERARCHICAL K-MEANS CLUSTERING

下载PDF

导出

摘要针对支持向量机SVM分类效率低下的问题,提出一种基于层次K-均值聚类的支持向量机HKSVM(Hierarchical K-means SVM)学习模型。该方法首先对每类样本分别进行K-均值聚类,计算每类中心并训练SVM,得到初始分类器;然后根据超平面与聚类结果的关系,将聚类所得结果划分为活动类集和静止类集,并对超平面附近的活动类集进行深层聚类,以得到更小的类别同时计算类中心来训练新的SVM模型,并校正分类超平面,如此循环往复,直到得到较为精确的分类器为止。采用基于层次K-均值聚类的SVM模型,通过对活动类集进行不断地深层次聚类,从而在分类超平面附近得到较多样本点,而在距离超平面较远处则取少量训练样本,以有效压缩训练集规模,在保持SVM训练精度的同时大幅度提高其学习效率。标准数据集上的实验结果表明,HKSVM方法在大规模数据集上同时得到了较高的分类效率和测试精度。 This paper presents an improved SVM learning model,it is based on hierarchical k-means clustering and is called as hierarchical k-means SVM（ HKSVM）,to solve the problem of SVM in low classification efficiency. The method first makes k-means clustering on every sample class respectively and calculates the centre of each class as well as trains SVM to get initial classifier; then it divides the clustering result into active class set and static class set according to the relationship between the hyperplane and the clustering result,and conducts deeper clustering on the active sets near to the hyperplane for obtaining even smaller classes,and calculates at the same time the class centres to train new SVM model,and corrects the classified hyperplane. This process is on ad infinitum until the more precise classifier is obtained. Adopting hierarchical k-means clustering-based SVM model and by incessant deep clustering on active class sets,more sample points are obtained near the classified hyperplane; however,in where farther from the hyperplane,the extracted training samples are not much so as to effectively compress the size of the training set,and significantly improve SVM＇s learning efficiency while keeping its training precision. The experimental results on UCI benchmark datasets demonstrate that the proposed HKSVM model achieves higher classification efficiency and testing accuracy simultaneously on large-scale dataset.

作者王秀华秦振吉

机构地区晋中学院计算机学院

出处《计算机应用与软件》 CSCD 北大核心 2014年第5期172-176,共5页 Computer Applications and Software

关键词层次K-均值聚类支持向量机 HKSVM模型活动类集静止类集 Hierarchical k-means clustering Support vector machine（SVM） HKSVM model Active class set Static class set

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献13

1IDC研究报告[DB/OL].2011-06.http://storage.chinabyte.com/163/12110163.shtml.
2李航.统计学习方法[M].清华大学出版社,2012.
3Vapnik V N.The nature of statistical learning theory [ M ].Berlin:Springer-Verlag,1995.
4吴东洋,业巧林,业宁,张训华,武波.一种SVM训练样本集寻优算法[J].计算机应用与软件,2010,27(9):14-16. 被引量：5
5Zhang X G.Using class-center vectors to build support vector machines [ C]//Proceedings of 1999 IEEE Signal Processing Society Workshop on Neural Networks for Signal Processing,Madison,WI,USA,1999,4:3-11.
6Katagiri S,Abe S.Incremental training of support vector machines using hyperspheres [J]Pattern Recognition Letters,2006,27(13):1495-1507.
7Ossua E,Freund R,Girosi F.Training support vector machines:An ap-plication to face detection[ C ]//Proceedings of 1997 IEEE Computer Society on Computer Vision and Pattern Recognition,Puerto Rico,1997:130-136.
8Friel3 T T,Cristianini N,Campbell C.The kernel-adatron algorithm:A fast and simple learning procedure for support vector machines [ C ]//International Conference of Machine Learning,1998:188-196.
9李建民,张钹,林福宗.序贯最小优化的改进算法[J].软件学报,2003,14(5):918-924. 被引量：30
10Tsang I W,Kwok J T,Cheung P M.Core vector machines:fast SVM training on very large data sets [ J ].Journal of Machine Learning Re-search,2005,6:363-392.

二级参考文献22

1余小鹏,周德翼.一种自适应k-最近邻算法的研究[J].计算机应用研究,2006,23(2):70-72. 被引量：16
2李琳,张晓龙.基于RBF核的SVM学习算法的优化计算[J].计算机工程与应用,2006,42(29):190-192. 被引量：41
3Vapnik V N.The Nature of Statistical Learning Theory[M].New York:Springer-Verlag,1995.
4Cherkassky V,Mulier F.Learning from Data:Concept,Theory and Method.NY:JohnViley&sons,1997.
5Richard O Duda,Peter E Hart,David G Stork.Pattern Classification[M].Znd ed.2003.
6Vaseghi S.State duration modeling in hidden Markov models.Signal Processing,1995,41:31-41.
7Guan D,Yuan W,tee Y K,et al.Nearest neighbor editing aided by unlabeled data[J].Information Sciences,2009,179(13):2273-2282.
8Wang J,Neskovic P,Cooper L N.Improving nearest neighbor rule with a simple adaptive distance measure[J].Pattern Recognition Letters,2007,28(2):207-213.
9Jahromi M Z,Parvinnia E,John R.A method of learning weighted similarity function to improve the performance of nearest neighbor[J].Information Sciences,2009,179(17):2964-2973.
10Krishma K,Murty M N.Genetic K-means algorithm[J].IEEE Trans on System,Man,and Cybernetics:Part B,1999,5(1):96-100.

共引文献42

1胡懋智,古红英.各种不同类型的支持向量机及其性能比较分析[J].计算机工程与应用,2005,41(12):37-40. 被引量：8
2纪华,郑璐石.支持向量机及其在岩土工程中的应用[J].宁夏工程技术,2005,4(2):160-164. 被引量：4
3杜晓东,李岐强.支持向量机及其算法研究[J].信息技术与信息化,2005(3):37-40. 被引量：13
4业宁,孙瑞祥,董逸生.MLSVM4——一种多乘子协同优化的SVM快速学习算法[J].计算机研究与发展,2005,42(9):1467-1471. 被引量：3
5杨晓伟,骆世广,余舒,吴春国,梁艳春.基于支持向量机的大样本回归算法比较研究[J].计算机工程与应用,2006,42(6):36-38. 被引量：3
6业宁,孙瑞祥,董逸生.多拉格朗日乘子协同优化的SVM快速学习算法研究[J].计算机研究与发展,2006,43(3):442-448. 被引量：2
7杨晓伟,欧阳柏平,余舒,吴春国,梁艳春.自适应迭代算法支持向量集的特性研究[J].吉林大学学报（信息科学版）,2006,24(2):153-157. 被引量：4
8张浩然,汪晓东,张长江,徐秀玲.一种新型回归支持向量机的学习算法[J].测试技术学报,2006,20(2):168-173. 被引量：7
9艾青,刘洋,秦玉平.支持向量训练算法研究[J].渤海大学学报（自然科学版）,2006,27(3):266-268. 被引量：4
10开心豆.新音乐主义索尼爱立信W950i超前试用[J].数字通信,2006,33(21):82-85.

同被引文献9

1张琳,陈燕,汲业,张金松.一种基于密度的K-means算法研究[J].计算机应用研究,2011,28(11):4071-4073. 被引量：43
2谢娟英,王艳娥.最小方差优化初始聚类中心的K-means算法[J].计算机工程,2014,40(8):205-211. 被引量：86
3王学贺.一种基于改进微粒群和轮廓系数的划分聚类方法[J].云南民族大学学报（自然科学版）,2016,25(4):367-371. 被引量：13
4王宏杰,师彦文.结合初始中心优化和特征加权的K-Means聚类算法[J].计算机科学,2017,44(B11):457-459. 被引量：19
5蒋林利,吴建生.层次K-均值聚类结合改进ITML的迁移度量学习方法[J].计算机应用研究,2017,34(12):3552-3555. 被引量：1
6陈逸斐,虞慧群.xk-split:基于k-medoids的分裂式聚类算法[J].华东理工大学学报（自然科学版）,2017,43(6):849-854. 被引量：2
7蒋丽,薛善良.优化初始聚类中心及确定K值的K-means算法[J].计算机与数字工程,2018,46(1):21-24. 被引量：26
8刘建生,吴斌,章泽煜.基于相关性加权的K-means算法[J].江西理工大学学报,2018,39(1):87-92. 被引量：6
9王兆丰,单甘霖.一种基于k-均值的DBSCAN算法参数动态选择方法[J].计算机工程与应用,2017,53(3):80-86. 被引量：23

引证文献1

1包志强,赵媛媛,胡啸天,赵研.一种对孤立点不敏感的新的K-Means聚类算法[J].现代电子技术,2020,43(5):109-112. 被引量：5

二级引证文献5

1肖韵菲,黄捷,孙冠宇,高希龙,陈建国,文婷婷,文剑.基于无监督机器学习的核电厂支吊架智能布置研究[J].电子技术（上海）,2021,50(1):58-61. 被引量：2
2顾明星,黄伟建,黄远,生龙,申超,张梦甜.结合用户聚类与改进用户相似性的协同过滤推荐[J].计算机工程与应用,2020,56(22):185-190. 被引量：20
3张玉西,苏小会,高广棵,尚煜.改进主成分和K-均值聚类算法的行驶工况[J].科学技术与工程,2021,21(8):3199-3205. 被引量：3
4田浩.自动调优技术在智慧校园数据库的应用与优化[J].湖南邮电职业技术学院学报,2021,20(4):26-29. 被引量：2
5徐凡然.基于聚类分析法的广东省区域科技竞争力的评价[J].统计学与应用,2022,11(1):76-85.

1卢苇,彭雅.几种常用文本分类算法性能比较与分析[J].湖南大学学报（自然科学版）,2007,34(6):67-69. 被引量：31
2秦玉平,艾青,刘卫江.一种快速加权支持向量机训练算法[J].计算机应用研究,2007,24(7):32-34.
3钱强,庞林斌,高尚.一种基于改进型KNN算法的文本分类方法[J].江苏科技大学学报（自然科学版）,2013,27(4):381-385. 被引量：3
4郑晓星,吴今培.基于支持向量数据描述的数据约简[J].现代电子技术,2007,30(2):74-76. 被引量：6
5杨旭瑜,张铮,张为华.深度学习加速技术研究[J].计算机系统应用,2016,25(9):1-9. 被引量：4
6田飞,于威威.支持向量机与K-均值聚类融合算法的研究[J].现代计算机（中旬刊）,2016(7):35-38.
7廖慧惠,马宁.基于神经网络集成的模式识别研究[J].数字技术与应用,2011,29(5):118-118.
8金珠,马小平.基于蚁群聚类算法的SVM半监督式训练方法[J].西华大学学报（自然科学版）,2011,30(1):56-60. 被引量：3
9雷军程,黄同成,柳小文.一种基于权重的文本特征选择方法[J].计算机科学,2012,39(7):250-252. 被引量：8
10孙奕捷,申功璋.飞行器多学科设计优化中迭代更新的近似模型生成方法[J].航天控制,2009,27(5):58-64. 被引量：1

计算机应用与软件

2014年第5期

浏览历史

内容加载中请稍等...

基于层次K-均值聚类的支持向量机模型被引量：1

参考文献13

二级参考文献22

共引文献42

同被引文献9

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于层次K-均值聚类的支持向量机模型 被引量：1

参考文献13

二级参考文献22

共引文献42

同被引文献9

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于层次K-均值聚类的支持向量机模型被引量：1