NCA降维和贝叶斯优化调参对分类模型的改进被引量：14

IMPROVEMENT OF CLASSIFICATION MODEL BY NCA DIMENSION REDUCTION AND BAYESIAN OPTIMIZATION PARAMETER ADJUSTMENT

下载PDF

导出

摘要高校贫困生的贫困程度判定可以归属于构建分类模型对样本数据进行训练。但单个分类模型的精准度要取决于处理样本数据的大小和类型复杂度,在模型速度和准确性之间不易取舍。集成多个分类算法可以避免单个分类算法的过拟合。通过邻域分量分析(Neighborhood Component Analysis,NCA)进行特征降维降低初始分类模型的计算成本,对误判损失引入一个成本函数进行惩罚的同时采用贝叶斯优化进行超参数调优。结果表明,改进后的分类模型泛化能力得到明显提升。计算时间成本降低的同时,误判率由初始的8%下降到5%,模型的准确率提升了近4%。 Poverty levels of poor students in the university can be attributed to build a classification model of training sample data.But the model of a single classification accuracy depends on the size of the sample data and types of complexity,and it is difficult to choose between the speed and accuracy of the model.Integrating multiple classification algorithm can avoid a single classification algorithm of fitting.Through the neighborhood component analysis (NCA) for feature dimension reduction,we reduced initial classification model of calculating cost.For misjudgment loss,we introduced a cost function to punish and used bayesian optimization to super parameter tuning simultaneously.The results show that the generalization ability of improved classification model is improved significantly.At the same time,the computation time cost decreases,misjudgment rate decreases from 8% to 5%,and the accuracy of the model increases by nearly 4%.

作者李斌王卫星 Li Bin;Wang Weixing(Modern Education Technology Center,College of Applied Engineering,Henan University of Science and Technology,Sanmenxia 472000,Henan,China)

机构地区河南科技大学应用工程学院现代教育技术中心

出处《计算机应用与软件》北大核心 2019年第8期281-287,299,共8页 Computer Applications and Software

基金河南省2017年高等教育教学改革研究与实践项目(2017SJGLX636)

关键词分类算法领域分量分析贝叶斯调优 MATLAB 贫困生判别 Classification algorithm Neighborhood component analysis(NCA) Bayesian tuning MATLAB Poor student discriminant

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献11

1李明江,卢玉,刘彦.一种基于C4.5决策树的贵州省高校贫困生评定方法[J].科技通报,2013,29(8):223-224. 被引量：7
2陈晓,王树宝,李建晶,张准.基于加权约束的决策树方法在贫困生认定中的应用研究[J].计算机应用与软件,2014,31(12):136-139. 被引量：14
3唐燕,王苹.随机森林算法在中医药院校贫困生认定预测中的应用研究[J].中国医药导报,2017,14(14):164-168. 被引量：6
4王正杰,杨伟丽,王喆,侯玉珊,郭银景.4种分类算法参数选择及分类特点研究[J].计算机与现代化,2018(2):54-60. 被引量：3
5颜会娟,秦杰.基于非线性SVM模型的木马检测方法[J].计算机工程,2011,37(8):121-123. 被引量：5
6咸云浩,张恒德,谢永华,杨乐.多元逐步回归与卡尔曼滤波法在霾预报中应用[J].系统仿真学报,2018,30(4):1482-1489. 被引量：14
7刘丛山,李祥宝,杨煜普.一种基于近邻元分析的文本分类算法[J].计算机工程,2012,38(15):139-141. 被引量：10
8邓帅.基于改进贝叶斯优化算法的CNN超参数优化方法[J].计算机应用研究,2019,36(7):1984-1987. 被引量：34
9崔佳旭,杨博.贝叶斯优化方法和应用综述[J].软件学报,2018,29(10):3068-3090. 被引量：190
10柴慧敏,赵昀瑶,方敏.利用先验正态分布的贝叶斯网络参数学习[J].系统工程与电子技术,2018,40(10):2370-2375. 被引量：15

二级参考文献63

1周琼,李海山.我国高校贫困生资助体系的现状及反思[J].文教资料,2006(11):23-24. 被引量：13
2尹清波,张汝波,李雪耀,王慧强.基于线性预测与马尔可夫模型的入侵检测技术研究[J].计算机学报,2005,28(5):900-907. 被引量：29
3赵正兵.论高校贫困生资助制度的完善[J].当代教育论坛（宏观教育研究）,2006(4):114-116. 被引量：12
4吴兑,毕雪岩,邓雪娇,李菲,谭浩波,廖国莲,黄健.珠江三角洲大气灰霾导致能见度下降问题研究[J].气象学报,2006,64(4):510-517. 被引量：390
5JiaweiHan,MichelineKamber.范明,孟小峰译.数据挖掘:概念与技术[M].北京:机械工业出版社,2007.
6陈友,沈华伟,李洋,程学旗.一种高效的面向轻量级入侵检测系统的特征选择算法[J].计算机学报,2007,30(8):1398-1408. 被引量：46
7于海波.把握安全市场脉搏发展民族安全企业[EB/OL](2008-05-13).http://www.zdnet.com.cn.
8King D, Nguyen H N, Ohn S Y, et al. Fusions of GA and SVM for Anomaly Detection in Intrusion Detection System[C]//Proc. of ISNN'05. [S. l.]: Springer-Verlag, 2005: 415-420.
9曾勇,杨煜普.广义近邻模式分类研究[D].上海:上海交通大学,2009.
10Liu Yang, Jill Rong. Distance Metric Learning: A Comprehensive Survey[EB/OL]. (2006-05-19). http://www.cs.emu.edu/Nliuy/ frame survey_v2.pdf.

共引文献280

1范霄,孔金玲,钟炎伶,蒋镒竹,张静雅.基于XGBoost算法的遥感图像云检测[J].遥感技术与应用,2023,38(1):156-162. 被引量：2
2赵哲耘,刘玉敏,孙静静.基于混合正交试验的卷积神经网络参数优化[J].统计与决策,2021(8):46-50. 被引量：2
3徐畅,丁俊琦,赵聃桐,乔岩,张领先.基于LightGBM和处方数据的番茄病害诊断方法[J].农业机械学报,2022,53(9):286-294. 被引量：5
4黄灿,田冷,王恒力,王嘉新,蒋丽丽.基于条件生成式对抗网络的油藏单井产量预测模型[J].计算物理,2022,39(4):465-478. 被引量：2
5杨杰.改进的支持向量机网络木马病毒检测算法研究[J].科技通报,2012,28(2):39-41. 被引量：6
6毛胜勇,林久军.反刍动物瘤胃真菌及其在饲料工业中的应用前景[J].北京奶牛,2000(1):5-7. 被引量：1
7张朝元,陈丽.基于PCA改进的SOR-LS-SVM旅游流量预测模型[J].科技通报,2013,29(3):100-104. 被引量：1
8黄丽梅,吴丽娟,冼月萍.基于特征选择优化算法的非线性SVM木马检测模型[J].计算机与现代化,2013(10):106-109.
9邸鹏,段利国.一种新型朴素贝叶斯文本分类算法[J].数据采集与处理,2014,29(1):71-75. 被引量：51
10龙钧宇.基于均值聚类和决策树算法的学生成绩分析[J].计算机与现代化,2014(6):79-83. 被引量：13

同被引文献136

1孙泽金,赵荣珍.基于EEMD能量矩与邻域粗糙集的转子故障数据集分类方法[J].计算机应用研究,2020,37(2):460-464. 被引量：5
2王亚舟,严玉婷,陈正强,吴迪.反射镜像法应用于电力设备红外检测的研究[J].高压电器,2020,56(2):202-209. 被引量：3
3姚栋方,吴瀛,罗磊,阎帅,武文广,丁宏.基于深度学习的短期电力负荷预测[J].国外电子测量技术,2020,39(1):44-48. 被引量：18
4张恺.基于WebGis的省级海洋环境监测数据管理系统[J].福建电脑,2006,22(10):120-120. 被引量：4
5方伟,孙俊,谢振平,须文波.量子粒子群优化算法的收敛性分析及控制参数研究[J].物理学报,2010,59(6):3686-3694. 被引量：116
6江德祥,胡明清,陈益强,刘军发,周经野.基于核岭回归的自适应蓝牙定位方法[J].计算机应用研究,2010,27(9):3487-3489. 被引量：24
7许春华,肖作兵,牛云蔚,于海燕.电子鼻和电子舌在果酒风味分析中的应用[J].食品与发酵工业,2011,37(3):163-167. 被引量：40
8陈辉.海洋生物分布有规可循[J].海洋世界,1998(1):20-20. 被引量：1
9陈伟根,奚红娟,苏小平,刘文.广义回归神经网络在变压器绕组热点温度预测中的应用[J].高电压技术,2012,38(1):16-21. 被引量：56
10陶永胜,彭传涛.中国霞多丽干白葡萄酒香气特征与成分关联分析[J].农业机械学报,2012,43(3):130-139. 被引量：80

引证文献14

1王建成,蔡延光.基于多模型融合的工业工件剩余寿命预测[J].自动化与信息工程,2020,41(1):30-38.
2乔淼,张磊,母芳林.基于电子鼻与LightGBM算法判别葡萄酒品种的研究[J].食品与机械,2020,36(5):76-79. 被引量：7
3丁晨旭,张远辉,孙哲涛,刘康.基于FMCW雷达的人体复杂动作识别[J].雷达科学与技术,2020,18(6):584-590. 被引量：13
4龙震宇,王长权,石立红,叶万立,刘洋,李一帆.基于KRR优化算法的油水系统中CO_(2)溶解度模型[J].吉林大学学报（地球科学版）,2022,52(1):194-201. 被引量：1
5程明霞,郭玉翠.基于GA和QPSO同步优化的医学分类模型[J].新型工业化,2021,11(12):125-128. 被引量：1
6严帆,刘晓兰,毛文卉,刘雅琴,秦楠.基于校园卡消费数据的学生经济困难程度的综合评价指标体系的构建[J].电脑知识与技术,2022,18(33):100-103. 被引量：1
7梁玉真,张仕海,汝承印,朱冶诚.海上平台电气温度监控系统及预测模型研究[J].电子测量技术,2022,45(22):162-169. 被引量：2
8黄海艳,韦必忠,戴戬,肖子涵.基于代价敏感的贫困生分类方法[J].桂林理工大学学报,2022,42(4):988-995.
9岳喜超,王勇,陈乐,王超群.结合主成分与熵权的关键变量筛选算法[J].中国电子科学研究院学报,2023,18(7):671-679.
10姜磊,章小卫.基于模糊隶属度邻域覆盖的三支分类决策[J].计算机应用与软件,2024,41(2):271-278.

二级引证文献25

1李梅芳.基于LightGBM的上市公司财务困境预测[J].轻工科技,2021(5):129-130. 被引量：2
2谷虹.如何保护和使用软磁盘[J].商业研究,2000(4):125-126.
3陈通,祁兴普,陈斌,程谦伟,刘萍.基于电子鼻技术的猪肉脯品质判别分析[J].肉类研究,2021,35(2):31-32. 被引量：5
4李潇婧,刘一航,刘朋举,任庆昌,李安桂,杨斌,成孝刚,陈杰.计算机视觉视频图像处理在暖通空调控制信号采集领域的应用[J].暖通空调,2021,51(6):1-12. 被引量：5
5李莎莎.商用低成本FMCW雷达测量小尺寸物体RCS可行性研究[J].弹箭与制导学报,2021,41(3):119-122. 被引量：1
6翟靖宇,陈金立.基于LSTM-Attention的毫米波雷达行人轨迹预测方法[J].中国电子科学研究院学报,2022,17(6):534-541. 被引量：1
7王建伟,叶升.电子鼻在食品行业的应用进展[J].中国调味品,2022,47(10):198-200. 被引量：12
8屈乐乐,张丁元,杨天虹,张丽丽,孙延鹏.基于双流特征融合的FMCW雷达人体连续动作识别[J].雷达科学与技术,2022,20(5):565-572. 被引量：1
9许志猛,张钐钐,陈良琴,孙北晨.基于时空域增强微多普勒谱图的行为识别方法[J].电子测量与仪器学报,2022,36(7):144-151. 被引量：3
10刘靓葳.模型预测控制技术在发动机空燃比控制中的应用研究[J].南方农机,2022,53(22):9-11.

1方娟.新媒体环境下高校贫困生社会主义核心价值观教育探索[J].儿童发展研究,2016(2):36-41.
2赵辉.科学家首次用AI造了一个宇宙无需调参几毫秒生成[J].计算机与网络,2019,45(13):14-14.
3黄丽萍,马倩敏,郭荣鑫,颜峰,林志伟,张敏,史天尧.碱矿渣胶凝材料水化产物特性[J].非金属矿,2019,42(4):34-37. 被引量：3
4徐树东.一刻钟为什么是15分[J].数学小灵通（启智版）（低年级）,2019(6):42-42.
5薛永旭,安宏利,徐凯勃,刘建龙,朱柏青.炼化一体化企业电网大面积停电对蒸汽系统影响研究[J].能源化工,2018,39(5):86-90.
6张华平.基于信号博弈的资源型企业低碳创新财政补贴问题研究[J].郑州轻工业学院学报（社会科学版）,2019,20(2):73-79.
7蔡景雪.高校贫困生的心理健康问题探析[J].锦州医科大学学报（社会科学版）,2019,17(4):59-61. 被引量：3
8罗霄,孙俊.基于栈式自编码器的制冷系统故障诊断[J].中国修船,2019,32(4):38-41. 被引量：1
9崔永香,赵学州,郭冬梅,何启明,杨铭懿,黎文杰.接收机系统交调分量分析[J].数码设计,2018,7(8):11-11.
10李晓霞,程伟丽,张雷,张朝阳.大数据处理中分类算法的数值比较[J].数学的实践与认识,2019,49(13):308-314. 被引量：1

计算机应用与软件

2019年第8期

浏览历史

内容加载中请稍等...

NCA降维和贝叶斯优化调参对分类模型的改进被引量：14

参考文献11

二级参考文献63

共引文献280

同被引文献136

引证文献14

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

NCA降维和贝叶斯优化调参对分类模型的改进 被引量：14

参考文献11

二级参考文献63

共引文献280

同被引文献136

引证文献14

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

NCA降维和贝叶斯优化调参对分类模型的改进被引量：14