近亲结点图编辑的Self-Training算法被引量：1

Self-Training Algorithm with Editing Direct Relative Node Graph

下载PDF

导出

摘要 Self-Training算法的性能很大程度上取决于高置信度样本的识别准确度。受DPC算法启发,利用密度峰值定义样本间的原型关系,并构造出近亲结点图这一新型数据结构。在此基础上,提出了一种近亲结点图编辑的Self Training算法(self-training algorithm with editing direct relative node graph-DRNG)。DRNG采用假设检验的方法选择高置信度样本,将其加入有标签样本集进行迭代训练。因误分的高密度样本点对Self-Training算法的分类性能影响较大,所以,DRNG综合考虑距离和密度两个方面定义了近亲结点图中割边的非对称权重,增大了高密度点的割边权重,使其落在拒绝域外的概率增加,减小了因其误分类而产生的风险。为了验证DRNG的性能,在8个基准数据集上与类似算法进行对比实验,实验结果验证了DRNG的有效性。 The performance of Self-Training algorithm largely depends on recognition accuracy of high-confidence sam-ples.Inspired by the DPC algorithm,it defines the prototype relationship between samples by density peak and constructs a new data structure named direct relative node graph.On this basis,a novel self-training algorithm with editing direct rel-ative node graph(DRNG)is proposed.DRNG employs a hypothesis test method to select high-confidence samples,and then adds them to the labeled sample set for iterative training.Because misclassified high-density sample points have a greater impact on the classification performance of the Self-Training algorithm,DRNG considers both distance and density to define the asymmetric weight of the cut edge in the direct relative node graph,which increases the cut edge weight of high-density points and the probability of high-density points falling outside the rejection domain.As a consequence,DRNG reduces the risk of high-density points being misclassified.To verify the performance of the DRNG,comparative experiments are carried out with 4 state-of-the-art algorithms on 8 benchmark datasets.The experimental results verify the effectiveness of the DRNG.

作者刘学文王继奎杨正国易纪海李冰聂飞平 LIU Xuewen;WANG Jikui;YANG Zhengguo;YI Jihai;LI Bing;NIE Feiping(School of Information Engineering,Lanzhou University of Finance and Economics,Lanzhou 730020,China;School of Computer Science,Center for Optical Imagery Analysis and Learning(OPTIMAL),Northwestern Polytechnical University,Xi’an 710072,China)

机构地区兰州财经大学信息工程学院西北工业大学计算机学院

出处《计算机工程与应用》 CSCD 北大核心 2022年第14期144-152,共9页 Computer Engineering and Applications

基金国家自然科学基金面上项目(61772427) 国家自然科学基金青年基金项目(11801345) 甘肃省高等学校创新能力提升项目(2021B-145) 甘肃省自然科学基金(21JR11RA132) 兰州财经大学科研项目(Lzufe2020B-011)。

关键词近亲结点图半监督分类密度峰值自训练 direct relative node graph semi-supervised classification density peak self-training

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献14

1尚耐丽,王骁力,沈鹍霄,卢玉领,马晓普,兰义华.半监督分类方法的研究[J].计算机应用与软件,2015,32(11):162-166. 被引量：4
2罗云松,吕佳.结合密度峰值优化模糊聚类的自训练方法[J].重庆师范大学学报（自然科学版）,2019,36(2):94-100. 被引量：8
3艾震鹏,王振友.基于数据密度的半监督自训练分类算法[J].计算机应用研究,2019,36(4):1072-1074. 被引量：8
4马茂源,吕佳.结合相似度的朴素贝叶斯半监督自训练方法[J].重庆师范大学学报（自然科学版）,2019,36(1):78-84. 被引量：3
5黎隽男,吕佳.基于近邻密度和半监督KNN的集成自训练方法[J].计算机工程与应用,2018,54(20):132-138. 被引量：2
6黎隽男,吕佳.结合主动学习与置信度投票的集成自训练方法[J].计算机工程与应用,2016,52(20):167-171. 被引量：8
7何丽,刘颖,韩克平.噪声标注下的改进TSVM学习算法[J].计算机工程与应用,2019,55(17):44-50. 被引量：2
8马蕾,汪西莉.基于支持向量机协同训练的半监督回归[J].计算机工程与应用,2011,47(3):177-180. 被引量：13
9龚彦鹭,吕佳.结合主动学习和密度峰值聚类的协同训练算法[J].计算机应用,2019,39(8):2297-2301. 被引量：10
10龚彦鹭,吕佳.结合半监督聚类和加权KNN的协同训练方法[J].计算机工程与应用,2019,55(22):114-118. 被引量：8

二级参考文献91

1任洪娥,霍满冬.基于PSO优化的SVM预测应用研究[J].计算机应用研究,2009,26(3):867-869. 被引量：32
2赵卓翔,王轶彤,田家堂,周泽学.社会网络中基于标签传播的社区发现新算法[J].计算机研究与发展,2011,48(S3):8-15. 被引量：37
3陈慧鹏,杨亮亮,李鸿,周云飞.模糊集识别法在纸币清分中的应用研究[J].机床与液压,2005,33(6):167-169. 被引量：2
4吴青,刘三阳,郑巍.基于乘性规则的支持向量机[J].智能系统学报,2007,2(2):74-77. 被引量：3
5边肇棋,张学工.模式识别[M].北京:清华大学出版社,2000.
6Lerner V.Pattern recognition using generalized portrait method[J].Automation and Remote Control,1963,24:774-780.
7Gunn S R.Support vector machines for classification and regression[D].University of Southampton,1997.
8Nigam K,Ghani R.Analyzing the effectiveness and applicability of co-training[C]//Proceedings of the 2000 ACM CIKM,McLean,US,2000:86-93.
9Zhou Z H,Wu J,Tang W.Ensembling neural networks:Many could be better than all[J].Artificial Intelligence,2002,137(1/2):239-263.
10Tsang I W,Kwok J T.Large-scale sparsified manifold regularization[C]//Proceedings of the Conference on The Neural Information Processing Systems,Vanconver,Canada,2006.

共引文献92

1李善寿,方潜生.基于FPGA和CIS的人民币图像采集系统设计[J].传感器与微系统,2010,29(10):97-99. 被引量：6
2尹惠玲.基于一维傅里叶变换特征提取的纸币识别[J].计算机与现代化,2011(7):34-35. 被引量：2
3肖军,肖本贤,陶运超,赵梅玲.基于FPGA和CIS的纸币图像采集及5/3提升小波图像处理方法[J].合肥工业大学学报（自然科学版）,2011,34(8):1160-1164. 被引量：2
4马蕾.粒子群算法支持向量机的半监督回归[J].电子科技,2013,26(9):10-13. 被引量：1
5刘习文,薛家祥.纸币接触式传感器图像模糊增强与边界检测[J].科学技术与工程,2013,21(34):10381-10385. 被引量：2
6刘习文,薛家祥.纸币图像Gabor特征提取与识别[J].光学与光电技术,2014,12(3):5-8. 被引量：4
7马茂源,吕佳.结合相似度的朴素贝叶斯半监督自训练方法[J].重庆师范大学学报（自然科学版）,2019,36(1):78-84. 被引量：3
8刘建伟,刘媛,罗雄麟.半监督学习方法[J].计算机学报,2015,38(8):1592-1617. 被引量：134
9刘艳萍,杜秋晨,张进东.基于BP神经网络的纸币面向识别方法[J].计算机应用与软件,2015,32(11):176-179. 被引量：5
10赵阳阳,刘纪平,杨毅,石丽红,王梅.一种协同时空地理加权回归PM2.5浓度估算方法[J].测绘科学,2016,41(12):172-178. 被引量：7

同被引文献11

1吕佳,刘强,李帅军.结合密度峰值和改进自然邻居的自训练算法[J].南京大学学报（自然科学版）,2022,58(5):805-815. 被引量：2
2张亮,宁芊.CART决策树的两种改进及应用[J].计算机工程与设计,2015,36(5):1209-1213. 被引量：57
3曹卫东,许志香,王静.基于深度生成模型的半监督入侵检测算法[J].计算机科学,2019,46(3):197-201. 被引量：10
4龚彦鹭,吕佳.结合主动学习和密度峰值聚类的协同训练算法[J].计算机应用,2019,39(8):2297-2301. 被引量：10
5卫丹妮,杨有龙,仇海全.结合密度峰值和切边权值的自训练算法[J].计算机工程与应用,2021,57(2):70-76. 被引量：4
6李福祥,王雪,张驰,周明.基于边界点的支持向量机分类算法[J].陕西理工大学学报（自然科学版）,2022,38(3):30-38. 被引量：23
7李帅军,吕佳.结合合成实例与adaboostENN密度峰值自训练算法[J].重庆师范大学学报（自然科学版）,2022,39(4):105-113. 被引量：1
8刘学文,王继奎,杨正国,李冰,聂飞平.密度峰值隶属度优化的半监督Self-Training算法[J].计算机科学与探索,2022,16(9):2078-2088. 被引量：2
9徐鑫,曹原.基于加权直觉模糊兰氏距离的密度峰值聚类算法[J].陕西师范大学学报（自然科学版）,2023,51(1):101-110. 被引量：5
10吴强.基于局部均值k近邻和密度峰值的实例约简[J].统计与决策,2022(24):10-16. 被引量：2

引证文献1

1韩运龙,尚庆生,赵薇,郭泓.结合密度峰值和集成过滤器的自训练算法[J].宜宾学院学报,2024,24(6):15-20.

1Wenxuan Zhang,Zhanpeng Liu,Jing Xia,Feng Li,Wenzhi He,Guangming Li,Juwen Huang.Preparing graphene from anode graphite of spent lithium-ion batteries[J].Frontiers of Environmental Science & Engineering,2017,11(5):77-84. 被引量：8
2张青显.野生遗传基因种质资源在小麦育种中的应用及遗传特征[J].农业科技通讯,2022(7):183-184. 被引量：2
3吴军,王理,刘肖,廖京京,王辉.Ti-2Al-2.5Zr单道次皮尔格轧制过程中显微组织和织构的演化(英文)[J].稀有金属材料与工程,2022,51(4):1145-1151. 被引量：2
4Isaac Baffour Senkyire,Zhe Liu.Supervised and Semi-supervised Methods for Abdominal Organ Segmentation: A Review[J].International Journal of Automation and computing,2021,18(6):887-914. 被引量：3
5葛丽娜,陈园园,周永权.密度峰值聚类算法研究现状与分析[J].广西科学,2022,29(2):277-286. 被引量：1
6缅甸琥珀中发现亿万年前萤火虫[J].科学大观园,2022(13):70-71.
7法国血统的潘帕斯雄鹰--阿根廷空军"幻影"/"短剑"的列装与备战[J].兵器,2022(8):60-64.
8Jia-Lin Yang,Xin-Xin Zhao,Wen-Hao Li,Hao-Jie Liang,Zhen-Yi Gu,Yan Liu,Miao Du,Xing-Long Wu.Advanced cathode for dual-ion batteries: Waste-to-wealth reuse of spent graphite from lithium-ion batteries[J].eScience,2022,2(1):95-101. 被引量：6
9Junhao GUO,Zhijian JI,Yungang LIU.Sufficient conditions and limitations of equivalent partition in multiagent controllability[J].Science China(Information Sciences),2022,65(3):148-162. 被引量：2

计算机工程与应用

2022年第14期

浏览历史

内容加载中请稍等...

近亲结点图编辑的Self-Training算法被引量：1

参考文献14

二级参考文献91

共引文献92

同被引文献11

引证文献1

相关作者

相关机构

相关主题

浏览历史

近亲结点图编辑的Self-Training算法 被引量：1

参考文献14

二级参考文献91

共引文献92

同被引文献11

引证文献1

相关作者

相关机构

相关主题

浏览历史

近亲结点图编辑的Self-Training算法被引量：1