一种优选神经网络训练样本的混合聚类算法被引量：2

Combined Clustering Algorithm for Neural Network Training Data Sample Selection

下载PDF

导出

摘要神经网络训练集中含有大量相似样本不但增加了网络的训练时间还对网络泛化能力存在较大影响,合理的选择样本集训练神经网络模型影响着建模的效率。根据实际应用中神经网络学习样本具有的内在特征和规律性,提出了一种基于自组织映射(SOM)神经网络的K-均值聚类算法优选神经网络样本,算法的主要思想是通过对样本数据的聚类分析,剔除孤立样本后挑选出具有代表性的样本训练神经网络。实验结果表明,相对随机选择法而言,本算法能够有效地减少训练样本的数目,提高建模效率。 The neural network training set containing lots of similar samples not only increases the training time but also reduces the network＇s generalization performance.Rational selections of training sample to train the neural network affect the efficiency of modeling.According to neural network training samples in the actual application embodying inherent characteristic and regularity,a hybrid algorithm of self-organization map（SOM） neural network,combined with K-means clustering algorithm was proposed to select training data.By clustering analysis of sample data,isolated samples were removed and representative samples were selected to train the neural network.The experiment results expatiate that the algorithm is better than random selection method on reducing the number of training samples effectively and improves the modeling efficiency.

作者王艳峰张健吴燕红

机构地区辽宁工业大学电气工程学院

出处《辽宁工业大学学报（自然科学版）》 2010年第6期364-367,共4页 Journal of Liaoning University of Technology(Natural Science Edition)

基金辽宁省教育厅重点实验室项目(2009S054)

关键词 SOM网络聚类神经网络样本选择 SOM network clustering neural network sample selection

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献10

1Philip N S,St Thomas Coll.what is there in a training sample[C].world congress on Nature & Biologically Inspired Computing,Coimbatore,2009:1507-1511.
2Donghai Guan,Weiwei Yuan,Young-Koo Lee.Training data selection based on fuzzy c-means[C].IEEE World Congress on Computational Intelligence,Hong Kong,2008:761-765.
3Hara K,Nakayama K,Karaf.A training data selection in on-line training for multilayer neural networks[C].IEEE World Congress on Computational Intelligence,vol.3,1998:2247-2252.
4申金媛,刘玥,张文伟,陈戍,郭鹏毅,宋庄,张延炘.利用汉明距离优选神经网络学习样本[J].光学学报,2000,20(9):1229-1234. 被引量：5
5任俊玲.基于广义置信度的样本选择算法[J].中文信息学报,2007,21(3):106-110. 被引量：4
6Kohonen T.The self-organization map[J].Proceedings of the IEEE,1990,78(9):1464-1480.
7陈金山,韦岗.遗传+模糊C-均值混合聚类算法[J].电子与信息学报,2002,24(2):210-215. 被引量：23
8杨广全,朱昌明,王向红,涂治国.基于粒子群K均值聚类算法的电梯交通模式识别[J].控制与决策,2007,22(10):1139-1142. 被引量：11
9马翔,陈新楚,王劭伯.均匀设计法在RBF神经网络样本优选中的应用[J].模式识别与人工智能,2005,18(2):252-255. 被引量：7
10刘立平,孟志青.一种选取初始聚类中心的方法[J].计算机工程与应用,2004,40(8):179-180. 被引量：19

二级参考文献41

1李爱国.多粒子群协同优化算法[J].复旦学报（自然科学版）,2004,43(5):923-925. 被引量：398
2张鸿宾.训练多层网络的样本数问题[J].自动化学报,1993,19(1):71-77. 被引量：23
3刘靖明,韩丽川,侯立文.基于粒子群的K均值聚类算法[J].系统工程理论与实践,2005,25(6):54-58. 被引量：122
4许玉格,罗飞.新型电梯群控系统交通模式识别方法[J].控制理论与应用,2005,22(6):900-904. 被引量：12
5张友民,李庆国,戴冠中,张洪才.一种RBF网络结构优化方法[J].控制与决策,1996,11(6):667-671. 被引量：24
6张青富李乃奎等.遗传算法＋正交设计：一种新的全局优化算法.第4届中国人工智能联合学术会议论文集[M].北京:清华大学出版社,1996.127-133.
7[加]韩家炜坎伯著范明等译.数据挖掘[M].,2001-08..
8胡飞，神经网络理论与应用研究，1996年，520页
9黄德双，神经网络理论与应用研究，1996年，62页
10何振亚，神经智能.认知科学的若干前沿问题研究，1996年，58页

共引文献62

1周丹,蔡坤宝.基于短时傅立叶变换的脉象信号的模式识别方法[J].重庆科技学院学报（自然科学版）,2007,9(3):49-52. 被引量：6
2吕一河,傅伯杰,陈利顶.汶川县生物多样性保育与区域发展的综合地域划分[J].地理研究,2004,23(4):504-512. 被引量：4
3马翔,陈新楚,王劭伯.均匀设计法在RBF神经网络样本优选中的应用[J].模式识别与人工智能,2005,18(2):252-255. 被引量：7
4姚新芳,张建设,范瑞华,骆晋晔.以快速房颤为主要表现的甲亢1例误诊分析[J].山西职工医学院学报,2005,15(2):75-75.
5张玉英,孟海东.数据挖掘技术中聚类算法的改进研究[J].包头钢铁学院学报,2005,24(4):338-341. 被引量：4
6杨占华,杨燕.一种基于SOM和K-means的文档聚类算法[J].计算机应用研究,2006,23(5):73-74. 被引量：16
7金民锁,朱单,王培雷.基于遗传的改进模糊C均值入侵检测方法[J].黑龙江科技学院学报,2006,16(3):197-200. 被引量：1
8刘霞,洪飞龙.遗传模糊C均值算法在入侵检测中的应用[J].信息安全与通信保密,2006,28(7):111-113. 被引量：4
9孟海东,张玉英.基于密度和对象方向聚类算法的改进[J].计算机工程与应用,2006,42(20):154-156. 被引量：14
10林琳,王树勋.基于遗传-模糊聚类的说话人识别方法及其仿真研究[J].系统仿真学报,2006,18(8):2338-2341. 被引量：13

同被引文献14

1肖化昆.系统仿真中任意概率分布的伪随机数研究[J].计算机工程与设计,2005,26(1):168-171. 被引量：31
2Andreas Arning.A Linear Method for Deviation Detection inLarge Database[J].IBM German Software Development Lab,1996.
3王晓峰.Web应用入侵异常检测新技术研究[D].华中科技大学博士论文,2007.
4Pang Ning Tan.Michael Steinbach[M].Introduction to DataMining,2011:38-39.
5Vladimir N.Vapnic,Statistic Learning Theory[M].Beijing:Publishing House of Electronics Industry,2004.
6张浥楠,郭平.用决策树方法优化表决器[J].电脑开发与应用,2010,23(2):1-3. 被引量：1
7郭小英,何东健.人工神经网络在农村土地利用分类中的应用[J].农机化研究,2011,33(1):190-194. 被引量：3
8杨希,王鹏.基于BP神经网络的高分辨率遥感影像分类[J].测绘,2011,34(3):115-118. 被引量：4
9林治,张璇.粗糙集理论的应用探析[J].邢台职业技术学院学报,2011,28(3):61-63. 被引量：2
10闫少华,张巍,滕少华.基于密度的离群点挖掘在入侵检测中的应用[J].计算机工程,2011,37(18):240-242. 被引量：5

引证文献2

1苗泽林,朱荆州.基于异常检测的NVP表决器[J].计算机与数字工程,2012,40(3):77-78.
2陈诗佳,何贞铭,马海兵,李娜.基于神经网络的山区土地利用信息提取研究[J].测绘地理信息,2018,43(3):99-102. 被引量：3

二级引证文献3

1黄铭,李威,汤琢,陈泽怡,孙炎,陈奕云.基于多元遥感数据与人工智能的自然资源资产审计系统[J].测绘地理信息,2020,45(5):97-100. 被引量：7
2戚瀚文,花向红,吴冲,李琪琪.一种基于神经网络快速检测震后坍塌房屋的方法[J].测绘地理信息,2022,47(2):77-81. 被引量：2
3曾鹏,喻宏伟,余雅滢,刘明勇,郑果,黄亮.基于双层组合神经网络的土地利用自动分类方法[J].测绘地理信息,2023,48(5):98-103. 被引量：1

1颜俊华,张敏,王永军.基于遗传算法的智能粒子群优化方法[J].西南大学学报（自然科学版）,2010,32(11):135-139. 被引量：6
2宋申民,宋卓异.基于蚁群算法的模糊控制规则的过滤简化[J].计算机仿真,2006,23(3):157-163. 被引量：2
3秦飞,杨燕.寻找相似样本的小样本半监督学习[J].计算机工程与科学,2010,32(9):127-129.
4薛富强,葛临东,吴月娴.基于动态自适应遗传算法的调制信号特征选择[J].计算机应用,2007,27(9):2270-2272.
5周志艳,周学成,罗锡文,李庆.基于Matlab的根系断层图像分割处理算法[J].农业机械学报,2006,37(12):118-121. 被引量：3
6代劲,何中市,胡峰.基于云模型的连续属性决策表简化算法[J].南京大学学报（自然科学版）,2009,45(5):638-644. 被引量：5
7刘苒苒,武小平,韦超,孔泽伦.一种基于非局部思想的改进图像降噪算法[J].计算机应用研究,2016,33(4):1277-1280. 被引量：5
8何磊,苏松志,李绍滋.单摄像头下基于样本学习的人体深度估计[J].智能系统学报,2014,9(2):161-167. 被引量：1
9邱桃荣,段文影,段隆振,白小明.一种基于粗糙集属性重要度和密度聚集的匿名化方法[J].南昌大学学报（工科版）,2013,35(3):297-302. 被引量：1
10张莉,卢星凝,夏佩佩.基于一类支持向量机的快速人脸相似性学习[J].浙江师范大学学报（自然科学版）,2015,38(1):67-72.

辽宁工业大学学报（自然科学版）

2010年第6期

浏览历史

内容加载中请稍等...

一种优选神经网络训练样本的混合聚类算法被引量：2

参考文献10

二级参考文献41

共引文献62

同被引文献14

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

一种优选神经网络训练样本的混合聚类算法 被引量：2

参考文献10

二级参考文献41

共引文献62

同被引文献14

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

一种优选神经网络训练样本的混合聚类算法被引量：2