期刊文献+

使用PGA的特征选择方法 被引量:1

Feature selection method applicated PGA
下载PDF
导出
摘要 特征选择是文本分类系统的核心步骤之一。然而现有的特征选择方法都是串行化的,应用于中文海量文本数据时时间效率较低,因此利用并行策略来提高特征选择的效率,已经成为研究的热点。详细设计了一个用于特征选择的并行遗传算法,该算法采用遗传算法搜索特征,利用并行策略评价特征子集,即将种群中个体的适应度计算并行在多个计算节点上同时进行,从而较快地获得较具代表性的特征子集。实验结果表明该方法是有效的。 Feature selection is one of the key steps in text classification system.However,most of existing feature selection methods are serial and are inefficient timely to be applied to Chinese massive text data sets,so it is a hotspot how to improve efficiency of feature selection by means of parallel strategy.It detailedly designs a Parallel Genetic Algorithm(PGA) which is used to select features.The algorithm uses genetic algorithm to search features and calculates fitness of feature subsets in multiple computing nodes at the same time,so can acquire quickly feature subsets which are more representative.Experimental results show that the method is effective.
出处 《计算机工程与应用》 CSCD 北大核心 2009年第22期107-110,217,共5页 Computer Engineering and Applications
基金 四川省科技计划项目(No.2008GZ0003) 四川省科技厅科技攻关项目(No.07GG006-014)
关键词 文本分类 特征选择 遗传算法 并行策略 text categorization feature selection Genetic Algorithm(GA) parallel strategy
  • 相关文献

参考文献10

二级参考文献56

  • 1曾雪强,王明文,陈素芬.一种基于潜在语义结构的文本分类模型[J].华南理工大学学报(自然科学版),2004,32(z1):99-102. 被引量:27
  • 2李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量:96
  • 3寇莎莎,魏振军.自动文本分类中权值公式的改进[J].计算机工程与设计,2005,26(6):1616-1618. 被引量:25
  • 4邹娟,周经野,邓成,刘玲.基于多重启发式规则的中文文本特征值提取方法[J].计算机工程与科学,2006,28(8):78-80. 被引量:3
  • 5刘勇 等.非数值并行算法(第二册)[M].科学技术出版社,1998..
  • 6康立山 谢云 等.非数值并行算法(第一册)[M].北京:科学出版社,1998..
  • 7[1]Muhlenbein H, Schomisch M, Born J. The Parallel Genetic Algorithm as Function Optimizer[ A ]//Proc of 4th Int Conf on GA. San Diego(California): [ s. n. ], 1991.
  • 8[2]Munetomo M, Takai Y, Sato Y. An Efficient Migration Scheme for Subpopulation-based Asynchronously Parallel Genetic Algorithms. [ A ]//Proc of 5th Int Conf on GA. Urbana -Champaign(Illinois): [ s. n. ], 1993.
  • 9[3]Wang S K M, Ziarko W. On optimal decision rules in decision tables[J]. Bulletin of Polish Academy of Sciences, 1985,33(6):693-676.
  • 10[5]Duntsch I, Gediga G. Statistical evaluation of rough set dependency analysis[ J ]. International Journal of Human- Computer Study,1997,46(5) :589-604.

共引文献253

同被引文献14

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部