期刊文献+

一种改进的文本聚类方法 被引量:3

An Improved Algorithm of Text Clustering
下载PDF
导出
摘要 针对实际中一个文本可能同时是几个类的侯选成员的问题,将粗集与遗传算法结合并应用于文本聚类,改进了聚类过程中权重参数的设定方法,即权重参数由遗传算法确定,从而使权重参数的设定更具有科学性和可操作性,通过仿真实验验证了算法的可行性。 Aim at the problem of a text may belong to several classes, a method with rough set and Generic Algorithm is proposed for the text clustering to improve the decision of parameters in the clustering progress. Simulation results are also given.
机构地区 五邑大学
出处 《自动化技术与应用》 2008年第9期30-32,共3页 Techniques of Automation and Applications
关键词 粗集 遗传算法 向量空间模型 rough set generic algorithm vector space model
  • 相关文献

参考文献6

二级参考文献9

  • 1[1]Rie K A,Lillian L Mostly-unsupervised Statistical Segmentation of Japanese[A].Language Technology Joint Conf of Applied Natural Language Processing and the North American Chapter of the Association for Computational LinguiSticS[C],2000-04
  • 2[2]Kolda T G Limited-memoryMatrix Methods with Applications[D]University of Maryland:College Park,Mayland,1997
  • 3[3]Krishnapuram R,Joshi A,YiL A Fuzzy Relative of the k-Medoids Algorithm with Application to Web Document and Snippet Clustering [A] Korea,ProcIEEE Intl ConfFuzzy Systems-FUZZ IEEE 1 999[C],1999-08
  • 4[4]Hathaway R J,Bezdek J C NERF c-Means Non-Euclidean Relational Fuzzy Clustering[J]Pattern Recognition.1 994,27(3):429-437
  • 5[5]Frigui H.Krishnapuram R Clustering by Competitive Agglomeration [J]Pattern Recognition.1 997.30(7):1109-1119
  • 6Yang Y,Proc of the 14th Intl Conf on Machine Learning ICML 97,1997年,412页
  • 7何新贵,彭甫阳.中文文本的关键词自动抽取和模糊分类[J].中文信息学报,1999,13(1):9-15. 被引量:54
  • 8庞剑锋,卜东波,白硕.基于向量空间模型的文本自动分类系统的研究与实现[J].计算机应用研究,2001,18(9):23-26. 被引量:293
  • 9陶志,许宝栋,汪定伟.基于决策属性支持度的知识约简方法[J].东北大学学报(自然科学版),2002,23(11):1025-1028. 被引量:14

共引文献71

同被引文献23

  • 1郭景峰,赵玉艳,边伟峰,李晶.基于改进的凝聚性和分离性的层次聚类算法[J].计算机研究与发展,2008,45(z1):202-206. 被引量:15
  • 2骆卫华,于满泉,许洪波,王斌,程学旗.基于多策略优化的分治多层聚类算法的话题发现研究[J].中文信息学报,2006,20(1):29-36. 被引量:38
  • 3岳丽华,杨冬青,龚育昌,等.数据库系统全书[M].北京:机械工业出版社,2006:693-699.
  • 4Makkonen J , Ahonen-Myka H, Salmenkivi M. Simple semantics in topic detection and tracking[ J]. Information Retrieval, 2004, 7 : 347 - 368.
  • 5Murata T. Petri nets : properties, analysis and applications [ J ]. Pmc IEEE, 1989,77 ( 1 ) : 541 - 580.
  • 6Dumais S T. Using latent semantic analysis to improve information retrieval [ C ] // Proceedings of the ACM Conference on Human Factors in Computing Systems. Washington D C, USA: ACM Press, 1988:281 -285.
  • 7霍琳琳.基于潜在语义分析的智能检索系统[D].上海:上海师范大学,2007.
  • 8张胜,许宝杰.神经网络模糊聚类方法在故障诊断中的应用[J].北京信息科技大学学报,2011,26(2):3-4.
  • 9ZHANG Xianfei, GUO Zhigang, LI Bicheng. An effective algorithm of news topic tracking [C]. Proceedings of the WRI Global Congress on Intelligent Systems, 2009: 510-513.
  • 10Allan J, Harding S, Fisher D, et al. Taking topic detection from evaluation to practice [C]. Hawaii: Proceeding of the Annual Hawaii International Conference on System Science, 2005.

引证文献3

二级引证文献13

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部