期刊文献+

文本自动分类的测评研究进展 被引量:13

Development of Text Automatic Categorization Measurement Research
下载PDF
导出
摘要 分类是文本挖掘的基础和核心,是近年来数据挖掘和网络挖掘的一个研究热点。本文从定性和定量两个方面,介绍国内外文本分类研究现状,分析影响文本分类的重要因素,希望通过对文本分类系统和算法的评测总结发现研究中存在的共同问题,为文本自动分类的优化、改进提供理论和事实依据。 Text categorization is the foundation and core of text - mining, which has been a research focus of data - mining and Internet - mining in recent years. This article introduces domestic and foreign research situation on text categorization from the view of the nature and quantity. It analyzes the important factors affecting text categorization, and hope to find the common problem by evaluating summary of text categorization system and arithmetic. The goal of the article is to provide theory and fact for the optimization and improvement of text automatic categorization.
出处 《现代图书情报技术》 CSSCI 北大核心 2005年第5期46-49,14,共5页 New Technology of Library and Information Service
关键词 自动分类 测评 特征选择 Automatic categorization Evaluate Feature selection
  • 相关文献

参考文献11

二级参考文献13

  • 1吴军,王作英,禹锋,王侠.汉语语料的自动分类[J].中文信息学报,1995,9(4):25-32. 被引量:24
  • 2黄萱青 吴立德.独立于语种的文本分类方法[M].,2000.37-43.
  • 3鲁松 白硕 等.文本中词语权重计算方法的改进[M].,2000.31-36.
  • 4卜东波.聚类/分类理论研究及其在大模型文本挖掘的应用:博士论文[M].,2000..
  • 5Yang Yiming,ProceedingsoftheSeventeenthInternationalACMSIGIRConferenceonResearchandDevelopme,1994年,12页
  • 6黄萱菁,2000 International Conference on Multilingual Information Processing,2000年,37页
  • 7鲁松,2000 International Conference on Multilingual Information Processing,2000年,31页
  • 8卜东波,博士学位论文,2000年
  • 9Yang Yiming,Proceedings of ACMSIGIR Conference on Research and Development in Information Retrieval(SIGIR),1999年,42页
  • 10Yang Yiming,J Information Retrieval,1999年,1卷,1/2期,67页

共引文献708

同被引文献167

引证文献13

二级引证文献243

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部