期刊文献+

自动分类技术研究 被引量:1

下载PDF
导出
摘要 随着网络的迅猛发展,海量文本信息正在以几何级数不断增长,自动分类技术已成为文本信息分类的主导关键技术。自动分类技术可分为自动聚类和自动归类两种类型,现有的文本分类技术主要采用基于连接、基于规则和基于统计等三种方法。随着数据挖掘领域和机器学习理论、技术研究的不断深入,解决不同实际应用和数据特征的问题将成为文本分类相关研究及其应用的主要突破方向和攻克难点。
作者 王琦
出处 《河南财政税务高等专科学校学报》 2008年第4期91-93,共3页 Journal of Henan College Of Finance & Taxation
  • 相关文献

参考文献5

二级参考文献47

  • 1吴军,王作英,禹锋,王侠.汉语语料的自动分类[J].中文信息学报,1995,9(4):25-32. 被引量:24
  • 2Shankar S,Karypis G.Weight adjustment schemes for a centroid based classifier[R].Computer Science Technical Report TR00-035 ,Department of Computer Science,University of Minnesota,Minneapolis,Minnesota, 2000.
  • 3Yang Y.An Evaluation of Statistical Approaches to Text Category[J]. Journal of Information Retrieval, 1999 ; 1 (1/2) :67-88.
  • 4Cairo R A,Partridge M.A Comparative Study of Principal Component Analysis Techniques[C].In:Proe Ninth Australian Conf On Neural Networks, Brisbane, QLD, 1998.
  • 5Deerwester S,Dumais S T,Furnas G W et al.Indexing by Latent Semantic Analysis[J].Joumal of the American Society for Information Science, 1990;41 (6) :391-407.
  • 6Dumais S T.Using LSI for information filtering:TREC-3 experiments[C]. In : Proc of the Third Text Retrieval (TREC-3), National Institute of Standards and Technoloy, 1995.
  • 7Karypis G,Han E H.Concept indexing;A fast dimensionality reduction algorithem with applications to document retrieval & categorization[R]. Technical Report TR-00-016,Department of Computer Science,University of Minnesota,Minneapolis,2000.
  • 8Yang Y,Pedersen J O.A Comparative Study on Feature Selection in Text Categorization[C].In : ICML 97,1997:412-420.
  • 9Kohavi R,John G.Wrappers for Feature Subset Selection[J].Artificial Intelligence, 1997 ; 97 ( 1-2 ) : 273-324.
  • 10Thorsten Joachims.A probabilistic analysis of the Rocchio algorithm with TFIDF for text categorization[C].In :Proceedings of ICML'97, 1997 : 143-151.

共引文献203

同被引文献2

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部