期刊文献+

基于支持向量机的中文文本自动分类研究 被引量:3

Study on Chinese Text Categorization Based on Support Vector Machine
下载PDF
导出
摘要 首先对文本提取特征向量,再利用词语相似度求出文本特征子集,由支持向量机进行文本分类,实现了一个中文文本自动分类系统,并对该系统进行了针对SVM大规模真实文本的试验测试。试验表明,该方法的系统的招回率较低,而准确率较高,取得了令人满意的结果。 First we get the feature extraction, then get the text feature sunset by using the similarity of words, last we get text categorization by using the support vector machine, the tests on the true large-scale text are made. The results show that the recall is comparatively low and the precision is comparatively high.
出处 《计算机应用研究》 CSCD 北大核心 2005年第11期61-63,共3页 Application Research of Computers
基金 国家自然科学基金资助项目(90204008)
关键词 文本分类 支持向量机 招回率 准确率 Text Categorization Support Vector Machine(SVM) Recall Precision
  • 相关文献

参考文献7

  • 1张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42. 被引量:2276
  • 2Vapnik V. Statistical Learning Theory[M]. New York :Wiley, 1998.
  • 3Cortes C, Vapnik V. Support Vector Networks [J]. Machine Lear-ning, 1995,20 (3) :273- 297.
  • 4张月杰,姚天顺.基于特征相关性的汉语文本自动分类模型的研究[J].小型微型计算机系统,1998,19(8):49-55. 被引量:21
  • 5刘群 李素建.基于《知网》的词汇语义相似度计算[C]..第三界汉语词汇语义研讨会[C].台北,2002..
  • 6Salton G, Wong A, Yang C S.A Vector Space Model for Automatic Indexing[J].Communications of ACM Archive, 1975, 18:613- 620.
  • 7Wang Xiao hua. An Automatic Fuzzy Text Classification Based on Statistical Word[C]. The 6th International Conference for Young Computer Scientists, Huangzhou, 2001.

二级参考文献6

  • 1刘东立,东北大学学报,1995年
  • 2吴军,中文信息学报,1995年,9卷,4期
  • 3姚天顺,自然语言理解,1995年
  • 4刘湘生,中国分类主题词表,1994年
  • 5梅家驹,同义词词林,1983年
  • 6卢增祥,李衍达.交互支持向量机学习算法及其应用[J].清华大学学报(自然科学版),1999,39(7):93-97. 被引量:41

共引文献2398

同被引文献31

引证文献3

二级引证文献27

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部