期刊文献+

中文文本分类的特征选取研究 被引量:2

下载PDF
导出
摘要 在自动文本分类系统中,特征选择是有效降低文本向量维数的一种方法。在分析了常用的一些特征选择评价函数的基础上,提出了一个新的评价函数,即互信息差值。实验证明这一方法简单可行,有助于提高所选特征子集的有效性。
作者 胡鑫
出处 《甘肃科技》 2006年第5期119-120,共2页 Gansu Science and Technology
  • 相关文献

参考文献2

二级参考文献9

  • 1黄萱菁 吴立德.独立于语种的文本分类方法[C]..2000International Conference on Multilingual Information Processing[C].,2000..
  • 2YANG Yiming. An Evaluation of Statistical Approaches to Text Categorization[J]. Information Retrieval, 1997, 1 (1):69-90.
  • 3YANG Yiming, Xin Liu. A Re-examination of Text cAtegorization Methods[A]. In: Proc of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval[C]. Berkeley: ACM Press, 1999. 42-49.
  • 4YANG Yiming. A Comparative Study on Feature Selection in Text Categorization[C]. The 14th International Conference on Machine Learning, Nashville, 1997.
  • 5MCCALLUM A, NIGAM K. A Comparison of Event Models for Naive Bayes Text Classification[C]. In AAAI-98 Workshop on Learning for Text Categorization, Madison, 1998.
  • 6朱靖波,姚天顺.基于FIFA算法的文本分类[J].中文信息学报,2002,16(3):20-26. 被引量:14
  • 7李辉,史忠植,何清,许卓群.基于支撑向量置换核函数的一种领域知识与模型融合的技术[J].计算机学报,2002,25(8):860-868. 被引量:5
  • 8代六玲,黄河燕,陈肇雄.中文文本分类中特征抽取方法的比较研究[J].中文信息学报,2004,18(1):26-32. 被引量:228
  • 9王玉玲,王娟.文本分类中的特征选取算法[J].孝感学院学报,2003,23(6):35-37. 被引量:5

共引文献25

同被引文献17

引证文献2

二级引证文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部