期刊文献+

基于自组织特征映射的网页分类研究 被引量:10

CLASSIFICATION OF WEB PAGES BASED ON SOFM
下载PDF
导出
摘要 本文提出了一种 SOFM(自组织特征映射 )与 L VQ(学习矢量量化 )相结合的分类算法 ,利用一种新的网页表示方法 ,形成特征向量并应用于网页分类中 .该方法充分利用了 SOFM自组织的特点 ,同时又利用 L VQ解决聚类中测试样本的交迭问题 .实验表明它不仅具有较高的训练效率 。 The web classification is the problem of automatically assigning electronic text documents to pre-specified categories. In this paper,we focus on the SOFM algorithm that is derived automatically using a technique based on frequencies of titles and frequencies of
出处 《信息与控制》 CSCD 北大核心 2003年第2期108-112,117,共6页 Information and Control
基金 清华大学 985项目 国家自然科学基金资助项目 ( 60 0 0 30 14 )
关键词 自组织特征映射 网页分类 神经网络 计算机网络 investigating the effect of such addition on text classification performance.Our investigation into keywords, selected on the basis of frequencies confirms that the addition of keywords does give better accuracy,and moreover,the larger the prop
  • 相关文献

参考文献5

  • 1[1]Salton G,Allan J,Buckley C, et al. Automatic analysis,theme generation and summarization of machine-readable texts[J].Science,1994,264:1421~1426
  • 2[2]William W C, Yoram S. Context-sensitive learning methods for text categoriza tion [A]. Hans-Pater Frei,Donna Harman,Peter Schanble. Nineteenth Annual Inte rnational ACM SIGIR Conference on Research and Development in Information Retrie val[C]. Zurich:1996.307~315
  • 3[3]Kivinen J, Warmuth M K. Exponentiated gradient versus gradient decent for li near predictors[R].Santa Cruz:University of California,1994
  • 4[4]David L, Robert S, James P C, et al. Training algorithms for linear class ifiers [A]. Hans-Peter Frei,Donna Harman,Peter Schanble. Nineteenth Annual In ternational ACM SIGIR Conference on Research and Development in Information Retr ieval[C]. Zurich:1996.298~300
  • 5[5]Kohonen T. Automatic formation of topological maps in self-organizing s ystem[A]. Oja E, Simula O. Proceedings of the 2nd Scand Inavian Conf on Image Analysis[C]. 1981.214~220

同被引文献60

引证文献10

二级引证文献38

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部