摘要
本文提出了一种 SOFM(自组织特征映射 )与 L VQ(学习矢量量化 )相结合的分类算法 ,利用一种新的网页表示方法 ,形成特征向量并应用于网页分类中 .该方法充分利用了 SOFM自组织的特点 ,同时又利用 L VQ解决聚类中测试样本的交迭问题 .实验表明它不仅具有较高的训练效率 。
The web classification is the problem of automatically assigning electronic text documents to pre-specified categories. In this paper,we focus on the SOFM algorithm that is derived automatically using a technique based on frequencies of titles and frequencies of
出处
《信息与控制》
CSCD
北大核心
2003年第2期108-112,117,共6页
Information and Control
基金
清华大学 985项目
国家自然科学基金资助项目 ( 60 0 0 30 14 )
关键词
自组织特征映射
网页分类
神经网络
计算机网络
investigating the effect of such addition on text classification performance.Our investigation into keywords, selected on the basis of frequencies confirms that the addition of keywords does give better accuracy,and moreover,the larger the prop