摘要
首先对文本提取特征向量,再利用词语相似度求出文本特征子集,由支持向量机进行文本分类,实现了一个中文文本自动分类系统,并对该系统进行了针对SVM大规模真实文本的试验测试。试验表明,该方法的系统的招回率较低,而准确率较高,取得了令人满意的结果。
First we get the feature extraction, then get the text feature sunset by using the similarity of words, last we get text categorization by using the support vector machine, the tests on the true large-scale text are made. The results show that the recall is comparatively low and the precision is comparatively high.
出处
《计算机应用研究》
CSCD
北大核心
2005年第11期61-63,共3页
Application Research of Computers
基金
国家自然科学基金资助项目(90204008)
关键词
文本分类
支持向量机
招回率
准确率
Text Categorization
Support Vector Machine(SVM)
Recall
Precision