题名 基于向量空间模型的文本自动分类系统的研究与实现
被引量:293
1
作者
庞剑锋
卜东波
白硕
机构
中国科学院计算技术研究所
出处
《计算机应用研究》
CSCD
北大核心
2001年第9期23-26,共4页
文摘
随着网络信息的迅猛发展 ,信息处理已经成为人们获取有用信息不可缺少的工具。文本自动分类系统是信息处理的重要研究方向 ,它是指在给定的分类体系下 ,根据文本的内容自动判别文本类别的过程。对文本分类中所涉及的关键技术 ,包括向量空间模型、特征提取、机器学习方法等进行了研究和探讨 ,并且提出了基于向量空间模型的文本分类系统的结构 。
关键词
中文信息处理
向量空间模型
文本自动分类系统
人工智能
计算机
Keywords
Text categorization
Chinese information processing
Vector space model
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
题名 一个基于向量空间模型的中文文本自动分类系统
被引量:45
2
作者
朱华宇
孙正兴
张福炎
机构
南京大学计算机软件新技术国家重点实验室
南京大学多媒体技术研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2001年第2期15-17,63,共4页
基金
国家自然科学基金项目!(69903006)
江苏省"九五"重点科技攻关项目!(BE96017)
教育部高等学校骨干教师资助计划项目!(教技司[2
文摘
介绍了一个基于向量空间模型的中文文本自动分类系统,重点阐述了特征提取、空间降维、层次分类和分类器训练等技术的实现方法。实践表明:该系统对文本分类具有较高的平均查全率和平均精度。
关键词
中文文本自动分类系统
向量空间模型
自然语言处理
Keywords
Text categorization;Chinese text;Vector space model;Feature extraction
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
题名 网络文本自动分类系统的研究与设计
被引量:9
3
作者
牛忠兰
陈跃新
徐正同
潘鲁军
机构
国防科大计算机学院
济南军区技术局
出处
《微处理机》
2002年第2期41-43,共3页
文摘
近年来 ,随着 Internet的飞速发展 ,人们可以突破地域的限制 ,方便地共享信息资源。但如何从大量信息中迅速有效地提取出所需信息却成了一个难题 ,信息的自动分类是解决此类难题的有效方法。本文从网络文本自动分类的需求出发 ,探讨分类系统的一些主要特征及优化算法 。
关键词
网络文本自动分类系统
设计
特征提取
分类 器
INTENET
Keywords
text classification,feature extraction,categorizer,match arithmetic
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
题名 Boosting算法在文本自动分类中的应用
被引量:7
4
作者
肖江
张亚非
机构
解放军理工大学通信工程学院
解放军理工大学理学院
出处
《解放军理工大学学报(自然科学版)》
EI
2003年第2期25-28,共4页
文摘
随着网络信息的迅猛发展 ,如何快捷、准确地识别和获取有用信息显得更为重要。文本自动分类系统是信息处理的重要研究方向 ,它是指在给定的分类体系下 ,根据文本的内容自动判别文本类别的过程。Boosting算法是一种新兴的机器学习算法。在文本分类中应用 Boosting算法经过试验证明是有效的 。
关键词
文本自动分类系统
自然语言处理
BOOSTING算法
机器学习
文本 类别
分类 器
Keywords
text categorization
natural language processing
boosting algorithm
machine
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 基于SVM和KNN算法的科技文献自动分类研究
被引量:10
5
作者
白小明
邱桃荣
机构
南昌大学信息工程学院计算机系
出处
《微计算机信息》
北大核心
2006年第12X期275-276,65,共3页
基金
江西省自然科学基金项目
编号JXPNSM-0311101
+1 种基金
南昌大学2005年度科技基金项目
编号Z-03323
文摘
本文着重对SVM和KNN分类法进行分析,并结合实际的文档集测试了SVM和KNN分类法的性能,给出了实验数据。
关键词
文本 分类 算法
SVM
KNN
文本自动分类系统
Keywords
Text sort algorithm, SVM, KNN, Text auto sort system
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 对小样本集进行分类技术研究
被引量:2
6
作者
杨传耀
张文德
机构
福州大学信息学院
福州大学图书馆
出处
《情报学报》
CSSCI
北大核心
2004年第2期142-146,共5页
基金
福建省教育厅科研项目,福建省科技厅科研项目
文摘
随着网络信息的迅猛发展,信息处理已经成为人们获取有用信息不可缺少的工具,文本自动分类系统是信息处理的重要研究方向.本文介绍了当今世界上较先进的"变换支持向量机"(TSVM,transductive support vectormachines)技术,它与普通的"支持向量机"(SVM)相比,TSVM方法所需的样本量大大降低,它能有效地对小样本数据集进行分类,同时重点分析了实现它的关键技术、算法及其实现过程.
关键词
信息处理
文本自动分类系统
“变换支持向量机”
TSVM
小样本集
分类号
G254.1
[文化科学—图书馆学]
G202
[文化科学—传播学]