期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于支持向量机的中文文本自动分类研究 被引量:25
1
作者 都云琪 肖诗斌 《计算机工程》 CAS CSCD 北大核心 2002年第11期137-138,F003,共3页
根据文本数据学习的特点,采用线性支持向量机(LSVM)学习算法,实现了一个中文文本自动分类系统,并对该系统进行了针对大规模真实文本的试验测试。结果发现,系统的招回率较低,而准确率较高,该文对此结果进行了分析,并提出了一种... 根据文本数据学习的特点,采用线性支持向量机(LSVM)学习算法,实现了一个中文文本自动分类系统,并对该系统进行了针对大规模真实文本的试验测试。结果发现,系统的招回率较低,而准确率较高,该文对此结果进行了分析,并提出了一种采用训练中拒识样本信息对分类器输出进行改进的方法,试验表明,该方法有效地提高了系统的性能,取得了令人满意的结果。 展开更多
关键词 支持向量机 中文文本 自动分类 招回率 准确率 学习算法 中文信息处理
下载PDF
跨语言同词化数据库与词汇类型学研究 被引量:2
2
作者 胡平 吴福祥 《当代语言学》 CSSCI 北大核心 2023年第4期562-576,共15页
同词化指两义或者多义寄于一形的共时词汇现象,主要包括同音词和多义词。跨语言普遍存在的同词化模式,在定名层面的范畴化、符意层面的语义演变方面均具有重要的类型学意义。专为研究同词化而设的跨语言同词化数据库(Database of Cross-... 同词化指两义或者多义寄于一形的共时词汇现象,主要包括同音词和多义词。跨语言普遍存在的同词化模式,在定名层面的范畴化、符意层面的语义演变方面均具有重要的类型学意义。专为研究同词化而设的跨语言同词化数据库(Database of Cross-Linguistic Colexifications,简称CLICS),目前已升级到第三版(CLICS3),但国内尚未充分重视,未见重大成果产出。本文将从三个方面介绍该数据库:1)概况及其发展:数据库的开发团队及其在数据库规模等三个方面的改进;2)研究对象及其原理,表明该数据库的研究对象实为多义词,该数据库之实现,一是使跨语言词汇比较成为可能,二是使同词化现象可量化为数据;3)框架、功能及其实现,主要涉及同词化图的实现形式和功能。我们相信,CLICS3引入国内语言学界,必将为汉语语义演变研究提供更多的跨语言材料,并在世界语言变异范围内发现汉语语义演变共相和殊相的研究中发挥无可替代的作用。 展开更多
关键词 同词化 范畴化 语义演变 词汇类型学 区域类型学
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部