多信息源评分

Multi Information Score

下载PDF

导出

摘要使用多信息源评分来对分析阶段出现的歧义进行消歧．多信息源评分综合运用了词汇、词性、句法和语义信息．并针对不同规模的训练集和测试集，分别给出按最大可能原理和输出多个评分结果的正确率．实验结果表明：对于训练集和测试集，两种方法在考虑上下文时都比不考虑上下文的正确率高．对于训练集，当语料规模越来越大时。正确率也逐渐在增加． Ambiguities are disambiguated using multi-information score for analytic stage. Multi-information score takes into account of lexical, part-of speech, syntactic and semantic information. Accurate rates of different scale training set and test set are given according to maximum likelihood principle and multi-score adults respectively. experimental results show thst for training sets and testing set the accurate rate taking into account context is higher than the accurate rate taking into account no context using two kinds of method, the accurate rate gradually increases when the size of corpus increases for training sets.

作者刘颖

机构地区清华大学中文系

出处《计算机工程》 CAS CSCD 北大核心 2001年第1期13-14,32,共3页 Computer Engineering

基金国家"863"高科技项目!(863-306-03-06-2)

关键词多信息源评分训练集自然语言处理计算机 Ambiguity Multi-information score Training set

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1刘开瑛郑家恒等.词料库词类自动标注算法研究.机器翻译研究进展[M].北京:电子工业出版社,..
2刘开瑛，机器翻译研究进展，378页

1马良有,高小平.硬盘软故障的修复[J].微计算机应用,1992,13(1):36-41.
2李春生.桌面云系统浅析[J].科技视界,2013(32):91-92. 被引量：2
3仇万元.电脑２０００年问题[J].职业技术教育,1998,19(8):52-52.
4张家晨,冯铁,王洪媛.面向对象分析到设计的类模型转换方法[J].计算机应用与软件,2005,22(1):12-14. 被引量：2
5何月顺,汤彬.Oracle数据库的灾难恢复[J].计算机系统应用,2002,11(9):65-67. 被引量：3
6徐秉铮,贺前华.汉语自动分词歧义及处理策略[J].中文信息,1992(1):17-20. 被引量：1
7胡燕,吴虎子,钟珞.中文文本分类中基于词性的特征提取方法研究[J].武汉理工大学学报,2007,29(4):132-135. 被引量：26
8计算技术与计算机科学[J].电子科技文摘,2002,0(2):89-94.
9张江.基于规则的分词方法[J].计算机与现代化,2005(4):18-20. 被引量：15
10闫妍,张茹新.浅析歧义与双关的不同之处[J].中国科技纵横,2010(18):119-119.

计算机工程

2001年第1期

浏览历史

内容加载中请稍等...

多信息源评分

参考文献2

相关作者

相关机构

相关主题

浏览历史