摘要
提出了边界统计与词性串校正相结合的英语基本名词短语识别策略,使英语基本名词短语识别的F测度值达到了96.90%,超过目前报道的最好结果。通过简单的符号替换(修改程序的时间不超过1h),用识别英语基本名词短语的程序实现了对汉语基本名词短语的识别,汉语基本名词短语识别的F测度值达到了95.04%。该技术可推广到对多种短语的快速移植。
出处
《高技术通讯》
EI
CAS
CSCD
2004年第12期21-24,共4页
Chinese High Technology Letters
参考文献7
-
1Cardie C, David P R. Error-driven pruning of treebank grammars for base noun phrase identification. In: Proceedings of COLING-ACL'98, 1998. 218
-
2Ramshaw A, Marcus P. Text chunking using transformation-based learning. In: Proceedings of the Third Workshop on Very Large Corpora, Originally appeared in WVLC-95, 1995.82
-
3Church K. A stochastic parts program and noun phrase parser for unrestricted text. In: Proceedings of the Second Conference on Applied Natural Language Processing, 1988. 136
-
4Xun E, Huang C.A unified statistical model for the identification of English baseNP. In: Proceedings of 38th Annual Meeting of the ACL, 2000.109
-
5Zhou G D, Su J.Error-driven HMM-based chunk tagger with context-dependent lexicon. In: Proceedings of Joint Sigdat Conference on Empirical Methods in Natural Language Processing and Very Large Corpora (EMNLP/VLC), 2000
-
6Taku K, Yuji M. Use of support vector learning for chunk identification. In: Proceedings of CoNLL-2000 and LLL-2000, 2000.127
-
7Tjong Kim Sang E F. Memory-based shallow parsing. In: Proceedings of CoNLL-2000 and LLL-2000, 2000. 559
同被引文献10
-
1梁颖红,赵铁军,岳琪.英语基本名词短语识别技术研究[J].信息技术,2004,28(12):22-24. 被引量:4
-
2吕琳,刘玉树.最大熵和Brill方法结合识别英语BaseNPs[J].北京理工大学学报,2006,26(6):500-503. 被引量:6
-
3Pantel P.An Unsupervised Approach to Prepositional Phrase Attachment Using Contextually Similar Words[M].USA:Association for Computational Linguistics,2000.
-
4Brill E,Resnik P.A Rule-based Approach to Prepositional Phrase-attachment Disambiguation[M].USA:Association for Computational Linguistics,1994.
-
5Schwartz L,Aikawa T,Quirk C.Disambiguation of English PP Attach--ment Using Multilingual Aligned Data[M].USA:[s.n.],2003.
-
6McLauchlan M.Thesauruses for Prepositional Phrase Attachment[C].USA:[s.n.],2004:73-80.
-
7李彦,吕琳,刘玉树,等.最大熵方法在英文基本名词短语识别中的应用[C].中国:[s.n.],2005:1265-1270.
-
8周强.汉语短语的自动划分和标注[J].中文信息学报,1997,11(1):1-10. 被引量:21
-
9张昱琪,周强.汉语基本短语的自动识别[J].中文信息学报,2002,16(6):1-8. 被引量:41
-
10周雅倩,郭以昆,黄萱菁,吴立德.基于最大熵方法的中英文基本名词短语识别[J].计算机研究与发展,2003,40(3):440-446. 被引量:62
二级引证文献7
-
1许亚堃,刘功申.利用依存关系优化拼音输入法[J].通信技术,2013,46(3):83-86.
-
2桑乐园,黄德根.基于简单名词短语的汉语介词短语识别研究[J].中文信息学报,2015,29(6):8-12. 被引量:2
-
3吴锋文.面向信息处理的非分句语段的类型及其特征[J].渭南师范学院学报,2017,32(3):64-69.
-
4李洪政,晋耀红.汉语介词短语自动识别研究综述[J].中文信息学报,2017,31(2):1-10. 被引量:1
-
5刘彤,黄德根,张聪.基于多模型融合的汉语介词短语识别[J].中文信息学报,2017,31(6):25-32.
-
6邢丹,饶高琦,荀恩东,王诚文.基于大规模语料库的介词结构搭配库构建[J].中文信息学报,2020,34(11):1-8. 被引量:8
-
7汪梦翔.基于规则的非典型有标被动句的语义角色自动标注研究[J].语言文字应用,2022(2):122-132.
-
1何如意,莫玮,高林,赵南楠,丁大勇.应用程序向LSB2.0移植[J].开放系统世界,2005(12):115-122.
-
2王萍,贾华忠,单超.μC/OS-Ⅱ的运行机理研究[J].工业控制计算机,2011,24(5):85-86.
-
3王艳秀.Dreamweaver MX中复制弹出式菜单的技巧[J].电脑知识与技术,2005(2):52-53. 被引量:2
-
4孙瑞娜,刘茜.基于互信息的汉语基本名词短语自动识别[J].信息与电脑(理论版),2012(11):71-72.
-
5梁颖红,赵铁军,姚建民,于浩,徐冰.基于混合策略的英语基本名词短语识别——边界统计和词性串规则校正相结合的策略[J].计算机工程与应用,2004,40(35):1-3. 被引量:2
-
6张大陆,曹栋.快速移植的微型呼叫中心设计[J].计算机应用研究,2006,23(5):230-231. 被引量:3
-
7赵军,黄昌宁.基于转换的汉语基本名词短语识别模型[J].中文信息学报,1999,13(2):1-7. 被引量:41
-
8梁颖红,赵铁军,岳琪.英语基本名词短语识别技术研究[J].信息技术,2004,28(12):22-24. 被引量:4
-
9周雅倩,郭以昆,黄萱菁,吴立德.基于最大熵方法的中英文基本名词短语识别[J].计算机研究与发展,2003,40(3):440-446. 被引量:62
-
10钱从新.放缩法证明数列不等式的基本策略[J].数学通讯(教师阅读),2008,22(11):26-27. 被引量:5