学习者英语书面语料自动词性赋码的信度研究被引量：13

POS tagging reliability on EFL learners' written data

导出

摘要对学习者语料进行自动词性赋码,可以使语料库获得“增值”,便于对中介语进行更深层次的研究。本研究考察两种自动词性赋码器对中国英语学习者书面语进行自动赋码的可行性。研究中使用Brill词性赋码器和CLAWS7词性赋码器分别为一组高分作文和一组低分作文进行自动词性赋码,并统计赋码的准确率。研究的目的在于:1)比较基于规则的词性赋码器和基于概率的词性赋码器对中国英语学习者书面语的适用度;2)考察学生作文质量对赋码准确率是否有显著影响;3)分析两类词性赋码器在处理学习者语言时所暴露出来的弱点。研究发现,作为一种基于概率的自动词性赋码器,CLAWS7具有较为可靠的性能,其赋码准确率基本达到该工具为英语母语进行词性赋码时的水平,而作为一种基于规则的词性赋码器,Brill的赋码准确率不够稳定,受学习者语言质量特别是语言错误的影响较大。本研究的发现表明,基于CLAWS7所提供的词性赋码,可以对中国英语学习者书面语的句法特点进行有效的研究。 POS tagging can bring “added value” to learner corpora and thus enable in-depth studies of interlanguage. This study investigates the performance of two POS taggers on Chinese EFL learners' written data. The Brill POS tagger and the CLAWS POS tagger were used to tag a group of high-proficiency learner texts and a group of low-proficiency learner texts, and tagging accuracy was then calculated. The study aims 1) to compare the performance of the rule-based tagger with that of the probability-based tagger; 2) to find out whether the performance of POS taggers is significantly affected by the quality of learnerlanguage; and 3) to discover typical errors of both types of POS taggers. Results of the study indicate that the probability-based tagger outperforms the rule-based tagger, and that the probability-based tagger yields an accuracy comparable to that achieved when the tagger is used to tag English native speakers' texts. It is also found that the rule-based tagger does not perform stably, and that its accuracy is often affected by the quality of learner language. It is concluded that learner written corpora tagged with CLAWS can serve as reliable data for syntactic studies of Chinese EFL learners' written language.

作者梁茂成

机构地区北京外国语大学中国外语教育研究中心

出处《外语教学与研究》 CSSCI 北大核心 2006年第4期279-286,共8页 Foreign Language Teaching and Research

关键词词性赋码中介语准确率

分类号 H319 [语言文字—英语]

引文网络
相关文献

参考文献17

1Aarts, J. & S. Granger. 1998. Tag sequences in learner corpora: A key to interlanguage grammar and discourse [A]. In S. Granger (ed.). 1998.
2Brill, E. 1992. A simple rule-based part of speech tagger [ A ]. In Proceedings of the DARPA Speech and Natural Language Workshop [C]. San Mateo, California: Morgan Kauffman.
3Brill, E. 1994. Some advances in rule-based part of speech tagging [ A]. In Proceedings of the Twelfth National Conference on Artificial Intelligence (AAAI-94) [C]. Seattle, WaA:AAAI Press.
4de Haan, P. 1999. Tagging non-native English with the TOSCA-ICLE tagger [A]. In C. Mair & M. Hundt (eds,). Corpus Linguistics and Linguistic Theory: Papers from the Twentieth International Conference on English Language Research on Computerized Corpora ( ICAME 20) [C]. Freiburg im Breisgau 1999.
5Granger, S. 1996. From CA to CIA and back: An integrated approach to computerized bilingual and learner corpora [ A]. In K. Aijmer, B. Altenberg & M.Johansson (eds.). Languages in Contrast: Papers from a Symposium an Taxt-based Cross-linguistic Studies [C]. Lund: Lund University Press.
6Granger, S. 1997. Automated retrieval of passives from native and learner corpora: Precision and recall [J ]. Journal of English Linguistics 25/4 : 365-374.
7Granger, S. 1998. The computer learner corpus: A versatile new source of data for SLA research[A]. In S. Granger (ed.). 1998.
8Granger, S. (ed.). 1998. Learner English an Computer [C]. London and New York: Longman.
9Granger, S. 2002. A bird's-eye view of learner corpus research [A]. In S. Granger, J. Hung & S. Petch- Tyson (eds.). 2002. Computer Learner Corpora, Second Language Acquisition and Foreign Language Teaching [C]. Amsterdam: John Benjamins.
10Jacobs, H., S. Zinkgraf, D. Wormuth, V. Hartfiel & J. Hughey. 1981. Testing ESL Composition: A Practical Approach [M]. Rowley, MA: Newbury House.

二级参考文献35

1濮建忠,闵行,东川路,800号.中国学生英语动词语法和词汇型式使用特点初探[J].现代外语,2000,23(1):24-44. 被引量：62
2肖旭月.语音表征在取词拼写过程中的作用——中国学生英语拼写错误的心理语言学分析[J].外语教学与研究,2001,33(6):422-429. 被引量：90
3李律.从英语连系动词看核心、非核心动词假说[J].外语教学与研究,1998,30(3):22-29. 被引量：9
4何安平.英语会话中的成功与非成功插话[J].外国语,1998,21(2):52-58. 被引量：13
5李律.英语复合及物动词的典型和非典型性[J].外语教学与研究,1995,27(1):45-51. 被引量：8
6熊建国.DOUBT的语料库研究及其对英语教学的一点启示[J].外语学刊,2002(3):106-111. 被引量：13
7赵福利.英语电视新闻导语的语步结构分析[J].外语教学与研究,2001,33(2):99-104. 被引量：28
8马广惠.中美大学生英语作文语言特征的对比分析[J].外语教学与研究,2002,34(5):45-49. 被引量：142
9张淑静.中国英语专业学生make的使用特点调查报告[J].解放军外国语学院学报,2002,25(4):58-63. 被引量：82
10卫乃兴.专业性搭配初探——语料库语言学方法[J].解放军外国语学院学报,2001,24(4):19-23. 被引量：74

共引文献28

1赵頔.AFL例:心理语言学研究的语料证据支持[J].山西师大学报（社会科学版）,2010,37(S2):96-98.
2吴良平,旷书文.运用语料库技术进行快速语篇分析[J].海外华文教育,2005(4):50-56.
3俞士汶,柏晓静.计算语言学与外语教学[J].外语电化教学,2006(5):3-11. 被引量：8
4刘成兰.浅议语料库对英语课堂教学的影响[J].天津职业大学学报,2007,16(5):27-29.
5杨江.近十年国内语料库语言学研究中的若干问题综述[J].湘潭师范学院学报（社会科学版）,2008,30(1):105-107. 被引量：6
6李泽莹.基于商务英语语料库的性别词汇研究[J].暨南学报（哲学社会科学版）,2008,30(2):110-114. 被引量：4
7刘伟.语料库语言学发展现状与应用[J].山东电力高等专科学校学报,2009,12(2):42-44.
8周浩.语料库与二语词汇习得——国内相关研究评述[J].四川教育学院学报,2009,25(7):107-109. 被引量：5
9张鸰.TC启示下建设职业用途英语语料库的构想[J].外语电化教学,2010(3):63-66. 被引量：5
10刘美良.语料库语言学综述[J].科技信息,2010(21):280-281. 被引量：2

同被引文献130

1胡韧奋.基于搭配的句法复杂度指标及其与汉语二语写作质量关系研究[J].语言文字应用,2021(1):132-144. 被引量：11
2李亮.英语语料库检索工具的设计理念及其深层化[J].外语电化教学,2007(6):16-20. 被引量：8
3梁茂成.利用WordPilot在外语教学中自建小型语料库[J].外语电化教学,2003(6):42-45. 被引量：57
4陈建生.语篇的自动词性附码[J].当代语言学,1998(1):18-29. 被引量：12
5何安平.英语会话中的成功与非成功插话[J].外国语,1998,21(2):52-58. 被引量：13
6王建新.语料库语言学发展史上的几个重要阶段[J].外语教学与研究,1998,30(4):53-59. 被引量：23
7王建新.我国在语料库语言学研究方面的部分进展(概述)[J].外语与外语教学,1999(3):18-20. 被引量：10
8冯跃进,汪腊萍.科比德在线演示版及其应用[J].外语学刊,1999(4):81-86. 被引量：2
9王建新.谈谈英国国家语料库的设计与内容[J].解放军外国语学院学报,1999,22(S1):44-46. 被引量：9
10喻云根,陈定山.英语介词汉译初探[J].中国翻译,1982(1):22-27. 被引量：5

引证文献13

1王莉,梁茂成.学习者口语语料自动词性赋码的信度研究[J].外语教学,2007,28(4):47-51. 被引量：12
2吴宁,徐筠.英汉应用语言学实证论文体裁对比分析——以方法部分为例[J].毕节学院学报（综合版）,2009,27(11):23-28. 被引量：1
3刘艾娟.中国大学生的语块使用频率及类别与写作质量的相关性研究[J].长春师范大学学报（人文社会科学版）,2010,29(4):137-140. 被引量：5
4葛诗利.自动作文评分中词汇接续错误自动识别研究[J].外语电化教学,2010(4):15-20. 被引量：4
5郑玉荣,栾岚,王丽丽.我国语料库研究发展历程分析[J].黑龙江教育学院学报,2011,30(6):133-135. 被引量：1
6李新利.学习者笔语中BE动词的类联接研究[J].疯狂英语（教师版）,2011(3):6-9. 被引量：2
7陈功.语料库检索的模式、问题及启示[J].当代外语研究,2011(10):10-14. 被引量：4
8毛文伟.日语自动词性赋码器的信度研究[J].外语电化教学,2012(3):10-14. 被引量：13
9王晓燕.运用计算机技术和任务教学法提高英语教学水平[J].长春理工大学学报（高教版）,2012(3):185-186.
10赵骞.基于NLP技术的日语词性赋码器信度研究[J].乐山师范学院学报,2019,34(4):44-48.

二级引证文献46

1董颖,刘日升,那春光.我国英语语料库计量研究综述[J].图书馆学刊,2011,33(1):126-129.
2鄢婧莉,王红.从口语测试模式转变反思大学英语口语教学[J].牡丹江大学学报,2011,20(1):152-154. 被引量：3
3Intern Inquest[J].海外英语,2011(7):26-27.
4郑玉荣,栾岚,王丽丽.我国语料库研究发展历程分析[J].黑龙江教育学院学报,2011,30(6):133-135. 被引量：1
5王婧.近四年来我国口语研究评述[J].文学界（理论版）,2011(10):37-38.
6李寒冰.2011中国语料库语言学大会述评[J].重庆邮电大学学报（社会科学版）,2012,24(2):134-139. 被引量：2
7张青妹.运用词块教学法提高大学英语写作能力的实验性探讨[J].吉林工程技术师范学院学报,2012,28(2):6-8. 被引量：3
8张青妹,吴丹,李华芳.非英语专业学生书面语词块使用情况对教学的启示——词块与写作输出能力的相关性分析[J].兰州教育学院学报,2011,27(6):62-64.
9张成国.高职学生英语口语语料库建设研究[J].黄冈职业技术学院学报,2012,14(6):36-38. 被引量：3
10李振营.中国大学生英语口语词汇特征研究[J].辞书研究,2013(1):35-41. 被引量：2

1王莉,梁茂成.学习者口语语料自动词性赋码的信度研究[J].外语教学,2007,28(4):47-51. 被引量：12
2毛文伟.日语自动词性赋码器的信度研究[J].外语电化教学,2012(3):10-14. 被引量：13
3周文华.外国学生习得时间介词的中介语考察[J].汉语学习,2011(2):89-97. 被引量：3
4琚长珍.英语习语与语篇衔接[J].考试周刊,2009(37):131-133.
5唐茹.中高级阶段泰国学生汉语语言语用失误研究[J].北方文学（下）,2014(3):137-138.
6胡开宝.汉外语言接触研究近百年:回顾与展望[J].外语与外语教学,2006(5):53-57. 被引量：24
7周莉红.大学生英语写作自我评估的信度研究[J].江西教育科研,2006(8):43-44. 被引量：3
8张君.主位推进模式与大学英语写作语篇连贯——高分作文与低分作文的对比分析[J].海外英语,2014(12X):68-70. 被引量：1
9晏小琴,黄文静.基于语料库的中国英语学习者的反身代词习得研究[J].疯狂英语（教师版）,2008,0(3):29-33. 被引量：1
10吴光亭,申勇.L1和L2学生写作中模糊限制语的对比分析研究[J].河北北方学院学报（社会科学版）,2009,25(2):61-66. 被引量：4

外语教学与研究

2006年第4期

浏览历史

内容加载中请稍等...

学习者英语书面语料自动词性赋码的信度研究被引量：13

参考文献17

二级参考文献35

共引文献28

同被引文献130

引证文献13

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

学习者英语书面语料自动词性赋码的信度研究 被引量：13

参考文献17

二级参考文献35

共引文献28

同被引文献130

引证文献13

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

学习者英语书面语料自动词性赋码的信度研究被引量：13