期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

数据挖掘技术在学习者作文特征分析中的应用研究被引量：7

An Analysis of Learner Compositions through the Application of Data Mining Technology

原文传递

导出

摘要本文探讨了数据挖掘技术在日语作文特征分析中的应用方式。词汇密度和文本特征分析显示,作文是一种独特的文体,与其他本族语语料差异显著。其特点表现为,词汇密度低,名词、数词等使用偏少,动词、形容词等占比高,句子短,书面语程度低。学习者与本族语使用者产出的作文之间存在明显差异。前者中状态描写偏多,动态描写较少,动词、助动词等占比低。相比之下,八级作文更加接近本族语使用者作文尤其是高年级组作文,但部分词汇的使用能力仍显不足。词语共现网络显示,随着等级的提高,学习者的描述逐渐细致、具体,词汇逐渐接近本族语使用者的产出,错误明显减少,但始终无法完全摆脱母语的干扰。 This paper discusses the application of data mining technology in the analysis of composition. The analysis of vocabulary density and text characteristics shows that composition is a unique style, which is obviously different from other native language materials. Its characteristics are low vocabulary density, less use of nouns and numerals, a high proportion of verbs, adjectives, etc., short sentences, and a low level of written language. There are obvious differences between the compositions produced by learners and native speakers. In the former, there are more state descriptions, less dynamic descriptions, and a lower proportion of verbs and auxiliary verbs. In contrast, level-eight composition is closer to the composition of native language users, but the ability to use some vocabulary is still insufficient. The co-occurrence network shows that as the level increases, learners’ descriptions become more detailed and specific, vocabulary gradually approaches the output of native speakers, and errors are significantly reduced. But they still cannot completely avoid the interference of their mother language.

作者毛文伟 Mao Wenwei(Shanghai International Studies University,China)

机构地区上海外国语大学日本文化经济学院

出处《日语学习与研究》 CSSCI 2022年第2期72-81,共10页 Journal of Japanese Language Study and Research

基金 2019年国家社科基金项目“基于数据挖掘技术的中国日语学习者认知机制研究”(项目编号:19BYY201)的阶段研究成果。项目主持人:毛文伟。

关键词二语习得词汇密度文本特征方差分析词语共现网络 SLA Lexical Density Text Features One-Way ANOVA Co-Occurrence Network

分类号 H09 [语言文字—语言学] TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献13

1栾孟颖,钟勇.日语专业毕业论文中的接续词使用特征研究——基于中日语料库对比视角[J].日语学习与研究,2020(4):39-46. 被引量：5
2毛文伟.论数据挖掘技术在文本分析中的应用[J].日语学习与研究,2019(1):1-9. 被引量：16
3毛文伟.基于线性分析的日语文本分类模型构建研究[J].外语电化教学,2019(6):97-102. 被引量：4
4毛文伟.日本的语料库文体学研究:进展、问题及展望[J].外国语,2021,44(3):82-90. 被引量：7
5毛文伟.日语学习者产出文本特征的量化分析[J].解放军外国语学院学报,2012,35(1):31-35. 被引量：14
6黄开胜,周新平.基于语料库的中国英语学习者词块输出能力的趋势研究[J].外语界,2016(4):27-34. 被引量：22
7邹玉梅,刘春燕.大学英语考试中写作提示类型对学习者写作表现的影响研究[J].外语测试与教学,2018(4):45-55. 被引量：3
8李雪莲.英语专业学习者书面语文本特征多维度研究——以自然语言处理软件Coh-Metrix为研究工具[J].南京工程学院学报（社会科学版）,2014,14(1):41-46. 被引量：8
9毛文伟.日语自动词性赋码器的信度研究[J].外语电化教学,2012(3):10-14. 被引量：13
10文秋芳,丁言仁,王文宇.中国大学生英语书面语中的口语化倾向——高水平英语学习者语料对比分析[J].外语教学与研究,2003,35(4):268-274. 被引量：366

二级参考文献115

1庞双子.基于历时类比语料库的翻译文本语体显化特征的计量分析[J].外国语,2019,42(6):83-94. 被引量：13
2刁琳琳.英语本科生词块能力调查[J].解放军外国语学院学报,2004,27(4):35-38. 被引量：274
3马广惠.中美大学生英语作文语言特征的对比分析[J].外语教学与研究,2002,34(5):45-49. 被引量：142
4张淑静.中国英语专业学生make的使用特点调查报告[J].解放军外国语学院学报,2002,25(4):58-63. 被引量：82
5雷秀云.基于语料库的学术英语语法的频率特征[J].上海交通大学学报（哲学社会科学版）,2000,8(1):117-122. 被引量：28
6杨诎人,谭晶华.全国日语专业四、八级测试的信度及效度研究[J].外语界,2005(2):73-77. 被引量：20
7丁言仁,戚焱.词块运用与英语口语和写作水平的相关性研究[J].解放军外国语学院学报,2005,28(3):49-53. 被引量：539
8梁茂成.学习者英语书面语料自动词性赋码的信度研究[J].外语教学与研究,2006,38(4):279-286. 被引量：13
9王立非,张岩.基于语料库的大学生英语议论文中的语块使用模式研究[J].外语电化教学,2006(4):36-41. 被引量：175
10梁茂成.学习者书面语语篇连贯性的研究[J].现代外语,2006,29(3):284-292. 被引量：93

共引文献453

1师育兰.中医药院校医学英语写作课程建设[J].中医教育,2020,39(3):78-81. 被引量：2
2苏乐舟.学术英语写作课中语体特征意识培养的教学设计——以非英语专业研究生学术写作课为例[J].中国ESP研究,2021(3):82-94.
3孙海燕,牛文爽.学习者英语动词配价型式使用特征研究——以agree为例[J].语料库语言学,2022,9(2):96-108.
4刘馨楟.关于独立学院非英语专业学生书面语中口语化倾向的研究[J].英语广场（学术研究）,2020(27):28-32. 被引量：1
5邢修强.基于数据挖掘技术的谷崎润一郎小说文体特征的研究[J].日语教育与日本学,2023(2):64-76.
6王子睿,刘善钰.基于计量文体学的谷崎润一郎小说文体变化研究[J].日语教育与日本学,2023(1):69-79.
7陈露.日语专业四级考试词汇语法的内容效度研究[J].日语教育与日本学,2023(1):1-15.
8毛文伟.日本的语料库文体学研究:进展、问题及展望[J].外国语,2021,44(3):82-90. 被引量：7
9赵丽.思维导图运用于初中英语单模块复习中的实验研究[J].南国博览,2019,0(8):292-292.
10娄宝翠,王亚丽.学习者英语学术写作介入标记语使用特征[J].当代外语研究,2019,0(4):58-69. 被引量：4

同被引文献54

1毛文伟.日本的语料库文体学研究:进展、问题及展望[J].外国语,2021,44(3):82-90. 被引量：7
2车思琪,李学沛.评价系统视阈下中美企业致股东信情感话语对比分析——基于情感词典和机器学习的文本挖掘技术[J].外国语,2021,44(2):50-59. 被引量：16
3刘世铸 ,韩金龙 .新闻话语的评价系统[J].外语电化教学,2004(4):17-21. 被引量：134
4王振华.评价系统及其运作——系统功能语言学的新发展[J].外国语,2001,24(6):13-20. 被引量：1050
5毛文伟.日语词辞转化的可能性初探——兼论机能辞的来源及分类[J].日语学习与研究,2006(4):20-25. 被引量：3
6王文森.变异系数——一个衡量离散程度简单而有用的统计指标[J].中国统计,2007,22(6):41-42. 被引量：147
7项蕴华.身份建构研究综述[J].社会科学研究,2009(5):188-192. 被引量：108
8岳颖.评价理论中“级差”的语篇功能研究概述[J].外语学刊,2012(1):84-88. 被引量：35
9周德志,刘怀亮,张倩.基于复杂网络的文本语义社区的构建[J].情报杂志,2013,32(10):136-140. 被引量：6
10房红梅.论评价理论对系统功能语言学的发展[J].现代外语,2014,37(3):303-311. 被引量：53

引证文献7

1毛文伟.情感分析工具的性能对比及其在二语习得研究中的应用[J].外语电化教学,2022(5):94-100. 被引量：4
2毛文伟,梁鹏飞,蒋夏梦.进展问题展望数据挖掘技术在日语语言研究中的应用[J].日语学习与研究,2022(6):76-94. 被引量：3
3毛文伟.基于语料库的中国日语学习者机能辞习得状况研究[J].东北亚外语研究,2023,11(1):22-35.
4孙成志,王成一.评价理论态度系统视域下集体身份的话语建构——以日本主流报纸“中国技能实习生”为例[J].日语学习与研究,2023(3):17-26. 被引量：1
5毛文伟,谢冬,郎寒晓.ChatGPT赋能新时代日语教学:场景、问题与对策[J].外语学刊,2023(6):25-33. 被引量：5
6王淑一,纪卫宁.基于数据挖掘技术的外语类国家级大创项目立项热点研究[J].创新与创业教育,2023,14(6):49-57. 被引量：3
7毛文伟,郎寒晓.计量语言学视角下的词汇文体特征研究——以日语副词为研究对象[J].日语学习与研究,2024(3):12-23.

二级引证文献13

1毛文伟,谢冬,郎寒晓.ChatGPT赋能新时代日语教学:场景、问题与对策[J].外语学刊,2023(6):25-33. 被引量：5
2阮宜龙,张宏俊.数据挖掘技术及其在电信业中应用的研究[J].软件,2024,45(1):13-17.
3汪珶.基于知识蒸馏改进双路BERT的经济类文本情感分析[J].山西师范大学学报（自然科学版）,2024,38(1):39-44.
4宝铁梅.大学日语教育中应用生成式AI的SWOT分析[J].品位·经典,2024(1):60-64.
5霍雨光.应急语言服务融入高校英语专业双创实践的路径探索[J].佳木斯职业学院学报,2024,40(6):146-148.
6冀东,秦世波,王宏宇.基于大创项目数据画像的创新创业教育现状审视与对策研究[J].潍坊学院学报,2024,24(3):81-91.
7毛文伟,郎寒晓.计量语言学视角下的词汇文体特征研究——以日语副词为研究对象[J].日语学习与研究,2024(3):12-23.
8何洋洋.生成式人工智能工具介入的“基础俄语”课程教学探索与反思[J].黑龙江教育（理论与实践）,2024(8):83-85.
9王宏俐,闫开伦,张寅.基于语料库与机器学习的推特涉华生态话语研究[J].外语电化教学,2024(3):48-55.
10李莉文.语言政策视角下人工智能与外语教育融合研究[J].语言政策与规划研究,2024(1):35-46.

1梁婷瑜.中美航运企业英文网站的语言特征研究:词汇密度和词频[J].现代语言学,2022,10(4):798-806.
2陈可嘉,刘惠.文本分类中基于单词表示的全局向量模型和隐含狄利克雷分布的文本表示改进方法[J].科学技术与工程,2021,21(29):12631-12637. 被引量：4
3赵丹,刘建国,陈曼倩.基于数据挖掘技术的文本分析研究[J].无线互联科技,2022,19(2):116-117. 被引量：2
4卢莹莹.基于词汇密度的教材难易度比较研究——以毛立群《物流专业英语》和牛国崎《物流专业英语》为例[J].现代语言学,2022,10(4):714-717.
5卜月琴.从读到写:运用动态描写表现景物变化——统编教材五年级上册第七单元习作简析及教学建议[J].小学语文教师,2021(12):24-27.
6奇曼古丽·许库力,阿布都外力·卡迪尔.维吾尔语助动词kεt-的偏误分析及教学对策探析[J].汉字文化,2021(S01):31-32.
7严雪梅.汉英翻译中的中式英语现象研究[J].休闲,2021(11):0102-0102.
8陈一坐.水果学园故事系列第一百零四集自由而无用[J].桥牌,2022(5):61-63.
9刘彦,李泓池,张昊男,曲怡,尤陌.体感交互技术在医学领域中应用的前沿与趋势[J].中国数字医学,2022,17(1):95-100. 被引量：2
10严中华.《四季之美》教学实录与反思[J].课程教材教学研究（教育研究）,2021(9):60-62.

日语学习与研究

2022年第2期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部