基于ELMO的低资源神经机器翻译被引量：3

Low-resource Neural Machine Translation Based on ELMO

下载PDF

导出

摘要低资源神经机器翻译的研究难点是缺乏大量的平行语料来给模型进行训练。随着预训练模型的发展,并且在各大自然语言处理任务中均取得很大的提升,本文提出一种融合ELMO预训练模型的神经机器翻译模型来解决低资源神经机器翻译问题。本文模型在土耳其语-英语低资源翻译任务上相比于反向翻译提升超过0.7个BLEU,在罗马尼亚语-英语翻译任务上提升超过0.8个BLEU。此外,在模拟的中-英、法-英、德-英、西-英这4组低资源翻译任务上相比于传统神经机器翻译模型分别提升2.3、3.2、2.6、3.2个BLEU。实验表明使用融合ELMO的模型来解决低资源神经机器翻译问题是有效的。 The difficulty in low-resource neural machine translation is lack of numerous parallel corpus to train the model.With the development of the pre-training model,it has made great improvements in various natural language processing tasks.In this paper,a neural machine translation model combining ELMO is proposed to solve the problem of low-resource neural machine translation.There are more than 0.7 BLEU improvements in the Turkish-English low-resource translation task compared to the back translation,and more than 0.8 BLEU improvements in the Romanian-English translation task.In addition,compared with the traditional neural machine translation model,the simulated low-resource translation tasks of Chinese-English,French-English,German-English and Spanish-English increase by 2.3,3.2,2.6 and 3.2 BLEU respectively.The experimental results show that the ELMO model is effective for low-resource neural machine translation.

作者王浩畅孙孟冉赵铁军 WANG Hao-chang;SUN Meng-ran;ZHAO Tie-jun(School of Computer and Information Technology,Northeast Petroleum University,Daqing 163318,China;School of Computer Science and Technology,Harbin Institute of Technology,Harbin 150001,China)

机构地区东北石油大学计算机与信息技术学院哈尔滨工业大学计算机科学与技术学院

出处《计算机与现代化》 2021年第7期38-42,共5页 Computer and Modernization

基金国家自然科学基金资助项目(61402099,61702093)。

关键词低资源平行语料预训练模型神经机器翻译模型 low-resource parallel corpus pre-training model neural machine translation model

分类号 TP38 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

同被引文献12

1陈祎荻,秦玉平.基于机器学习的文本分类方法综述[J].渤海大学学报（自然科学版）,2010,31(2):201-205. 被引量：12
2翟剑锋.基于BERT的用户画像[J].电子技术与软件工程,2019,0(24):253-255. 被引量：4
3石磊,王毅,成颖,魏瑞斌.自然语言处理中的注意力机制研究综述[J].数据分析与知识发现,2020,4(5):1-14. 被引量：63
4高晗,田育龙,许封元,仲盛.深度学习模型压缩与加速综述[J].软件学报,2021,32(1):68-92. 被引量：62
5徐佳,叶娜,张桂平,黎天宇.利用质量估计改进无监督神经机器翻译[J].中文信息学报,2021,35(3):51-59. 被引量：6
6贾澎涛,孙炜.基于深度学习的文本分类综述[J].计算机与现代化,2021(7):29-37. 被引量：20
7李铮,陈莉,张爽.基于ELMo和Bi-SAN的中文文本情感分析[J].计算机应用研究,2021,38(8):2303-2307. 被引量：12
8岳增营,叶霞,刘睿珩.基于语言模型的预训练技术研究综述[J].中文信息学报,2021,35(9):15-29. 被引量：47
9陈可嘉,刘惠.基于改进BiGRU-CNN的中文文本分类方法[J].计算机工程,2022,48(5):59-66. 被引量：13
10安娜,白雄文,王红艳,张萌.基于双流注意力机制的阅读理解式事件抽取模型[J].计算机工程与设计,2022,43(6):1686-1693. 被引量：7

引证文献3

1顾玉蓉.基于预训练模型的深度学习算法优化研究[J].无线互联科技,2023,20(3):126-128. 被引量：1
2苑婧,周杨,胡校飞,孙姝娅,张呈龙,刘龙辉.融合多教师模型的知识蒸馏文本分类[J].电子技术应用,2023,49(11):42-48. 被引量：2
3仁青卓玛,拥措,唐超超.面向藏汉神经机器翻译的数据筛选方法[J].计算机与现代化,2024(6):19-24.

二级引证文献3

1王力康,田勇,胡成,王红军,马青.模拟仿真技术在选择性催化还原脱硝中的应用[J].科技创新与应用,2023,13(32):177-180.
2梅巧玲,郝晓培,杨立鹏,易超.基于实时流处理的自适应冰雪爱好者旅客群体划分模型研究[J].铁道运输与经济,2024,46(4):27-33.
3周子凡,李志.基于多教师知识蒸馏的多语种仇恨言论识别[J].中国人民警察大学学报,2024,40(10):31-38.

1徐红云.蒙古语从格与土耳其语从格比较分析[J].中国蒙古学（蒙文）,2021,49(2):168-175.
2曲倩倩,王治梅,马伦.中医典籍书名翻译的“三维”转换[J].西部中医药,2021,34(6):158-160.
3叶晓辉,张军,闾荔,代安稳,尹杰.水蒸气壁面冷凝数值模拟中源项模型的发展现状[J].节能,2021,40(6):66-70.
4刘彤,刘琛,倪维健.多层次数据增强的半监督中文情感分析方法[J].数据分析与知识发现,2021,5(5):51-58. 被引量：8
5丁泽源,杨志豪,罗凌,王磊,张音,林鸿飞,王健.基于深度学习的中文生物医学实体关系抽取系统[J].中文信息学报,2021,35(5):70-76. 被引量：15
6郑珊,周海银.西方高校本科课程设计模型的发展轨迹及启示[J].中国人民大学教育学刊,2021(2):160-180. 被引量：6
7贾澎涛,孙炜.基于深度学习的文本分类综述[J].计算机与现代化,2021(7):29-37. 被引量：20
8周忠宝,任甜甜,肖坤虎,吴士健,LIU Wenbin.存在非期望产出的决策单元阻塞问题研究[J].中国管理科学,2021,29(6):115-124.
9申梦悦,代梧佑.陈式太极拳翻译若干问题研究[J].武术研究,2021,6(7):66-68. 被引量：2
10陈佳明,王庆,王英英,曾伟伟,尹纪元,李莹莹.水产动物模型的建立及在病害防控上的研究进展[J].生态毒理学报,2021,16(2):119-126. 被引量：1

计算机与现代化

2021年第7期

浏览历史

内容加载中请稍等...

基于ELMO的低资源神经机器翻译被引量：3

同被引文献12

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于ELMO的低资源神经机器翻译 被引量：3

同被引文献12

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于ELMO的低资源神经机器翻译被引量：3