融合BERT语境词向量的译文质量估计方法研究被引量：7

Integrating BERT Word Embedding into Quality Estimation of Machine Translation

下载PDF

导出

摘要蕴含语义、句法和上下文信息的语境词向量作为一种动态的预训练词向量,在自然语言处理的下游任务中有着广泛应用。然而,在机器译文质量估计中,没有相关研究工作涉及语境词向量。该文提出利用堆叠双向长短时记忆网络将BERT语境词向量引入神经译文质量估计中,并通过网络并联的方式与传统的译文质量向量相融合。在CWMT18译文质量估计评测任务数据集上的实验结果表明,融合中上层的BERT语境词向量均显著提高了译文质量估计与人工评价的相关性,并且当对BERT语境词向量的最后4层表示平均池化后引入译文质量估计中对系统性能的提高幅度最大。实验分析进一步揭示了融合语境词向量的方法能利用译文的流利度特征来提高翻译质量估计的效果。 The word embedding of BERT contains semantic, syntactic and context information, pre-trained for a various downstream tasks of natural language processing. We propose to introduce BERT into neural quality estimation of MT outputs by employing stacked BiLSTM(bidirectional long short-term memory), concatenated with the existing the quality estimation network at the output layer. The experiments on the CWMT18 datasets show that the quality estimation can be significantly improved by integrating upper and middle layers of the BERT, with the top-improvement brought by average pooling of the last four layers of the BERT. Further analysis reveals that the fluency in translation is better exploited by BERT in the MT quality estimation task.

作者李培芸李茂西裘白莲王明文 LI Peiyun;LI Maoxi;QIU Bailian;WANG Mingwen(School of Computer and Information Engineering,Jiangxi Normal University,Nanchang,Jiangxi 330022,China)

机构地区江西师范大学计算机信息工程学院

出处《中文信息学报》 CSCD 北大核心 2020年第3期56-63,共8页 Journal of Chinese Information Processing

基金国家自然科学基金(61662031,61462044,61876074)。

关键词神经译文质量估计语境词向量循环神经网络编码器-解码器网络质量向量 neural quality estimation of machine translation contextual word embedding recurrent neural network encoder-decoder network quality vector

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1李亚超,熊德意,张民.神经机器翻译综述[J].计算机学报,2018,41(12):2734-2755. 被引量：109
2陈志明,李茂西,王明文.基于神经网络特征的句子级别译文质量估计[J].计算机研究与发展,2017,54(8):1804-1812. 被引量：14
3孙潇,朱聪慧,赵铁军.融合翻译知识的机器翻译质量估计算法[J].智能计算机与应用,2019,9(2):271-275. 被引量：12
4刘洋.神经机器翻译前沿进展[J].计算机研究与发展,2017,54(6):1144-1149. 被引量：107

二级参考文献3

1尹宝生,苗雪雷,季铎,蔡东风,张桂平.大规模无参考译文质量自动评测技术的研究[J].沈阳航空航天大学学报,2012,29(1):70-74. 被引量：3
2刘知远,孙茂松,林衍凯,谢若冰.知识表示学习研究进展[J].计算机研究与发展,2016,53(2):247-261. 被引量：261
3焦李成,杨淑媛,刘芳,王士刚,冯志玺.神经网络七十年:回顾与展望[J].计算机学报,2016,39(8):1697-1716. 被引量：369

共引文献201

1熊璨.论人工智能翻译的可能性——从翻译的三个层次看非文学与文学翻译[J].中外文化与文论,2020(2):106-115. 被引量：2
2赵莹莹.机器翻译与人工翻译特点对比与关系分析[J].作家天地,2020(13):30-31.
3王醒.译军突起:人工翻译能否经受住机器翻译的考验?[J].现代英语,2021(10):72-74. 被引量：1
4贾承勋,赖华,余正涛,文永华,于志强.基于短语替换的汉越伪平行句对生成[J].中文信息学报,2021,35(8):47-55. 被引量：2
5明玉琴,夏添,彭艳兵.基于GAN模型优化的神经机器翻译[J].中文信息学报,2020(4):47-54. 被引量：7
6邓凌云,余环.中外笔译质量要求的对比研究与启示[J].当代外语研究,2019,0(4):115-123.
7朱婕.汉韩机器翻译错误分析[J].大众标准化,2021(2):134-136.
8夏玲,李宜蔓,李弘武.人工智能背景下科技论文摘要的机器翻译与译后编辑[J].编辑学报,2022,34(4):396-401. 被引量：12
9赵玉蓉,刘欢,龙玟月,杨鑫,杨茜,阮先玉.浅析张培基英译散文风格与AI英译散文风格[J].新东方英语（中英文版）,2019,0(12):101-102.
10李思特.基于自然语言处理的人工智能歌词创作[J].中国科技纵横,2019,0(14):41-42.

同被引文献54

1罗琪,李茂西.引入源端信息的机器译文自动评价方法研究[J].中文信息学报,2021,35(12):60-67. 被引量：2
2彭义春,张捷,卢伟杰,陈佐瓒.基于RBF-BP神经网络的人居环境自然适宜性评价[J].智能计算机与应用,2022,12(1):28-34. 被引量：1
3陈志明,李茂西,王明文.基于神经网络特征的句子级别译文质量估计[J].计算机研究与发展,2017,54(8):1804-1812. 被引量：14
4张琴,郭红梅,张智雄.融合词嵌入表示特征的实体关系抽取方法研究[J].数据分析与知识发现,2017,1(9):8-15. 被引量：8
5李亚超,熊德意,张民.神经机器翻译综述[J].计算机学报,2018,41(12):2734-2755. 被引量：109
6刘洋.神经机器翻译前沿进展[J].计算机研究与发展,2017,54(6):1144-1149. 被引量：107
7孙潇,朱聪慧,赵铁军.融合翻译知识的机器翻译质量估计算法[J].智能计算机与应用,2019,9(2):271-275. 被引量：12
8李芊芊,张克亮.基于依存分析的军事领域英文实体关系抽取研究[J].情报工程,2019,5(1):98-112. 被引量：3
9鄂海红,张文静,肖思琪,程瑞,胡莺夕,周筱松,牛佩晴.深度学习实体关系抽取研究综述[J].软件学报,2019,30(6):1793-1818. 被引量：166
10吴粤敏,丁港归,胡滨.基于注意力机制的农业金融文本关系抽取研究[J].数据分析与知识发现,2019,3(5):86-92. 被引量：6

引证文献7

1陈聪,李茂西,罗琪.译文质量估计中基于Transformer的联合神经网络模型[J].中文信息学报,2021,35(6):47-54. 被引量：3
2马江微,吕学强,游新冬,肖刚,韩君妹.融合BERT与关系位置特征的军事领域关系抽取方法[J].数据分析与知识发现,2021,5(8):1-12. 被引量：2
3罗兰,何贤敏,李茂西.句子级别机器译文质量估计研究综述[J].情报工程,2022,8(2):34-50. 被引量：1
4陈世男,贡正仙,李军辉,周国栋.相似度增强的译文质量评估方法[J].厦门大学学报（自然科学版）,2022,61(4):646-653.
5尹天涯.基于最大熵模型的机器翻译错误自动检测研究[J].自动化与仪器仪表,2022(7):35-39. 被引量：5
6王蕊.基于BP神经网络的机器翻译自动化评判模型设计[J].自动化与仪器仪表,2023(4):15-19. 被引量：1
7李伟棠.AI人工智能翻译中基于注意力机制和联合训练的QE任务分析[J].自动化与仪器仪表,2024(9):258-262.

二级引证文献12

1罗兰,何贤敏,李茂西.句子级别机器译文质量估计研究综述[J].情报工程,2022,8(2):34-50. 被引量：1
2程鑫颐,刘海.基于3D技术的虚拟口译仿真系统设计[J].自动化与仪器仪表,2023(8):262-267.
3李指南.生态翻译理念下智能翻译机器人机交互研究[J].自动化与仪器仪表,2023(9):224-228.
4俞立平,梁艳霞.学术评价中客观多属性评价的误差问题研究[J].情报理论与实践,2023,46(12):36-42. 被引量：1
5张昕煜.基于机器视觉技术的生态翻译机器错误文本检测方法设计[J].自动化与仪器仪表,2023(10):179-182.
6李潇.基于人工神经网络的机器自动化翻译及矫正模型构建[J].自动化与仪器仪表,2023(11):20-24. 被引量：1
7蒲真真,罗妮娜.融合长短期记忆和循环神经网络的语言自动化校验模型构建[J].自动化与仪器仪表,2023(12):23-27.
8罗兵,张显峰,段立,陈琳.基于RoBERTa-Span-Attack的标签指针网络军事命名实体识别[J].海军工程大学学报,2024,36(1):76-82. 被引量：1
9张钰,王嘉,袁建园,张益嘉.基于证据图推理的文档级实体关系抽取[J].情报杂志,2024,43(7):122-130.
10葛腾飞.基于Attention机制和双向LSTM编码模型的智能软件工程情景式翻译研究[J].自动化与仪器仪表,2024(7):256-261.

1王涛,武淑红,王耀力.基于半监督宽度学习系统的气温空间插值[J].科学技术与工程,2020,20(2):630-636. 被引量：3
2陈阳.基于Bert和Bi-GRU的心理人格投射测验检验方法与实现[J].物联网技术,2020,10(5):104-106.
3刘卫平,张豹,陈伟荣,张诚,陈渊,潘仁前.基于迁移表示学习的军事命名实体识别[J].指挥信息系统与技术,2020,11(2):64-69. 被引量：6
4郑新宁.语块情景教学模式对提高大学英语口语教学质量的实证研究[J].潍坊学院学报,2019,19(6):91-94. 被引量：1
5李鲁群,徐孟达.基于权重优化LSTM网络跨站脚本攻击检测的研究[J].网络空间安全,2019,10(7):12-19.
6付健,孔芳.融入结构化信息的端到端中文指代消解[J].计算机工程,2020,46(1):45-51. 被引量：1
7陶颖,刘惠义.基于EBGAN的图像风格化技术[J].计算机与现代化,2020,0(4):24-29.
8赵桑榆.农村流动人口地位认同偏移研究[J].风景名胜,2020,0(2):0111-0112.
9郭全刚.江河钓鲇,如何通过“鱼花”和声响选钓位[J].垂钓,2020,0(5):52-53.
10冯晓鹏(文/图).HERA钓技揭秘——浅宙篇(三)[J].垂钓,2020,0(5):73-80.

中文信息学报

2020年第3期

浏览历史

内容加载中请稍等...

融合BERT语境词向量的译文质量估计方法研究被引量：7

参考文献4

二级参考文献3

共引文献201

同被引文献54

引证文献7

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

融合BERT语境词向量的译文质量估计方法研究 被引量：7

参考文献4

二级参考文献3

共引文献201

同被引文献54

引证文献7

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

融合BERT语境词向量的译文质量估计方法研究被引量：7