基于最长名词短语分治策略的神经机器翻译被引量：7

Divide-and-conquer Strategy of Maximal NP for NMT

下载PDF

导出

摘要神经机器翻译自兴起以来,不断给机器翻译领域带来振奋人心的消息。但神经机器翻译没有显式地利用语言学知识对句子结构进行分析,因此对结构复杂的长句翻译效果不佳。该文基于分治法的思想,识别并抽取句子中的最长名词短语,保留特殊标识或核心词,与其余部分组成句子框架。通过神经机器翻译系统分别翻译最长名词短语和句子框架,再将译文重新组合,缓解了神经机器翻译对句子长度敏感的问题。实验结果表明,该方法获得的译文与基线系统相比,BLEU分值提升了0.89。 Neural Machine Translation（NMT）is defected in long sentences with complex structure owing to its neglect of linguistic knowledge of sentence structure.Adopting the idea of divide-and-conquer strategy,this paper proposes to identifying and extracting the Maximal Noun Phrases in a sentence,and retaining special marks or head words and the rest component to form the sentence framework.Then the Maximal Noun Phrases and sentence frames are translated by NMT,respectively.Experimental results show that the method proposed yields 0.89 imporovments in terms of BLEU score compared with the baseline system.

作者张学强蔡东风叶娜吴闯 ZHANG Xueqiang;CAI Dongfeng;YE Na;WU Chuang(Human-Computer Intelligence Research Center, Shenyang Aerospace University, Shenyang, Liaoning 110136, China)

机构地区沈阳航空航天大学人机智能研究中心

出处《中文信息学报》 CSCD 北大核心 2018年第3期42-48,63,共8页 Journal of Chinese Information Processing

基金国家自然科学基金(61402299 61403262)

关键词神经机器翻译最长名词短语分治策略 neural machine translation maximal-length noun phrase divide-and-conquer strategy

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1蔡东风,赵奇猛,饶齐,王裴岩.基于马尔科夫逻辑网的中文专利最大名词短语识别[J].中文信息学报,2016,30(4):21-28. 被引量：2

二级参考文献4

1代翠,周俏丽,蔡东风,杨洁.统计和规则相结合的汉语最长名词短语自动识别[J].中文信息学报,2008,22(6):110-115. 被引量：16
2鉴萍,宗成庆.基于双向标注融合的汉语最长短语识别方法[J].智能系统学报,2009,4(5):406-413. 被引量：9
3周强,孙茂松,黄昌宁.汉语最长名词短语的自动识别[J].软件学报,2000,11(2):195-201. 被引量：37
4钱小飞,侯敏.基于混合策略的汉语最长名词短语识别[J].中文信息学报,2013,27(6):16-22. 被引量：7

共引文献1

1李志鹏,王锐,张天驰,徐学晨,梁鹏.基于马尔科夫模型的智能汉字盲文转换系统设计[J].单片机与嵌入式系统应用,2019,19(10):33-36. 被引量：3

同被引文献59

1明玉琴,夏添,彭艳兵.基于GAN模型优化的神经机器翻译[J].中文信息学报,2020(4):47-54. 被引量：7
2张剑平,王益.机器人教育:现状、问题与推进策略[J].中国电化教育,2006(12):65-68. 被引量：122
3李峻,刘玉杰.教育的本真:自由的生成与精神的唤醒——雅斯贝尔斯《什么是教育》解读[J].大学教育科学,2007(4):15-19. 被引量：21
4黄荣怀,杨俊锋,胡永斌.从数字学习环境到智慧学习环境——学习环境的变革与趋势[J].开放教育研究,2012,18(1):75-84. 被引量：621
5刘清堂,毛刚,杨琳,程云.智能教学技术的发展与展望[J].中国电化教育,2016(6):8-15. 被引量：64
6王娟,胡来林,安丽达.国外整合STEM的教育机器人课程案例研究——以卡耐基梅隆大学机器人学院ROBOTC课程为例[J].现代教育技术,2017,27(4):33-38. 被引量：23
7朱珂.网络学习空间中学习者交互分析模型及应用研究[J].电化教育研究,2017,38(5):43-48. 被引量：29
8宋鼎新,黄德根.一种融合句法短语的汉英统计机器翻译方法[J].小型微型计算机系统,2017,38(10):2197-2201. 被引量：6
9赵足娥,李培隆.基于弱化语法规则的英文机器翻译的优化研究[J].现代电子技术,2017,40(22):27-29. 被引量：3
10余胜泉.人工智能教师的未来角色[J].开放教育研究,2018,24(1):16-28. 被引量：369

引证文献7

1韦书令,文梦丹,刘权纬.人工智能视域下开放大学教师的信息素养提升:挑战、技术支持与实施策略[J].成人教育,2020,40(10):22-29. 被引量：9
2侯强,侯瑞丽.神经机器翻译研究——洞见与前景[J].外语学刊,2021(5):54-59. 被引量：9
3张海玲,邵玉斌,杨丹,龙华,杜庆治.基于句法规则层次化分析的神经机器翻译[J].小型微型计算机系统,2021,42(11):2300-2306. 被引量：6
4吴迪.基于机器翻译的语法错误检测语音识别模型[J].信息技术,2022,46(5):82-87. 被引量：9
5王少华.基于语音识别的英语名词短语在线翻译系统[J].自动化技术与应用,2022,41(7):184-187. 被引量：3
6牛小青.基于HNC理论的英语长句语义切分全局翻译优化[J].信息技术,2024,48(8):121-126.
7詹聪,李盛乐.改进的模板驱动的神经机器翻译[J].微电子学与计算机,2019,36(5):29-32.

二级引证文献36

1夏玲,李宜蔓,李弘武.人工智能背景下科技论文摘要的机器翻译与译后编辑[J].编辑学报,2022,34(4):396-401. 被引量：12
2李沁遥.智能时代中小学教师信息素养发展研究[J].西部素质教育,2021,7(18):144-146.
3李晗佶,陈海庆.翻译技术中“认知摩擦”问题与消解途径[J].外语学刊,2021(5):60-65. 被引量：1
4刘敏娜.提升地方院校学生信息素养的四位一体人才培养研究[J].陕西教育（高教版）,2022(1):51-52.
5冯俊辉,刘晨,郭浩然.基于模板和规则的声明式代码生成[J].数字技术与应用,2022,40(2):151-154.
6温碧莹,陈丽虹,叶炜莹,叶美玲,向燕.基于人工智能赋能理念的师范生信息素养研究--以广东省国家教师教育创新实验区高校为例[J].教育信息技术,2022(1):89-93. 被引量：2
7王毅,卜丽竹.教师信息素养研究的现状、热点及启示——基于2000-2021年CNKI和Web of Science的文献计量分析[J].齐鲁师范学院学报,2022,37(2):1-12. 被引量：5
8王薇.轻量型的计算机辅助翻译系统设计[J].自动化与仪器仪表,2022(9):110-114. 被引量：1
9李治瑾,赖华,文永华,高盛祥.融合双向依存自注意力机制的神经机器翻译[J].计算机应用,2022,42(12):3679-3685. 被引量：6
10张攀红.人工智能时代高校教师信息化教学能力发展现状及提升策略——以湖北经济学院为例[J].湖北经济学院学报（人文社会科学版）,2023,20(1):126-129. 被引量：14

1刘任涛,陈卫.近邻搜索在多孔材料格点模型建模中的应用[J].计算机工程与应用,2018,54(7):239-244.
2小丁.伞字入谜[J].文史杂志,2008(6):51-51.
3范里.“橙色书包”里不该有偏见[J].甘肃教育,2017(19):7-7.
4泽红.编读之窗[J].文史天地,2011(7):88-88.
5编读之窗[J].文史天地,2011(4):88-88.
6余萍萍.从句子结构处理看张培基散文英译[J].文教资料,2017(24):17-18. 被引量：1
7机器翻译系统取得崭新的突破[J].智能城市,2017,3(12):58-58.
8申玉革.邢台佛教文化与外宣翻译探微[J].校园英语,2018,0(6):209-210.
9编读之窗[J].文史天地,2010(2):89-89.
10罗琳雅.《葛底斯堡演说》译文对英文长句翻译的分析与研究[J].青苹果,2017,0(3X):19-20.

中文信息学报

2018年第3期

浏览历史

内容加载中请稍等...

基于最长名词短语分治策略的神经机器翻译被引量：7

参考文献1

二级参考文献4

共引文献1

同被引文献59

引证文献7

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

基于最长名词短语分治策略的神经机器翻译 被引量：7

参考文献1

二级参考文献4

共引文献1

同被引文献59

引证文献7

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

基于最长名词短语分治策略的神经机器翻译被引量：7