局部感知递归神经网络在语言模型中的应用被引量：4

Character-Level language modeling with local-aware recurrent neural network

下载PDF

导出

摘要数据序列预测被许多人认为是机器学习和人工智能领域中的关键问题,在一系列的单词或字符数据处理任务的语言模型中,递归神经网络展示出了当前最优秀的序列预测能力。文中通过将三层RNN按一定层次组合在一起,由低层到高层使每一层负责不同层次的信息处理,从而使新模型具有更强的信息综合能力,从而使得模型更容易处理较长的数据序列。在Penn Treebank Data数据集做字符级(Character-Level)语言模型中的测试结果显示,新模型获得了与CNN-LSTM等当前最好模型相匹敌的成绩。 Data sequence predicting is considered by Scientist as a key problem in machine learning and artificial intelligent. Meanwhile,the recurrent neural network has shown it ＇s state-to-art sequence prediction ability in a series of word or character data sequence processing. In this paper,three layers of recurrent neural network were stacked together as a special hierarchy,from low level to high level,each processing specific level of data sequence, to make a new model that is more powerful on data comprehensive and long sequence processing. On Penn Treebank Data dataset test,the language model achieves the result that is competitive to models as CNN-LSTM＇s.

作者王刚刘惠义 WANG Gang,LIU Hui-yi(School of Computer and Information Technology, Hohai University, Nanjing 211100,Chin)

机构地区河海大学计算机与信息学院

出处《信息技术》 2018年第4期94-97,102,共5页 Information Technology

关键词自然语言处理神经网络递归神经网络 LSTM natural language processing neural net w o r k recurrent neural net w o r k long short-term memory

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献37

1戴新宇,尹存燕,陈家骏,郑国梁.机器翻译研究现状与展望[J].计算机科学,2004,31(11):176-179. 被引量：28
2蒋嵘,李德毅.基于形态表示的时间序列相似性搜索[J].计算机研究与发展,2000,37(5):601-608. 被引量：34
3余正红,伍永豪,邓娟,王俊.基于Hadoop与XMPP的云翻译系统的研究与实现[J].计算机与数字工程,2014,42(2):239-242. 被引量：2
4蒋锐滢,崔磊,何晶,周明,潘志庚.基于主题模型和统计机器翻译方法的中文格律诗自动生成[J].计算机学报,2015,38(12):2426-2436. 被引量：16
5张舸,张鹏远,潘接林,颜永红.基于递归神经网络的语音识别快速解码算法[J].电子与信息学报,2017,39(4):930-937. 被引量：17
6张阳,余正涛,周珂.词汇化调序模型中融合语言特性的层次短语翻译方法研究[J].计算机与数字工程,2017,45(12):2389-2392. 被引量：3
7刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：473
8王毅,谢娟,成颖.结合LSTM和CNN混合架构的深度神经网络语言模型[J].情报学报,2018,37(2):194-205. 被引量：19
9李洁,林永峰.基于多时间尺度RNN的时序数据预测[J].计算机应用与软件,2018,35(7):33-37. 被引量：50
10邝少辉,熊德意.训练语料的不同利用方式对神经机器翻译模型的影响[J].中文信息学报,2018,32(8):53-59. 被引量：4

引证文献4

1司存友,李珂,周金玉.基于相似性搜索的水文时间序列预测模型研究[J].信息技术,2020,44(3):19-24. 被引量：8
2董斌.基于改进编码/解码模型的中英机器翻译方法[J].计算机与数字工程,2021,49(6):1253-1257. 被引量：5
3潘红丽.基于RNN弱监督网络的英语语义分析技术研究[J].电子设计工程,2021,29(15):97-101. 被引量：4
4林岚,武雨桐.大型语言模型在医疗领域的应用现状与展望[J].医疗卫生装备,2024,45(8):102-109.

二级引证文献17

1张蕾.基于时序相似性搜索的设备状态预测[J].上海电机学院学报,2020,23(6):328-332.
2李丽,赖俊星.基于Attention的AIS数据段相似性搜索模型[J].指挥控制与仿真,2022,44(1):86-91.
3杨琼波,崔东文.WPD-RSO-ESN和SSA-RSO-ESN模型在径流时间序列预测中应用比较[J].中国农村水利水电,2022(2):61-67. 被引量：16
4王颖洁,朱久祺,汪祖民,白凤波,弓箭.自然语言处理在文本情感分析领域应用综述[J].计算机应用,2022,42(4):1011-1020. 被引量：50
5刘渝.融合语言特征和神经网络的英语机器翻译研究[J].自动化与仪器仪表,2022(5):142-145. 被引量：3
6付敏.基于特征提取的英汉机器自动转换翻译系统设计[J].自动化与仪器仪表,2022(5):166-169. 被引量：1
7杨雪晴.基于语音识别的英语翻译器设计[J].自动化与仪器仪表,2022(8):221-225. 被引量：4
8刘红学,翁茂峰,刘益晓.基于LSTM神经网络模型的灞河流域径流预报研究[J].江西水利科技,2023,49(3):206-212. 被引量：4
9田如意,顾风军,彭坤,国栩.基于一维Logistic映射和二维Tent映射双混沌思路的网络信息加密[J].计算机测量与控制,2023,31(6):280-286. 被引量：10
10李敏,张铭锋,朱黎明,彭卓越.基于贝叶斯理论的水文干旱预测[J].水文,2023,43(3):34-39. 被引量：3

1屈莉.高中语文整体阅读教学初探[J].散文百家（下旬刊）,2017,0(8):93-94. 被引量：1
2我给代表委员捎个话[J].绿色中国,2018,0(5):86-87.
3阿依努尔·哈木扎.浅谈如何提高中学生的信息素养[J].新课程（中学）,2016,0(12):262-262.
4刘大千,刘万军,费博雯.局部感知下的稀疏优化目标跟踪方法[J].电子与信息学报,2018,40(2):272-281. 被引量：3
5张俊,刘亚奇.新型职业农民科技素质教育培训策略研究[J].中国成人教育,2017(20):158-160. 被引量：4
6樊爱法.Visual FoxPro环境字符排序探讨[J].河南科学,2011,29(7):859-862.
7李娇,郭瑞良.基于视觉注意机制的男装网络展示研究[J].山东纺织科技,2017,58(6):39-43. 被引量：1
8韩超.给写作一个展示的舞台——例谈初中生作文展示的途径[J].作文成功之路（小学）,2017,0(11):75-75.
9刘旭东,钟小雪,吴海芳,张雨晴,但文超,何庆勇.基于复杂系统熵聚堆方法的1019例血脂异常的中医证候研究[J].北京中医药,2017,36(12):1085-1091. 被引量：4
10彭三春,张云华.基于RNTN和CBOW的商品评论情感分类[J].计算机工程与设计,2018,39(3):861-866. 被引量：4

信息技术

2018年第4期

浏览历史

内容加载中请稍等...

局部感知递归神经网络在语言模型中的应用被引量：4

同被引文献37

引证文献4

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

局部感知递归神经网络在语言模型中的应用 被引量：4

同被引文献37

引证文献4

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

局部感知递归神经网络在语言模型中的应用被引量：4