深度语音信号与信息处理:研究进展与展望被引量：33

Deep Speech Signal and Information Processing:Research Progress and Prospect

下载PDF

导出

摘要首先对深度学习进行简要的介绍,然后就其在语音信号与信息处理研究领域的主要研究方向,包括语音识别、语音合成、语音增强的研究进展进行了详细的介绍。语音识别方向主要介绍了基于深度神经网络的语音声学建模、大数据下的模型训练和说话人自适应技术;语音合成方向主要介绍了基于深度学习模型的若干语音合成方法;语音增强方向主要介绍了基于深度神经网络的若干典型语音增强方案。最后对深度学习在语音信与信息处理领域的未来可能的研究热点进行展望。 Deep learning is briefly introduced at first. Then, a review on the research progress of deep speech signal and information processing is provided along the main research branches including speech recognition, speech synthesis and speech enhancement. For speech recogni- tion, the acoustic modeling methods based on deep neural network（DNN）, DNN model train- ing technologies for big speech data and DNN speaker adaptation methods are introduced. For speech synthesis, several speech synthesis methods based on models in deep learning are sum- marized. For speech enhancement, a couple of typical DNN based speech enhancement frame- works are presented. Finally, the possible future research points of deep speech signal and in- formation processing are discussed.

作者戴礼荣张仕良

机构地区中国科学技术大学语音与语言信息处理国家工程实验室

出处《数据采集与处理》 CSCD 北大核心 2014年第2期171-179,共9页 Journal of Data Acquisition and Processing

基金国家重点基础研究发展计划("九七三"计划)(2012CB326405)资助项目国家自然科学基金(61273264)资助项目

关键词深度学习深度神经网络语音识别语音合成语音增强 deep learning deep neural network speech recognition speech synthesis speech enhancement

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献61

1Hinton G E, Osindero S, Teh Y W. A fast learning algorithm for deep belief nets[J]. Neural computa- tion, 2006,18(7) :1527-1554.
2Arel I, Rose D C, Karnowski T P. Deep machine learning-A new frontier in artificial intelligence re- search[J]. Computational Intelligence Magazine, IEEE, 2010,5(4) :13-18.
3Deng L. An overview of deep-structured learning for information processing[C]//Proc Asian- Pacific Sig nal and Information Processing-Annual Summit and Conference (APSIPA-ASC). Xi'an, China: [s. n. ], 2011.
4Bengio Y. Learning deep architectures for AI[J]. Foundations and Trends in Machine Learning, 2009, 2(1) :1-127.
5Hinton G E. Training products of experts by minimi- zing contrastive divergenee[J]. Neural Computation, 2002,14(8): 1771-1800.
6Baker J, Deng L, Glass J, et al. Developments and directions in speech recognition and understanding, Part 1[J]. Signal Processing Magazine, IEEE, 2009, 26(3) :75-80.
7Yu D, Deng L. Deep learning and its applications to signal and information processing[J]. Signal Process ing Magazine, IEEE, 2011,28(1) : 145-154. H.
8opfield J J. Neural networks and physical systems with emergent collective computational abilities[J]. Proceedings of the National Academy of Sciences, 1982,79(8):2554-2558.
9Orbach J. Principles of neurodynamics perceptrons and the theory of brain mechanisms[J]. Archives of General Psychiatry, 1962,7 (3) : 218.
10Rumelhart D E, Hinton G E, Williams R J. Learn- ing representations by back-propagating errors [J]. Cognitive Modeling, 2002,1 : 213.

同被引文献299

1德庆卓玛.藏语语音识别研究综述[J].西藏大学学报（社会科学版）,2010,25(S1):192-195. 被引量：5
2吴宗济.赵元任先生在汉语声调研究上的贡献[J].清华大学学报（哲学社会科学版）,1996,11(3):60-65. 被引量：44
3黄丽娜,苏轼阁,刘莎,韩娜.中文广东话版与普通话版噪声下言语测试材料的开发(英文)[J].中国耳鼻咽喉头颈外科,2005,12(1):55-60. 被引量：36
4徐士林,应勇.汉语声调的多特征模糊识别方法[J].模式识别与人工智能,1994,7(1):60-65. 被引量：4
5梁国远,查红彬,刘宏.基于三维模型和仿射对应原理的人脸姿态估计方法[J].计算机学报,2005,28(5):792-800. 被引量：25
6杨金辉,易中华,王煦法.一种基于Straight的语音焦点合成方法[J].计算机工程,2005,31(13):46-47. 被引量：3
7徐立.言语识别中的时域及频域信息[J].中华耳科学杂志,2006,4(4):335-342. 被引量：24
8沈琳琳,纪震.采用精选Gabor小波和SVM分类的物体识别[J].自动化学报,2009,4(35):350-355.
9Jeong H J , Kim E H, Kyung-Suk, et al. Determi- nation of the source rate released into the environ- ment from a nuclear power plant[J]. Radiation Pro- tection Dosimetry, 2005,113(3) : 308-313.
10Kalman R E. A new approach to linear filtering and prediction problems[J]. Journal of Basic Engineer- ing, 1960,82(Series D) :35-45.

引证文献33

1冯乐乐,王昆,郝冲,赵阳.语音识别技术在智能作业指导书系统中的应用[J].电声技术,2023,47(1):105-109.
2肖超烈,姚志强,贺淑梅.血脂康与脂必妥对高胆固醇血症的调脂作用比较[J].广东医学,2000,21(5):430-431. 被引量：10
3麦麦提艾力.吐尔逊,戴礼荣.深度神经网络在维吾尔语大词汇量连续语音识别中的应用[J].数据采集与处理,2015,30(2):365-371. 被引量：12
4侯闻宇,凌永生,赵丹,单卿,黑大千,贾文宝.BP神经网络反演核事故源项中重要参数的研究[J].南京航空航天大学学报,2015,47(5):778-784. 被引量：4
5张斌,全昌勤,任福继.语音合成方法和发展综述[J].小型微型计算机系统,2016,37(1):186-192. 被引量：29
6刘念,阚江明.基于多特征融合和深度信念网络的植物叶片识别[J].北京林业大学学报,2016,38(3):110-119. 被引量：24
7韩纪庆.声学事件检测技术的发展历程与研究进展[J].数据采集与处理,2016,31(2):231-241. 被引量：7
8袁飞,陈炜玲,李晔,程恩.水声语音通信体验质量的实时测量方法[J].数据采集与处理,2016,31(2):307-314. 被引量：3
9孙晓辉,凌震华,戴礼荣.融合自动检错的单元挑选语音合成方法[J].数据采集与处理,2016,31(2):385-392.
10马建,陈克绪,肖露欣,吴建华.基于受限玻尔兹曼机的电能质量复合扰动识别[J].南昌大学学报（理科版）,2016,40(1):30-34. 被引量：11

二级引证文献209

1邹澍宣.中医药治疗高脂血症的研究进展[J].天津中医学院学报,2005,24(4):233-235. 被引量：2
2张百放.脂肪肝的药物治疗[J].齐齐哈尔医学院学报,2009,30(1):69-71. 被引量：2
3吴晓晟.脂肪肝的药物治疗[J].中外医学研究,2010,8(9):25-28.
4袁松范.中国进入世贸组织的前景[J].中国医药情报,2000,6(1):34-37. 被引量：3
5卢书伟,蔡皓东,崔振宇.脂肪肝的药物治疗[J].中国新药杂志,2001,10(12):937-940. 被引量：38
6高薇,曾健民.基于卷积神经网络算法的图像识别应用研究[J].西安文理学院学报（自然科学版）,2019,22(1):10-14. 被引量：8
7杜建平,赵自明,夏能能,任薇.原发性高脂血症患者血脂康调脂有效性临床再评价[J].华西医学,2015,30(2):254-262. 被引量：7
8卢宏涛,张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理,2016,31(1):1-17. 被引量：557
9陈明健,陈志泊,杨猛,莫琴.叶片传统特征和距离矩阵与角点矩阵相结合的树种识别算法[J].北京林业大学学报,2017,39(2):108-116. 被引量：10
10郑一力,钟刚亮,王强,赵玥,赵燕东.基于多特征降维的植物叶片识别方法[J].农业机械学报,2017,48(3):30-37. 被引量：26

1董军,胡上序.混沌神经网络研究进展与展望[J].信息与控制,1997,26(5):360-368. 被引量：50
2肖田元.虚拟制造研究进展与展望[J].系统仿真学报,2004,16(9):1879-1883. 被引量：43
3唐四春,袁保宗.计算机视觉研究进展与展望[J].通信学报,1993,14(4):55-64. 被引量：5
4董聪,夏人伟.智能结构研究进展与展望[J].大自然探索,1996,15(2):6-11. 被引量：1
5蔡卫峰.动态系统故障诊断技术研究进展与展望[J].计算机测量与控制,2002,10(12):775-777. 被引量：13
6丁建立,陈增强,袁著祉.DNA计算与DNA计算机研究进展与展望[J].计算机科学,2003,30(12):19-22.
7肖艳萍,张舜标,郑铮华.网络安全态势感知在校园网络安全的研究进展与展望[J].广东农工商职业技术学院学报,2013,29(4):38-41. 被引量：9
8曹春华.你还是对方的好友吗?[J].网友世界,2011(6):21-21.
9黄大宇.结构振动控制的研究进展与展望[J].中原工学院学报,2009,20(4):43-46. 被引量：4
10陶霖密.情感计算研究进展与展望——本期主题专栏“情感计算进展”序[J].中国图象图形学报,2009,14(5).

数据采集与处理

2014年第2期

浏览历史

内容加载中请稍等...

深度语音信号与信息处理:研究进展与展望被引量：33

参考文献61

同被引文献299

引证文献33

二级引证文献209

相关作者

相关机构

相关主题

浏览历史

深度语音信号与信息处理:研究进展与展望 被引量：33

参考文献61

同被引文献299

引证文献33

二级引证文献209

相关作者

相关机构

相关主题

浏览历史

深度语音信号与信息处理:研究进展与展望被引量：33