基于计算听觉场景分析的语音增强改进算法被引量：2

Improved Speech Enhancement Based on Computational Auditory Scene Analysis

下载PDF

导出

摘要针对单通道语音增强问题,基于计算听觉场景分析(CASA)的原理,提出了一种基于CASA计算模型的语音增强改进算法。该算法在特征提取中选择了目标语音有效能量、信道互相关等特征,对语谱能量和互相关特征的阈值选取进行了改进。在5种低信噪比噪声干扰条件下的仿真实验结果证明,该算法输出增强语音的信噪比平均提高了9.32dB,有效地抑制了噪声。 Based on computational auditory scene analysis （CASA）, this paper proposes an improved algorithm for monaural speech enhancement. In the proposed algorithm, both effective energy of target speech and cross-channel correlation are chosen as extracted feature. Moreover, this algorithm improves the threshold selection on energy spectrum and cross-channel correlation feature. Under the condition of low SNR with 5 different noises, the experimental results show that the proposed algorithm can raise the output SNR by 9.32 dB averagely, and attenuates noise effectively.

作者王雨林家骏袁文浩

机构地区华东理工大学信息科学与工程学院

出处《华东理工大学学报（自然科学版）》 CAS CSCD 北大核心 2012年第5期617-621,共5页 Journal of East China University of Science and Technology

关键词语音增强计算听觉场景分析语音有效能量信道互相关二值掩码 speech enhancement computational auditory scene analysis effective energy of targetspeech cross channel correlation binary mask

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献12

1陈雪勤,赵鹤鸣,陈小平.基于计算听觉场景分析的强噪声背景下基音检测方法[J].电路与系统学报,2003,8(3):128-131. 被引量：5
2Bregman A S. Auditory Scene Analysis: The Perceptual Organization of Sound[M]. MA, USA: MIT Press, 1990.
3赵鹤鸣,朱美虹,俞一彪,陈雪勤.一种适于计算声场景分析的混叠语音基音检测方法[J].电子学报,2003,31(1):123-126. 被引量：3
4Shao Yang, Srinivasan S, Jin Zhaozhang, et al. A computa- tional auditory scene analysis system for speech segregation and robust speech recognition [J]. Computer Speech and Language, 2010, 24(1) :77-93.
5Hu Guoning, Wang Deliang. Monaural speech segregation based on pitch tracking and amplitude modulation[J]. IEEE Transactions on Neural Networks, 2004, 15(5):1135-1149.
6Gonzales R C. Digital Image Processing Using Matlab[M]. gejing , China: Publishing House of Electronics Industry, 2005 : 252-284.
7Wang Deliang, Brown G J. Computational Auditory Scene Anatysis [M]. USA: IEEE Press, 2006.
8孟晓辉,肖灵,崔杰.基于听觉感知模型的多通道语音增强系统[J].计算机工程,2010,36(13):9-12. 被引量：3
9Lee Yun-Kyung, Kwon Oh-Wook. Application of shape anal- ysis techniques for improved CASA-based speech separation [J]. IEEE Transactions on Consumer Electronics, 2009, 55 (1) : 146-149.
10虞晓,胡光锐,崔玉红.基于CASA简化模型的语音增强算法[J].上海交通大学学报,2001,35(11):1635-1639. 被引量：3

二级参考文献15

1程俊,张璞,戴善荣,易克初.小波变换用于信号突变的检测[J].通信学报,1995,16(3):96-104. 被引量：36
2JWAndr.A comparison of auditory and blind separation techniques for speech separation [J].IEEE Trans on Speech and Audio Processing,2001,9(3):189-195.
3Gulzow T,Engelsberg A,Heute U.Comparison of a Discrete Wavelet Transformation and a Nonuniform Polyphase Filterbank Applied to Spectral-subtraction Speech Enhancement[J].Signal Processing,1998,64(1):5-19.
4Smith J O,Abel J S.Bark and ERB Bilinear Transforms[J].IEEE Trans.on Speech and Audio Processing,1999,7(6):697-708.
5Evangelism G,Cavaliere S.Frequency-warped Filter Banks and Wavelet Transforms:A Discrete-time Approach via Laguerre Expansion[J].IEEE Trans.on Signal Processing,1998,46(10):2638-2650.
6Vary P.Digital Filter Banks with Unequal Resolution[C] //Proc.of EUSIPCO Conf.on Short Communication Digest.Lausanne,Switzerland:[s.n.] ,1980:41-42.
7Crochiere R,Rabiner L.Multirate Digital Signal Processing[M].New Jersey,USA:Prentice-Hall,Inc.,1983.
8Kadambe S, et al. Application of the wavelet transform for pitch detection of speech signals[J]. IEEE Trans. on IT, 1992, 38(2): 917-924.
9Jackson P, Shadle CH. Pitch-Scaled Estimation of Simultaneous Voiced and Turbulence Components in Speech[J]. IEEE Trans. on Speech and Audio Processing, 2001,9(7): 713-726.
10Brown G J, Cooke M. Computational auditory scene analysis[J]. Computer Speech and Language, 1994, 8: 297-336.

共引文献9

1赵彩华,刘琚,孙建德,闫华.基于小波变换和独立分量分析的含噪混叠语音盲分离[J].电子与信息学报,2006,28(9):1565-1568. 被引量：14
2王珊,许刚.基于计算听觉场景分析的语音混叠信号分离[J].计算机工程,2007,33(18):211-213. 被引量：1
3胡连锋,夏秀渝,张佩,李志昌.一种改进的强噪声背景下基音检测算法[J].通信技术,2009,42(12):164-166. 被引量：2
4蒋毅,梁维谦,周宏,冯振明.低信噪比下二值掩蔽算法性能分析[J].清华大学学报（自然科学版）,2012,52(5):636-641. 被引量：3
5王雨,林家骏,袁文浩,陈宁.基于改进基音跟踪算法的单通道语音分离[J].华东理工大学学报（自然科学版）,2013,39(3):338-344. 被引量：4
6高婉贞,张玲华,曹旭来,李云天.基于GSC结构的多通道语音补偿算法研究[J].南京邮电大学学报（自然科学版）,2014,34(4):51-56. 被引量：1
7屈俊玲,李鸿燕.基于计算听觉场景分析的混合语音信号分离算法研究[J].计算机应用研究,2014,31(12):3822-3824. 被引量：6
8唐伟,张二华,张丽娜.基于计算听觉场分析的单声道的双人语音浊音分离[J].计算机与数字工程,2021,49(4):704-710.
9陈健,韩少华,陈红梅,傅丰林.一种基于DSP的语音增强器的设计与实现[J].电声技术,2004,28(2):34-36. 被引量：1

同被引文献23

1赵鹤鸣,葛良,陈雪勤,俞一彪.基于声音定位和听觉掩蔽效应的语音分离研究[J].电子学报,2005,33(1):158-160. 被引量：16
2王珊,许刚.基于计算听觉场景分析的语音混叠信号分离[J].计算机工程,2007,33(18):211-213. 被引量：1
3Wang Deliang, Brown G J. Computational Auditory Scene Analysis: Principles, Algorithms, and Applications [M]. USA.- IEEE Press, 2006.
4Hu Guoning, Wang Deliang. Segregation of unvoiced speech from nonspeech interferences[J]. Journal of the Acoustical Society of America, 2008,124(2): 1306-1379.
5Hu Ke, Wang Deliang. Unvoiced speech segregation from nonspeech interference via CASA and spectral substraction [J]. IEEE Transactions on Audio, Speech and Language Pro cessing, 2011,19(6) : 1600-1609.
6Hu Guoning, Wang Deliang. Monaural speech segregation based on pitch tracking and amplitude modulation [J]. IEEE Transactions on Neural Networks, 2004, 15(5):1135-1149.
7Hu Guoning, Wang Deliang. Auditory segmentation based on onset and offset analysis[J]. IEEE Transactions on Speech and Audio Processing, 2007,15(2): 396 -405.
8Wang Yu, Lin Jiajun, Chen Ning, et al. Improved monaural speech segregation based on computational auditory scene analysis [J]. EURASIP Journal on Audio, Speech, and Music Processing,2013(2) : 1-15.
9Kuldip Paliwal, Kamil Wojcicki, Belinda Schwerin. Single- channel speech enhancement using spectral subtraction in the short-time modulation domain[ J]. Speech Communication, 2010, 52(5) :450-475.
10Hu Ke, Wang Deliang. An unsupervised approach to cochan- nel speech separation [J]. IEEE Transactions on Audio, Speech, and Language Processing, 2013,21(1): 120-129.

引证文献2

1王雨,林家骏,袁文浩,陈宁.基于计算听觉场景分析的改进清音分离方法[J].华东理工大学学报（自然科学版）,2014,40(2):212-217. 被引量：3
2屈俊玲,李鸿燕.基于计算听觉场景分析的混合语音信号分离算法研究[J].计算机应用研究,2014,31(12):3822-3824. 被引量：6

二级引证文献9

1赵蓉蓉,李鸿燕,曹猛.基于CASA和谱减法的清音分离改进算法[J].电子技术应用,2016,42(1):68-71.
2李然军,李辉,李冬冬.改进听觉组织方法的单声道浊语音分离[J].小型微型计算机系统,2016,37(3):637-640.
3李冬冬,唐建,李然军,李辉.基于CASA的噪声环境下的话者辨认[J].小型微型计算机系统,2016,37(5):1107-1111.
4刘航,李扬,袁浩期,王俊影.基于生成对抗网络的语音信号分离[J].计算机工程,2020,46(1):302-308. 被引量：6
5郝敏,刘航,李扬,简单,王俊影.基于聚类分析与说话人识别的语音跟踪[J].计算机与现代化,2020,0(4):7-13. 被引量：4
6杨吕祥,胡燕.基于多层次注意力机制一维DenseNet音频事件检测[J].计算机应用研究,2020,37(6):1642-1646. 被引量：2
7何冰,孟夏卿,顾俊杰,俞杰,李伟.微振动传感与声振特征识别的输电线路环境异变预警研究[J].电力信息与通信技术,2020,18(9):57-63. 被引量：1
8钱政.基于计算听觉场景分析的单声道语音分离研究[J].北京印刷学院学报,2020,28(S02):276-278.
9李伟,曾繁洋,王博,陈忠斌.基于MFCC加权动态特征组合的声纹识别技术在地下电缆防护的应用[J].电力信息与通信技术,2022,20(5):16-22. 被引量：2

1SHENG Bin.An Energy Efficient Transmission Scheme for OFDM Systems in LTE[J].China Communications,2014,11(3):13-18.
2赵晓华,陈辉.蚁群优化和能量有效的Ad Hoc路由协议[J].现代电子技术,2011,34(19):49-51.
3雷军.前途漫漫，希望犹存——电源行业绿色环保技术与趋势分析[J].微型计算机,2009,29(18):16-16.
4王孜,张永红.一种短波扩频通信系统的信号接收方案[J].舰船科学技术,2008,30(B11):128-131. 被引量：2
5葛勇,樊雯,刘慧龙.基于奇异谱分析的盲源分离单通道语音增强算法研究[J].军械工程学院学报,2014,26(1):51-54.
6张永红,杨春兰.短波扩频通信的Rake接收技术[J].信息安全与通信保密,2007,29(6):77-80. 被引量：4
7张应芳.谱能量传感及USRP实现[J].电子世界,2014(2):72-73.
8边东明,冉崇森.一种基于二倍钟采样的OFDM载波偏差估计算法[J].电子学报,2003,31(10):1473-1475.
9林祎,彭华,王彬,钟润添.基于码元分布特性的FSK信号识别算法[J].信息工程大学学报,2012,13(3):274-280. 被引量：2
10孟一鸣,欧智坚.改进的基于长时谱能量差异和基音比例的语音检测方法[J].电讯技术,2013,53(8):1039-1043. 被引量：1

华东理工大学学报（自然科学版）

2012年第5期

浏览历史

内容加载中请稍等...

基于计算听觉场景分析的语音增强改进算法被引量：2

参考文献12

二级参考文献15

共引文献9

同被引文献23

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于计算听觉场景分析的语音增强改进算法 被引量：2

参考文献12

二级参考文献15

共引文献9

同被引文献23

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于计算听觉场景分析的语音增强改进算法被引量：2