基于声源方位信息和非线性时频掩蔽的语音盲提取算法被引量：10

Speech blind extraction algorithm based on sound source azimuth information and nonlinear time-frequency masking

导出

摘要针对欠定卷积混合的语音信号模型,提出一种基于声源方位信息和非线性时频掩蔽的语音盲提取算法。首先对低频段混合语音信号进行时频分析估计瞬时相对时延(ITD)并采用势函数聚类分析方法估计出声源个数及其ITD,接着锁定目标提取准确的目标语音方位信息,最后利用独立语音在时频域上的近似W一分离正交性,采用非线性时频掩蔽的方法提取目标语音。仿真实验表明,该方法能锁定任意感兴趣目标方位,能有效提取目标语音,文中实验条件下信噪比增益平均达9.5 dB。 For the underdetermined convolution mixture model, a new speech blind extraction algorithm based on sound source azimuth information and nonlinear time-frequency masking was proposed. At first, instantaneous ITDs were calculated through time-frequency analysis in lower frequency domain, and the number of sources and their ITDs were estimated using the potential function. Then the object source was locked and accurate azimuth information of object was estimated. At last, the object speech was extracted via nonlinear time-frequency masking which was based on the azimuth information of object. Simulation results showed that our proposed speech extraction algorithm can lock interested object speech from random direction and extract object speech effectively, the signal-noise-ratio gain （SNRG） was obtained 9.5 dB averagely in our experiment condition.

作者夏秀渝何培宇

机构地区四川大学电子信息学院

出处《声学学报》 EI CSCD 北大核心 2013年第2期224-230,共7页 Acta Acustica

基金国家自然科学基金(61071159)资助项目

关键词盲提取算法语音信号时频分析方位信息非线性掩蔽声源聚类分析方法 Acoustic generators Blind source separation

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献4

1谢志文,尹俊勋,饶丹.空间掩蔽效应的实验研究[J].声学学报,2006,31(4):363-369. 被引量：10
2徐舜,陈绍荣,刘郁林.基于非线性时频掩蔽的语音盲分离方法[J].声学学报,2007,32(4):375-381. 被引量：9
3谢胜利,孙功宪,肖明,傅予力,吕俊.欠定和非完全稀疏性的盲信号提取[J].电子学报,2010,38(5):1028-1031. 被引量：23
4HE Zhaoshui XIE Shengli FU Yu.Sparse representation and blind source separation of ill-posed mixtures[J].Science in China(Series F),2006,49(5):639-652. 被引量：24

二级参考文献34

1章晋龙,谢胜利,何昭水.盲分离问题的可分性理论(英文)[J].自动化学报,2004,30(3):337-344. 被引量：6
2饶丹,谢菠荪,谢志文.双通路立体声条件下的双耳掩蔽[J].电声技术,2005,29(2):53-56. 被引量：8
3谢志文,尹俊勋,饶丹.空间掩蔽效应的实验研究[J].声学学报,2006,31(4):363-369. 被引量：10
4Freymaaa et al. The role of perceived spatial separation in the unmasking of speech. J. Acoust. Soc. Am., 1999; 106:3578-3588
5Good et al. The relation between detection in noise and localization in noise in the free field. Binaural and Spatial Heaving in Real and Virtual Environments, Edited by R.Gilkey and T. Anderson Erlbaum, New York, 1997: 349-376
6Doll T J, Hanna T E. Spatial and spectral release from masking in three-dimensional auditory displays. Hum.Factors, 1995; 37:341-355
7Gatehouse R W. Further research on free-field masking. J.Acoust. Soc. Am. 1987; 82(Suppl.1): S108
8Moore B C J. An introduction to the psychology of hearing. Second Edition, Academic Press, Orlando, F1, USA,1982, Chapter 5
9Johnston J D, Ferreira A J. Sum-difference stereo transfer coding. In: Proc. IEEE ICASSP, 1992:569-571
10Douglas S et al. The effects of spatial separation in distance on the informational and energetic masking of a nearby speech signal. J. Acoust. Soc. Am., 2002; 112(2): 664-676

共引文献60

1谭北海,杨祖元,周郭许,章晋龙.欠定盲分离中源的个数估计和分离算法[J].中国科学（F辑:信息科学）,2009,39(3):349-356. 被引量：6
2钟小丽,谢菠荪.头相关传输函数空间对称性的分析[J].声学学报,2007,32(2):129-136. 被引量：5
3谢胜利,谭北海,傅予力.基于平面聚类算法的欠定混叠盲信号分离[J].自然科学进展,2007,17(6):795-800. 被引量：7
4Xie Shengli Tan Beihai Fu Yuli.Blind signal separation of underdetermined mixtures based on clustering algorithms on planes[J].Progress in Natural Science:Materials International,2007,17(6):670-674. 被引量：2
5徐舜,陈绍荣,刘郁林.基于非线性时频掩蔽的语音盲分离方法[J].声学学报,2007,32(4):375-381. 被引量：9
6Yang Zuyuan Xie Shengli.Estimation of underdetermined mixing matrix based on support vector machine[J].Progress in Natural Science:Materials International,2007,17(11):1363-1367. 被引量：1
7谢志文,金晶.耳机重发下延迟时间对空间分离前向掩蔽效应影响的研究[J].声学学报,2008,33(3):283-287. 被引量：1
8Zuyuan Yang Guoxu Zhou Zongze Wu Jinlong Zhang.New method for signal encryption using blind source separation based on subband decomposition[J].Progress in Natural Science:Materials International,2008,18(6):751-755. 被引量：2
9XU Shun CHEN Shaorong LIU Yulin.Blind speech source separation via nonlinear time-frequency masking[J].Chinese Journal of Acoustics,2008,27(3):203-214.
10付宁,彭喜元.K-Hough欠定盲信道估计算法[J].电子测量与仪器学报,2008,22(5):63-67. 被引量：13

同被引文献105

1罗志增,徐斌.基于小波消噪和盲源分离的脑电信号处理方法[J].华中科技大学学报（自然科学版）,2011,39(S2):157-160. 被引量：4
2赵鹤鸣,葛良,陈雪勤,俞一彪.基于声音定位和听觉掩蔽效应的语音分离研究[J].电子学报,2005,33(1):158-160. 被引量：16
3郑佳.解开“鸡尾酒会效应”之谜[J].世界科学,1995,17(1):23-23. 被引量：1
4胡红英,马孝江.基于局域波分解的信号降噪算法[J].农业机械学报,2006,37(1):118-120. 被引量：26
5谢志文,尹俊勋,饶丹.空间掩蔽效应的实验研究[J].声学学报,2006,31(4):363-369. 被引量：10
6何昭水,谢胜利,傅予力.信号的稀疏性分析[J].自然科学进展,2006,16(9):1167-1173. 被引量：12
7赵彩华,刘琚,孙建德,闫华.基于小波变换和独立分量分析的含噪混叠语音盲分离[J].电子与信息学报,2006,28(9):1565-1568. 被引量：14
8徐舜,陈绍荣,刘郁林.基于非线性时频掩蔽的语音盲分离方法[J].声学学报,2007,32(4):375-381. 被引量：9
9Bell A J;Sejnowski T J.An information-maximization approach to blind separation and blind deconvolution,1995(06).
10肖明,谢胜利,傅予力.基于频域单源区间的具有延迟的欠定盲分离[J].电子学报,2007,35(12):2279-2283. 被引量：20

引证文献10

1张凤仪,夏秀渝,冉国敬,何礼,叶于林.多声源环境下的鲁棒说话人识别[J].计算机系统应用,2015,24(4):32-37. 被引量：1
2钱思冲,向阳,李恒,李胜杨,施雨骁,李瑞.基于计算听觉场景分析的内燃机噪声源分离方法[J].内燃机学报,2015,33(1):63-70. 被引量：1
3钱思冲,向阳,李胜杨,李恒.基于独立分量分析与二值掩膜的语音分离[J].华中科技大学学报（自然科学版）,2015,43(7):87-92. 被引量：2
4孟宗,马钊,刘东,李晶.基于小波半软阈值消噪的盲源分离方法[J].中国机械工程,2016,27(3):337-342. 被引量：10
5叶于林,莫建华,刘夏.多说话人环境下目标说话人语音提取方案[J].计算机系统应用,2016,25(4):8-15. 被引量：1
6蔡良,夏秀渝,陆雄,孙文慧.基于基音跟踪的语音增强研究[J].成都信息工程大学学报,2019,34(1):1-6.
7刘镇,吕超,范远超.基于深度学习的多声源并行化声纹辨别方法[J].江苏科技大学学报（自然科学版）,2018,32(1):106-111. 被引量：6
8康春玉,李文哲,夏志军,李军,李昆鹏,严韶光.盲重构频域阵列信号的压缩感知水声目标方位估计[J].声学学报,2019,44(6):951-960. 被引量：8
9KANG Chunyu,LI Wenzhe,XIA Zhijun,Li Jun,LI Kunpeng,YAN Shaoguang.Direction of arrival estimation for underwater acoustic target based on compressed sensing after blind reconstruction of array signal in frequency domain[J].Chinese Journal of Acoustics,2020,39(1):10-24. 被引量：1
10代勇,夏秀渝,陈林,叶于林.基于时频域的具有延迟的欠定盲分离[J].四川大学学报（工程科学版）,2014,0(S1):166-170. 被引量：3

二级引证文献33

1赵忠华,杨晓梅.基于FastICA的语音盲源分离方法（英文）[J].四川大学学报（自然科学版）,2015,52(4):830-834. 被引量：6
2叶于林,莫建华,刘夏.多说话人环境下目标说话人语音提取方案[J].计算机系统应用,2016,25(4):8-15. 被引量：1
3张袁元,辛江慧,刘国兵,周祥.结合累积量切片的联合对角化盲分离及应用[J].华中科技大学学报（自然科学版）,2016,44(7):86-90.
4王尔馥,郑远硕,陈新武,刘晓珍.语音信号的混沌遮掩及其正定盲提取算法[J].通信学报,2016,37(8):191-198. 被引量：4
5王川川,王华兵,曾勇虎.基于低通滤波和盲源分离算法的信号分离方法研究[J].电子对抗,2016,0(5):22-25.
6乔玲玲,郭秀婷.人体语音特征提取身份优化验证仿真研究[J].计算机仿真,2017,34(2):342-345. 被引量：3
7王川川,曾勇虎,赵明洋,汪连栋.基于小波降噪和盲源分离算法的信号分离方法研究[J].电光与控制,2017,24(7):7-11. 被引量：6
8刘镇,范远超,卜禹,陆璐璐.基于并行化的说话人识别方法的研究[J].信息技术,2017,41(10):121-123.
9陈一飞,汤建龙,马少玥.基于奇异值阈值和DSS的雷达信号盲分离方法[J].电光与控制,2018,25(1):34-36. 被引量：2
10杨正益,刘博文,任山,衡柟男.一种改进的形态-小波阈值降噪方法[J].计算机科学,2018,45(5):300-302. 被引量：9

1高鹰,谢胜利.一种线性混合信号盲提取算法[J].电子与信息学报,2006,28(6):999-1003. 被引量：12
2王尔馥,郑远硕,陈新武,刘晓珍.语音信号的混沌遮掩及其正定盲提取算法[J].通信学报,2016,37(8):191-198. 被引量：4
3王卫华,黄凤岗.基于二阶统计量的非平稳源盲提取算法[J].计算机应用研究,2008,25(4):1054-1056. 被引量：2
4傅予力,沈轶,谢胜利.基于规范高阶累积量的盲分离算法[J].应用数学,2006,19(4):869-876. 被引量：8
5胡国华,李锐,胡学友,陶亮.自适应离散Gabor变换及其时频滤波[J].计算机应用研究,2015,32(5):1421-1423. 被引量：1
6赵仁才,孙钢,郭军.基于模式识别的短波ALE系统8FSK信号解调[J].电讯技术,2004,44(5):19-21. 被引量：3
7陈寿齐,沈越泓,许魁.胎儿心电信号的两步盲提取算法[J].电路与系统学报,2011,16(1):125-130. 被引量：2
8张凤仪,夏秀渝,冉国敬,何礼,叶于林.多声源环境下的鲁棒说话人识别[J].计算机系统应用,2015,24(4):32-37. 被引量：1
9胡然,张天骐,高洪兴.基于离散小波变换和离散余弦变换域的扩频水印盲提取算法[J].计算机应用,2013,33(1):138-141. 被引量：4
10王尔馥,张乃通,孟维晓.多径信道下阵元约束布位的信号盲提取算法[J].哈尔滨工业大学学报,2007,39(5):761-764.

声学学报

2013年第2期

浏览历史

内容加载中请稍等...

基于声源方位信息和非线性时频掩蔽的语音盲提取算法被引量：10

参考文献4

二级参考文献34

共引文献60

同被引文献105

引证文献10

二级引证文献33

相关作者

相关机构

相关主题

浏览历史

基于声源方位信息和非线性时频掩蔽的语音盲提取算法 被引量：10

参考文献4

二级参考文献34

共引文献60

同被引文献105

引证文献10

二级引证文献33

相关作者

相关机构

相关主题

浏览历史

基于声源方位信息和非线性时频掩蔽的语音盲提取算法被引量：10