时域和频域特征相融合的语音端点检测新方法被引量：6

A novel speech activity detection algorithm based on the fusion of time domain and frequency domain features

下载PDF

导出

摘要为了提高语音端点检测的适应性和鲁棒性,提出一种时域和频域特征相融合的语音端点检测新方法.在对语音信号进行预处理的基础上,对每一帧分别提取调和性、清晰度和周期性这3个时域或频域特征,使用主成分分析进行特征融合,并采用双门限法得到语音端点的候选集合.在此基础上通过支持向量机对候选集合中的端点进行判断得到最终结果.仿真实验表明:相对于传统的语音端点检测算法、时域和频域特征相融合的语音端点检测新算法提高了语音端点检测的正确率,有效降低了误测率和漏检率,具有更好的适应性和鲁棒性,对不同噪声背景的信号都有较好的检测能力. In order to improve the adaptability and robustness of speech activity detection,a novel algorithm for speech activity detection（SAD） is proposed based on the integration of time domain and frequency domain features. In the proposed method,three features,i. e. harmonicity,clarity,periodicity are extracted and combined together with principal component analysis. The candidates of the endpoints are detected by double-threshold method. SVM is utilized to determine the final set of endpoints based on the candidates. Experimental results indicate that the proposed SAD method is effective and provides superior and consistent performance across various noise and distortion levels.

作者刘欢王骏林其光王士同

机构地区江南大学数字媒体学院无锡百互科技有限公司

出处《江苏科技大学学报（自然科学版）》 CAS 北大核心 2017年第1期73-78,共6页 Journal of Jiangsu University of Science and Technology:Natural Science Edition

基金国家自然科学基金资助项目(61300151) 江苏省自然科学基金资助项目(BK20130155) 江苏省高校自然科学研究项目(13KJB520001) 科技部科技型中小企业技术创新基金(14C26213201061)

关键词特征融合特征提取支持向量机语音端点检测主成分分析 feature fusion feature extraction support vector machine speech activity detection principal component analysis

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1徐大为,吴边,赵建伟,刘重庆.一种噪声环境下的实时语音端点检测算法[J].计算机工程与应用,2003,39(1):115-117. 被引量：30
2李荣荣,胡昌奎,余娟.基于谱熵的语音端点检测算法改进研究[J].武汉理工大学学报,2013,35(7):134-139. 被引量：10
3王晓华,屈雷.基于时频参数融合的自适应语音端点检测算法[J].计算机工程与应用,2015,51(20):203-207. 被引量：7
4何俊红,王彪.基于倒谱距离—频带方差的端点检测方法[J].计算机与数字工程,2014,42(11):2014-2016. 被引量：3
5朱恒军,于泓博,王发智.小波分析和支持向量机相融合的语音端点检测算法[J].计算机科学,2012,39(6):244-246. 被引量：10
6王坤峰,李镇江,汤淑明.基于多特征融合的视频交通数据采集方法[J].自动化学报,2011,37(3):322-330. 被引量：15
7王宏志,徐玉超,李美静.基于Mel频率倒谱参数相似度的语音端点检测算法[J].吉林大学学报（工学版）,2012,42(5):1331-1335. 被引量：16

二级参考文献82

1严剑峰,付宇卓.一种新的基于信息熵的带噪语音端点检测方法[J].计算机仿真,2005,22(11):117-119. 被引量：13
2赵彦平,赵晓晖.用于语音端点检测的鲁棒性特征提取新方法[J].吉林大学学报（工学版）,2006,36(1):77-81. 被引量：6
3朴春俊,马静霞,徐鹏.带噪语音端点检测方法研究[J].计算机应用,2006,26(11):2685-2686. 被引量：10
4Morris B T, Trivedi M M. Contextual activity visualization from long-term video observations. IEEE Intelligent Systems, 2010, 25(3): 50-62.
5Kanhere N K, Birchfield S T. Real-time incremental segmentation and tracking of vehicles at low camera angles using stable features. IEEE Transactions on Intelligent Transportation Systems, 2008, 9(1): 148-160.
6O'Malley R, Jones E, Glavin M. Rear-lamp vehicle detection and tracking in low-exposure color video for night conditions. IEEE Transactions on Intelligent Transportation Systems, 2010, 11(2): 453-462.
7Maggio E, Cavallaro A. Learning scene context for multiple object tracking. IEEE Transactions on Image Processing, 2009, 18(8): 1873-1884.
8Mandellos N A, Keramitsoglou I, Kiranoudis C T. A background subtraction algorithm for detecting and tracking vehicles. Expert Systems with Applications, 2011, 38(3): 1619-1631.
9Cho S Y, Quek C, Seah S X, Chong C H. HebbR2-Taffic: a novel application of neuro-fuzzy network for visual based traffic monitoring system. Expert Systems with Applications, 2009, 36(3): 6343-6356.
10Hsu W L, Liao H Y M, Jeng B S, Fan K C. Real-time traffic parameter extraction using entropy. IEE Proceedings - Vision, Image and Signal Processing, 2004, 151(3): 194-202.

共引文献80

1卢洵波,李昕.特征融合的VAD方法在语音识别系统中的应用[J].电子测量技术,2020(7):129-136. 被引量：2
2茹海峰,殷业.基于与图像相结合的语音端点检测方法研究[J].仪器仪表学报,2005,26(z1):600-603. 被引量：1
3朱淑琴,裘雪红.一种精确检测语音端点的方法[J].计算机仿真,2005,22(3):214-216. 被引量：15
4王达伟,曹俊兴.一种基于噪音类型估计的端点检测系统[J].计算机工程与应用,2005,41(19):87-89. 被引量：1
5李晔,张仁智,崔慧娟,唐昆.低信噪比下基于谱熵的语音端点检测算法[J].清华大学学报（自然科学版）,2005,45(10):1397-1400. 被引量：37
6刘建辉,卢珞先,黄涛.一种小词汇量快速语音识别系统的实现[J].武汉理工大学学报（信息与管理工程版）,2006,28(2):10-13. 被引量：3
7李晔,崔慧娟,唐昆.基于能量和鉴别信息的语音端点检测算法[J].清华大学学报（自然科学版）,2006,46(7):1271-1273. 被引量：9
8廖逢钗,卢昌荆,王红雨.基于短时平均幅度的语音端点检测的改进[J].三明学院学报,2006,23(2):191-193. 被引量：2
9李晋,王玲.一种改进的孤立词端点检测方法[J].计算机工程与应用,2006,42(30):69-71. 被引量：3
10马英杰,陈骥,帅杰.基于语音识别的失语症康复治疗仪软件设计与实现[J].生物医学工程学杂志,2006,23(6):1343-1346. 被引量：7

同被引文献32

1高应波,柳钦火,李静,杨乐.基于时序植被指数特征时相识别的多熟制耕地提取新方法[J].遥感技术与应用,2015,30(3):431-438. 被引量：12
2李晔,张仁智,崔慧娟,唐昆.低信噪比下基于谱熵的语音端点检测算法[J].清华大学学报（自然科学版）,2005,45(10):1397-1400. 被引量：37
3闫润强,祖漪清,朱贻盛.递归趋势分析在汉语语音声韵母切分中的应用研究[J].信号处理,2007,23(4):521-525. 被引量：5
4武鹏鹏,赵刚,邹明.基于多窗谱估计的改进谱减法[J].现代电子技术,2008,31(12):150-152. 被引量：20
5汉小欢,景新幸.基于功率谱差分和TEO的语音端点检测[J].计算机应用与软件,2011,28(4):82-83. 被引量：6
6王艳,冯宏伟,张利平,忽满利.基于元音检测的汉语连续语音声韵母分割[J].计算机工程与应用,2011,47(14):134-136. 被引量：7
7陈斌,张连海,王波,屈丹.基于Seneff听觉谱特征的汉语连续语音声韵母边界检测[J].声学学报,2012,37(1):104-112. 被引量：6
8卢志茂,金辉,张春祥,任明溪.基于HHT和OSF的复杂环境语音端点检测[J].电子与信息学报,2012,34(1):213-217. 被引量：12
9陆东钰,周萍.基于双门限算法的语音端点检测和声韵母分离研究[J].桂林电子科技大学学报,2011,31(6):480-484. 被引量：10
10李杰,周萍,杜志然.短时TEO能量在带噪语音端点检测中的应用[J].计算机工程与应用,2013,49(12):144-147. 被引量：13

引证文献6

1沈希忠,郑晓修.基于Teager能量算子和经验模态分解的语音端点检测算法[J].电子与信息学报,2018,40(7):1612-1618. 被引量：5
2沈希忠,郑晓修.基于自适应分段的语音端点融合检测[J].应用技术学报,2018,18(3):273-277. 被引量：4
3沈希忠,郑晓修.基于Teager能量算子和经验模态分解的语音端点检测算法[J].电子工程学院学报,2019,8(2):83-89.
4孙梦娜,李天昊.连续语音声韵母自动分段算法研究[J].测控技术,2020,39(11):73-79.
5毛强,刁鸿鹄,章小兵.基于方差和谱熵结合的语音端点检测方法[J].常州工学院学报,2021,34(2):36-40.
6韩天,张宏国,郑重,崔扬,于晓洋.基于时序结构的听觉感知语音信号端点特征检测[J].吉林大学学报（工学版）,2019,49(1):313-318. 被引量：2

二级引证文献10

1卢洵波,李昕.特征融合的VAD方法在语音识别系统中的应用[J].电子测量技术,2020(7):129-136. 被引量：2
2刘婷,柳钰,薛小庆.MATLAB在语音信号处理中的应用[J].电子测试,2018,29(23):74-75. 被引量：8
3罗庆,包亚萍,俞强.基于改进语音特征与极限学习机的语音端点检测[J].微电子学与计算机,2020,37(3):37-41.
4沈钰瑞,李文钧,金伟杰,岳克强.低信噪比环境下子带能熵比端点检测算法[J].计算技术与自动化,2020,39(2):109-113. 被引量：6
5韦莎丽,王健,曾庆宁,郑展恒.低信噪比环境下语音端点检测技术[J].计算机工程与设计,2020,41(9):2507-2514. 被引量：3
6吴亚文,邵睿,李淼,张锋,陶浩兵,辜丽川,焦俊.基于改进EMD-TEO倒谱距离的生猪音频信号端点检测[J].中国农业大学学报,2021,26(4):104-116. 被引量：4
7柏顺,颜夕宏,张生平,陈建飞,张胜.基于梅尔频率倒谱系数与短时能量的低信噪比语音端点检测[J].南京师大学报（自然科学版）,2021,44(2):117-120. 被引量：9
8张净波,杨元维,徐杰,蒋梦月,李鹏,杜李慧.语音驱动弗格森曲线合成嘴唇动画[J].计算机与数字工程,2021,49(8):1676-1681.
9刘庆强,郑长敏,何红凯,吴力.一种基于小波阈值的变步长LMS语音降噪算法[J].吉林大学学报（理学版）,2022,60(4):943-949. 被引量：8
10甘智高,岳克强,李文钧,潘成铭.基于ARM的呼吸暂停综合征检测系统[J].电子技术应用,2023,49(10):124-129.

1朱恒军,于泓博,王发智.小波分析和支持向量机相融合的语音端点检测算法[J].计算机科学,2012,39(6):244-246. 被引量：10
2杨尚国,杨新华,马晓东.基于互相关函数的孤立词端点检测算法[J].微计算机信息,2007,23(18):202-203. 被引量：1
3金敏.多特征和神经网络相结合的语音端点检测算法[J].计算机应用与软件,2013,30(5):307-310. 被引量：2
4刘妮.多特征和支持向量机相结合的语音端点检测模型[J].重庆邮电大学学报（自然科学版）,2013,25(5):686-689. 被引量：2
5马瑞,张盛兵,郑乔石.一种语音端点检测电路的设计[J].计算机工程与应用,2010,46(14):69-71. 被引量：2
6张梅.一种语音端点检测算法及其在DSP上的实现[J].电子技术应用,2012,38(8):133-135. 被引量：3
7宋海吒,唐立军,谢新辉,周小果.基于FPGA的语音端点检测[J].微型机与应用,2010,29(22):76-78.
8孙一鸣,吴杨扬,李平.基于改进双门限法的语音端点检测研究[J].长春理工大学学报（自然科学版）,2016,39(1):91-95. 被引量：14
9张毅,王可佳,席兵,颜博.基于子带能熵比的语音端点检测算法[J].计算机科学,2017,44(5):304-307. 被引量：11
10李守轩,张华,刘继忠,朱克华.基于DTW的轮椅命令字识别系统研究[J].电声技术,2008,32(2):49-51.

江苏科技大学学报（自然科学版）

2017年第1期

浏览历史

内容加载中请稍等...

时域和频域特征相融合的语音端点检测新方法被引量：6

参考文献7

二级参考文献82

共引文献80

同被引文献32

引证文献6

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

时域和频域特征相融合的语音端点检测新方法 被引量：6

参考文献7

二级参考文献82

共引文献80

同被引文献32

引证文献6

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

时域和频域特征相融合的语音端点检测新方法被引量：6