谐波显著度的基频提取方法被引量：5

Pitch estimation based on harmonic salience

导出

摘要我们提出的谐波显著度的基频提取方法,目的是从语音信号中自动获取人声基频,该方法利用抑制因子计算出基频的谐波显著度谱,对各次谐波显著度加权求和之后进行基频轨迹跟踪确定语音的基频序列。在TIMIT掺噪数据集和音乐信息检索评测2005主旋律数据集上,谐波显著度方法的准确率分别达到了88.5%和73.3%,使倍频、半频错误相对降低了80%。实验表明,基于谐波显著度的基频提取方法增强了系统的抗噪性能以及抗倍半频错误的能力。 A method based on harmonic salience is proposed for extracting the fundamental frequency from speech signal. It first calculates the harmonic salience spectrum by a inhibiting factor, and summarizes the weighted salience of every harmonic partial. Finally the pitch stream is determined by harmonic tracking. The experiment is conducted with various noised data of TIMIT database and polyphonic melody data of Music Information Retrieval Evaluation Exchange （MIREX） 2005 respectively. The result shows that the accuracy of 88.5% and 73.3% are achieved, and 80% of the half-frequency errors and multi-frequency errors are eliminated. It indicates that this method can effectively enhance the noise immunity and suppress the half-frequency errors and multi-frequency errors.

作者宋黎明李明颜永红

机构地区中国科学院声学研究所中国科学院语言声学与内容理解重点实验室

出处《声学学报》 EI CSCD 北大核心 2015年第2期294-299,共6页 Acta Acustica

基金国家自然科学基金(10925419 90920302 61072124 11074275 11161140319 91120001 61271426) 中国科学院战略性先导科技专项(面向感知中国的新一代信息技术研究 XDA06030100 XDA06030500) 国家863计划(2012AA012503) 中国科学院重点部署项目(KGZD-EW-103-2)资助

关键词显著度语音信号轨迹跟踪基音周期抗噪性能数据集共振峰加权求和基音检测宽度范围 Errors Speech processing

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献28

1吴玺宏.声纹识别听声辨人[J].计算机世界,2001,(8):14.
2张建平,李明,索宏彬,杨琳,付强,颜永红.长时语音特征在说话人识别技术上的应用[J].声学学报,2010,35(2):267-269. 被引量：8
3周若华,颜永红.一个快速自动音乐记谱方法[J].声学学报,2010,35(2):282-287. 被引量：4
4Ding H,Soon Y,Yeo C K.A DCT-based speech enhancement system with pitch synchronous analysis.Audio,Speech,and Language Processing,IEEE Transactions on,2011;19(8):2614-2623.
5Chen J H,Kao Y A.Pitch marking based on an adaptable filter and a peak-valley estimation method.Computational Linguistics and Chinese Language Processing,2001;6(5):1-12.
6Geckinli N,Yavuz D.Algorithm for pitch extraction using zero-crossing interval sequence.Acoustics,Speech and Signal Processing,IEEE Transactions on,1977;25(6):559-564.
7胡海洋,原猛,冯海泓.一种基于动态平滑的实时基频提取算法[J].声学技术,2012,31(6):583-588. 被引量：1
8王杰,耿丽红.基于谐波自相关的基音检测[J].系统工程与电子技术,2013,35(1):218-222. 被引量：2
9俞翠华.含噪语音信号的基音提取算法研究.南京信息工程大学,2011.
10Ahmadi S,Spanias A S.Cepstrum-based pitch detection using a new statistical V/UV classification algorithm.Speech and Audio Processing,IEEE Transactions on,1999;7(3):333-338.

二级参考文献62

1岳振军,王浩,张雄伟.基于正弦谐波模型和BP神经网络的语音变换算法及实现[J].信号处理,2005,21(z1):208-211. 被引量：7
2Campbell W M, Sturim D E, Reynolds D A. Support vector machines using GMM supervectors for speaker verification. IEEE SIGNAL PROCESSING LETTERS, 2006; 13(5).
3Reynolds D A, Rose R C. An integrated speech-background model for robust speaker identification. ICASSP-92 pp. II- 185 - II-188.
4Pelecanos J, Sridharan S. Feature warping for robust speaker verification. In: Proc. ISCA Workshop on Speaker, Recognition - 2001.
5Campbell W M, Sturim D, Reynolds D A, Solomonoff A. SVM based speaker verification using a GMM supervector kernel and NAP variability compensation. ICASSP, 2006: 97-100.
6Kenny P, Boulianne G, Ouellet P, Dumouchel P. Joint factor analysis versus eigenchannels in speaker recognition. IEEE Transactions. on Audio, Speech, and Language, 2007; 15(4): 1435-1447.
7Auckenthaler R, Carey M, Lloyd-Thomas H. Score normalization for text-independent speaker verification systems. Digital Signal Processing, 2000; 10:42-54.
8Dehak Najim, Demouchel Pierre, Kenny Patrick. Modeling prosodic feature with joint factor analysis for speaker verification. IEEE Trans. Audio Speech and Language Processing, 2007.
9Baker Brendan, Vogt Robbie, Sridharan Sridha. Gaussian mixture modeling of broad phonetic and syllable events for text-independent speaker verification. In: Proc. Interspeech2005, Lisbon, Portugal, 2005:2429-2432.
10Zeng Yumin, Wu Huayu, Cao Rong. Pitch synchronous analysis method and criterion based speaker identification. In: Proc. ICNC2007.

共引文献20

1熊新荣.谈声纹识别技术[J].新疆警官高等专科学校学报,2005(z1):59-61.
2郑锦波,张贵仓.一种基于线性预测系数多级矢量量化的语音零水印[J].佳木斯大学学报（自然科学版）,2010,28(5):728-731.
3郑锦波,张贵仓.基于语音低频分量的语音零水印[J].电脑知识与技术,2010(12):9849-9851.
4郭奕,徐红兵,唐继勇,何俐.自动音乐标注系统综述[J].计算机应用研究,2011,28(4):1201-1205. 被引量：2
5黄永明,章国宝,李雄,达飞鹏.全局特征及弱尺度融合策略的小样本语音情感识别[J].声学学报,2012,37(3):330-338. 被引量：9
6王民,曹绘,要趁红.一种改进的小波变换基音检测算法[J].重庆邮电大学学报（自然科学版）,2012,24(3):283-287. 被引量：5
7李倩,庄琳,达钊,郭霞生,章东.讲话人识别系统的鼻腔参数研究[J].声学技术,2012,31(3):291-295.
8杨海,张翔,梁春燕,索宏彬,颜永红.联合因子分析和稀疏表示在稳健性说话人确认中的应用[J].声学学报,2012,37(5):548-552. 被引量：7
9黄永明,章国宝,董飞,李悦.层叠式“产生/判别”混合模型的语音情感识别[J].声学学报,2013,38(2):231-240. 被引量：3
10李申,柳玉华.一种新的双端通话检测方法研究[J].科技广场,2014(8):93-98.

同被引文献27

1刘卫.人声浊音基频测量谱分析算法[J].现代电子技术,2008,31(4):113-114. 被引量：1
2梁颂朗.基于去噪的ACF-CEP基音检测算法[J].中国科技信息,2008(12):37-38. 被引量：1
3王跃,谢磊,杨玉莲.基于自适应白化的音乐节拍实时跟踪算法[J].计算机应用研究,2009,26(5):1676-1678. 被引量：1
4赵鹤鸣,周旭东,金延庆,翁桂荣.基于小波变换的重叠语音基频提取及声调识别[J].声学学报,1999,24(1):87-93. 被引量：15
5王敏,赵鹤鸣.基于多带解调分析和瞬时频率估计的耳语音话者识别[J].声学学报,2010,35(4):471-476. 被引量：12
6周超,洪弘.汉语普通话双基频检测[J].声学学报,2011,36(2):239-243. 被引量：1
7孙艳庆,张晴晴,周瑜,赵庆卫,颜永红.用于语音识别置信度的发音特征各维度分析和子集优化[J].声学学报,2011,36(3):339-348. 被引量：2
8李亚丽,徐为群,颜永红.语义类的提取及其在语音搜索系统中的应用[J].声学学报,2011,36(5):550-556. 被引量：1
9张婷,何凌,黄华,刘肖珩.基于小波及能量熵的带噪语音端点检测算法[J].计算机工程与设计,2013,34(4):1331-1335. 被引量：3
10魏翀,张宇,张赛,徐晓辉.网箱养殖大黄鱼合成声信号特性研究[J].声学学报,2013,38(3):300-305. 被引量：10

引证文献5

1张宇,杨帅,黄楠木,李琳.高速摄影成像分析声带振动发声的前后不对称性[J].声学学报,2017,42(3):341-347. 被引量：1
2Tan Xinjie,Cui Jizhe.A Review of Audio Gene Recognition Copyright Protecting Technology[J].计算机科学与技术汇刊（中英文版）,2017,6(1):8-15.
3杨贵福,夏一鸣,冉华,冯永平,孙慧.基于优化能量值门限和增强倍频效应的抗噪基音检测算法[J].东北师大学报（自然科学版）,2019,51(1):63-70.
4后方帅,黎美琪,刘若伦.利用谐波显著度和语者音色特征的混合语音中目标人基频轨迹提取[J].声学技术,2019,38(4):408-413. 被引量：3
5章森,曹瑞兴,邓海刚.一种稳定、精准、实时的语音信号基频的检测与提取算法[J].图像与信号处理,2020,9(4):246-255.

二级引证文献4

1吴亮,叱干鹏举,王素品,万明习.声带上表面振动黏膜波波速的激光测振估计方法[J].声学学报,2020,45(1):124-130.
2章瑾,冯平.影视动画配音节奏特征自动提取系统设计[J].现代电子技术,2020,43(18):59-63. 被引量：1
3郑攀,周建华,高素杰,陈奔,刘祥雄,巫世晶.基于SPS与CNN的行星齿轮箱故障特征提取与诊断研究[J].机械传动,2022,46(4):73-79. 被引量：4
4孟雨璇,袁尉,李雯,邓丽华,何凌,李元媛.基于语音音调域动态特征的精神分裂症自动检测算法[J].计算机应用与软件,2022,39(8):171-180. 被引量：1

1吕碧波,王根,赵军.863信息检索评测——自动化所[J].中文信息学报,2006,20(B03):78-82.
2曾福庚.无线传感器网络中DV-Hop定位算法的改进[J].海南热带海洋学院学报,2016,23(5):68-71. 被引量：4
3张俊林,刘洋,孙乐,刘群.2005年度863信息检索评测方法研究和实施[J].中文信息学报,2006,20(B03):19-24. 被引量：3
4赵乐,岑荣伟,王灿辉,齐伟,金奕江,张敏,马少平.清华THUIR2005年863信息检索评测[J].中文信息学报,2006,20(B03):91-95.
5范正光,屈丹,闫红刚,张文林.基于深层神经网络的多特征关联声学建模方法[J].计算机研究与发展,2017,54(5):1036-1044. 被引量：6
6张晴晴,刘勇,王智超,潘接林,颜永红.卷积神经网络在语音识别中的应用[J].网络新媒体技术,2014,3(6):39-42. 被引量：15
7朱宁.谈数字图书馆存储系统管理策略[J].办公自动化（办公设备与耗材）,2013(7):42-43. 被引量：1
8张少博,周之平,吴介一,郭小清.一种基于组合型模糊控制的主动队列管理算法[J].信息与控制,2007,36(2):204-210. 被引量：3
9刘权,郭武.基于核主成分分析的话题跟踪系统[J].清华大学学报（自然科学版）,2013,53(6):865-868. 被引量：3
10张志昌,张宇,高立琦,袁新成,胡晓光,刘挺,李生.2005年863信息检索评测哈尔滨工业大学信息检索研究室技术报告[J].中文信息学报,2006,20(B03):83-90.

声学学报

2015年第2期

浏览历史

内容加载中请稍等...

谐波显著度的基频提取方法被引量：5

参考文献28

二级参考文献62

共引文献20

同被引文献27

引证文献5

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

谐波显著度的基频提取方法 被引量：5

参考文献28

二级参考文献62

共引文献20

同被引文献27

引证文献5

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

谐波显著度的基频提取方法被引量：5