说话人识别系统中MFCC参数的改进算法被引量：1

Improved MFCC Algorithm in Speaker Recognition System

下载PDF

导出

摘要在说话人识别系统中,如何在语音信号中提取出能够表征说话人个性的特征参数是系统的关键问题之一。目前使用最多的M FCC参数主要描述了表征声道特性的谱包络特征,一般忽略了基音频率对M FCC的影响。由于基音频率能够影响M FCC参数对声道特性的准确描述,进而影响说话人识别系统的性能,因此本文提出了一种基于平滑短时幅度谱包络的S MFCC参数(smoothing MFCC)。实验表明,改进后的M FCC参数能够很好地减少基因频率对M FCC的影响,尤其对于基音频率较高的女性说话者,效果更为显著。 In speaker recognition system,one of the key problems is how to extract the feature parameters which are characterizing the speaker.The currently most widely used MFCC parameter primarily describes the spectrum envelope of the sound tract characteristics and ignores the impacts of fundamental frequency theoretically.Given that the fundamental frequency is able to influence the description accuracy of MFCC parameters about the sound track characteristics,thus influence the performance of the speaker recognition system,this paper puts forward the smoothing MFCC（SMFCC）,which is based on smoothing short-term spectral amplitude envelope.Experimental results show that the improved MFCC parameters can degrade the bad influences of fundamental frequency effectively and upgrade the performances of speaker recognition system,especially for female speakers,who have higher fundamental frequency.

作者兰胜坤石翼波

机构地区福州海峡职业技术学院信息工程系福建工程学院国脉信息学院郑州新智信息技术有限公司

出处《洛阳理工学院学报（自然科学版）》 2013年第4期51-55,63,共6页 Journal of Luoyang Institute of Science and Technology：Natural Science Edition

关键词说话人识别 MFCC 谱包络五点三次算法 speaker recognition MFCC spectral envelop five-dot-cubic method

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1Furui S.An overview of speaker recognition technology[C].ESCA Workshop on Automatic Speaker Recognition,Identification and Verification,1994:1-9.
2杨建华,于小宁.说话人识别中语音特征参数研究[J].大理学院学报（综合版）,2009,8(8):32-35. 被引量：5
3甄斌,吴玺宏,刘志敏,迟惠生.语音识别和说话人识别中各倒谱分量的相对重要性[J].北京大学学报（自然科学版）,2001,37(3):371-378. 被引量：74
4王华朋,杨洪臣.声纹识别特征MFCC的提取方法研究[J].中国人民公安大学学报（自然科学版）,2008,14(1):28-30. 被引量：21
5张伟伟,杨鼎才.用于说话人识别的MFCC的改进算法[J].电子测量与技术,2009,32(8):11 8-122.
6张震,王化清.语音信号特征提取中Mel倒谱系MFCC的改进算法[J].计算机工程与应用,2008,44(22):54-55. 被引量：29
7陆伟,戴蓓蒨,李辉,刘青松.MFCC中的基音频率信息对说话人识别系统性能的影响[J].中国科学技术大学学报,2009,39(8):859-863. 被引量：11

二级参考文献27

1汪峥,连翰,王建军.说话人识别中特征参数提取的一种新方法[J].复旦学报（自然科学版）,2005,44(1):197-200. 被引量：16
2章熙春,曹燕,张军,韦岗.语音MFCC特征计算的改进算法[J].数据采集与处理,2005,20(2):161-165. 被引量：6
3林玮,杨莉莉,徐柏龄.基于修正MFCC参数汉语耳语音的话者识别[J].南京大学学报（自然科学版）,2006,42(1):54-62. 被引量：23
4郭武,王仁华,戴礼荣.基于基音周期与清浊音信息的梅尔倒谱参数[J].数据采集与处理,2007,22(2):229-233. 被引量：1
5杨行峻迟惠生.数字语音信号处理[M].北京:电子工业出版社,1995..
6张雄伟,陈亮,杨吉斌.现代语音技术及应用[M].北京:机械工业出版社.2003.
7Fakhr W,Salam A A,Hamdy N.Enhancement of mismatched conditions in speaker recognition for multimedia applications [J].IEEE International Conference on Acoustics,Speech,and Signal Processing, 2004.
8Sambur M R.Selection of Acoustic Features for Speaker Identification[C].IEEE Trans On ASSP, 1975: 176-182.
9Shajith Ikbal, H.Hermansky, H.Bourlard.Nonlinear Spectral Transformations for Robust Speech Recognition[A].in Proc. of IEEE ASRU 2003 workshop, Nov-Dec, 2003 : 393-398.
10Reynodls D,Rose R.Robust text-independent speaker identification using Gaussian mixture speaker models[J].IEEE Trans on Speech and Audio processing, 1995,3(1 ): 72-83.

共引文献132

1艾佳琪,左毅,刘君霞,贺培超,李铁山,陈俊龙.基于余弦相似度的动态语音特征提取算法[J].计算机应用研究,2020,37(S02):147-149. 被引量：10
2王光艳,赵晓群,王霞.基于MATLAB GUI的语音信号特征提取系统设计[J].河北工业大学学报,2010,39(4):14-18. 被引量：11
3德庆卓玛.藏语语音识别研究综述[J].西藏大学学报（社会科学版）,2010,25(S1):192-195. 被引量：5
4王大巍.基于Windows CE的语音口令识别系统的设计[J].电子技术（上海）,2010(11):40-41.
5岳倩倩,周萍,景新幸.基于非线性幂函数的听觉特征提取算法研究[J].微电子学与计算机,2015,32(6):163-166. 被引量：5
6闫向宏,张亚萍,乔文孝.基于倒双谱的套管井声学评价系统特性辨识[J].应用声学,2005,24(4):250-254.
7李鹏怀,徐佩霞.基于DSP的嵌入式语音识别系统的实现[J].计算机工程,2005,31(16):160-162. 被引量：10
8崔双喜,朴春俊.噪声环境下的语音识别性能研究[J].计算机测量与控制,2005,13(11):1276-1278. 被引量：11
9马军,杨苹.一种聚焦式模糊分段算法及其在语音识别中的应用[J].科技资讯,2006,4(7):2-4.
10白莹,赵振东,戚银城,王斌,郭建勇.基于小波神经网络的与文本无关说话人识别方法研究[J].电子与信息学报,2006,28(6):1036-1039. 被引量：7

同被引文献13

1童英华,陈学煌,冯忠岭.心音和脉搏信号采集系统的设计[J].微型电脑应用,2011(2):63-64. 被引量：1
2成谢锋,马勇,刘陈,张学军,郭宇锋.心音身份识别技术的研究[J].中国科学：信息科学,2012,42(2):237-251. 被引量：24
3李玉鼎.语音信号特征提取中Mel倒谱系MFCC算法的讨论[J].高等函授学报（自然科学版）,2012,25(4):78-80. 被引量：2
4张金溪,徐慧,李照耀.藏语语音处理中对MFCC参数提取的研究[J].无线互联科技,2012,9(11):141-141. 被引量：1
5周俊,双海军,刘丽川.小波变换在声发射信号去噪中的应用研究[J].石油工业计算机应用,2013(1):44-46. 被引量：2
6钟丽莎,万江中,黄志伟,郭兴明,段赟.基于GMM的心音信号生物识别方法研究[J].中国医疗器械杂志,2013,37(2):92-95. 被引量：3
7曹辉,徐晨,赵晓,吴胜举.说话人识别中的Mel特征频率倒谱系数[J].西北大学学报（自然科学版）,2013,43(2):203-208. 被引量：12
8吴迪,曹洁,王进花.基于自适应高斯混合模型与静动态听觉特征融合的说话人识别[J].光学精密工程,2013,21(6):1598-1604. 被引量：18
9袁少锋,王士同.基于多元混合高斯分布的多分类人脸识别方法[J].计算机应用研究,2013,30(9):2868-2871. 被引量：5
10赵新中,陶永耀,贺佩,石敏.一种基于小波邻域的半软阈值去噪算法[J].国外电子测量技术,2016,35(4):42-45. 被引量：14

引证文献1

1刘翔,孙静,赵洋,王威廉.基于MFCC的心音信号特征提取及识别研究[J].电子测量技术,2018,41(2):1-5. 被引量：7

二级引证文献7

1王涛,王国中,朱林林.一种基于声纹识别的智能门锁系统设计与实现[J].电子测量技术,2019,42(3):107-111. 被引量：9
2曾文入,王维博,王彬蓉,房玉,郑永康.基于小波能量谱的先天或风湿性心脏病异常心音分类算法研究[J].航天医学与医学工程,2020,33(2):159-165. 被引量：3
3张小兰,房玉,刘栋博,王维博,王海滨.肥心病心音时频杂波特征提取识别算法研究[J].电子测量与仪器学报,2020,32(4):20-26. 被引量：6
4袁倩影,全海燕.基于新进化优化BP学习算法的心音识别方法[J].吉林大学学报（理学版）,2020,58(5):1195-1201. 被引量：2
5毛文青,管业鹏.基于LPBMFCC的文本无关说话人识别[J].电子测量技术,2020,43(19):169-176.
6王博爱,杨瑞召,李德伟,张都,郭嘉梁.基于循环神经网络的微地震有效信号自动识别[J].断块油气田,2021,28(5):649-654. 被引量：10
7孙树平,张旭,黄婷婷,张弼强,陈豪,杨博文,李辉.随机森林算法在心音分类中的应用研究[J].计算机科学与应用,2020,10(4):591-600.

1张伟伟,杨鼎才.用于说话人识别的MFCC的改进算法[J].电子测量技术,2009,32(8):118-121. 被引量：8
2熊伟,罗云贵.语音识别的MFCC算法研究[J].现代商贸工业,2010,22(3):291-292. 被引量：2
3崔建国,刘宝胜,王桂华,于明月,高阳.基于功率谱包络能量和SVM的舰用发动机故障诊断方法[J].计算机测量与控制,2015,23(12):3953-3955.
4李波,王成友,杨聪,蔡宣平,张尔扬.基于语音频谱包络抽取的MFCC算法[J].国防科技大学学报,2004,26(4):42-45. 被引量：4
5徐欣,李枚亭.基于频谱包络算法的语音转换研究[J].数字技术与应用,2011,29(9):123-125. 被引量：1
6郑文秀,刘悦凯,刘云飞.基于谱包络分形特征提取的仿冒攻击检测[J].西安邮电大学学报,2016,21(2):32-35.
7吴秋玲,杨启文.改进型自适应遗传变异算子[J].河海大学常州分校学报,2005,19(4):12-15. 被引量：5
8孙静,陶智,顾济华,赵鹤鸣.基于AD神经网络的耳语音增强的研究[J].计算机工程与应用,2007,43(29):242-244. 被引量：2
9郑杰.舰载网络中未知协议识别方法研究与仿真[J].舰船科学技术,2015,37(9):166-170.
10张辉,李波,王宝良.利用谱包络变换后LPC系数实现频谱搬移[J].空军工程大学学报（自然科学版）,2006,7(6):62-64. 被引量：1

洛阳理工学院学报（自然科学版）

2013年第4期

浏览历史

内容加载中请稍等...

说话人识别系统中MFCC参数的改进算法被引量：1

参考文献7

二级参考文献27

共引文献132

同被引文献13

引证文献1

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

说话人识别系统中MFCC参数的改进算法 被引量：1

参考文献7

二级参考文献27

共引文献132

同被引文献13

引证文献1

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

说话人识别系统中MFCC参数的改进算法被引量：1