期刊文献+

音频的梅尔频率倒谱系数特征抽取过程 被引量:4

下载PDF
导出
摘要 特征工程是机器学习中重要的一环。梅尔倒谱系统特征是语音的关键信息,提取该特征是语音识别的特征工程之一。首先分析了梅尔特征的提取过程,包括预加重、分窗、窗函数、短时傅里叶、能量普计算、三角滤波、取对数、离散余弦变换和倒谱抬升八个步骤,其中重点分析了窗函数和梅尔三角滤波,这两个过程因有多种算法应用于不同的语音识别场景。在三角滤波过程中,引入了梅尔尺度的概念。然后,把梅尔特征的提取步骤在Python语言中,使用librosa库函数中的mfcc函数进行关键步骤实现。结果表明,梅尔倒谱系特征是语音识别中的典型特征,其提取过程对于其它特征的提取具有广泛的借鉴意义。
作者 赵扬青 彭智才 蒋雨涵 陈佳瑜 陈子怡 赵舒悦 ZHAO Yangqing;PENG Zhicai;JIANG Yuhan;CHEN Jiayu;CHEN Ziyi;ZHAO Shuyue
出处 《信息技术与信息化》 2023年第1期104-111,共8页 Information Technology and Informatization
  • 相关文献

参考文献8

二级参考文献57

  • 1艾佳琪,左毅,刘君霞,贺培超,李铁山,陈俊龙.基于余弦相似度的动态语音特征提取算法[J].计算机应用研究,2020,37(S02):147-149. 被引量:11
  • 2汪峥,连翰,王建军.说话人识别中特征参数提取的一种新方法[J].复旦学报(自然科学版),2005,44(1):197-200. 被引量:16
  • 3于明,袁玉倩,董浩,王哲.一种基于MFCC和LPCC的文本相关说话人识别方法[J].计算机应用,2006,26(4):883-885. 被引量:14
  • 4CAMBELL J P. Speaker recognition: a tutorial [ J]. Proceedings of the IEEE, 1997, 185(9) : 1437 - 1462.
  • 5DAVIS S B, MERMELSTEIN P. Comparison of parametric repre- sentations for monosyllabic word recognition in continuously spoken sentences [ J]. IEEE Transactions on Acoustics, Speech and Signal Processing, 1980, 28(4) : 357 - 365.
  • 6QIAN ZHEN, LIU LI-YAN, LI XUE-YAO. Speaker identification based on MFCC and IMFCC [ C]//ICISE: Proceedings of 2009 the 1st International Conference on Information Science and Engineer- ing. Piscataway, NJ: IEEE Press, 2009:5416 - 5419.
  • 7FISHER R A. The use of multiple measurements in taxonomic prob- lems [J]. Annals of Eugenics, 1936, 7(1) : 179 - 188.
  • 8ZHU JIAN-WEI, SUN SI-IUI-FA, DAN ZHI-PING, et al. MFCC extraction based on f-ratio and correlated distance criterion in speak- er recognition[ C]// MINES ' 09: Proceedings of the 2009 Interna- tional Conference on Multimedia Information Networking and Securi- ty. Washington, DC: IEEE Computer Society, 2009:329-333.
  • 9RGOUTAM S, SANDIPAN C, SUMAN S. An f-ratio based optimi- zation technique for automatic speaker recognition system [ C]// Proceedings of the IEEE INDICON 2004 India Annual Conference. Piscataway, NJ: IEEE Press, 2005:352-355.
  • 10HU YI, LOIZOU P C. Subjective evaluation and comparison of speech enhancement algorithms [ J]. Speech Communication, 2007, 49(7/8) : 588 - 601.

共引文献49

同被引文献39

引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部