-
题名音频的梅尔频率倒谱系数特征抽取过程
被引量:4
- 1
-
-
作者
赵扬青
彭智才
蒋雨涵
陈佳瑜
陈子怡
赵舒悦
-
机构
十堰市太和医院信息资源部计算机中心
-
出处
《信息技术与信息化》
2023年第1期104-111,共8页
-
文摘
特征工程是机器学习中重要的一环。梅尔倒谱系统特征是语音的关键信息,提取该特征是语音识别的特征工程之一。首先分析了梅尔特征的提取过程,包括预加重、分窗、窗函数、短时傅里叶、能量普计算、三角滤波、取对数、离散余弦变换和倒谱抬升八个步骤,其中重点分析了窗函数和梅尔三角滤波,这两个过程因有多种算法应用于不同的语音识别场景。在三角滤波过程中,引入了梅尔尺度的概念。然后,把梅尔特征的提取步骤在Python语言中,使用librosa库函数中的mfcc函数进行关键步骤实现。结果表明,梅尔倒谱系特征是语音识别中的典型特征,其提取过程对于其它特征的提取具有广泛的借鉴意义。
-
关键词
梅尔倒谱系数
窗函数
短时傅里叶
梅尔三角滤波
梅尔尺度
-
分类号
TN912.34
[电子电信—通信与信息系统]
-