摘要
深度神经网络DNN(Deep Neural Network)是近年机器学习理论中被诸多研究者广泛关注的语音识别模型。DNN模型利用DNN的学习能力可提升对噪声和口音的鲁棒性,在很多大规模语音识别任务中都超过了GMM模型。本文基于DNN与HMM特点,提取40维的MFCC特征向量后,利用DNN的每个输出节点估计HMM每个状态的后验概率,进而得到了对电话录音场景下的模型参数。最后,对1000小时的汉语电话录音和公开汉语语料集thchs-30上进行三次模型训练设计实验,并对比GMM-HMM模型参数效果。实验结果表明,DNN-HMM模型在1000小时的电话录音测试集上误识率降低了5.84%-9.42%,且两种模型识别效果表现得都比较稳定。
作者
孔玲军
李艳
KONG Lingjun;LI Yan(Binhai College,Nankai University,Tianjin,China,300270)
出处
《福建电脑》
2022年第3期52-54,共3页
Journal of Fujian Computer