应用MAP方差估计的话者自适应训练方法

Speaker Adaptive Training of Appling MAP Estimation for Covariance

下载PDF

导出

摘要近年来话者自适应训练(SAT)方法日益受到重视。然而在实际中此方法通常因为部分方差的估计失误而导致识别性能下降。该文提出了一种应用最大后验概率(MAP)估计方差的全新SAT方法,它能够根据后验概率动态地调整模型的方差,从而解决上述问题。在Switchboard数据库上的实验显示,新方法能够显著地提高识别性能,并且有效地提升系统的稳定性。 Recently there has been a growing interest in speaker adaptive training（SAT）. However, errors can often arise when estimating covariance matrices in the original SAT framework due to the lack of observations in some Gauss components. This paper presents a novel approach which applies maximum a posteriori （MAP） covariance-estimating into original SAT. Experimental results in Switchboard corpus demonstrate that the proposed method can deliver significant reductions in word error rate （WER） and raise the robustness of SAT process.

作者黄盈椿王欢良冯涛

机构地区中国科学院电子学研究所哈尔滨工业大学计算机科学与技术学院

出处《计算机工程》 EI CAS CSCD 北大核心 2006年第20期203-204,212,共3页 Computer Engineering

关键词语音识别话者自适应话者自适应训练 MAP Speech recognition Speaker adaptation Speaker adaptive training（SAT） Maximum a postefiofi（MAP）

分类号 TP391.42 [自动化与计算机技术—计算机应用技术] TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献5

1李虎生,刘加,刘润生.语音识别说话人自适应研究现状及发展趋势[J].电子学报,2003,31(1):103-108. 被引量：32
2Anastasakos T,McDonough J W,Makhoul J.Speaker Adaptive Training:A Maximum Likelihood Approach to Speaker Normalization[C].Proc.of ICASSP,1997:1043-1046.
3Leggetter C J,Woodland P C.Maximum Likelihood Linear Regression for Speaker Adaptation of Continuous Density Hidden Markov Models[J].Computer Speech and Language,1995,9(2):171-185.
4Gauvain J L,Lee C H.Maximum A Posteriori Estimation for Multivariate Gaussian Mixture Observations of Markov Chains[J].IEEE Trans.on Speech and Audio Processing,1994,2(2):291-298.
5Anastasakos T,Mcdonough J W,Schwartz R,et al.A Compact Model for Speaker Adaptive Training[C].Proc.of ICSLP,1996:764-767.

二级参考文献2

1张昊天.[D].北京:清华大学电子工程系,2000.
2李虎生,杨明杰,刘润生.汉语数码语音识别自适应算法[J].电路与系统学报,1999,4(2):1-6. 被引量：4

共引文献31

1杨吉斌,邢艳玲,曹铁勇,张雄伟.基于Mellin变换和Mel频率分析的非特定人语音识别特征研究[J].模式识别与人工智能,2005,18(3):350-353. 被引量：2
2李财莲,赵小阳,王丽娟,岳振军.说话人识别中关键技术的现状与发展[J].军事通信技术,2005,26(2):62-65. 被引量：3
3蔡铁,朱杰.基于支持说话人权重的快速说话人自适应算法[J].上海交通大学学报,2005,39(12):1997-2001.
4徐向华,朱杰,郭强.决策树结构对说话人自适应影响的研究[J].声学学报,2006,31(1):42-47. 被引量：3
5倪建克,曾虹,张翔.基于最大均值似然判决规则的说话人辨认研究[J].杭州电子科技大学学报（自然科学版）,2006,26(5):96-99.
6申朝文,何家峰,蔡继祖.说话人识别技术的方法与展望[J].中国科技信息,2007(4):269-270.
7朱浩冰,郭东辉.声纹识别系统原理及其关键技术[J].计算机安全,2007(9):14-17. 被引量：15
8武永星,郑海,周波,杨常青,李茂林.基于距离和相关性准则的混合参数说话人识别[J].系统仿真学报,2008,20(4):926-930.
9雷建军,杨震,刘刚,郭军.噪声鲁棒语音识别研究综述[J].计算机应用研究,2009,26(4):1210-1216. 被引量：14
10魏星,周萍.语音识别系统及其特征参数的提取研究[J].计算机与现代化,2009(9):167-168. 被引量：5

1李国强,杜利民.语音识别的话者自适应研究[J].电子科技导报,1999(9):21-24.
2陈凌辉,凌震华,戴礼荣.基于话者无关模型的说话人转换方法[J].模式识别与人工智能,2013,26(3):254-259.
3戴蓓倩,郁正庆,戴任飞,张劲松,王长富,司虎.基于话者分类和HMM的话者自适应语音识别[J].中国科学技术大学学报,1996,26(2):147-153. 被引量：2
4钱芳,韩纪庆,张磊.基于MAP自适应算法的应力下变异语音识别方法[J].计算机工程与应用,2004,40(5):42-44.
5顾滨兵.一种软件模型检测方法及其原型系统[J].微计算机应用,2010,31(11):39-46. 被引量：4
6卢晓东,周凤岐,周军.马尔可夫随机场中应用蚁群系统的红外图像分割[J].弹箭与制导学报,2006,26(S5):297-299.
7卢晓东,周凤岐,周军.马尔可夫随机场中应用蚁群系统的红外图像分割[J].火力与指挥控制,2006,31(7):86-89. 被引量：2
86.3% 微软语音识别错误率行业最低[J].新电脑,2016,0(10):30-30.
9刘吉颖,方思行.AI规划的回顾与展望[J].中山大学学报论丛,2000,20(5):78-81. 被引量：3
10李天翼,王明辉,常化文,陈淑清.基于熵检测的图像噪声方差小波域估计[J].北京邮电大学学报,2011,34(5):1-5. 被引量：9

计算机工程

2006年第20期

浏览历史

内容加载中请稍等...

应用MAP方差估计的话者自适应训练方法

参考文献5

二级参考文献2

共引文献31

相关作者

相关机构

相关主题

浏览历史