基于鼻韵尾分离的汉语声韵母识别模型被引量：3

Initial/final acoustic model based on separating nasal coda in Chinese Putonghua speech recognition

导出

摘要研究汉语自然口语识别中的建模单元选择问题。在HMM三状态模型中,声韵母单元与音素单元作为两种最流行的建模单元各有优劣。一方面从自然口语音变严重的问题出发,倾向采用粗粒度的声韵母单元以概括各种音变;另一方面从三状态结构可能无法有效描述复杂单元的问题出发,又倾向采用细粒度的音素单元。本文在实验语音学理论研究成果与声韵母时长分析实验结果的基础上,主张对扩展声韵母单元进行有选择的拆分,提出了基于鼻韵尾分离的声韵母拆分方法。实验结果表明本文的方法与扩展声韵母单元、音素单元相比,识别性能有了明显改善,其字错误率分别降低2.23%和9.45%。 This paper focuses research on acoustic modeling unit selection in Chinese Putonghua spontaneous speech recognition. Under HMM three-state models,two most popular modeling units,namely extended initial/final（XIF） units and phoneme units,have their own advantages and drawbacks.On one hand,from the perspective of serious pronunciation variation problem in spontaneous speech,the coarsely granular XIF units are preferred to gather up all kinds of pronunciation variations.On the other hand,from the perspective of the low-distinguish ability of three-state structure for complex modeling units,the finely granular phoneme units are preferred.In this paper,based on theoretical achievements of experimental phonetics and the experimental results of duration analysis of XIF units,we propose an XIF model with separating nasal coda.Experiments carried out on a Chinese Putonghua spontaneous speech recognition task show that our proposed method is better than the XIF modeling and phoneme-based modeling,with the character error rate is reduced by 2.23%and 9.45%respectively.

作者邵健赵庆卫颜永红

机构地区浙江大学计算机学院中国科学院声学研究所

出处《声学学报》 EI CSCD 北大核心 2010年第5期587-592,共6页 Acta Acustica

基金 973项目(2004CB318106) 863项目(2006AA010102)和863项目(2006AA01Z195)

关键词识别模型韵母分离语声分析实验理论研究成果鼻自然口语

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献8

1葛凤培,潘复平,董滨,颜永红.汉语发音质量评估的实验研究[J].声学学报,2010,35(2):261-266. 被引量：12
2刘赵杰,邵健,张鹏远,赵庆卫,颜永红,冯稷.汉语自然口语中声调识别的研究[J].物理学报,2007,56(12):7064-7069. 被引量：5
3张晴晴,潘接林,颜永红.基于发音特征的汉语普通话语音声学建模[J].声学学报,2010,35(2):254-260. 被引量：14
4吴宗济.试论“人－机对话”中的汉语语音学[J].世界汉语教学,1997,11(4):4-21. 被引量：5
5李净,郑方,张继勇,吴文虎.汉语连续语音识别中上下文相关的声韵母建模[J].清华大学学报（自然科学版）,2004,44(1):61-64. 被引量：18
6王志洁.英汉音节鼻韵尾的不同性质[J].现代外语,1997,20(4). 被引量：19
7张辉,杜利民.汉语连续语音识别中不同基元声学模型的复合[J].电子与信息学报,2006,28(11):2045-2049. 被引量：7
8王作英,肖熙.基于段长分布的HMM语音识别模型[J].电子学报,2004,32(1):46-49. 被引量：42

二级参考文献65

1钱跃良,林守勋,刘群,刘宏.2005年度863计划中文信息处理与智能人机接口技术评测回顾[J].中文信息学报,2006,20(B03):1-6. 被引量：4
2董滨,赵庆卫,颜永红.基于共振峰模式的汉语普通话中韵母发音水平客观测试方法的研究[J].声学学报,2007,32(2):122-128. 被引量：16
3齐士钤张家禄.汉语普通话辅音音长分析[J].声学学报,1982,(1):8-13.
4吴宗济.普通话语句中的声调变化[J].中国语文,1982,6:439-449.
5王作英.基于段长分布的HMM语音识别模型 [A]..第二届全国汉字汉语识别会议 [C].庐山,1989.9.
6Kirchhoff K. Robust speech recognition using articulatory information. PhD thesis, University of Bielefeld, Germany, 1999.
7Livescu K et al. Articulatory feature-based methods for acoustic and audio-visual speech recognition: JHU Summer Workshop Final Report. Technical report, Johns Hopkins University Center for Language and Speech Processing, 2007.
8Cetin Oet al. An articulatory feature-based tandem approach and factored tandem observation modeling, in ICASSP, 2007; 4: 645-648, ISBN: 1-4244-0727-3.
9Cetin O, Magimai-Doss M, Livescu K, Kantor A, King S, Bartels C, Frankel J. Monolingual and crosslingual comparison of tandem features derived from articulatory and phone MLPs. in Proc. ASRU, 2007:36-41.
10吴宗济.试论普通话语音的“区别特征”及其相互关系[J].中国语文,1982,(6).

共引文献107

1时秀娟,夏桐.儿童腭裂术后鼻尾异常等级的量化标准[J].南开语言学刊,2019(1):12-22. 被引量：1
2曹剑芬,李爱军,胡方,张利刚.语音学知识在语音识别中的应用:案例分析[J].清华大学学报（自然科学版）,2008,48(S1):748-753. 被引量：3
3冉启斌.汉语鼻音韵尾的实验研究[J].南开语言学刊,2005(2):37-44. 被引量：11
4贾珈,蔡莲红,李明,张帅.汉语普通话与沈阳方言转换的研究[J].清华大学学报（自然科学版）,2009(S1):1309-1315. 被引量：7
5吴英成.北京话是单音节语言的质疑[J].当代语言学,2000,2(4):231-247. 被引量：5
6李明琴,李涓子,王作英,陆大.语义分析和结构化语言模型[J].软件学报,2005,16(9):1523-1533. 被引量：7
7刘敬伟,王作英,肖熙.基于自回归模型的加性噪声环境稳健语音识别[J].清华大学学报（自然科学版）,2006,46(1):50-53. 被引量：2
8陈立伟,张晔.基于改进的隐马尔可夫和神经网络混合模型的语音识别[J].应用声学,2006,25(2):90-95.
9王宏,郭艳丽,贾新民.基于HMM的孤立字识别[J].昌吉学院学报,2006(1):94-98. 被引量：3
10范斐斐,李振波,陈佳品.基于K均值分段的语音识别在微机器人控制系统中的应用[J].电子技术应用,2006,32(5):4-6. 被引量：2

同被引文献30

1栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
2邝航宇,张军,韦岗.一种基于检测元音的孤立词端点检测算法[J].电声技术,2005,29(3):40-43. 被引量：5
3孙金城,倪宏,莫福源,李昌立.普通话声母和韵母的统计特性[J].应用声学,1995,14(3):35-41. 被引量：2
4钱博,李燕萍,唐振民,徐利敏.基于频域能量分布分析的自适应元音帧提取算法[J].电子学报,2007,35(2):279-282. 被引量：7
5闫润强,祖漪清,朱贻盛.递归趋势分析在汉语语音声韵母切分中的应用研究[J].信号处理,2007,23(4):521-525. 被引量：5
6Stelmachowicz P C, Lewis D E, Choi S, Hoover B. The effect of stimulus bandwidth on auditory skills in normal- hearing and hearing-impaired children. Ear & Hearing, 2007: 28(4): 483-494.
7Arioz U, Arda K, Tuncel U. Preliminary results of a novel enhancement method for high-frequency hearing loss. Computer Methods and Programs in Biomedicine, 2011: 102(3): 277-287.
8Miller-Hansen D R, Nelson P B, Widen J E, Simon S D. Evaluating the benefit of speech recoding hearing aids in children. American Journal of Audiology, 2003: 12(2): 106-113.
9James C, Albegger K, Battmer R, Burdo S, Deggouj N, Deguine O, Dillier N, Cersdorff M, Laszig R, Lenarz T. Preservation of residual hearing with cochlear implanta- tion: how and why. Acta Oto-Laryngologica, 2005: 125(5): 481-91.
10Kiefer J, Pok M, Adunka O, Stiirzebecher E, Baumgartner W, Schmidt M, Tillein J, Ye Q, Gstoettner W. Combined electric and acoustic stimulation of the auditory system: re- sults of a clinical study. Audiology and Neurotology, 2005: 10(3): 134-144.

引证文献3

1李皓,唐朝京.采用损失函数和声学特征切分声韵母的方法[J].声学学报,2012,37(3):339-345. 被引量：3
2梁瑞宇,邹采荣,赵力,王青云,奚吉.汉语数字助听器高频听损增强方法的实验研究[J].声学学报,2012,37(5):527-533. 被引量：1
3朱铮宇,廖丽平,杨春玲,王泳,蔡君,邱华愉.基于韵母发音事件匹配与位置时延分析的音唇一致性判决方法[J].电子学报,2021,49(1):140-148. 被引量：1

二级引证文献5

1梁瑞宇,王侠,王青云,赵力,邹采荣.啸叫快速抑制的助听器回声抵消算法[J].声学学报,2016,41(2):249-259. 被引量：4
2王熙月,黄毅鹏,钱佳慧,何凌,黄华,尹恒.基于声学特征的腭裂语音声韵母切分[J].计算机工程与应用,2018,54(8):123-130. 被引量：3
3朱铮宇,邱华愉,杨春玲,王泳.基于特定韵母发音事件分析的语音唇动一致性判决方法[J].华南理工大学学报（自然科学版）,2020,48(1):139-146. 被引量：4
4朱铮宇,廖丽平,杨春玲,王泳,蔡君,邱华愉.基于韵母发音事件匹配与位置时延分析的音唇一致性判决方法[J].电子学报,2021,49(1):140-148. 被引量：1
5闵秋洁,刘东.基于机器翻译的普通话发音标准度测试系统[J].自动化与仪器仪表,2022(9):115-119. 被引量：2

1一种采用位置和速度测量的三状态最卡尔曼跟踪器[J].空载雷达,1994(1):60-65.
2刘亚斌,李爱军.朗读语料与自然口语的差异分析[J].中文信息学报,2002,16(1):13-18. 被引量：16
3薛德黔.交互式自然口语语音识别关键技术[J].计算机应用,2002,22(7):45-47. 被引量：3
4声韵：数字化[J].世界广播电视,2010,24(11):42-42.
5曾勇,于聪梅,宁云隆.BCH纠错码的性能分析与仿真实现[J].科技资讯,2009,7(13):9-9. 被引量：1
6吴霁,侯伯亨.利用声韵过渡段特征的说话人识别实验及系统设计[J].西安电子科技大学学报,1993,20(3):10-17.
7楚建梅,郑红凤.移动信道自适应三状态马尔可夫模型的建立及验证[J].电信网技术,1994,0(2):11-16.
8钟银飞.电子电气产品限用物质检测的样品拆分方法[J].安徽化工,2015,41(6):93-95. 被引量：2
9袁东风,罗济军,张立军,刘华章.2,1,3)、(2,1,5)卷积码在典型快衰落移动信道中的纠错性能[J].通信学报,1997,18(10):52-59. 被引量：9
10董儒胥.三状态有源滤波器[J].电信快报,1996(7):28-30.

声学学报

2010年第5期

浏览历史

内容加载中请稍等...

基于鼻韵尾分离的汉语声韵母识别模型被引量：3

参考文献8

二级参考文献65

共引文献107

同被引文献30

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于鼻韵尾分离的汉语声韵母识别模型 被引量：3

参考文献8

二级参考文献65

共引文献107

同被引文献30

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于鼻韵尾分离的汉语声韵母识别模型被引量：3