语音学知识在语音识别中的应用:案例分析被引量：3

Application of phonetic knowledge in automatic speech recognition—Case analysis

导出

摘要计算机自动语音识别中的热门话题之一就是怎样利用语音学的知识来提高识别的正确率。在早期的数字语音识别中,2与8经常容易混淆,曾经被视为一个难题。该文试图通过对这个具体案例的分析,探讨语音学特征知识在识别中的应用问题。采用声学和生理实验以及感知实验相结合的方法,探讨了2与8的区别性语音学特征及其在二者识别中的作用。结果表明:2与8的最大差异是声调,在缺乏声调信息的情况下,第3共振峰(F3)的差异是决定性的区别特征,而它们的第1(F1)和第2共振峰(F2)非常近似,在识别上没有太大作用。早期的自动识别恰恰忽略了声调这个最最显著的区别特征;而在自然语流中、尤其是非正式的语体中,有些2发音时舌尖运动不够到位,因而导致它与8的第3共振峰差异不十分明显,这些是识别中二者常常混淆的主要原因。由此可见,在自动语音识别中,加强对语音学特征知识的了解是个迫在眉睫的任务,在系统中充分地综合利用这些区别性特征信息,是提高识别率的有效途径。 One key topic in automatic speech recognition(ASR) systems is how to enhance the recognition accuracy by utilizing phonetic knowledge.Early Chinese number speech recognition system had difficulty discriminating 2 and 8.This paper discusses the application of phonetic knowledge in ASR through an analysis of this specific case.This study uses acoustical and physiological experiments combined with a set of perception tests to investigate the distinctive phonetic features for distinguishing 2 and 8.The results ...

作者曹剑芬李爱军胡方张利刚

机构地区中国社会科学院语言研究所

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2008年第S1期748-753,共6页 Journal of Tsinghua University(Science and Technology)

基金中国社会科学院语音与自然话语处理重点学科项目

关键词计算机自动语音识别语音学知识感知声调基频声谱图共振峰 computer automatic speech recognition（ASR） phonetic knowledge perception tone fundamental frequency（F0） spectrogram formant

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1王作英,肖熙.基于段长分布的HMM语音识别模型[J].电子学报,2004,32(1):46-49. 被引量：42

二级参考文献2

1齐士钤张家禄.汉语普通话辅音音长分析[J].声学学报,1982,(1):8-13.
2王作英.基于段长分布的HMM语音识别模型 [A]..第二届全国汉字汉语识别会议 [C].庐山,1989.9.

共引文献41

1李明琴,李涓子,王作英,陆大.语义分析和结构化语言模型[J].软件学报,2005,16(9):1523-1533. 被引量：7
2刘敬伟,王作英,肖熙.基于自回归模型的加性噪声环境稳健语音识别[J].清华大学学报（自然科学版）,2006,46(1):50-53. 被引量：2
3陈立伟,张晔.基于改进的隐马尔可夫和神经网络混合模型的语音识别[J].应用声学,2006,25(2):90-95.
4王宏,郭艳丽,贾新民.基于HMM的孤立字识别[J].昌吉学院学报,2006(1):94-98. 被引量：3
5范斐斐,李振波,陈佳品.基于K均值分段的语音识别在微机器人控制系统中的应用[J].电子技术应用,2006,32(5):4-6. 被引量：2
6赵蕤,王作英.语音识别中信道和噪音的联合补偿[J].声学学报,2006,31(5):466-470. 被引量：11
7贺无名.语音识别技术及其研究进展[J].中国科技信息,2006(18):157-158. 被引量：3
8孙健,王作英.融合段长信息的中、英文语种辨识[J].模式识别与人工智能,2006,19(5):567-571.
9王作英,孙健.一般拓扑结构的非齐次隐含马尔科夫模型及其在中、英文语种辨识中的应用[J].电子与信息学报,2007,29(4):867-869. 被引量：1
10孙健,王作英.集成语种辨识的中英文LVCSR系统[J].计算机工程与设计,2007,28(8):1931-1933.

同被引文献23

1呼和.蒙古语元音的声学分析[J].民族语文,1999(4):58-60. 被引量：12
2曹剑芬.连读变调与轻重对立[J].中国语文,1995(4):312-320. 被引量：43
3张家騄.汉语普通话区别特征系统[J].声学学报,2005,30(6):506-514. 被引量：26
4曹剑芬.音段延长的不同类型及其韵律价值[J].南京师范大学文学院学报,2005(4):160-167. 被引量：26
5王昆仑,樊志锦,吐尔洪江,方晓华,徐绍琼,吾买尔.维吾尔语综合语音数据库系统[C]//第五届全国人机语音通讯学术会议论文集,1998.
6杨行骏.语音信号与数字处理[M].电子工业出版社,1995.
7Delattre,P. The physiological interpretation of sound spectrogram[M]. PLMA, Vol LⅩⅥ(5), 1951.
8吴宗济.普通话单音节语图册[M].中国社会科学出版社,1986.
9http://htk.eng.cam.ac.uk/.
10Fant G.Phonetics and speech technology. QuarterlyProgress and Status Report . 1983

引证文献3

1曹剑芬.语音处理上如何逐渐减少对具体语料的依赖?[J].清华大学学报（自然科学版）,2009(S1):1380-1387. 被引量：3
2王昆仑,张贯虹,吐尔洪江.阿布都克力木.维吾尔语元音的声频特性分析和识别[J].中文信息学报,2010,24(2):122-128. 被引量：10
3刘子琦.浅析基于人工智能的自然语言处理技术[J].中国科技纵横,2023(5):43-45.

二级引证文献13

1许辉,木合塔尔.霍加,祁恩春,米尔阿迪力.阿不都卡地尔,卡米力江.买买提明,玛依努尔.艾赛提,白尔娜.吾守尔.新疆维吾尔族腭裂患者元音共振峰分析[J].新疆医科大学学报,2012,35(5):638-641. 被引量：7
2武晓敏,达瓦·伊德木草,吾守尔·斯拉木.自然语料缺乏的民族语言连续语音识别[J].计算机工程,2012,38(12):129-131. 被引量：2
3余礼根,滕光辉,李保明,劳凤丹,邢永正.蛋鸡发声音频数据库的构建与应用[J].农业工程学报,2012,28(24):150-156. 被引量：20
4阿依努尔.努尔太,祖丽皮亚.阿曼,地里木拉提.吐尔逊,艾斯卡尔.艾木都拉.维吾尔语双音节词元音格局研究[J].计算机工程与科学,2013,35(1):185-190. 被引量：2
5芦世丹,崔荣一.发音相似的朝鲜语和汉语单元音辨识方法[J].中文信息学报,2013,27(2):112-117. 被引量：1
6黄小明,熊子瑜.基于古音系统的汉语方言语音合成[J].清华大学学报（自然科学版）,2013,53(6):771-775.
7王昆仑.基于区别特征系统的连续语音识别模型研究[J].合肥学院学报（自然科学版）,2014,24(1):31-34.
8达瓦.伊德木草,木合亚提.尼亚孜别克,吾守尔.斯拉木.语音技术在少数民族语言的应用研究[J].新疆大学学报（自然科学版）,2014,31(1):88-96. 被引量：3
9优丽吐孜.热甫开提,古力努尔·艾尔肯,艾斯卡尔·艾木都拉.维吾尔语元音u的实验分析研究[J].信息通信,2018,31(1):33-36.
10古丽江·艾力江,古力努尔·艾尔肯,地里木拉提·吐尔逊,艾斯卡尔·艾木都拉.哈萨克族大学生汉语普通话单元音声学研究[J].电脑知识与技术,2018,14(4):212-214.

1优必选与亚马逊合作推出人形机器人Lynx[J].智能机器人,2017,0(1):17-17.
2张正兰,史金松.数字语音识别[J].微小型计算机开发与应用,1989(3):41-43.
3周晓敏,李应.基于小波矩和BP网络的声音识别[J].计算机工程与应用,2015,51(3):192-196. 被引量：6
4周晓敏,李应.基于Radon和平移不变性小波变换的鸟类声音识别[J].计算机应用,2014,34(5):1391-1396. 被引量：7
5严海兵.基于扩展锚文本的网页特征识别[J].苏州科技学院学报（自然科学版）,2009,26(2):51-54.
6赵林.华为Voice Internet业务——带给您全新的感受[J].电信技术,2003(1):86-86.
7俞铁城.适用于自动语音识别的声道参数[J].物理,1998,27(2):125-125.
8孔旭,关佶红.以声谱图相似度为度量的波形音乐检索[J].计算机工程与应用,2009,45(13):136-141. 被引量：7
9弓彦婷,程小雪,任洪梅,陈雁翔.声谱图显著性在音频识别中的应用[J].合肥工业大学学报（自然科学版）,2016,39(1):62-66. 被引量：4
10应宏,蔡莲红,陶建华.自然语流中二音节组重读的表现[J].计算机科学,2000,27(8):77-79.

清华大学学报（自然科学版）

2008年第S1期

浏览历史

内容加载中请稍等...

语音学知识在语音识别中的应用:案例分析被引量：3

参考文献1

二级参考文献2

共引文献41

同被引文献23

引证文献3

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

语音学知识在语音识别中的应用:案例分析 被引量：3

参考文献1

二级参考文献2

共引文献41

同被引文献23

引证文献3

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

语音学知识在语音识别中的应用:案例分析被引量：3