一种基于语义分析的汉语语音识别纠错方法被引量：2

An Error-correct Approach in Chinese Automatic Speech Recognition Based on Semantic Analysis

下载PDF

导出

摘要汉语语音识别的研究越来越重视与语言处理的结合,语音识别已经不是单纯的语音信号处理。N-gram语言模型应用到语音识别系统中,大大增强了系统的正确率和稳定性,但它也有其自身的局限性,使得语音识别出现许多语法和语义的错误结果。本文分析了语音识别产生语音和文字方面的错误的原因和类型,在概念层次网络语言模型的基础上提出了一种基于语句语义分析和混淆音矩阵的语音识别纠错方法。通过三个发音人、5万字的声音语料和216句实验语句的纠错测试,本文的纠错系统在纠正语义搭配型错误方面有比较好的表现,可克服N-gram语言模型带来的一些缺陷。本文提出的纠错方法还可以融合到语音识别系统中,以便更好地为语音识别的纠错处理服务。 Now automatic speech recognition （ASR） is not a simplex signal processing. The natural language processing is more and more regarded in Chinese ASP. As a language model, N-gram improved the accurate rate and stability of ASR remarkably. But there are still many syntactic and semantic errors in ASR because of the inherent limitation of N-gram language model. This paper analysed the reson and the types of the phonetic and literal errors in ASR. An error-correct approach in Chinese ASR was proposed in this paper based on sentence semantic analysis, confusion matrix and a language model constructed on hierarchical network of concepts. The error-correct software system runs well especially in correetting the errors of semantic relationship, tested with vocal corpus of 3 person and 50,000 words and with 216 experimental sentences for error-correct. So the new language model constructed on hierarchical network of concepts can overcome the limitation of N-gram model. The approach in this paper also can be merged into ASR to improve the performance of error-correct in ASP.

作者韦向峰张全熊亮

机构地区中国科学院声学研究所

出处《计算机科学》 CSCD 北大核心 2006年第10期152-155,共4页 Computer Science

基金国家973项目"自然语言理解的交互引擎研究"(2004CB318104) 中国科学院声学研究所创新项目资助。

关键词语音识别纠错语义分析语言模型概念层次网络 Automatic speech recognition （ASR）, Error-correct, Semantic analysis, Language model, Hierarchical network of concepts

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1黄曾阳.HNC(概念层次网络)理论[M].北京:清华大学出版社,1998..
2王轩,王晓龙,张凯.语音识别中统计与规则结合的语言模型[J].自动化学报,1999,25(3):309-315. 被引量：6
3关毅,王晓龙,张凯.现代汉语计算语言模型中语言单位的频度—频级关系[J].中文信息学报,1999,13(2):8-15. 被引量：15
4赵力,邹采荣,吴镇扬.汉语连续语音识别中语音处理和语言处理统合方法的研究[J].声学学报,2001,26(1):73-78. 被引量：9

二级参考文献11

1新美康永.音声认识[M].日本共立出版社,1987..
2Li W，IEEE Trans Information Theory，1992年，38卷，6期，1842页
3Chien Leefeng，IEEE Trans Speech Audio Processing，1993年，1卷，2期，221页
4Lee K F，IEEE Trans Acoust Speech Signal Processing，1990年，38卷，35页
5Zhao L，ICCCPOL'97，1997年，178页
6Zhao L，日本音响学会论文志，1997年，53卷，12期，933页
7Zhao L，IEICE Technical Report SP98 26，1995年，9页
8Zhao L，IEICE TRANS INF SYST ED，1995年，78卷，6期，66页
9Chien L F，IEEE Trans SAP，1993年，1卷，2期，221页
10Lei L，IEICE Technical Report SP90 105，1990年

共引文献73

1晋耀红.基于语境框架的文本相似度计算[J].计算机工程与应用,2004,40(16):36-39. 被引量：26
2李良炎,何中市,易勇.基于词联接的语义分析原理及其算法[J].重庆大学学报（自然科学版）,2004,27(8):69-74. 被引量：2
3彭波,李晓明.搜索引擎倒排文件的一种分块组织技术[J].电子学报,2005,33(2):358-362. 被引量：9
4黄启良.汉语方言语音识别系统的构建[J].广西科学院学报,2005,21(3):193-195.
5李玉鑑,肖创柏.蛋白质序列中可能存在的Zipf定律[J].北京工业大学学报,2005,31(4):366-368. 被引量：1
6吴晨,缪建明,张全.跨语种信息检索中的文本比较及结果生成算法[J].计算机工程与应用,2005,41(29):11-15. 被引量：1
7韦向峰,张全.汉语动词连见的计算机处理规则研究[J].计算机应用研究,2006,23(1):37-40. 被引量：3
8郑贵滨,韩纪庆,李海峰,郑铁然.基于分段的实时声频检索方法[J].声学学报,2006,31(2):101-108. 被引量：5
9苗传江.基于HNC句类体系的句子语义研究[J].语言文字应用,2006(1):126-133. 被引量：5
10吴晨,张全.基于概念匹配的中文问答处理模型核心问题探讨[J].中文信息学报,2006,20(4):49-55. 被引量：2

同被引文献15

1冯洋,邵晨泽.神经机器翻译前沿综述[J].中文信息学报,2020(7):1-18. 被引量：36
2陈诚.机器翻译技术的综述[J].电子技术（上海）,2021,50(11):290-291. 被引量：3
3李晶皎,张王利,姚天顺.汉语语音理解中自动纠错系统的研究[J].软件学报,1999,10(4):377-381. 被引量：4
4朱宏宣.语音识别字幕制作系统构想[J].影视制作,2013(2):71-73. 被引量：2
5司玉景,潘接林,颜永红,高杰.基于在线语音流的字幕自动生成系统算法研究与实现[J].网络新媒体技术,2013,2(4):52-54. 被引量：1
6塞麦提.麦麦提敏,侯敏,吐尔根.伊布拉音.基于锚点句对的汉维句子对齐方法[J].计算机工程,2015,41(4):166-170. 被引量：5
7张巍,王永远,贾晓茹,李传越.无标注的含噪中文长篇幅语音文本的文语对齐研究[J].中国海洋大学学报（自然科学版）,2015,45(10):121-126. 被引量：1
8徐涛.语音识别在电视字幕编辑中的应用[J].有线电视技术,2017,24(8):106-107. 被引量：1
9侯强,侯瑞丽.机器翻译方法研究与发展综述[J].计算机工程与应用,2019,55(10):30-35. 被引量：26
10董海雅.语际实时字幕翻译研究:现状与展望[J].东方翻译,2019,0(6):25-31. 被引量：5

引证文献2

1韦向峰,袁毅,张全,池毓焕.富媒体环境下语音和文本内容的对齐研究[J].情报工程,2019,5(2):17-27. 被引量：1
2周城光,周军,韦向峰,周文佳,王荣泉.科普视频双语字幕生成系统的设计与实现[J].网络新媒体技术,2023,12(2):62-68. 被引量：1

二级引证文献2

1徐锴,陶冶,李辉.不完全匹配的语音和文本语句级对齐[J].计算机系统应用,2023,32(4):300-307. 被引量：1
2沈华彤.基于人工智能的新闻视频自动化生成系统设计与实现[J].电视技术,2024,48(9):73-75.

1谢法奎,张全.基于最大熵模型的语义块切分[J].计算机工程与应用,2009,45(26):118-120. 被引量：1
2熊亮.基于概念树的文本自动分类系统的研究与实现[J].计算机工程与应用,2005,41(30):6-9. 被引量：2
3陶志荣.N—gram语言模型的Katz平滑技术[J].电子计算机,2002(2):32-35. 被引量：1
4丁泽亚,张全.利用概念知识的文本分类[J].应用科学学报,2013,31(2):197-203. 被引量：3
5谢法奎,张全.HNC语义标注模型的构建[J].计算机科学,2009,36(5):238-240. 被引量：3
6卢先宁,高泽华,高峰.Web日志挖掘中的会话识别技术研究[J].数据通信,2012(4):19-21.
7肖明忠,廖全萍,陈笑蓉.自然语言理解新思路─HNC[J].贵州大学学报（自然科学版）,2000,17(2):135-138. 被引量：4
8毛伟,徐蔚然,郭军.基于n-gram语言模型和链状朴素贝叶斯分类器的中文文本分类系统[J].中文信息学报,2006,20(3):29-35. 被引量：16
9林杏光.计算机理解语言研究的新突破——《NHC(概念层次网络)理论》述评[J].科技导报,1999,17(1):62-64. 被引量：1
10汪洋,帅建梅.基于语义扩展模型的中文网页关键词抽取[J].计算机工程,2012,38(22):163-166. 被引量：4

计算机科学

2006年第10期

浏览历史

内容加载中请稍等...

一种基于语义分析的汉语语音识别纠错方法被引量：2

参考文献4

二级参考文献11

共引文献73

同被引文献15

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一种基于语义分析的汉语语音识别纠错方法 被引量：2

参考文献4

二级参考文献11

共引文献73

同被引文献15

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一种基于语义分析的汉语语音识别纠错方法被引量：2