语音特征匹配的图像配准方法

An approach to speech feature matching using image registration algorithm

下载PDF

导出

摘要为了解决传统DTW算法准确度和效率不高的问题,提出了一种基于图像配准方法的语音特征匹配算法.该方法将MFCC参数映射为二值图像,并通过引入图像配准的方法进行模板匹配,达到了语音特征匹配的目的.实验结果表明,与传统的DTW算法相比,该方法的准确率、召回率和算法执行效率有了明显的提高. To overcome the low accuracy and efficiency of the traditional DTW algorithm used in speech feature matching, an approach employing the image registration algorithm is proposed. The speech feature matching process was implemented by mapping MFCC coefficients to the binary image, and introducing the image registration algorithm to the template matching. The experimental result shows that, comparing with the traditional DTW algorithm, the proposed algorithm achieves a better performance in precision rate, recall rate and the cost of computation.

作者金小峰崔荣一洪炳镕

机构地区延边大学工学院哈尔滨工业大学计算机科学与技术学院

出处《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2008年第7期1152-1155,共4页 Journal of Harbin Institute of Technology

基金吉林省科技发展计划国际合作项目(20050703-1)

关键词 DTW 模板匹配图像配准语音识别 DTW template matching image registration speech recognition

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1姚天任.数字语音处理[M].武汉:华中科技大学出版社.2003.
2张晨燕,孙成立.非特定人孤立词语音识别系统的片上实现[J].计算机工程与应用,2007,43(13):194-196. 被引量：10
3韩继庆,张磊,郑铁然.语音信号处理[M].北京:清华大学出版社,2004.
4赵文,杨澄宇,杨鉴.孤立字词识别[J].计算机应用,2001,21(6):12-14. 被引量：7
5刘敬伟,徐美芝,郑忠国,程乾生.基于DTW的语音识别和说话人识别的特征选择[J].模式识别与人工智能,2005,18(1):50-54. 被引量：13
6BOU-GHAZALE S E, HANSEN J H L. A comparative study of traditional and newly proposed features for recognition of speech under stress [ J ]. IEEE Transition on Speech and Audio Processing ,2000, 8 (4) :429 -442.
7SKOWRONSKI M D, HARRIS J G. Increased MFCC filter bandwidth for noise - robust phoneme recognition [ C]//IEEE International Conference on Acoustics, Speech, and Signal Processing. Florida, USA : [ s. n. ] , 2002:801 - 804.
8GHAFFARY B K, SAWCHUK A A. A survey of new tech- niques for image registration and mapping [ C ]//Proceedings of the SPIE : Applications of Digital Image Processing. Bellingham, WA, USA: [ s. n. ], 1983:222 - 239.
9HUTTENLOCHER D P, KLANDERMAN G A, RUCKLIDGE W J. Comparing images using the Hausdorff distance[ J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1993, 15 (9) :850 - 863.
10VENTURA A D, RAMPINI A, SCHETTINI R. Image registration by recognition of corresponding structures [J ]. IEEE Transactions on Geoscience and Remote Sensing, 1990, 28 (3) : 305 - 314.

二级参考文献27

1杜利民,谢凌云,刘斌.HMM非特定人连续语音识别的嵌入式实现[J].电子与信息学报,2005,27(1):60-63. 被引量：6
2拉宾纳 R．W．谢弗.语音信号数字处理[M].北京:科学出版社,1984..
3周浩.Windows实时语音命令识别系统.中国科学院自动化研究所硕士论文[M].,1994..
4Lawrence Rabiner，Fundamentals of speech recognition，1996年
5杨行峻，语音信号数字处理，1995年
6周浩，学位论文，1994年
7拉宾纳，语音信号数字处理，1984年
8Campbell J P. Speaker Recognition: A Tutorial. Proc of the IEEE, 1997, 85(9): 1437-1462.
9Furui S. Recent Advances in the Speaker Recognition. Pattern Recognition Letters, 1997, 18(9): 859-872.
10Pandit M, Kittler J. Feature Selection for a DTW-Based Speaker Verification System. In: Proc of the IEEE International Conference on Acoustics, Speech, and Signal Processing. Seattle,USA, 1998, Ⅱ: 769-772.

共引文献41

1杨海洋,贾艳艳.语音识别机器人的设计[J].轻工科技,2020,36(2):67-68. 被引量：1
2汪国有,段敏涛.基于定点DSP的G.723.1语音编码器的实时实现[J].计算机与数字工程,2006,34(1):107-110. 被引量：4
3黎育红,张熹,袁荃.基于语音识别技术的门禁系统的研究[J].电子技术应用,2006,32(12):88-92. 被引量：8
4凌军,兰竞.小词汇量语音识别与应用[J].计算机科学,2006,33(B12):146-147.
5胡文吉,王让定.基于小波包分析的特征参数提取[J].宁波大学学报（理工版）,2007,20(1):51-54. 被引量：3
6郑展恒,曾庆宁,张少兵.一种语音端点检测方法的研究[J].桂林电子科技大学学报,2008,28(1):23-26. 被引量：3
7王君伟,范启富.基于DTW的红外乘客计数方法研究[J].微型电脑应用,2008,24(4):16-19.
8王君伟,范启富,白凌云.基于DTW的红外乘客计数系统[J].测控技术,2008,27(6):32-35. 被引量：8
9吴宗魁,王晓耘.基于TMS320C64xx的多通道语音编码平台的设计[J].现代电子技术,2008,31(22):62-66. 被引量：1
10张燕,唐振民,李燕萍.基于单字音特征提取的说话人识别方法[J].计算机工程,2009,35(10):188-189. 被引量：1

1曹陶科,顾鸿虹,曹轶倩,金纯.基于视觉的手势识别研究[J].郑州大学学报（理学版）,2008,40(3):63-66. 被引量：3
2潘智刚,姚敏锋,张晶.多模板优化的语音识别算法[J].电脑知识与技术,2015,0(1):146-149. 被引量：1
3彭晓明,丁明跃,周成平,马茜.一种准自动多传感器图像配准方法[J].华中科技大学学报（自然科学版）,2003,31(4):85-87.
4蔡宗吟,叶秋冬.一种多特征融合的小波变换图像配准方法[J].计算机应用与软件,2012,29(11):75-78. 被引量：1
5马彦昭,胡浩基,王曰海.一种基于SIFT特征的铁道检测图片的匹配方法[J].微型机与应用,2016,35(21):40-41.
6孙鑫,谢元旦,任地成.基于小波变换和子图的图像配准方法[J].计算机工程与设计,2010,31(21):4653-4656. 被引量：5
7伍君,李树涛.基于小波分解和互信息测度的图像配准方法[J].计算机工程与应用,2005,41(5):73-75. 被引量：2
8李晓静,赵蕾,刘婷婷.基于SIFT特征的遥感图像配准方法研究与实现[J].电脑编程技巧与维护,2012(8):106-107. 被引量：1
9朱齐亮,杜俊俐,樊要玲.基于互信息的医学图像配准中的优化算法[J].科技信息,2007(32):40-40. 被引量：1
10刘春群,颜锦,许发翔,何应勇.基于特征点图像配准方法的应用研究[J].科技与企业,2014(7):357-357. 被引量：1

哈尔滨工业大学学报

2008年第7期

浏览历史

内容加载中请稍等...

语音特征匹配的图像配准方法

参考文献11

二级参考文献27

共引文献41

相关作者

相关机构

相关主题

浏览历史