基于两级BP模型的普通话声调识别系统被引量：8

Mandarin Tone Recognition System Based on Two-level BP Model

下载PDF

导出

摘要普通话声调识别参数除常用的基音轮廓外,基音的一阶差分、能量及能量的一阶差分等也具一定的声调特征。实验结果表明:如果将各种参数同时作为一个BP模型的输入参数,声调识别率不但没有提高,反而显著下降,因此,该文提出了将各种参数分别训练一个各自的BP网络,再将这些网络的输出作为另一高层BP网络的输入的普通话声调识别方法。另外,针对上声的特点提出了一种改进的基音平滑算法。这些方法的运用使系统的声调识别率达到90.05%。 In a mandarin tone recognition system,the parameter is usually pitch contour.But the tone can also be partly characterized by pitch difference,energy and energy difference.The experimental result shows that if all these parameters are input ted to one neural network,the recognition results are not any better but much lower than the system only using pitch contour.This paper describes a new method of using those parameters.It is that every kind of parameter is used to train one different BP model,and all the outputs of these BP models as the inputs of the higher level BP model.An improved pitch smooth method is put forward by the characterization of the third tone.The experimental result shows that using these new methods,an accuracy rate of90.05%can be achieved in mandarin tone recognition.

作者汤霖尹俊勋粟志昂赖国庭

机构地区华南理工大学电信学院江门教育学院计算机系江门教育学院计算机系

出处《计算机工程与应用》 CSCD 北大核心 2004年第25期96-99,共4页 Computer Engineering and Applications

关键词声调识别语音识别神经网络 tone recognition,speech recognition,neural network

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1顾良,刘润生.利用声调判别提高汉语数码语音识别性能[J].清华大学学报（自然科学版）,1998,38(9):36-39. 被引量：7
2孙放,胡光锐.一种新型前向神经网络用于汉语四声识别[J].上海交通大学学报,1997,31(5):36-38. 被引量：3
3朱小燕,王昱,刘俊.汉语声调识别中的基音平滑新方法[J].中文信息学报,2001,15(2):45-50. 被引量：26
4徐士林.四声模糊识别方法[J].电子学报,1996,24(1):119-121. 被引量：12
5钟金宏,杨善林,徐士林.三字词声调的模糊识别方法[J].系统工程与电子技术,2000,22(12):69-72. 被引量：6
6方绍武,戴蓓倩.基于话者特征图案的BPNN话者模型[J].计算机学报,2002,25(5):556-560. 被引量：2
7LR拉宾纳 RW谢弗.语音信号数字处理[M].北京：科学出版社,1983.116-122.
8Ross M,Shaffer H,Cohen A et al. Average magnitude difference function pitch extractor[J].IEEE Trans on Acoustics,Speech and Signal Processing, 1974; ASSP-22 (5): 353～362
9Seneff S.Real-time harmonic pitch detector[J].IEEE Trans on Acoustics,Speech and Signal Processing,1978;ASSP-26(4):358～365

二级参考文献23

1关存太,陈永彬.非特定人四声识别[J].声学学报,1993,18(5):379-385. 被引量：4
2杜利民,侯自强.汉语语音识别研究面临的一些科学问题[J].电子学报,1995,23(10):110-116. 被引量：21
3徐士林.四声模糊识别方法[J].电子学报,1996,24(1):119-121. 被引量：12
4陶维青,徐士林,任静.汉语语音的基音快速提取算法[J].合肥工业大学学报（自然科学版）,1996,19(3):31-36. 被引量：3
5Ying Y，Proceeding of ICSP’93，1993年
6徐士林，中文信息学报，1993年，1期
7Chang P C，Proceedng of ICASSP，1990年
8黄泽镇，声学学报，1990年，1期
9Yang W J，IEEE Trans ASSP，1988年
10汪培庄，模糊集合论及其应用，1984年

共引文献51

1宁继荣.一种语音信号基音频率提取算法的研究及实现[J].中国新通信,2020,0(3):70-70. 被引量：2
2陈蕾,肖珺,贾嫣.基于改进LD归一化算法的汉语声调识别系统的性能研究[J].自动化与仪器仪表,2016(1):148-151.
3王义元,赵黎明.基于小波变换的汉语三字词语音基音频率提取[J].吉林大学学报（信息科学版）,2005,23(1):22-26. 被引量：2
4黄海亮,谢康林,杜平,吴边.一种高精度的基音提取方案[J].计算机工程,2004,30(B12):343-345. 被引量：4
5马占武,王炳锡.汉语第零声的声调特征研究[J].电声技术,2005,29(7):45-47. 被引量：1
6柏静,韦岗.一种基于线性预测与自相关函数法的语音基音周期检测新算法[J].电声技术,2005,29(8):43-46. 被引量：14
7胡瑛,陈宁,夏旭.一种改进的自相关基音检测算法[J].电子科技,2007,20(2):25-28. 被引量：5
8戚建宇,赵鹤鸣,何松.基于HMM的普通话单字发音准确度评价方法研究[J].计算机工程与应用,2007,43(7):224-226. 被引量：3
9罗亚飞,鲍长春.基于DCT分带谱熵与信号分解的高精度基音检测算法[J].电子学报,2007,35(1):13-22. 被引量：5
10黄海辉,邹虹.一种高效的语调检测与评估方案[J].重庆邮电大学学报（自然科学版）,2007,19(B06):72-74. 被引量：1

同被引文献62

1李晓文.高校多媒体汉语言教学中存在的问题及对策[J].大家,2011(17):144-144. 被引量：1
2艾伦,王陆,张鸽.汉语标准普通话水平训练和自动测试系统[J].中国电化教育,2004(7):78-80. 被引量：3
3关存太,陈永彬.非特定人四声识别[J].声学学报,1993,18(5):379-385. 被引量：4
4栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
5叶明,顾利民.LPC倒谱参数的说话人特征分析[J].南京航空航天大学学报,1994,26(6):797-804. 被引量：7
6陈振标,徐波.基于子带能量特征的最优化语音端点检测算法研究[J].声学学报,2005,30(2):171-176. 被引量：22
7赵楠楠.交互理论下的计算机辅助对外汉语语言教学[J].剑南文学（经典教苑）（下）,2011(10):113-113. 被引量：2
8徐士林.四声模糊识别方法[J].电子学报,1996,24(1):119-121. 被引量：12
9郭春霞,裘雪红.基于MFCC的说话人识别系统[J].电子科技,2005,18(11):53-56. 被引量：19
10肖汉光,蔡从中,廖克俊.利用声波和地震波识别军事车辆类型[J].系统工程理论与实践,2006,26(4):108-113. 被引量：7

引证文献8

1汤霖,尹俊勋.普通话声调的客观评测[J].中文信息学报,2007,21(6):116-124. 被引量：4
2钱盛友,许慧燕.基于动态时间规整和神经网络的方言辨识研究[J].计算机工程与应用,2008,44(10):211-213. 被引量：9
3肖汉光,蔡从中.基于SVM的非特定人声调识别的研究[J].计算机工程与应用,2009,45(9):174-176. 被引量：4
4傅德胜,李仕强,王水平.支持向量机的汉语连续语音声调识别方法[J].计算机科学,2010,37(5):228-230. 被引量：4
5汤霖,姜世芬.多类噪声环境下的语音端点检测[J].计算机工程与应用,2012,48(29):114-118. 被引量：2
6贾嫣,陈蕾,王含斌,杨丽宁.计算机辅助语言学习中基于K-GMM模型的一种汉语声调识别技术及其应用研究[J].电化教育研究,2012,33(12):83-86. 被引量：2
7李仕强,王水平.基于BP网络的汉语普通话声调识别[J].南京信息工程大学学报（自然科学版）,2012,4(5):456-460. 被引量：2
8陈蕾.基于K均值混合高斯模型的声调识别系统性能研究[J].自动化与仪器仪表,2017(2):48-50.

二级引证文献25

1万济萍,肖云鹏,叶卫平.错音检测及其在语音教学中的应用综述[J].中文信息学报,2009,23(4):95-102. 被引量：4
2朱颖,钱盛友,赵新民.基于SOM神经网络和支持向量机的方言辨识[J].计算机工程与应用,2009,45(22):200-201. 被引量：6
3赵理,崔杜武.一种基于遗传优化和汉字声调的文本水印算法[J].中文信息学报,2009,23(5):108-113. 被引量：3
4陈浩,钱宇虹,周晓琴,郭梦和.普通话单音节词四声的时间频率分析三维语谱图研究[J].南方医科大学学报,2010,30(8):1805-1809.
5王改良,武妍.基于仿生模式识别理论的声调识别[J].计算机应用,2010,30(10):2709-2711. 被引量：2
6刘明骞,李兵兵,刘涵.数字调制信号识别性能的评估方法[J].计算机科学,2011,38(5):64-66.
7刘晋胜.采用熵相关性优化分离性的SVM说话人识别[J].计算机工程与设计,2011,32(8):2845-2848.
8贾嫣,陈蕾,王含斌,杨丽宁.计算机辅助语言学习中基于K-GMM模型的一种汉语声调识别技术及其应用研究[J].电化教育研究,2012,33(12):83-86. 被引量：2
9李仕强,王水平.基于BP网络的汉语普通话声调识别[J].南京信息工程大学学报（自然科学版）,2012,4(5):456-460. 被引量：2
10胡扬,年晓红.一种汉语方言编码与转换机制的研究[J].计算机应用研究,2013,30(1):206-210.

1顾明亮,夏玉果,杨亦鸣.支持矢量机的汉语声调识别[J].声学技术,2007,26(6):1186-1190. 被引量：2
2徐士林,SamuelC.Lee.汉语孤立字声调的模糊识别方法[J].中文信息学报,1993,7(1):7-17. 被引量：2
3王改良,武妍.基于仿生模式识别理论的声调识别[J].计算机应用,2010,30(10):2709-2711. 被引量：2
4肖汉光,蔡从中.基于SVM的非特定人声调识别的研究[J].计算机工程与应用,2009,45(9):174-176. 被引量：4
5杨靖,刘晓刚,尹小静.基于普适计算的交互汉语学习系统[J].计算机与现代化,2010(5):130-134. 被引量：1
6陶维青,徐士林,钟金宏.非特定人二字词声调模糊识别方法[J].模式识别与人工智能,1998,11(1):82-88. 被引量：3
7傅德胜,李仕强,王水平.支持向量机的汉语连续语音声调识别方法[J].计算机科学,2010,37(5):228-230. 被引量：4
8汤霖,尹俊勋.普通话声调的客观评测[J].中文信息学报,2007,21(6):116-124. 被引量：4
9钟金宏,杨善林,黄玲,李毅.FUZZY ARTMAP在三字词声调识别中的应用[J].计算机工程与设计,2004,25(1):52-54. 被引量：1
10宋刚,姚艳红.用于汉语单音节声调识别的基频轨迹拟合方法[J].计算机工程与应用,2008,44(29):239-240. 被引量：6

计算机工程与应用

2004年第25期

浏览历史

内容加载中请稍等...

基于两级BP模型的普通话声调识别系统被引量：8

参考文献9

二级参考文献23

共引文献51

同被引文献62

引证文献8

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

基于两级BP模型的普通话声调识别系统 被引量：8

参考文献9

二级参考文献23

共引文献51

同被引文献62

引证文献8

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

基于两级BP模型的普通话声调识别系统被引量：8