基于韵律特征参数的情感语音合成算法研究被引量：8

Synthesis of emotional speech based on prosody parameters

下载PDF

导出

摘要为了合成更为自然的情感语音,提出了基于语音信号声学韵律参数及时域基音同步叠加算法的情感语音合成系统。实验通过对情感语音数据库中生气、无聊、高兴和悲伤4种情感的韵律参数分析,建立4种情感模板,采用波形拼接语音合成技术,运用时域基音同步叠加算法合成含有目标感情色彩的语音信号。实验结果表明,运用波形拼接算法,调节自然状态下语音信号的韵律特征参数,可合成较理想的情感语音。合成的目标情感语音具有明显的感情色彩,其主观情感类别判别正确率较高。 In order to synthesize more natural emotional speech signals, an emotional speech synthesis system was proposed based on the acoustic prosody parameters and time domain pitch synchronous overlap add algorithm. The experiment built up prosodic templates for four emotions： angry, bored, happy and sad, through analyzing the prosody parameters of emotional speech signals. Then the waveform concatenative technique time domain pitch synchronous overlap add algorithm was used to im- plement emotional speech synthesis. The experiment results show that the proposed waveform concatenative algorithm combined with acoustic prosodic parameters modification method, had good performance on emotional speech synthesis. The synthesized emotional speech show strong emotional arouse and high subjective classification accuracy is achieved.

作者何凌黄华刘肖珩

机构地区四川大学电气信息学院四川大学基础医学与法医学院

出处《计算机工程与设计》 CSCD 北大核心 2013年第7期2566-2569,2584,共5页 Computer Engineering and Design

基金国家自然科学基金项目(10972148)

关键词情感语音合成韵律参数时域基音同步叠加波形拼接基音频率 synthesis of emotional speech prosody parameters time domain pitch synchronous overlap add waveform concatenation fundamental frequency

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1邵艳秋,韩纪庆,王卓然,刘挺.韵律参数和频谱包络修改相结合的情感语音合成技术研究[J].信号处理,2007,23(4):526-530. 被引量：7

二级参考文献15

1M. Schroder. Emotional speech synthesis: A review. In: Proceedings of the 7th European Conference on Speech Communication and Technology Eurospeech 2001, Aalborg, 2001:561-564.
2J. E. Cahn. Generating expression in synthesized speech. Master' s thesis, Massachusetts Institute of Technology, 1989.
3I. R. Murray, J. L. Arnott. Implementation and testing of a system for producing emotion-by-rule in synthetic speech. Speech Communication. 1995,16 : 369 - 390.
4Iida A, Campbell N, Higuchi F, Yasumura M, A Corpusbased Speech Synthesis System with Emotion, Speech Communication, 2003, 40,161-187.
5Iida A, Campbell N, A Speech Synthesis System with Emotion for Assisting Communication, In: Proceedings of ISCA Workshop (ITRW) on Speech and Emotion. Newcastle, Northern Ireland, 2000, 167 - 172.
6E. Rank and H. Pirker, "Generating emotional speech with a concatenative synthesizer", in Proceedings, ICSLP '98, Sydney, Australia, 1998, 3:671-674.
7陶建华，许晓颖．面向情感的语音合成系统．第一届中国情感计算及智能交互会议论文集，北京，2003：191-198．
8Nagasaki Y, Komatsu T: Can people perceive different emotions from a non-emotional voice by modifying its F0 and duration? In: Proceedings of Speech Prosody 2004. Nara, Japan (2004).
9T. Moriyama and S. Ozawa," Emotion recognition and synthesis system on speech" ,IEEE ICMCS 99,June 1999.
10Gobl C. , Bennett E. , N'i Chasaide A.: Expressive synthesis: How crucial is voice quality? . In: Proceedings of IEEE Workshop on Speech Synthesis, Santa, Monica (2002).

共引文献6

1韩文静,李海峰,王朝友.语音情感信息可视化建模研究与探析[J].燕山大学学报,2010,34(2):128-132.
2陈明义,党培霞.基于情感基音模板的情感语音合成[J].中南大学学报（自然科学版）,2010,41(6):2258-2263. 被引量：4
3汪成亮,张玉维.基于共振峰合成和韵律调整的语音验证码方法研究[J].计算机应用研究,2011,28(7):2458-2461. 被引量：4
4任蕊,苗振江.基于PSOLA算法的情感语音合成[J].系统仿真学报,2008,20(S1):423-426. 被引量：2
5王敬华,刘建银,张国燕,赵新想.情感语音合成中韵律参数的基频研究[J].小型微型计算机系统,2013,34(9):2047-2050. 被引量：2
6李勇,魏珰,王柳渝.基于PSOLA与DCT的情感语音合成方法[J].计算机工程,2017,43(12):278-282. 被引量：5

同被引文献58

1韩文静,李海峰.基于韵律语段的语音情感识别方法研究[J].清华大学学报（自然科学版）,2009(S1):1363-1368. 被引量：8
2李爱军,邵鹏飞,党建武.情感表达的跨文化多模态感知研究[J].清华大学学报（自然科学版）,2009(S1):1393-1401. 被引量：6
3韩家炜.数据挖掘:概念与技术[M].3版北京:机械工业出版社,2012.
4Picard R. Affective computing [ M ]. Cambridge, USA, MIT Press, 1997.
5Shiqing Zhang, Xiaoming Zhao. Dimensionality reduction based spoken emotion recognition[ J ]. Muhimed Tools Appl, 2013,8 ( 63 ) : 615 - 646.
6Jianhua Tao, Le Xin, Panrong Yin. Realistic Visual Speech Synthesis based on Hybrid Concatenation Method [ J ]. Speech and Language Pro- cessing, 2009,3(17) :469 -477.
7Fernandez R, Picard R. Recognizing affect from speech prosody using hierarchical graphical models [ J ]. Speech Communication, 2011,53 (10) : 1088 - 1103.
8Agrawal R. Mining Association Rules Between Sets of Items in Large Databases[ C ]//Washington: Proceedings of the ACM SIGMOD Inter- national Conference Management of Data, 1993.
9熊子瑜.Praat语音软件使用手册[R].中国社会科学院现代语音学暑假班讲义,2008.
10赵力.语音信号处理[M].2版.北京:机械工业出版社,2012.

引证文献8

1李景娜,吴娇.中国学习者对英语情感语调的感知研究[J].中国外语研究,2021(1):54-62.
2徐照松,元昌安,覃晓,元建,李双.基于关联规则的语音情感中韵律特征抽取算法研究[J].计算机应用与软件,2015,32(9):42-45. 被引量：1
3曲珍,扎西加,春燕.最大熵软决策树HMM最大似然藏语音合成[J].计算机工程与设计,2017,38(4):981-988.
4孙晓虎,李洪均.语音情感识别综述[J].计算机工程与应用,2020,56(11):1-9. 被引量：16
5庞聪,连海伦,周健,王华彬,陶亮.一种基于特征融合的耳语音向正常音的转换方法[J].南京航空航天大学学报,2020,52(5):777-782.
6范涛,王昊,郝琳娜,王诗琴.基于视频上下文和高维融合的突发事件中网民情感分析研究[J].情报科学,2021,39(5):176-183. 被引量：6
7张昕,胡航烨,曹欣怡,王蔚.基于Tacotron模型和韵律修正的情感语音合成方法[J].数据采集与处理,2022,37(4):909-916. 被引量：2
8崔娟娟,张海燕.以项目为导向的虚拟仿真教学案例研究[J].移动信息,2024,46(6):109-111.

二级引证文献25

1张卫,张雪英,孙颖.融合模糊认知图用于语音情感识别[J].计算机工程与应用,2017,53(15):14-17.
2吴和生.监狱工作中智能语音技术的应用[J].电声技术,2020,44(7):22-24.
3陶小梅,陈心怡.在线学习环境中基于眼动特征情感识别研究[J].计算机技术与发展,2021,31(3):186-190. 被引量：5
4李丹,李丽萍,李丹.三孩政策出台的舆情效应及启示——基于NLP的网络大数据分析[J].中国青年研究,2021(10):46-53. 被引量：17
5武渊,徐逸卿.基于多层异构注意力机制和深度学习的短文本分类方法[J].中北大学学报（自然科学版）,2021,42(5):426-434. 被引量：4
6王传昱,李为相,陈震环.基于语音和视频图像的多模态情感识别研究[J].计算机工程与应用,2021,57(23):163-170. 被引量：6
7王兰馨,王卫亚,程鑫.结合Bi-LSTM-CNN的语音文本双模态情感识别模型[J].计算机工程与应用,2022,58(4):192-197. 被引量：18
8焦亚萌,周成智,李文萍,崔琳,董免.融合多头注意力的VGGNet语音情感识别研究[J].国外电子测量技术,2022,41(1):63-69. 被引量：11
9邬卓恒,赵嘉熙,时小芳.基于BP神经网络的语音情感识别系统分析与设计[J].电脑知识与技术,2022,18(10):76-79. 被引量：1
10况姗芸,郑美秋,钟玲,卢昀.在线学业情绪:类型与测量[J].教育信息技术,2022(11):3-9.

1陈明义,党培霞.基于情感基音模板的情感语音合成[J].中南大学学报（自然科学版）,2010,41(6):2258-2263. 被引量：4
2王敬华,刘建银,张国燕,赵新想.情感语音合成中韵律参数的基频研究[J].小型微型计算机系统,2013,34(9):2047-2050. 被引量：2
3邵艳秋,穗志方,韩纪庆,王志伟.小规模情感数据和大规模中性数据相结合的情感韵律建模研究[J].计算机研究与发展,2007,44(9):1624-1631.
4李虎孬,赵晖.情感语音合成综述[J].现代计算机（中旬刊）,2014(7):31-37. 被引量：1
5张鹏,王丽红,毛琳.语音合成系统中波形拼接过渡算法的研究[J].黑龙江大学自然科学学报,2011,28(6):867-870. 被引量：1
6刘均,古辉.中文文语转换在电话语音系统中的应用[J].浙江工业大学学报,2006,34(6):668-671.
7韩文静,李海峰.情感语音数据库综述[J].智能计算机与应用,2013,3(1):5-7. 被引量：15
8李勇,于洪志,达哇彭措.基于关联规则的藏语语音韵律参数提取[J].微计算机信息,2009(6):255-257. 被引量：3
9包权.Wave文件在VB开发平台下的读写和拼接技术[J].电声技术,2013,37(3):73-75. 被引量：2
10鲁小勇,潘涛,高兰德.基于广义回归神经网络的情感语音韵律特征预测[J].自动化与仪器仪表,2015(2):145-146.

计算机工程与设计

2013年第7期

浏览历史

内容加载中请稍等...

基于韵律特征参数的情感语音合成算法研究被引量：8

参考文献1

二级参考文献15

共引文献6

同被引文献58

引证文献8

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

基于韵律特征参数的情感语音合成算法研究 被引量：8

参考文献1

二级参考文献15

共引文献6

同被引文献58

引证文献8

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

基于韵律特征参数的情感语音合成算法研究被引量：8