基于语音声学特征的情感信息识别被引量：38

Speech emotion recognition using acoustic features

导出

摘要为提高情感语音识别的正确率,研究了声学参数的统计特征和时序特征在区分情感中的作用,并提出了一种将两者相融合的情感识别方法。在提取出基本的韵律参数和频谱参数后,首先利用PNN(probab ilistic neura l netw ork)和HMM(h idden m arkov m ode l)分别对声学参数的统计特征和时序特征进行处理。计算它们各自属于每类情感的概率,获得采用加法规则和乘法规则融合统计特征和时序特征的识别结果。实验结果表明:各组特征在区分情感方面的侧重不尽相同,通过特征融合,平均识别正确率相较单独采用统计特征或时序特征均有提高,在最好情况下达到了92.9%。这说明了该方法的有效性。 A speech emotion recognition algorithm was developed based on the statistical and temporal fealures of the acoustic parameters for discriminating between emotions. The system first extracted the basic prosody parameters and spectral parameters, then. used a PNN （probabilistic neural network） to model the statistic features and a HMM （hidden Markov model） to model the temporal features. The sum and product rules were used to combine the probabilities from each group of features for the final decision. Experiments on the Cbinese speech corpus showed how the statistical and temporal features tend to reflect different aspects of emotions. The accuracy rate obtained by feature combination is higher than that by each group alone, reaching a maximum of 92.9%.

作者蒋丹宁蔡莲红

机构地区清华大学计算机科学与技术系

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2006年第1期86-89,共4页 Journal of Tsinghua University(Science and Technology)

基金国家自然科学基金资助项目(60433030 60418012)

关键词语言识别模式识别情感信息处理声学特征 speech recognition pattern recognition emotion information processing acoustic features

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1Cowie R,Cowie E D,Tsapatsoulis N,et al.Emotion recognition in human-computer interaction[J].IEEE Signal Processing Magazine,2001,18(1):32-80.
2Paeschke A,Sendlmeier W F.Prosodic characteristics of emotional speech:measurements of fundamental frequency movements[A].Proc of ISCA Workshop on Speech and Emotion[C].Northern Ireland:Textflow,2000.75-80.
3Schuller B,Rigoll G,Lang M.Hidden markov model-based speech emotion recognition[A].Proc of ICASSP'03[C].New York:IEEE Press,2003.II,1-4.
4赵力,将春辉,邹采荣,吴镇扬.语音信号中的情感特征分析和识别的研究[J].电子学报,2004,32(4):606-609. 被引量：49
5Cheveign A D,Kawahara H.YIN:A fundamental frequency estimator for speech and music[J].J Acoust Soc Am,2002,111(4):1917-1930.
6Tzanetakis G,Cook P.Musical genre classification of audio signals[J].IEEE Transactions on Speech and Audio Processing,2002,10(5):293-302.
7Lu L,Zhang H J,Jiang H.Content analysis of audio classification and segmentation[J].IEEE Transactions on Speech and Audio Processing,2002,10(7):504-516.
8Kittler J,Hatef M,Duin R P,et al.On combining classifiers[J].IEEE Transactions on Pattern Analysis and Machine Learning,1998,20(3):226-239.

二级参考文献8

1周迪伟高东杰（译）.计算机语音处理[M].国防工业出版社,1987..
2Y Niimi.Emotional Robot World[M].Tokyo:Talk and Speak Press,Japan,1995.67-96.
3Cowie R.Emotion recognition in human-computer interaction.IEEE Signal Processing Magazine,2001,18(1):32-80.
4Zhao L,Y Kobayashi,Y Niimi.Tone recognition of Chinese continuous speech using continuous HMMs.日本音响学会论文志,1997,53(12):933-940.
5M Shigenaga.Features of Emotionally Uttered Speech Revealed by Discriminant Analysis(Ⅵ)[M].The preprint of the acoustical society of Japan,1999.2-18.
6赵力,钱向民,邹采荣,吴镇扬.从语音信号中提取情感特征的研究[J].数据采集与处理,2000,15(1):120-123. 被引量：12
7赵力,钱向民,邹采荣,吴镇扬.语音信号中的情感特征分析和识别的研究[J].通信学报,2000,21(10):18-24. 被引量：28
8赵力,钱向民,邹采荣,吴镇扬.语音信号中的情感识别研究[J].软件学报,2001,12(7):1050-1055. 被引量：56

共引文献48

1韩丁,新吉乐,王亮,王亚欣,李厅霞,郭瑛.声学监测技术在家畜福利化养殖中的发展应用[J].内蒙古农业大学学报（自然科学版）,2023,44(5):89-100.
2张立华,杨莹春.情感语音变化规律的特征分析[J].清华大学学报（自然科学版）,2008,48(S1):652-657. 被引量：14
3付丽琴,毛峡,陈立江.基于改进的排序式选举算法的语音情感融合识别[J].计算机应用,2009,29(2):381-385. 被引量：1
4赵腊生,张强,魏小鹏.语音情感识别研究进展[J].计算机应用研究,2009,26(2):428-432. 被引量：21
5陈清.英语儿歌中的语言象似性特征研究[J].长沙铁道学院学报（社会科学版）,2009,10(1):226-228. 被引量：3
6徐俊,蔡莲红.面向情感转换的层次化韵律分析与建模[J].清华大学学报（自然科学版）,2009(S1):1274-1277. 被引量：7
7詹永照,曹鹏.语音情感特征提取和识别的研究与实现[J].江苏大学学报（自然科学版）,2005,26(1):72-75. 被引量：16
8国辛纯,郭继昌,窦修全.基于HMM的语音信号情感识别研究[J].电子测量技术,2006,29(5):69-70. 被引量：10
9陈明义,余伶俐,朱晗,周昆湘.基于特征参数融合的语音情感识别方法[J].微电子学与计算机,2006,23(12):168-171. 被引量：10
10林奕琳,韦岗,杨康才.语音情感识别的研究进展[J].电路与系统学报,2007,12(1):90-98. 被引量：33

同被引文献389

1杨洁,孔江平.汉语陈述句和疑问句感知范畴研究[J].中国语音学报,2020(1):1-13. 被引量：2
2陈墨玉,孔江平.汉语焦点重音感知研究[J].中国语音学报,2019(1):147-157. 被引量：2
3塔什甫拉提·尼扎木丁,梁瑞宇,谢跃,赵力.采用原子表示模型的维吾尔语语音情感识别[J].信号处理,2020,36(1):9-17. 被引量：3
4王璐,孔江平.德宏傣语单元音和复元音感知范畴研究[J].民族语文,2021(1):90-98. 被引量：3
5谢波,陈岭,陈根才,陈纯.普通话语音情感识别的特征选择技术[J].浙江大学学报（工学版）,2007,41(11):1816-1822. 被引量：13
6刘箴.虚拟人情绪向量和表情向量的合成[J].系统仿真学报,2006,18(z1):404-406. 被引量：4
7韩文静,李海峰,韩纪庆.基于长短时特征融合的语音情感识别方法[J].清华大学学报（自然科学版）,2008,48(S1):708-714. 被引量：20
8张立华,杨莹春.情感语音变化规律的特征分析[J].清华大学学报（自然科学版）,2008,48(S1):652-657. 被引量：14
9赵腊生,张强,魏小鹏.语音情感识别研究进展[J].计算机应用研究,2009,26(2):428-432. 被引量：21
10沈炯.汉语语调分类和标记方法试说[J].语言文字应用,1998(1):104-106. 被引量：19

引证文献38

1韩文静,李海峰,韩纪庆.基于长短时特征融合的语音情感识别方法[J].清华大学学报（自然科学版）,2008,48(S1):708-714. 被引量：20
2张立华,杨莹春.情感语音变化规律的特征分析[J].清华大学学报（自然科学版）,2008,48(S1):652-657. 被引量：14
3付丽琴,毛峡,陈立江.基于改进的排序式选举算法的语音情感融合识别[J].计算机应用,2009,29(2):381-385. 被引量：1
4赵腊生,张强,魏小鹏.语音情感识别研究进展[J].计算机应用研究,2009,26(2):428-432. 被引量：21
5徐露,徐明星,杨大利.面向情感变化检测的汉语情感语音数据库[J].清华大学学报（自然科学版）,2009(S1):1413-1418. 被引量：6
6张少龙,吴佳鑫.语音信息的内容分析技术研究综述[J].现代图书情报技术,2007(4):28-31. 被引量：2
7余伶俐,蔡自兴,陈明义.语音信号的情感特征分析与识别研究综述[J].电路与系统学报,2007,12(4):76-84. 被引量：27
8邵艳秋,穗志方,韩纪庆,王志伟.小规模情感数据和大规模中性数据相结合的情感韵律建模研究[J].计算机研究与发展,2007,44(9):1624-1631.
9韩一,王国胤,杨勇.基于MFCC的语音情感识别[J].重庆邮电大学学报（自然科学版）,2008,20(5):597-602. 被引量：23
10刘箴,潘志庚.虚拟人动机驱动的自主情绪模型研究[J].中国图象图形学报,2009,14(5):773-781. 被引量：17

二级引证文献195

1董理,谈笑.昆剧小生行当情感念白声学研究[J].中国语音学报,2021(2):52-60.
2张高媛,王韫佳,黄靖雯.声学线索掩蔽下普通话情感语音的听辨研究[J].中国语音学报,2020(1):14-23.
3张石清,刘瑞欣,赵小明.跨库语音情感识别研究进展[J].计算机系统应用,2022,31(11):31-48.
4刘婷婷,刘箴,许辉煌,王瑾,柴艳杰,陆静.基于情绪认知评价理论的虚拟人情绪模型研究[J].心理科学,2020,43(1):53-59. 被引量：12
5李君,吕晓军,邵夫驰,杨恩泽,行鸿彦.铁路智能客服的架构及其技术研究[J].电子测量技术,2020(15):172-176. 被引量：1
6王旭,张达敏,周勇.基于小波变换的数字调制信号特征提取[J].贵州科学,2008(4):30-33.
7赵腊生,张强,魏小鹏.语音情感识别研究进展[J].计算机应用研究,2009,26(2):428-432. 被引量：21
8韩文静,李海峰.基于韵律语段的语音情感识别方法研究[J].清华大学学报（自然科学版）,2009(S1):1363-1368. 被引量：8
9徐露,徐明星,杨大利.面向情感变化检测的汉语情感语音数据库[J].清华大学学报（自然科学版）,2009(S1):1413-1418. 被引量：6
10汪碧云,杨新凯.E-Learning中一种基于气质类型的情感计算算法[J].上海师范大学学报（自然科学版）,2013,42(1):25-30. 被引量：1

1叶斌.基于HMM和PNN的语音情感识别研究[J].青岛大学学报（工程技术版）,2011,26(4):53-56.
2黄崑.情感信息处理研究综述[J].现代图书情报技术,2007(11):67-71. 被引量：11
3王艳秋,高云华.基于人工神经网络的语音识别技术的研究[J].福建质量管理,2016,0(7):17-18.
4何琨,王国胤,杨勇.基于选择性集成的情感识别[J].重庆邮电大学学报（自然科学版）,2007,19(4):413-416. 被引量：2
5蒲国林.基于粗糙集与信息增益的情感特征选择方法[J].微电子学与计算机,2016,33(1):96-99. 被引量：5
6毛峡.情感信息处理[J].遥测遥控,2000,21(6):58-62. 被引量：1
7王琦,陈仪香.基于知网的虚拟人情感建模研究[J].自动化技术与应用,2008,27(5):76-79. 被引量：2
8屠彬彬,于凤芹.基于样本熵与MFCC融合的语音情感识别[J].计算机工程,2012,38(7):142-144. 被引量：7
9王丽艳.证据理论和改进神经网络相融合的图像识别算法[J].微电子学与计算机,2013,30(2):148-152. 被引量：2
10胡明霞.表面肌电信号识别特征提取的仿真研究[J].计算机仿真,2013,30(5):345-348. 被引量：11

清华大学学报（自然科学版）

2006年第1期

浏览历史

内容加载中请稍等...

基于语音声学特征的情感信息识别被引量：38

参考文献8

二级参考文献8

共引文献48

同被引文献389

引证文献38

二级引证文献195

相关作者

相关机构

相关主题

浏览历史

基于语音声学特征的情感信息识别 被引量：38

参考文献8

二级参考文献8

共引文献48

同被引文献389

引证文献38

二级引证文献195

相关作者

相关机构

相关主题

浏览历史

基于语音声学特征的情感信息识别被引量：38