考虑情感程度相对顺序的维度语音情感识别被引量：2

Considering relative order of emotional degree in dimensional speech emotion recognition

下载PDF

导出

摘要维度语音情感识别(Dim-SER)是情感计算领域的一个新兴分支,它从多维、连续的角度看待情感,将SER问题建模为连续值的预测回归任务。当前的Dim-SER系统在进行情感预测时缺少对语料间情感程度相对顺序的考虑,严重影响了人机交互系统对说话人情感变化趋势的把握。从该需求出发,本文以人类情感认知特性为参照,构建了一个对情感程度相对顺序敏感的Dim-SER系统,并引入Gamma统计对SER系统性能评价标准加以完善。系统构建过程中,本文构造了Top-rank概率分布对语料间的情感顺序进行描述,并使用Kullback-Leibler距离对预测造成的顺序一致性损失进行度量,最后提出顺序敏感的神经网络算法实现系统预测损失的最小化。情感预测实验结果表明,同常用的k近邻算法和支持向量回归算法相比,该系统有效地提高了语料间情感程度相对顺序的正确性。 Dimensional speech emotion recognition（Dim-SER） is a rising branch of emotion computing field.It views emotion from dimensional and continuous perspective,and formalizesthe SER problem as a regression task.Current Dim-SER researches never consider the relative order of emotional degree between utterances,which would makethe human-machine interface get wrong information about speaker＇ s emotion variation trend.Starting from this demand,this paper constructs an order sensitive Dim-SER system with the human emotion cognitive characteristics as reference,and employsGamma statisticto evaluate emotion recognition performance.Specifically, the Top-rank probability distribution is developed to describethe emotional ordering of utterances,and the Kullback-Leibler divergence is usedto measure the loss of order consistency caused by emotion recognition.Finally,the Order-Senstive Network（OSNet） algorithm is proposed to minimized prediction loss.Experimental results show that,compared with the commonly usedA-Nearest Neighbor （k-NN） and Support Vector Regression（SVR） approaches,the proposed system effectively improve thecorrectness of emotional relative order between utterances.

作者韩文静李海峰马琳

机构地区哈尔滨工业大学计算机学院

出处《信号处理》 CSCD 北大核心 2011年第11期1658-1663,共6页 Journal of Signal Processing

基金自然科学基金(60772076) 语言语音教育部微软重点实验室开放基金资助项目(HIT.KLOF.2009015) 高等学校博士学科点专项科研基金(No.20050213032)

关键词维度语音情感识别情感空间 Kullback-Leibler距离神经网络梯度下降 dimensional speech emotion recognition emotion space Kullback-Leibler divergence neural network gradient descent

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献13

1Lee, C., Narayanan, S., Pieraccini, R. Combining acous- tic and language information for emotion recognition [ C ]//J Proc. ICSLP, 2002. 873-876.
2Dellaert, F., Polzin, T.,Waibel, A.. Recognizing emotion in speeeh[C]ffProc. ICSLP, 1996. 1970-1973.
3Schuller, B., Rigoll,G. Lang, M. Hidden Markov mod- el-based speech emotion recognition [ C ] ff Proc. ICME, 2003, 1. 401-404.
4Giannakopoulos, T., Pikrakis, A. Theodoridis, S.. A di- mensional approach to emotion recognition of speech from movies[ C]////Proc. ICASSP, 2009. 65-68.
5Grimm,M., Kroschel, K. Narayanan, S.. Support vector regression for automatic recognition of spontaneous emo-tions in speech [ C ] ,//Proe. ICASSP, 2007, IV. 1085- 1088.
6Russell, J.. A eireumplex model of affect [ J ]. Journal of Personality & Social Psychology, 1980, 39 (6) : 1161- 1178.
7Yang,Y., Lin, Y., Su, Y., Chen, H. A regression ap- proach to music emotion recognition [ J ]. IEEE Trans. Au- dio, Speech & Language Processing, 2008, 16, (2) : 448- 457.
8Hanjalie, A. ,Xu, L.. Affective video content representa- tionand modeling[J]. IEEE Trans. on Multimedia, 2005, 7(1) :143-154.
9Kehrein, R. The prosody of authentic emotions [ C ]//Proc. Speech Prosody Conference, 2002. 423-426.
10Grimm, M. , Kroschel, K. and Narayanan, S.. The Vera am Mittag German audio-visual emotional speech database [ C]//Proc. ICME, 2008. 865-868.

同被引文献10

1韩文静,李海峰,韩纪庆.基于长短时特征融合的语音情感识别方法[J].清华大学学报（自然科学版）,2008,48(S1):708-714. 被引量：20
2韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：169
3陈婧,李海峰,马琳,陈肖,陈晓敏.多粒度特征融合的维度语音情感识别方法[J].信号处理,2017,33(3):374-382. 被引量：9
4Filippo Cavallo,Francesco Semeraro,Laura Fiorini,Gergely Magyar,Peter Sincadk,Paolo Dario.Emotion Modelling for Social Robotics Applications： A Review[J].Journal of Bionic Engineering,2018,15(2):185-203. 被引量：4
5陈逸灵,程艳芬,陈先桥,王红霞,李超.PAD三维情感空间中的语音情感识别[J].哈尔滨工业大学学报,2018,50(11):160-166. 被引量：6
6孙晓虎,李洪均.语音情感识别综述[J].计算机工程与应用,2020,56(11):1-9. 被引量：16
7李海峰,陈婧,马琳,薄洪健,徐聪,李洪伟.维度语音情感识别研究综述[J].软件学报,2020,31(8):2465-2491. 被引量：17
8张钹,朱军,苏航.迈向第三代人工智能[J].中国科学：信息科学,2020,50(9):1281-1302. 被引量：173
9张会云,黄鹤鸣,李伟,康杰,无.语音情感识别研究综述[J].计算机仿真,2021,38(8):7-17. 被引量：18
10张颖,罗森林.情感建模与情感识别[J].计算机工程与应用,2003,39(33):98-102. 被引量：24

引证文献2

1李海峰,陈婧,马琳,薄洪健,徐聪,李洪伟.维度语音情感识别研究综述[J].软件学报,2020,31(8):2465-2491. 被引量：17
2陶建华,陈俊杰,李永伟.语音情感识别综述[J].信号处理,2023,39(4):571-587. 被引量：5

二级引证文献22

1罗春梅,张风雷.基于均值特征和改进深度神经网络的说话人识别算法[J].声学技术,2021,40(4):503-507. 被引量：2
2钱佳琪,黄鹤鸣,张会云.基于ARCNN-GAP网络的语音情感识别[J].计算机与现代化,2021(12):91-95.
3胡心约,张恬路,李英武.基于AI的情绪识别在组织中的实践:现状、未来和挑战[J].中国人力资源开发,2022,39(1):57-70. 被引量：8
4彭涛,郑传锟,张自力,刘军平,胡新荣,何儒汉.基于时空特征融合的语音情感识别[J].郑州大学学报（理学版）,2022,54(4):42-48.
5胡新荣,陈志恒,刘军平,彭涛,何儒汉,何凯.基于SGD的决策级融合维度情感识别方法[J].郑州大学学报（理学版）,2022,54(4):49-54. 被引量：3
6焦亚萌,周成智,李文萍,崔琳,董免.融合多头注意力的VGGNet语音情感识别研究[J].国外电子测量技术,2022,41(1):63-69. 被引量：11
7陈闯.智能语音产品用户体验提升对策研究[J].软件导刊,2022,21(12):33-37. 被引量：1
8汪洋,傅洪亮,陶华伟,杨静,谢跃,赵力.基于决策边界优化域自适应的跨库语音情感识别[J].计算机应用,2023,43(2):374-379. 被引量：4
9耿磊,傅洪亮,陶华伟,卢远,郭歆莹,赵力.基于动态卷积递归神经网络的语音情感识别[J].计算机工程,2023,49(4):125-130. 被引量：5
10陶建华,陈俊杰,李永伟.语音情感识别综述[J].信号处理,2023,39(4):571-587. 被引量：5

1曹建芳,陈俊杰,李海芳,赵涓涓.基于模糊理论的场景图像情感语义标注方法研究[J].重庆师范大学学报（自然科学版）,2014,31(2):67-71.
2刘婉军,王宏志.基于先验知识和Kullback-Leibler距离的超分辨率图像重建[J].长春工业大学学报,2014,35(6):645-649.
3胡伟武,夏培肃.顺序一致共享存储系统中的乱序执行技术──基本理论[J].计算机学报,1997,20(6):481-490. 被引量：3
4胡伟武,夏培肃.顺序一致共享存储系统中的乱序执行技术──模拟实现[J].计算机学报,1997,20(6):491-500. 被引量：2
5周如旗,陈文伟.基于EKLD的属性约简方法[J].计算机工程,2007,33(11):62-63.
6吕巍,邬春学,张明西,钟聃.基于P-Rank的网络书店相似性搜索[J].计算机工程与设计,2015,36(10):2849-2855.
7任倩慧.浅析认知心理学在ATM界面设计中的应用[J].艺术科技,2013,26(5):212-213.
8陈婧,李海峰,马琳,陈肖,陈晓敏.多粒度特征融合的维度语音情感识别方法[J].信号处理,2017,33(3):374-382. 被引量：9
9孙忠贵.基于模糊集的数字图像脉冲噪声滤除[J].微计算机信息,2008,24(15):302-303.
10冷泳林,申华,鲁富宇.基于P-Rank的RDF有向图的分布式存储[J].重庆理工大学学报（自然科学）,2015,29(1):91-95. 被引量：2

信号处理

2011年第11期

浏览历史

内容加载中请稍等...

考虑情感程度相对顺序的维度语音情感识别被引量：2

参考文献13

同被引文献10

引证文献2

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

考虑情感程度相对顺序的维度语音情感识别 被引量：2

参考文献13

同被引文献10

引证文献2

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

考虑情感程度相对顺序的维度语音情感识别被引量：2