基于稀疏特征迁移的语音情感识别被引量：3

Speech Emotion Recognition Using Sparse Feature Transfer

下载PDF

导出

摘要为了解决语音情感识别系统中训练数据和测试数据来自不同数据库所引起的识别率降低的问题,提出了一种基于稀疏特征迁移的语音情感识别方法。通过引入稀疏编码获取情感特征在不同数据库条件下的共同稀疏表示;同时引入最大区分差异(Maximum mean discrepancy,MMD)来衡量不同数据库条件下稀疏表示分布之间的距离,并将其作为稀疏编码目标函数的约束条件,从而获得较为鲁棒的稀疏特征。实验结果表明,相比传统语音情感识别方法,基于稀疏特征迁移的语音情感识别方法显著提高了跨库条件下的情感识别率。 In speech emotion recognition system ,recognition rates will drop drastically when the training and the testing utterances are from different corpora .To solve this problem ,a novel sparse feature trans‐fer approach is proposed .By employing sparse coding algorithm ,the common sparse feature representa‐tion of emotion features from different corpora is obtained .Meanwhile ,the maximum mean discrepancy （MMD） algorithm is introduced to measure the distance between different distributions ,and is used as the regularization term for the objective function of sparse coding .Finally ,the robust sparse features are achieved for recognition .Experimental results show that ,compared to traditional methods ,the proposed approach can significantly improve the recognition rates for cross databases .

作者宋鹏金赟查诚赵力

机构地区烟台大学计算机与控制工程学院东南大学儿童发展与学习科学教育部重点实验室东南大学信息科学与工程学院

出处《数据采集与处理》 CSCD 北大核心 2016年第2期325-330,共6页 Journal of Data Acquisition and Processing

基金山东省自然科学基金(ZR2014FQ016 ZR2015PF010)资助项目国家自然科学基金(61273266 61403328 61403329)资助项目东南大学基本科研业务费(CDLS-2015-04)资助项目

关键词语音情感识别特征迁移稀疏编码 speech emotion recognition feature transfer sparse coding

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献18

1Ayadi E1 M, Kamel M S, Karray F. Survey on speech emotion recognition: Features, classification schemes, and databases [J]. Pattern Recognition, 2011, 44(3) 572-587.
2赵力,黄程韦.实用语音情感识别中的若干关键技术[J].数据采集与处理,2014,29(2):157-170. 被引量：35
3Stuhlsatz A, Meyer C, Eyben F, et al. Deep neural networks for acoustic emotion recognition: Raising the benchmarks[C] //Proceedings of International Conference on Acoustics, Speech and Signal Processing (ICASSP). Dallas, USA IEEE Sig- nal Processing Society, 2011: 5688-5691.
4余华,黄程韦,金赟,赵力.基于粒子群优化神经网络的语音情感识别[J].数据采集与处理,2011,26(1):57-62. 被引量：20
5Zhang Z, Weninger F, Wollmer M, et al. Unsupervised learning in cross-corpus acoustic emotion recognition[C]//Proceed ings of IEEE Workshop on Automatic Speech Recognition and Understaading (ASRU). Hawaii, USA: IEEE Signal Process- ing Society, 2011: 523-528.
6J eon J H, Le D, Xia R, et ai. A preliminary study of cross-lingual emotion recognition from speech: Automatic classification versus human perception[C]//Proceedings of Interspeeeh. Lyon, France ISCA, 2013 : 2837 2840.
7Deng J, Zhang Z, Eyben F, et al. Autoencoder-based unsupervised domain adaptation for speech emotion recognition[J]. IEEE Signal Processing Letters, 2014, 21(9): 1068-1072.
8Song P, Jin Y, Zhao L, et al. Speech emotion recognition using transfer learning[J]. IEICE Transactions on Information and Systems, 2014, 97(9): 2530-2532.
9Huang K, Aviyente S. Sparse representation for signal classification[C]//Proceedings of Advances in Neural Information Processing Systems. Vancouver, Canada: MIT Press, 2006: 609-616.
10Pan S J, Yang Q. A survey on transfer learning[J]. IEEE Transactions on Knowledge and Data Engineering, 2010, 22(10) : 1345- 1359.

二级参考文献71

1赵力,王治平,卢韦,邹采荣,吴镇扬.全局和时序结构特征并用的语音信号情感特征识别方法[J].自动化学报,2004,30(3):423-429. 被引量：15
2王治平,赵力,邹采荣.基于基音参数规整及统计分布模型距离的语音情感识别[J].声学学报,2006,31(1):28-34. 被引量：26
3Heard R W.Affective computing[M].Cambridge:MIT Press,1997.
4Heard R W.Toward computers that recognize and respond to user emotion[J].IBM Technical Journal,2000,38(2):705-719.
5Qiang Guo,Zhang Peter.Neural networks for classification:a survey[J].IEEE Transaction on Systern,Man,and Cybernetics Application and Reviews,2000,30(4):451-462.
6Yamada T,Hashimoto H,Tosa N,Pattern recognition of emotion with neural network[C] //Proceeding of the 1995 IEEE IECON 21st International Conference on Industrial Electronics.Control,and Instrumentation.[S.l.] :IEEE,1995,1:183-187.
7Sato H,Mitsukura Y,Fukumi M,et al.Emotional speech classification with prosodic parameters by using neural networks[C] //Seventh Australian and NewZealand Intelligent Information Systems Conference.New Zealand:[s.n.] ,2001:395-398.
8Nicholson J,Takahashi K,Nakatsu R.Emotion recognition in speech using neural networks[C] //Proceedings ICONIP 99,6 th International Conference on Neural Information Processing,1999(2):16-20.
9日本文部省.情感信息处理的信息学、心理学研究.[R].1999.
10Shi Y,Eberhart R C.A modified swarm optimizer[C] //IEEE International Conference on Evolutionary Computation.Anchorage,AK,USA:IEEE,1998:69-73.

共引文献51

1张霞,杨勇,赵力.基于复数帧段特征的语音情感识别方法[J].电子器件,2022,45(2):479-482.
2周红标.融合语音和脉搏的多模态情感识别研究[J].微电子学与计算机,2015,32(6):5-9. 被引量：4
3王凯.粒子群优化RBF神经网络的语音识别研究[J].数字技术与应用,2013,31(4):109-110.
4李忠国,侯杰,王凯,刘庆华.模糊支持向量机在路面识别中的应用[J].数据采集与处理,2014,29(1):146-151. 被引量：13
5徐照松,元建.基于BP神经网络的语音情感识别研究[J].软件导刊,2014,13(4):11-13. 被引量：6
6钟巍,孔祥维,尤新刚,王波.基于分数倒谱变换的取证语音拼接特征提取与分析[J].数据采集与处理,2014,29(2):248-253. 被引量：6
7郝欢,陈亮,张翼鹏.基于短时能量和最小相对均方误差准则的神经网络语音水印方法[J].数据采集与处理,2014,29(2):254-258. 被引量：1
8陈金龙,范影乐,倪红霞,武薇.基于小波包分解的含噪语音时频特性分析及端点检测[J].数据采集与处理,2014,29(2):293-297. 被引量：3
9李海林,周建江,谭静,汪飞.基于MOPSO算法的卫星共形阵列天线多波束形成[J].数据采集与处理,2014,29(3):415-420. 被引量：7
10张明阳,查诚,塔什甫拉提.尼扎木丁,徐新洲,赵力.结合数据场情感空间和混合蛙跳算法的连续语音情感变化趋势检测[J].声学学报,2019,44(1):12-19. 被引量：5

同被引文献25

1黄力行,辛乐,赵礼悦,陶建华.自适应权重的双模态情感识别[J].清华大学学报（自然科学版）,2008,48(S1):715-719. 被引量：8
2韩文静,李海峰.基于韵律语段的语音情感识别方法研究[J].清华大学学报（自然科学版）,2009(S1):1363-1368. 被引量：8
3危辉,栾尚敏.基于连通结构与动力学过程的知觉记忆层次模型[J].软件学报,2004,15(11):1616-1628. 被引量：1
4淦文燕,李德毅,王建民.一种基于数据场的层次聚类方法[J].电子学报,2006,34(2):258-262. 被引量：83
5张石清,赵知劲,戴育良,杨广映.支持向量机应用于语音情感识别的研究[J].声学技术,2008,27(1):87-90. 被引量：10
6黄程韦,金赟,王青云,赵力,邹采荣.基于语音信号与心电信号的多模态情感识别[J].东南大学学报（自然科学版）,2010,40(5):895-900. 被引量：14
7于重重,田蕊,谭励,涂序彦.非平衡样本分类的集成迁移学习算法[J].电子学报,2012,40(7):1358-1363. 被引量：27
8闫静杰,郑文明,辛明海,邱伟.表情和姿态的双模态情感识别[J].中国图象图形学报,2013,18(9):1101-1106. 被引量：15
9赵小蕾,毛启容,詹永照.融合功能性副语言的语音情感识别新方法[J].计算机科学与探索,2014,8(2):186-199. 被引量：5
10张潇丹,黄程韦,赵力,邹采荣.应用改进混合蛙跳算法的实用语音情感识别[J].声学学报,2014,39(2):271-280. 被引量：11

引证文献3

1张明阳,查诚,塔什甫拉提.尼扎木丁,徐新洲,赵力.结合数据场情感空间和混合蛙跳算法的连续语音情感变化趋势检测[J].声学学报,2019,44(1):12-19. 被引量：5
2蒋林利,吴建生.层次K-均值聚类结合改进ITML的迁移度量学习方法[J].计算机应用研究,2017,34(12):3552-3555. 被引量：1
3曹春香.语音特征和情感特征的翻译系统与实现[J].现代电子技术,2018,41(13):123-127. 被引量：1

二级引证文献7

1塔什甫拉提·尼扎木丁,梁瑞宇,谢跃,赵力.采用原子表示模型的维吾尔语语音情感识别[J].信号处理,2020,36(1):9-17. 被引量：3
2包志强,赵媛媛,胡啸天,赵研.一种对孤立点不敏感的新的K-Means聚类算法[J].现代电子技术,2020,43(5):109-112. 被引量：5
3王枫.基于4G通信的语音格式转换系统的设计与实现[J].数码设计,2020,9(24):44-45.
4周静雷,颜婷.应用变分模态分解及能量熵的扬声器异常声分类[J].声学学报,2021,46(2):263-270. 被引量：11
5朱龙珠,盛妍,刘鲲鹏.基于深度学习的海量语音数据识别及分类方法研究[J].电子设计工程,2021,29(9):116-120. 被引量：4
6ZHOU Jinglei,YAN Ting,DING Fang.Loudspeaker rub&buzz automatic classification with combined variational mode decomposition and energy entropy[J].Chinese Journal of Acoustics,2021,40(4):539-552.
7周静雷,贺家琛,崔琳.CNN-GRU和SSA-VMD在扬声器异常声分类中的应用[J].电子测量与仪器学报,2023,37(3):161-168. 被引量：2

1宋鹏,郑文明,赵力.基于特征迁移学习方法的跨库语音情感识别[J].清华大学学报（自然科学版）,2016,56(11):1179-1183. 被引量：13
2余汇,鞠文煜,马双云.基于平移不变性稀疏编码的滚动轴承故障诊断[J].无线互联科技,2016,13(16):67-68.
3何继爱,刘向阳.压缩感知理论及其在盲源分离中的应用[J].测控技术,2016,35(11):149-152. 被引量：3
4王兰芹,沙静,徐颖蕾.Petri网在传输协议中的应用[J].山东科技大学学报（自然科学版）,2004,23(3):56-58. 被引量：2
5聂元铭.大数据及其安全研究[J].信息安全与通信保密,2013,11(5):15-16. 被引量：27
6激动人心的游戏娱乐体验[J].电脑时空,2006(6):57-57.
7伍志聪.MySQL数据库在中小型业务系统的应用[J].数字技术与应用,2011,29(11):122-122. 被引量：7
8徐刚,张磊,陈倩倩,邢孟道.基于稀疏约束最优化的ISAR相位自聚焦成像算法[J].电子学报,2013,41(9):1772-1777. 被引量：6
9李柯蒙,邵枫,蒋刚毅,郁梅.基于稀疏表示的立体图像客观质量评价方法[J].光电子．激光,2014,25(11):2227-2233. 被引量：4
10白树忠,刘琚,孙国霞.基于最小均方误差和稀疏特征的欠定盲源分离[J].山东大学学报（工学版）,2008,38(4):97-101. 被引量：1

数据采集与处理

2016年第2期

浏览历史

内容加载中请稍等...

基于稀疏特征迁移的语音情感识别被引量：3

参考文献18

二级参考文献71

共引文献51

同被引文献25

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于稀疏特征迁移的语音情感识别 被引量：3

参考文献18

二级参考文献71

共引文献51

同被引文献25

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于稀疏特征迁移的语音情感识别被引量：3