多层次时空特征自适应集成与特有-共享特征融合的双模态情感识别

Bimodal Emotion Recognition With Adaptive Integration of Multi-level Spatial-Temporal Features and Specific-Shared Feature Fusion

下载PDF

导出

摘要在结合脑电(EEG)信号与人脸图像的双模态情感识别领域中,通常存在两个挑战性问题:(1)如何从EEG信号中以端到端方式学习到更具显著性的情感语义特征;(2)如何充分利用双模态信息,捕捉双模态特征中情感语义的一致性与互补性。为此,提出了多层次时空特征自适应集成与特有-共享特征融合的双模态情感识别模型。一方面,为从EEG信号中获得更具显著性的情感语义特征,设计了多层次时空特征自适应集成模块。该模块首先通过双流结构捕捉EEG信号的时空特征,再通过特征相似度加权并集成各层次的特征,最后利用门控机制自适应地学习各层次相对重要的情感特征。另一方面,为挖掘EEG信号与人脸图像之间的情感语义一致性与互补性,设计了特有-共享特征融合模块,通过特有特征的学习和共享特征的学习来联合学习情感语义特征,并结合损失函数实现各模态特有语义信息和模态间共享语义信息的自动提取。在DEAP和MAHNOB-HCI两种数据集上,采用跨实验验证和5折交叉验证两种实验手段验证了提出模型的性能。实验结果表明,该模型取得了具有竞争力的结果,为基于EEG信号与人脸图像的双模态情感识别提供了一种有效的解决方案。 There are usually two challenging issues in the field of bimodal emotion recognition combining ElectroEncephaloGram(EEG)and facial images:(1)How to learn more significant emotionally semantic features from EEG signals in an end-to-end manner;(2)How to effectively integrate bimodal information to capture the coherence and complementarity of emotional semantics among bimodal features.In this paper,a bimodal emotion recognition model is proposed via the adaptive integration of multi-level spatial-temporal features and the fusion of specific-shared features.On the one hand,in order to obtain more significant emotionally semantic features from EEG signals,a module,called adaptive integration of multi-level spatialtemporal features,is designed.The spatial-temporal features of EEG signals are firstly captured with a dualflow structure before the features from each level are integrated by taking into consideration the weights deriving from the similarity of features.Finally,the relatively important feature information from each level is adaptively learned based on the gating mechanism.On the other hand,in order to leverage the emotionally semantic consistency and complementarity between EEG signals and facial images,one module fusing specificshared features is devised.Emotionally semantic features are learned jointly through two branches:specificfeature learning and shared-feature learning.The loss function is also incorporated to automatically extract the specific semantic information for each modality and the shared semantic information among the modalities.On both the DEAP and MAHNOB-HCI datasets,cross-experimental verification and 5-fold cross-validation strategies are used to assess the performance of the proposed model.The experimental results and their analysis demonstrate that the model achieves competitive results,providing an effective solution for bimodal emotion recognition based on EEG signals and facial images.

作者孙强陈远 SUN Qiang;CHEN Yuan(Department of Communication Engineering,School of Automation and Information Engineering,Xi’an University of Technology,Xi’an 710048,China;Xi’an Key Laboratory of Wireless Optical Communication and Network Research,Xi’an 710048,China)

机构地区西安理工大学自动化与信息工程学院通信工程系西安市无线光通信与网络研究重点实验室

出处《电子与信息学报》 EI CAS CSCD 北大核心 2024年第2期574-587,共14页 Journal of Electronics & Information Technology

基金西安市科技计划项目(22GXFW0086) 西安市碑林区科技计划项目(GX2243) 西安理工大学研究生校企协同创新基金(310/252062108)。

关键词双模态情感识别脑电人脸图像多层次时空特征特征融合 Bimodal emotion recognition ElectroEncephaloGram(EEG) Facial image Multi-level spatialtemporal features Feature fusion

分类号 TN911.7 [电子电信—通信与信息系统] TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1姚鸿勋,邓伟洪,刘洪海,洪晓鹏,王甦菁,杨巨峰,赵思成.情感计算与理解研究发展概述[J].中国图象图形学报,2022,27(6):2008-2035. 被引量：8
2柳长源,李文强,毕晓君.基于RCNN-LSTM的脑电情感识别研究[J].自动化学报,2022,48(3):917-925. 被引量：11
3刘嘉敏,苏远歧,魏平,刘跃虎.基于长短记忆与信息注意的视频–脑电交互协同情感识别[J].自动化学报,2020,46(10):2137-2147. 被引量：5
4杨杨,詹德川,姜远,熊辉.可靠多模态学习综述[J].软件学报,2021,32(4):1067-1081. 被引量：9
5李幼军,黄佳进,王海渊,钟宁.基于SAE和LSTM RNN的多模态生理信号融合和情感识别研究[J].通信学报,2017,38(12):109-120. 被引量：22
6王斐,吴仕超,刘少林,张亚徽,魏颖.基于脑电信号深度迁移学习的驾驶疲劳检测[J].电子与信息学报,2019,41(9):2264-2272. 被引量：17
7杨俊,马正敏,沈韬,陈壮飞,宋耀莲.基于深度时空特征融合的多通道运动想象EEG解码方法[J].电子与信息学报,2021,43(1):196-203. 被引量：6
8陈景霞,郝为,张鹏伟,闵重丹,李玥辰.基于混合神经网络的脑电时空特征情感分类[J].软件学报,2021,32(12):3869-3883. 被引量：7

二级参考文献28

1赵腊生,张强,魏小鹏.语音情感识别研究进展[J].计算机应用研究,2009,26(2):428-432. 被引量：21
2林奕琳,韦岗,杨康才.语音情感识别的研究进展[J].电路与系统学报,2007,12(1):90-98. 被引量：33
3陈曾,刘光远.脑电信号在情感识别中的应用[J].计算机工程,2010,36(9):168-170. 被引量：14
4聂聃,王晓韡,段若男,吕宝粮.基于脑电的情绪识别研究综述[J].中国生物医学工程学报,2012,31(4):595-606. 被引量：66
5王斐,王少楠,王惜慧,彭莹,杨乙丁.基于脑电图识别结合操纵特征的驾驶疲劳检测[J].仪器仪表学报,2014,35(2):398-404. 被引量：44
6赵力,钱向民,邹采荣,吴镇扬.语音信号中的情感识别研究[J].软件学报,2001,12(7):1050-1055. 被引量：56
7李霞,卢官明,闫静杰,张正言.多模态维度情感预测综述[J].自动化学报,2018,44(12):2142-2159. 被引量：22
8邹小兵.孤独症谱系障碍干预原则与BSR模式[J].中国儿童保健杂志,2019,27(1):1-6. 被引量：27
9阚威,李云.基于LSTM的脑电情绪识别模型[J].南京大学学报（自然科学版）,2019,55(1):110-116. 被引量：17
10王凯明,钟宁,周海燕.基于改进功率谱熵的抑郁症脑电信号活跃性研究[J].物理学报,2014,63(17):391-398. 被引量：7

共引文献76

1朱丽,杨青,吴涛,李晨,李铭.基于CNN和Bi-LSTM的脑电波情感分析[J].应用科学学报,2022,40(1):1-12. 被引量：6
2柳长源,孙雨涵,李文强,兰朝凤.基于MAResnet的脑电情感识别研究[J].仪器仪表学报,2020,41(7):235-242. 被引量：5
3耿治胜,王月明,高东辉,罗果萍.基于LSTM-Attention与MOPSO高炉节能减排控制算法研究[J].电子测量技术,2023,46(14):102-108.
4周莽,高僮,李晨光,姜辰龙.GRU神经网络短期电力负荷预测研究[J].科技创新与应用,2018,8(33):52-53. 被引量：17
5陈田,陈占刚,袁晓辉,鞠思航,任福继.基于脑电信号瞬时能量的情感识别方法[J].计算机工程,2019,45(4):196-204. 被引量：8
6陈景霞,王丽艳,贾小云,张鹏伟.基于深度卷积神经网络的脑电信号情感识别[J].计算机工程与应用,2019,55(18):103-110. 被引量：26
7潘礼正,尹泽明,佘世刚,袁峥峥,赵路.基于FCA-ReliefF的融合生理信号情绪识别研究[J].计算机测量与控制,2020,28(2):179-183. 被引量：1
8刘尚争,刘斌.生成对抗网络图像类别标签跨模态识别系统设计[J].现代电子技术,2020,43(8):173-175. 被引量：3
9闵建亮,蔡铭.基于前额脑电多尺度小波对数能量熵的驾驶疲劳检测分析[J].中国公路学报,2020,33(6):182-189. 被引量：19
10柯丽,王丹妮,杜强,姜楚迪.基于卷积长短时记忆网络的心律失常分类方法[J].电子与信息学报,2020,42(8):1990-1998. 被引量：15

1蒋守成,杨霞银.主题创新活动赋能课后服务新样态[J].江苏教育,2023(49):95-96.
2王颖怡,周云,武虹.学生主体的活动设计——以“西方的文官制度”为例[J].历史教学（上半月）,2024(1):33-39.
3唐徐佳,卢伟鹏,颜学峰.基于双层自适应集成残差主成分分析的复杂非线性过程监测[J].华东理工大学学报（自然科学版）,2024,50(1):88-96.
4刘节媛.中小企业股权估值中的难点与对策[J].财经界,2023(26):24-26.
5胡玉玲,万雨瑞,李紫旋,齐子琛.融合知识图谱和案例推理的燃气应急辅助决策研究[J].消防科学与技术,2024,43(2):143-148.
6王伟,周建华,刘紫恒,赵世昊,伏云发.基于时空Inception残差注意力网络的脑电情绪识别[J].重庆邮电大学学报（自然科学版）,2024,36(1):68-75.
7李晓华,高磊,于可君.基于图论的不同情绪状态下脑网络功能连接研究[J].医疗卫生装备,2023,44(11):9-14.
8王雪蒙,郭滨,马欣.基于优化变分模态分解的脑电情绪识别[J].计算机应用与软件,2024,41(2):80-85.
9李鹏,黄文琦,王鑫,梁凌宇,闫昆鹏,孙凌云.数据与知识联合驱动的人工智能方法在电力调度中的应用综述[J].电力系统自动化,2024,48(1):160-175.

电子与信息学报

2024年第2期

浏览历史

内容加载中请稍等...

多层次时空特征自适应集成与特有-共享特征融合的双模态情感识别

参考文献8

二级参考文献28

共引文献76

相关作者

相关机构

相关主题

浏览历史