基于强化学习的机器人认知情感交互模型被引量：1

Cognitive Emotional Interaction Model of Robot Based on Reinforcement Learning

下载PDF

导出

摘要为增强机器人的认知情感计算能力,依据PAD情感空间建立结合即时反馈和长期趋势的机器人认知情感生成方法,该文提出一种基于强化学习的机器人认知情感交互模型。首先,依据人际交往心理学理论,模拟人类情感生成过程进行类人情感生成,并从中提取相似性、积极性、共情性3个影响因素;其次,利用强化学习的全局统筹特性,建立响应情感状态与上下文长期情感状态之间的关联关系,从而对机器人情感生成过程进行建模;然后,将3个因素纳入模型奖励机制用于交互情感状态评估,实现模型更新并得到最优情感策略;最后,利用所得最优情感策略对应的最优情感状态对机器人情感状态转移概率进行更新,并依据6种基本情感状态在空间中的情感值,将其映射到连续情感空间中得到机器人的最优响应情感值。主客观对比实验表明,该文模型能有效增加机器人情感表达的细腻性、连续性、积极性以及共情性,还能有效降低机器人对外界情感刺激的依赖性,进一步提升和谐友好的人机交互关系。 In order to enhance the cognitive emotional computing ability of robot,a cognitive emotional interaction model of robot based on reinforcement learning is proposed,which combines immediate feedback and long-term trend according to PAD(Pleasure-Arousal-Dominance)emotional space.Firstly,according to the psychology theory of interpersonal communication,the human emotion generation process is simulated to generate human-like emotions,and the three influencing factors of similarity,positivity and empathy are extracted.Secondly,the relationship between the response emotion+state and the contexted long-term emotion state is established by using the global co-ordination feature of reinforcement learning,so as to model the robot emotion generation process.Then,three factors are incorporated into the model reward mechanism for the evaluate of the interactive emotion state,to update the model and get the optimal emotional strategy.Finally,the optimal emotional state corresponding to the obtained optimal emotional strategy is used to update the robot's emotional state transition probability,and based on the sentiment values of the six basic emotional states in space,them are mapped to continuous emotional space to get the optimal response emotional value of the robot.Subjective and objective comparison experiments show that the model in this paper can effectively increase the delicateness,continuity,positivity and empathy of the robot's emotional expression,and can effectively reduce the robot's dependence on external emotional stimuli,further improving the harmonious and friendly human-computer interaction.

作者黄宏程李净胡敏陶洋寇兰 HUANG Hongcheng;LI Jing;HU Min;TAO Yang;KOU Lan(School of Communication and Information Engineering,Chongqing University of Posts and Telecommunications,Chongqing 400065,China;Chongqing Engineering Research Center of Communication Software,Chongqing 400065,China)

机构地区重庆邮电大学通信与信息工程学院重庆市通信软件工程技术研究中心

出处《电子与信息学报》 EI CSCD 北大核心 2021年第6期1781-1788,共8页 Journal of Electronics & Information Technology

基金国家重点研发计划(2019YFB2102001) 国家自然科学基金(61871062)。

关键词 PAD情感空间强化学习情感状态转移认知情感生成 Pleasure-Arousal-Dominance(PAD)emotion space Reinforcement learning Emotional state transfer Cognitive emotion generation

分类号 TP242.6 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献5

1杨勇,张志瑜.基于PAD的个性化情感模型[J].重庆邮电大学学报（自然科学版）,2012,24(1):96-103. 被引量：8
2丁永刚,李石君,付星,刘梦君.面向时序感知的多类别商品方面情感分析推荐模型[J].电子与信息学报,2018,40(6):1453-1460. 被引量：6
3Xin Liu,Lun Xie,Zhiliang Wang.Empathizing with Emotional Robot Based on Cognition Reappraisal[J].China Communications,2017,14(9):100-113. 被引量：3
4杨杨,邱雪松,孟洛明,高志鹏.情感驱动的自私MANETs节点协商机制[J].电子与信息学报,2011,33(6):1294-1300. 被引量：1
5吴伟国,李虹漫.PAD情感空间内人工情感建模及人机交互实验[J].哈尔滨工业大学学报,2019,51(1):29-37. 被引量：13

二级参考文献30

1王玉洁,王志良,陈锋军,王国江,王玉锋.基于隐马尔可夫模型的情感建模[J].北京农学院学报,2005,20(1):61-64. 被引量：5
2滕少冬,王志良,王莉,王国江.基于心理能量思想的人工情感模型[J].计算机工程与应用,2007,43(3):1-4. 被引量：9
3李莉,董树松,温向明.基于博弈理论建立无线自组网中激励合作机制的研究[J].电子与信息学报,2007,29(6):1299-1303. 被引量：8
4鹿麟,吴伟国,孟庆梅.具有视觉及面部表情的仿人头像机器人系统设计与研制[J].机械设计,2007,24(7):20-24. 被引量：20
5MINSKY M L. The Society of Mind [ M ]. New York : Si- mon and Schuster, 1985.
6PICARD R W. Affective Computing [ M ]. Cambridge, Massachusetts : MIT Press, 1997.
7ORTONY A, CLORE G L, COLLINS A. The cognitive structure of emotions [ M ]. Cambridge : Cambridge Uni- versity Press, 1988.
8ELLIOTY C. The affective reasoner: a process model of emotions in a multi-agent system [ D ]. Evanston: North- western University, 1992.
9KSHIRSAGAR S, THALMANN N M. A Multilayer Per- sonality Model [ C ]//Proceedings of the 2nd International Symposium on Smart Graphics. New York, USA: ACM, 2002 : 107-115.
10GEBHARD P. ALMA-A Layered Model of Affect [ C ]// AAMAS'05. Utrecht, Netherlands: ACM, 2005:29-36.

共引文献25

1石宜金,贾志洋.基于维度情感计算的E-Learning模型研究[J].大理学院学报（综合版）,2014,13(6):15-19.
2潘巧明,胡伟俭,李庆华,沈洋,谢海明,刘箴,潘志庚.情绪和动机驱动的虚拟人自适应感知模型[J].计算机辅助设计与图形学学报,2015,27(9):1786-1794.
3李芮,王万森.融入性格的E-Learning情绪模型[J].计算机工程与设计,2016,37(1):216-220. 被引量：2
4吴伟国,李虹漫.PAD情感空间内人工情感建模及人机交互实验[J].哈尔滨工业大学学报,2019,51(1):29-37. 被引量：13
5李吉,黄微,郭苏琳,孙悦.网络口碑舆情情感强度测度模型研究——基于PAD三维情感模型[J].情报学报,2019,38(3):277-285. 被引量：24
6黄宏程,刘宁,胡敏,陶洋,寇兰.基于博弈的机器人认知情感交互模型[J].电子与信息学报,2019,41(10):2471-2478. 被引量：6
7伍京华,王竞陶,刘浩,叶慧慧.基于Agent的情感映射的劝说模型及系统[J].计算机集成制造系统,2020,26(4):1081-1096. 被引量：6
8杜晶晶,周东,李欣.基于视觉传达的产品外观设计感知差异建模分析[J].现代电子技术,2020,43(18):11-13.
9洪小娟,宗江燕,黄卫东,洪巍.基于情感语义空间的食品安全舆情情感分析[J].现代情报,2020,40(10):132-143. 被引量：8
10韩杰,肖莹慧.基于智慧学习环境下的学习画面情感识别模型[J].电脑知识与技术,2021,17(3):195-196.

同被引文献5

1朱勤,王前.社会技术系统论视角下的工程伦理学研究[J].道德与文明,2010(6):119-124. 被引量：4
2杨秀香.论康德幸福观的嬗变[J].哲学研究,2011(2):85-92. 被引量：9
3仙侬.维乐,陈佳.论技术德性的建构[J].东北大学学报（社会科学版）,2016,18(5):441-449. 被引量：8
4李义天.感觉、认知与美德——亚里士多德美德伦理的情感概念及其阐释[J].哲学动态,2020,0(4):92-102. 被引量：3
5刘鑫.亚里士多德的类比学说[J].清华西方哲学研究,2015(1):400-431. 被引量：4

引证文献1

1王亮.人工智能体道德设计的美德伦理路径:基于道德强化学习[J].自然辩证法研究,2022,38(10):56-62.

1陈健霞.社区商业空间人文情感化设计分析[J].中外建筑,2020(11):67-70. 被引量：1
2贾梦久.基于大数据可视化的网络意见领袖特征研究[J].信息技术与信息化,2020(2):15-18.
3刘京林.我国传播心理学研究的最新思考[J].汕头大学学报（人文社会科学版）,2020,36(12):57-60. 被引量：2
4马晓悦,孟啸,王镇,刘益东.网络突发事件中社交机器人情感的交互式影响机制研究[J].图书情报工作,2021,65(8):74-84. 被引量：7
5王俊涵,李荣日.体育直播平台社群文化对电子口碑生成动机影响:情感与环境刺激的链式中介效应[J].吉林体育学院学报,2021,37(2):52-59.
6尼罗拜尔·艾尔提,郑亮.新媒体时代短视频内容生产的特点、趋势与困境[J].中国编辑,2021(3):81-85. 被引量：34
7王绍珍.术前中医情志护理有何效果[J].大健康,2021(15):0070-0070.
8魏翔宇.中职学生日语学习策略的实证研究[J].职业教育,2021(8):7-11. 被引量：1
9王丽.图式理论在初中英语后进生阅读教学中的应用[J].中学生英语,2020(38):9-9.
10闫浩雨,陈望.纪念性景观方法论浅析[J].风景名胜,2021(4):0389-0389.

电子与信息学报

2021年第6期

浏览历史

内容加载中请稍等...

基于强化学习的机器人认知情感交互模型被引量：1

参考文献5

二级参考文献30

共引文献25

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于强化学习的机器人认知情感交互模型 被引量：1

参考文献5

二级参考文献30

共引文献25

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于强化学习的机器人认知情感交互模型被引量：1