面向语义多样性的对话生成模型被引量：4

Dialogue Generation Model for Semantic Multiplicity

下载PDF

导出

摘要开放域对话系统目前采用的检索-生成方法是基于相似问题具有相似回答这一假设,其中最新的聚类-生成方法对训练集中的问题进行硬聚类,并从每个问题簇所对应的回答中学习该簇问题的回复模式.然而现有的方法忽略了问题的语义多样性,影响了生成回复的相关性和信息性.为了解决上述问题,本文提出了面向语义多样性的对话生成模型,利用可学习的软聚类网络将训练集的问题分配到多个语义簇来更好地捕获语义多样性.特别的,本文使用径向基神经网络实现软聚类过程,径向基网络的可微性使得模型能够对软聚类和回复生成过程进行端到端的训练,让这两个过程更加紧密耦合.在Chat数据集上进行实验,结果表明本文算法的性能高于已有的先进算法. The retrieval-generation approaches,based on the hypothesis that similar questions have similar responses,are commonly used in current open-domain dialogue systems.Among them,the latest clustering-generation-based method employs a hard clustering manner for the training questions and learns the schema from each response cluster corresponding to each question cluster.However,current studies ignore the semantic multiplicity of questions,which weakens the relevance and informativeness of the generated responses.To tackle the above issue,we propose a dialogue generation model for semantic multiplicity utilizing a learnable soft-clustering network to group the training questions into multiple semantic clusters for better capturing semantic multiplicity.In particular,Radial Basis Function neural network is devised to fulfill the clustering network,and its differentiability endows the soft-clustering and the generation processes with end-to-end trainability,hence leading to two processes being more tightly coupled.The experiments have been conducted in Chat dataset and the results show that our proposed model outperforms the state-of-the-art baselines.

作者刘家卢永美何东卜令梅陈黎于中华 LIU Jia;LU Yong-mei;HE Dong;BU Ling-mei;CHEN Li;YU Zhong-hua(College of Computer Science,Sichuan University,Chengdu 610065,China)

机构地区四川大学计算机学院

出处《小型微型计算机系统》 CSCD 北大核心 2022年第10期2028-2034,共7页 Journal of Chinese Computer Systems

基金国家重点研究项目(2020YFB0704502)资助.

关键词对话生成信息检索软聚类径向基网络 response generation information retrieval soft clustering radial basis function network

分类号 T391 [一般工业技术]

引文网络
相关文献

参考文献2

1陈晨,朱晴晴,严睿,柳军飞.基于深度学习的开放领域对话系统研究综述[J].计算机学报,2019,42(7):1439-1466. 被引量：48
2谢琪,陈羽中,刘漳辉.一种基于多粒度循环神经网络与词注意力的多轮对话回答选择方法[J].小型微型计算机系统,2021,42(12):2553-2560. 被引量：1

二级参考文献5

1俞凯,陈露,陈博,孙锴,朱苏.任务型人机对话系统中的认知技术——概念、进展及其未来[J].计算机学报,2015,38(12):2333-2348. 被引量：39
2张伟男,张杨子,刘挺.对话系统评价方法综述[J].中国科学：信息科学,2017,47(8):953-966. 被引量：21
3宋皓宇,张伟男,刘挺.基于DQN的开放域多轮对话策略学习[J].中文信息学报,2018,32(7):99-108. 被引量：5
4李菁,张海松,宋彦.面向非任务型对话系统的人工标注中文数据集[J].中文信息学报,2019,33(3):17-24. 被引量：6
5叶铱雷,曹斌,范菁,王俊,陈江斌.面向任务型多轮对话的粗粒度意图识别方法[J].小型微型计算机系统,2020,41(8):1620-1626. 被引量：10

共引文献47

1段宣翡,刘伟东,高东辉,黄艳华,刘硕,焦若丹.一种基于典型范式的智能客服评测方法[J].电子测试,2023(1):53-59.
2秦汉忠,于重重,姜伟杰,赵霞.基于多头注意力和BiLSTM改进DAM模型的中文问答匹配方法[J].中文信息学报,2021,35(11):118-126. 被引量：3
3陈鑫,周强.开放型对话技术研究综述[J].中文信息学报,2021,35(11):1-12. 被引量：3
4黄毅,冯俊兰,胡珉,吴晓婷,杜晓宇.智能对话系统架构及算法[J].北京邮电大学学报,2019,42(6):10-19. 被引量：8
5姚佳.人工智能的训练数据制度——以“智能涌现”为观察视角[J].贵州社会科学,2024(2):51-57. 被引量：3
6黄毅,冯俊兰,胡珉,吴晓婷,杜晓宇.5G背景下的智能对话系统架构及应用[J].电信工程技术与标准化,2020,33(1):43-50. 被引量：2
7郁林音.译者视角的当代机器翻译发展综述[J].现代交际,2020,0(4):71-73. 被引量：2
8蔡钺,游进国,丁家满.基于近端策略优化与对抗学习的对话生成[J].计算机工程与科学,2020,42(9):1680-1689. 被引量：1
9卢东来,郑战光.基于深度学习的多机械手轨迹规划系统设计[J].计算机测量与控制,2020,28(11):247-250. 被引量：3
10陈立,朱丙丽.基于多尺度与改进注意力机制的序列到序列模型[J].计算机应用与软件,2020,37(12):140-144.

同被引文献44

1钱锦,黄荣涛,邹博伟,洪宇.基于多任务学习的生成式阅读理解[J].中文信息学报,2021,35(12):103-111. 被引量：4
2张家培,李舟军.Q2SM:基于BERT的多领域任务型对话系统状态跟踪算法[J].中文信息学报,2020(7):89-95. 被引量：6
3俞凯,陈露,陈博,孙锴,朱苏.任务型人机对话系统中的认知技术——概念、进展及其未来[J].计算机学报,2015,38(12):2333-2348. 被引量：39
4杨丽,吴雨茜,王俊丽,刘义理.循环神经网络研究综述[J].计算机应用,2018,38(A02):1-6. 被引量：401
5陈键飞,朱军.最大熵判别主题模型的高效学习算法[J].模式识别与人工智能,2019,32(8):736-745. 被引量：2
6霍晓凯,史冬辉,石一锐,周柚,时小虎,吴春国.口语对话系统中对话管理的演变[J].吉林大学学报（信息科学版）,2019,37(6):623-630. 被引量：4
7张莹莹,钱胜胜,方全,徐常胜.基于多模态知识感知注意力机制的问答方法[J].计算机研究与发展,2020,57(5):1037-1045. 被引量：17
8王一成,万福成,马宁.基于条件随机场的多线索中文语义角色标注[J].云南大学学报（自然科学版）,2020,42(3):474-480. 被引量：3
9赵阳洋,王振宇,王佩,杨添,张睿,尹凯.任务型对话系统研究综述[J].计算机学报,2020,43(10):1862-1896. 被引量：43
10郭晓哲,彭敦陆,张亚彤,彭学桂.GRS:一种面向电商领域智能客服的生成-检索式对话模型[J].华东师范大学学报（自然科学版）,2020(5):156-166. 被引量：8

引证文献4

1刘漳辉,林宇航,陈羽中.一种用于多域对话状态追踪的知识增强与自注意力引导的图神经网络[J].小型微型计算机系统,2024,45(1):108-114.
2杜建强,郑奇民,罗计根,聂斌,熊旺平,刘勇,周添强.管道式对话系统研究进展及其在医疗领域应用[J].科学技术与工程,2024,24(6):2187-2200.
3黄玉芳.融合情感信息的开放域对话生成算法在学前教育聊天机器人中的应用研究[J].自动化与仪器仪表,2024(7):266-269.
4骆仕杰,金日泽,韩抒真.采用低秩编码优化大语言模型的高校基础知识问答研究[J].计算机科学与探索,2024,18(8):2156-2168.

1刘艳,周斌.增量文本软聚类速度改善算法设计及仿真[J].计算机仿真,2022,39(8):524-528. 被引量：1
2马芳.高中地理知识点生活化教学研究[J].中华活页文选（高中版）,2022(12):163-165.
3管梦雨,王中卿,李寿山,周国栋.基于对话约束的回复生成研究[J].中文信息学报,2022,36(8):144-153. 被引量：1
4高盛祥,赵瑶,余正涛,黄于欣.差异性案件要素增强的案件舆情时间线生成方法[J].小型微型计算机系统,2022,43(9):1902-1907.
5李凯伟,马力.基于生成对抗网络的情感对话回复生成[J].计算机工程与应用,2022,58(18):130-136. 被引量：5
6郑巍.核心素养背景下语文学科单元教学路径初探[J].学语文,2022(5):16-18.
7王凯,李舟军,盛文博,陈舒玮,王明轩,刘剑青,蓝海波,张锐.多轮对话技术及其在电网数据查询中的应用[J].计算机科学,2022,49(10):265-271. 被引量：2
8程路易,王志军.基于任务型对话系统的电子病历结构化录入系统设计[J].智能计算机与应用,2022,12(9):50-55.
9朱杰,龚声蓉,周立凡,徐少杰,钟珊.面向语义分割模型的外接多尺度投票网络[J].计算机工程,2022,48(10):279-287. 被引量：2
10张贝,闵华松,张新明.强化信息交流的堆优化算法及其机器人路径规划[J].计算机应用研究,2022,39(10):2935-2942. 被引量：3

小型微型计算机系统

2022年第10期

浏览历史

内容加载中请稍等...

面向语义多样性的对话生成模型被引量：4

参考文献2

二级参考文献5

共引文献47

同被引文献44

引证文献4

相关作者

相关机构

相关主题

浏览历史

面向语义多样性的对话生成模型 被引量：4

参考文献2

二级参考文献5

共引文献47

同被引文献44

引证文献4

相关作者

相关机构

相关主题

浏览历史

面向语义多样性的对话生成模型被引量：4