文档增强型知识库问答

Document-enhanced Question Answering over Knowledge-Bases

下载PDF

导出

摘要近年来,知识库(Knowledge Base,KB)被广泛应用于问答(Question Answering,QA)任务中。给定自然语言问题,利用知识库为给定问题提供正确答案,被称为KBQA问题。然而,知识库本身可能是不完整的(例如,KB不包含问题的答案或问题中的一些实体和关系),这限制了现有KBQA模型的总体性能。为了解决这个问题,文中提出了一个新的模型,利用文本语料库信息提供额外信息来增强知识库覆盖率和背景信息以增强问题的表示。具体来说,该模型由3个模块组成,即实体和问题表征模块、文档和问题增强表征模块以及答案预测模块。实体和问题表征模块从检索到的知识库子图中学习实体的表示,然后通过融合种子实体信息更新问题表示;文档和问题增强表征模块尝试学习与给定问题相关文档的正确表示,然后通过融合文档信息进一步改进问题表示;最后,答案预测模块根据知识库实体表征、文档表征和更新的问题表征进行答案预测。利用所提方法在WebQuestionsSP数据集上进行了大量的实验,结果表明,与其他方法相比,所提方法可以获得更高的准确性。 Recently,knowledge base(KB)has been widely adopted to the task of question answering(QA)to provide a proper answer for a given question,known as the KBQA problem.However,knowledge base itself may be incomplete(e.g.KB does not contain the answer to the question,or some of the entities and relationships in the question),limiting the overall performance of existing KBQA models.To resolve this issue,this paper proposes a new model to leverage textual documents for KBQA task by providing additional answers to enhance knowledge base coverage and background information to enhance the representation of questions.Specifically,the proposed model consists of three modules,namely entity and question representation module,document and enhanced-question representation module and answer prediction module.The first module aims to learn the representations of entities from the retrieved subgraph of knowledge base.Then,the question representation can be updated with the fusion of seed entities.The second module attempts to learn a proper representation of the document that is relevant to the given question.Then,the question representation can be further improved by fusing the document information.Finally,the last module makes an answer prediction based on the information of knowledge base,updated question and documents.Extensive experiments are conducted on the WebQuestionsSP dataset,and the results show that better accuracy can be obtained in comparison with other counterparts.

作者冯程程刘派姜琳颖梅笑寒郭贵冰 FENG Chengcheng;LIU Pai;JIANG Linying;MEI Xiaohan;GUO Guibing(School of Software,Northeastern University,Shenyang 110000,China;School of Engineering,Westlake University,Hangzhou 310000,China;School of Software,University of Maryland,Maryland MD20740,USA)

机构地区东北大学软件学院西湖大学工学院马里兰大学软件学院

出处《计算机科学》 CSCD 北大核心 2023年第3期266-275,共10页 Computer Science

基金国家自然科学基金(61972078) 沈阳市科技计划项目(21-108-9-19)。

关键词知识库问答协同注意力机制端到端神经网络融合门控函数 KB-QA Co-attention End-to-end Neural network Fusion gate function

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1欧阳丹彤,肖君,叶育鑫.基于实体对弱约束的远监督关系抽取[J].吉林大学学报（工学版）,2019,49(3):912-919. 被引量：5
2王广祥,何世柱,刘康,余正涛,高盛祥,郭军军.融合事实文本的知识库问答方法[J].模式识别与人工智能,2021,34(3):267-274. 被引量：1
3吴天波,刘露平,罗晓东,卿粼波,何小海.基于弱依赖信息的知识库问答方法[J].计算机工程,2021,47(6):76-82. 被引量：4
4程州,周欣,何小海,卿粼波,陈洪刚.融合位置编码的多角度注意力知识图谱问答[J].科学技术创新,2022(9):85-88. 被引量：1

二级参考文献7

1Zhiwen XIE,Zhao ZENG,Guangyou ZHOU,Weijun WANG.Topic enhanced deep structured semantic models for knowledge base question answering[J].Science China(Information Sciences),2017,60(11):24-38. 被引量：10
2周博通,孙承杰,林磊,刘秉权.基于LSTM的大规模知识库自动问答[J].北京大学学报（自然科学版）,2018,54(2):286-292. 被引量：38
3俞敬松,魏一,张永伟.基于BERT的古文断句研究与应用[J].中文信息学报,2019,33(11):57-63. 被引量：21
4王玥,张日崇.基于动态规划的知识库问答方法[J].郑州大学学报（理学版）,2019,51(4):37-42. 被引量：5
5温秀秀,马超,高原原,康子路.基于标签聚类的中文重叠命名实体识别方法[J].计算机工程,2020,46(5):41-46. 被引量：6
6张芳容,杨青.知识库问答系统中实体关系抽取方法研究[J].计算机工程与应用,2020,56(11):219-224. 被引量：13
7段江丽,胡新.自然语言问答中的语义关系识别[J].山东大学学报（工学版）,2020,50(3):1-7. 被引量：3

共引文献7

1邓玉婧,武志昊,林友芳.基于多粒度时间注意力RNN的航班客座率预测[J].计算机工程,2020,46(1):294-301. 被引量：8
2唐朝,诺明花,胡岩.ResNet结合BiGRU的关系抽取混合模型[J].中文信息学报,2020,34(2):38-45. 被引量：3
3翁兆琦,张琳.基于多角度信息交互的文本语义匹配模型[J].计算机工程,2021,47(10):97-102. 被引量：2
4白天,徐明蔚,刘思铭,张佶安,王喆.基于深度神经网络的诉辩文本争议焦点识别[J].吉林大学学报（工学版）,2022,52(8):1872-1880. 被引量：3
5丁建立,苏伟.基于BERT-CNN编码特征融合的实体关系联合抽取方法[J].中国民航大学学报,2023,41(2):47-53.
6陈阳,万卫兵.多通道特征融合的实体链接模型泛化性能优化[J].计算机工程与应用,2023,59(16):125-134.
7刘昀抒,申彦明,齐恒,尹宝才.基于层次结构图的多跳知识图谱问答模型[J].计算机工程,2024,50(1):101-109.

1Rui LIU,Yahong HAN.Instance-sequence reasoning for video question answering[J].Frontiers of Computer Science,2022,16(6):93-101. 被引量：1
2刘思远,潘梦寒(指导).我在琢磨中医穴位知识[J].新读写,2023(2):44-44.
3曹书林,史佳欣,侯磊,李涓子.知识库问答研究进展与展望[J].计算机学报,2023,46(3):512-539. 被引量：7
4刘海涛.关于语言规划学科的几点思考[J].外语与外语教学,2022(6):1-8. 被引量：8
5彭晓,罗江.成都特色街区语言景观研究[J].中文科技期刊数据库（全文版）社会科学,2022(10):1-5.
6蔡泽,胡耀光,闻敬谦,张立祥.复杂动态环境下基于深度强化学习的AGV避障方法[J].计算机集成制造系统,2023,29(1):236-245. 被引量：4
7邹品荣,肖锋,张文娟,黄姝娟,张万玉.融合场景语义与空间关系的视觉问答[J].西安工业大学学报,2023,43(1):56-65. 被引量：1
8Qi Zheng,Chao-Yue Wang,Dadong Wang,Da-Cheng Tao.Visual Superordinate Abstraction for Robust Concept Learning[J].Machine Intelligence Research,2023,20(1):79-91.
9廖雪霞,向雪琴.在语言中复活南方——《北流》的一种打开方式[J].广西民族师范学院学报,2022,39(6):28-33.
10蔡文琪,李泽坤,翟佳乐,陈宇,唐旭,李晓钰,杨立娜.大豆种皮纤维素薄膜的制备及性能研究[J].包装与食品机械,2023,41(1):1-7. 被引量：5

计算机科学

2023年第3期

浏览历史

内容加载中请稍等...

文档增强型知识库问答

参考文献4

二级参考文献7

共引文献7

相关作者

相关机构

相关主题

浏览历史