基于多任务学习的中文事件抽取联合模型被引量：43

Joint Chinese Event Extraction Based Multi-task Learning

下载PDF

导出

摘要事件抽取旨在从非结构化的文本中提取人们感兴趣的信息,并以结构化的形式呈现给用户.当前,大多数中文事件抽取系统采用连续的管道模型,即:先识别事件触发词,后识别事件元素.其容易产生级联错误,且处于下游的任务无法将信息反馈至上游任务,辅助上游任务的识别.将事件抽取看作序列标注任务,构建了基于CRF多任务学习的中文事件抽取联合模型.针对仅基于CRF的事件抽取联合模型的缺陷进行了两个扩展:首先,采用分类训练策略解决联合模型中事件元素的多标签问题(即:当一个事件提及中包含多个事件时,同一个实体往往会在不同的事件中扮演不同的角色).其次,由于处于同一事件大类下的事件子类,其事件元素存在高度的相互关联性.为此,提出采用多任务学习方法对各事件子类进行互增强的联合学习,进而有效缓解分类训练后的语料稀疏问题.在ACE2005中文语料上的实验证明了该方法的有效性. Event extraction aims to extract the interesting and structured information from unstructured text. Most Chinese event extraction methods use a continuous pipeline model which first identify event trigger word, and then identify the event arguments. Thus, it is prone to produce cascading errors, and the information contained in downstream task cannot be fed back to the upstream task. In this study, event extraction is considered as a sequence labeling task, and a multi-task learning with CRF enhanced Chinese event extraction model is proposed. Two extensions on the CRF based event extraction model are performed:(1) the separate training strategy to solve multi-label problem for an event argument in the joint model (i.e., when an event scope includes multiple events, the same entity tends to play different roles in different events);(2) considered event arguments of sub-events under the same class have the high correlation, a multi-task learning approach is proposed to jointly learn sub-events, which can alleviate the corpus sparsity to some extent. The experiment results on ACE 2005 Chinese corpus show the effectiveness of the proposed method.

作者贺瑞芳段绍杨 HE Rui-Fang;DUAN Shao-Yang(College of Intelligence and Computing, Tianjin University, Tianjin 300350, China;Tianjin Key Laboratory of Cognitive Computing and Applications, Tianjin 300350, China)

机构地区天津大学智能与计算学部天津市认知计算与应用重点实验室

出处《软件学报》 EI CSCD 北大核心 2019年第4期1015-1030,共16页 Journal of Software

基金国家自然科学基金(61472277) 天津市自然科学基金(18JCYBJC15500)~~

关键词多任务学习条件随机场(CRF) 事件抽取 multi-task learning condition random field (CRF) event extraction

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1赵妍妍,秦兵,车万翔,刘挺.中文事件抽取技术研究[J].中文信息学报,2008,22(1):3-8. 被引量：106
2徐浩煜,任智慧,施俊,周晗.基于链式条件随机场的中文分词改进方法[J].计算机应用与软件,2016,33(12):211-213. 被引量：10
3邱泉清,苗夺谦,张志飞.中文微博命名实体识别[J].计算机科学,2013,40(6):196-198. 被引量：33

二级参考文献25

1张晓艳,王挺,陈火旺.命名实体识别研究[J].计算机科学,2005,32(4):44-48. 被引量：66
2俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：157
3周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：112
4黄昌宁,赵海.中文分词十年回顾[J].中文信息学报,2007,21(3):8-19. 被引量：249
5赵海,揭春雨.基于有效子串标注的中文分词[J].中文信息学报,2007,21(5):8-13. 被引量：26
6Naomi Daniel,Dragomir Radev and Timothy Allison.Sub-event based Multi-document Summarization[A].In:Proceedings of the HLT-NAACL Workshop on Text Summarization[C].2003.9-16.
7Elena Filatova and Vasileios Hatzivassiloglou.Event-based Extractive summarization[A].In:Proceedings of ACL Workshop on Summarization[C]].2004.104-111.
8Wenjie Li,Mingli Wu and Qin Lu.Extractive Summarization using Inter-and Intra-Event Relevance[A].In:Proceedings of the 44th Annual Meeting of the Association for Computational Liguistics[C].2006.369-376.
9David Ahn.The stages of event extraction[A].In:Proceedings of the Workshop on Annotations and Reasoning about Time and Events[C].2006.1-8.
10ACE (Automatic Content Extraction) Chinese Annotation Guidelines for Events.National Institute of Standards and Technology[R].2005.

共引文献146

1许荣华,吴刚,李培峰,朱巧明.基于指代消解的中文事件融合方法[J].计算机应用,2009,29(8):2264-2267. 被引量：3
2付剑锋,刘宗田,付雪峰,周文,仲兆满.基于依存分析的事件识别[J].计算机科学,2009,36(11):217-219. 被引量：19
3仲兆满,刘宗田,周文,付剑锋.事件关系表示模型[J].中文信息学报,2009,23(6):56-60. 被引量：23
4许荣华,吴刚,李培峰,朱巧明.基于事件框架的主题事件融合研究[J].计算机应用研究,2009,26(12):4542-4545. 被引量：6
5张先飞,郭志刚,刘嵩,程磊,田雨暄.基于触发词指导的自相似度聚类事件检测[J].计算机科学,2010,37(3):212-214. 被引量：12
6付剑锋,刘宗田,刘炜,单建芳.基于特征加权的事件要素识别[J].计算机科学,2010,37(3):239-241. 被引量：9
7许君宁,董萍,刘怀亮.基于知网的中文事件抽取研究[J].情报杂志,2009,28(B12):150-151. 被引量：2
8吴刚,许荣华,朱巧明,李培峰,钱培德.一种基于角色匹配的事件抽取方法[J].微计算机信息,2010,26(9):187-189. 被引量：3
9石振国,刘宗田,王杰华,冯达盛.事件网络模型与应用研究[J].南通大学学报（自然科学版）,2010,9(3):55-65.
10刘小明,樊孝忠,刘里.融合事件信息的复杂问句分析方法[J].华南理工大学学报（自然科学版）,2011,39(7):140-145. 被引量：7

同被引文献318

1冯斌,张又文,唐昕,郭创新,王坚俊,杨强,王慧芳.基于BiLSTM-Attention神经网络的电力设备缺陷文本挖掘[J].中国电机工程学报,2020,40(S01):1-10. 被引量：54
2陈美杉,夏晨曦.肝癌患者在线提问的命名实体识别研究:一种基于迁移学习的方法[J].数据分析与知识发现,2019,3(12):61-69. 被引量：15
3蔡莉,王淑婷,刘俊晖,朱扬勇.数据标注研究综述[J].软件学报,2020,31(2):302-320. 被引量：62
4王捷,洪宇,陈佳丽,姚建民.基于共享BERT和门控多任务学习的事件检测方法[J].中文信息学报,2021,35(10):101-109. 被引量：5
5周杨,刘梦梦,王宝雨,梁浩,贺维勇.基于BIM技术与风险评估体系的装配式建筑施工安全管理研究[J].建筑结构,2023,53(S02):2089-2093. 被引量：5
6丁士杰,马松,郭卫,贾剑伟,史忠友,刘楠楠,杨宗千,于佳伟.一种模块化装配式的房屋建筑体系施工技术研究与应用[J].建筑结构,2022,52(S01):3026-3028. 被引量：7
7陈载清,石俊生,白凤翔.基于模糊粗糙集的图像自动分类研究[J].吉林大学学报（工学版）,2013,43(S1):209-212. 被引量：3
8王卫星.论南京国际安全区的成立[J].民国档案,2005(4):101-108. 被引量：7
9吴平博,陈群秀,马亮.基于时空分析的线索性事件的抽取与集成系统研究[J].中文信息学报,2006,20(1):21-28. 被引量：21
10梁晗,陈群秀,吴平博.基于事件框架的信息抽取系统[J].中文信息学报,2006,20(2):40-46. 被引量：38

引证文献43

1盛煜堃,彭艳兵.基于注意力机制BiLSTM的事件抽取方法[J].电子设计工程,2020,28(8):170-173. 被引量：12
2曹文斌,武卓峰,杨涛,凡友荣.基于文本语料的涉恐事件实体属性抽取[J].工程科学学报,2020,42(4):500-508. 被引量：6
3黄婧.突发事件触发特征层级与事件识别模型构建研究[J].情报杂志,2020,39(9):137-142. 被引量：1
4余本功,范招娣.面向自然语言处理的条件随机场模型研究综述[J].信息资源管理学报,2020,10(5):96-111. 被引量：18
5王晓浪,邓蔚,胡峰,邓维斌,张清华.基于序列标注的事件联合抽取方法[J].重庆邮电大学学报（自然科学版）,2020,32(5):884-890. 被引量：4
6万齐智,万常选,胡蓉,刘德喜.基于句法语义依存分析的中文金融事件抽取[J].计算机学报,2021,44(3):508-530. 被引量：26
7邓君华,邹云峰,沈盛宇,季梦黎.基于卷积神经网络的电力领域事件要素提取方法研究[J].电子设计工程,2021,29(3):132-135. 被引量：2
8万家山,吴云志.基于深度学习的文本分类方法研究综述[J].天津理工大学学报,2021,37(2):41-47. 被引量：22
9陈健瑶,翟姗姗,夏立新,刘德印.融合句法特征和句法相似度的网络舆情突发事件识别方法研究[J].图书情报工作,2021,65(9):41-50. 被引量：4
10王炳乾,宿绍勋,梁天新.基于BERT的多层标签指针网络事件抽取模型--2020语言与智能技术竞赛事件抽取任务系统报告[J].中文信息学报,2021,35(7):81-88. 被引量：11

二级引证文献175

1李灿,解丹.中医电子病历入院记录信息自动抽取方法研究[J].世界科学技术-中医药现代化,2023,25(5):1615-1622. 被引量：1
2闫博.基于HanLP关键词抽取与句法分析的图谱构建[J].电子元器件与信息技术,2022,6(9):77-80. 被引量：3
3苏晓红.建立统一的国债回购市场[J].金融理论与实践,2000(3):18-19.
4郭凡莎,杨风暴.基于CRF的交通肇事诉讼案件关键要素抽取[J].计算机与现代化,2021(3):77-81. 被引量：2
5邢照野,刘晓群.基于改进ERNIE模型的中文文本分类方法[J].信息与电脑,2021,33(8):87-89. 被引量：4
6张萌萌,梁艳红.补充语义信息的多特征融合模糊文本分类[J].信息技术与信息化,2021(6):45-47. 被引量：1
7崔东虎,赵亚慧,崔荣一.基于相对熵的KNN文本分类方法的研究[J].延边大学学报（自然科学版）,2021,47(2):175-179. 被引量：7
8吴恪涵,张雪英,叶鹏,怀安,张航.基于BERT-BiLSTM-CRF的中文地址解析方法[J].地理与地理信息科学,2021,37(4):10-15. 被引量：6
9焦凯楠,李欣,朱容辰.中文领域命名实体识别综述[J].计算机工程与应用,2021,57(16):1-15. 被引量：41
10吴禹,靳华中.基于文本层级结构的图像描述生成算法[J].湖北工业大学学报,2021,36(4):17-21. 被引量：2

1殷洁.基于相互关联性开展语文整体教学[J].语文天地,2019,0(6):17-18.
2朱艳辉,李飞,胡骏飞,钱继胜,王天吉.基于三支决策的两阶段实体关系抽取研究[J].计算机工程与应用,2018,54(9):145-150. 被引量：4
3彭籍冲,王红斌.基于跨语言信息投影的泰语新闻事件抽取[J].信息技术,2017,41(12):10-13. 被引量：1
4李培峰,黄一龙,朱巧明.使用全局优化方法识别中文事件因果关系[J].清华大学学报（自然科学版）,2017,57(10):1042-1047. 被引量：7
5孙佳伟,李正华,陈文亮,张民.基于词模式嵌入的词语上下位关系分类[J].北京大学学报（自然科学版）,2019,55(1):1-7. 被引量：10
6夏冬生,孙先念,朱公志.微课、慕课和翻转课堂的特性及其相互关联性的探究[J].黑龙江教育（高教研究与评估）,2019(4):47-49. 被引量：37
7周海华,曹春萍.基于BLSTM-CRF的领域知识点实体识别技术[J].软件,2019,40(2):1-5.
8郑毅,胡祥培,尹进.基于多任务支持向量机的健康数据融合方法[J].系统工程理论与实践,2019,39(2):418-428. 被引量：11
9夏天赐,孙媛.基于联合模型的藏文实体关系抽取方法研究[J].中文信息学报,2018,32(12):76-83. 被引量：10
10孔国兴.《现代汉语篇章语言学》失校举隅[J].中国图书评论,2019,42(2):80-87.

软件学报

2019年第4期

浏览历史

内容加载中请稍等...

基于多任务学习的中文事件抽取联合模型被引量：43

参考文献3

二级参考文献25

共引文献146

同被引文献318

引证文献43

二级引证文献175

相关作者

相关机构

相关主题

浏览历史

基于多任务学习的中文事件抽取联合模型 被引量：43

参考文献3

二级参考文献25

共引文献146

同被引文献318

引证文献43

二级引证文献175

相关作者

相关机构

相关主题

浏览历史

基于多任务学习的中文事件抽取联合模型被引量：43