基于BERT-WWM预训练的跨文档三元组提取被引量：2

CROSS DOCUMENT SPO EXTRACTION WITH BERT-WWM PRE-TRAINING

下载PDF

导出

摘要关于跨文档三元组(Subject Predicate Object,SPO)抽取任务,当前的研究主要基于句子级别的分析。然而很多场景下SPO元素可能分散于文档的各个位置,句子级别的抽取技术远远无法满足需求,因此提出一种Doc2SpSPO联合SPO抽取模型。该模型通过Span候选集模型生成初始实体信息,基于BERT-WWM预训练模型得到上下文以及候选实体相关Embedding信息进行分类任务从而实现SPO的联合提取。实验结果表明,该模型实体识别可达到F1值44.4%、关系分类准确率66.9%的较好效果。 The current research of cross document subject predicate object(SPO)extraction task is mainly based on sentence level analysis.However,in many scenarios,SPO elements may be scattered in various locations of the document,and the current sentence level extraction technology is far from meeting the requirements.Therefore,we propose a Doc2SpSPO joint extraction of SPO model.In this model,the initial entity information was generated by Span candidate set model.Based on the pre-training model of BERT-WWM,the context and candidate entity related embedding information for classification tasks were obtained to achieve joint extraction of SPO.The experimental results show that this model s entity recognition achieved the F1 value of 44.4%and the relationship classification accuracy of 66.9%.

作者章振增 Zhang Zhenzeng(Linewell Software Co.,Ltd.,Quanzhou 362000,Fujian,China)

机构地区南威软件股份有限公司

出处《计算机应用与软件》北大核心 2023年第6期181-186,215,共7页 Computer Applications and Software

关键词跨文档三元组抽取 BERT Span规则联合实体关系抽取模型 Cross document SPO extraction BERT Span rule Joint entity relationship extraction model

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1丁相国,桑基韬.基于关系自适应解码的实体关系联合抽取[J].计算机应用,2021,41(1):29-35. 被引量：4

二级参考文献1

1常亮,张伟涛,古天龙,孙文平,宾辰忠.知识图谱的推荐系统综述[J].智能系统学报,2019,14(2):207-216. 被引量：66

共引文献3

1文辉,徐永林,于敬.基于主动学习的领域知识多模式抽取框架[J].新一代信息技术,2022,5(6):137-143.
2王景慧,卢玲,段志丽,张亮,王玉柯.融合依存信息的关系导向型实体关系抽取方法[J].计算机应用研究,2023,40(5):1410-1415. 被引量：4
3丁建立,苏伟.基于BERT-CNN编码特征融合的实体关系联合抽取方法[J].中国民航大学学报,2023,41(2):47-53.

同被引文献15

1陈勇杰.探究LEC评价法在非煤矿山安全评价中的应用[J].中外企业文化,2020(7):73-74. 被引量：2
2徐威,冯亚琼.LEC评价法用于作业风险辨识的应用与改良[J].化工管理,2015(1):195-195. 被引量：7
3王晔,李双,庄启亚.量规法在高校实验室安全风险评估中的应用[J].实验室研究与探索,2015,34(10):278-281. 被引量：13
4李艺彤,郭永成,司马艳,陈述.基于改进LEC评价法的高层建筑施工危险源评估与管控[J].三峡大学学报（自然科学版）,2019,41(4):55-59. 被引量：20
5杜春秧,石少忠,王若愚.基于水利工程管理安全风险评价的LEC法优化设计[J].治淮,2019,0(11):44-46. 被引量：3
6曹文涛,闫亚鹏,安远.基于PHA的LEC法在综采工作面风险评价中的应用[J].能源技术与管理,2020,45(1):147-149. 被引量：1
7郑巧夺,吴贞东,邹俊颖.基于双层CNN⁃BiGRU⁃CRF的事件因果关系抽取[J].计算机工程,2021,47(5):58-64. 被引量：10
8孙凯丽,罗旭东,罗有容.预训练语言模型的应用综述[J].计算机科学,2023,50(1):176-184. 被引量：9
9郑增亮,沈宙锋,苏前敏.基于XLNet的医学文本实体关系识别模型[J].智能计算机与应用,2023,13(4):8-13. 被引量：1
10邵勇,陶飞飞,皮妍玲,章猛.基于改进LEC法的水利工程安全风险分级评价[J].江苏水利,2023(6):60-65. 被引量：5

引证文献2

1于博帆,严嘉兴.基于BERT的煤矿事故风险LEC评价与优化研究[J].现代矿业,2024,40(1):217-221. 被引量：1
2张燎原,李英娜.基于三元组分类器的电力安全领域知识抽取[J].电力科学与工程,2024,40(6):11-18.

二级引证文献1

1景建立.煤矿安全风险综合评价与预警管理模式的研究[J].内蒙古煤炭经济,2024(17):92-94.

1何宪.政府人才集团探析[J].中国人事科学,2023(5):19-32. 被引量：1
2吴梅,赵家宇,刘怡,田兴磊,倪润祥,刘永林.土壤中砷和硒生物有效态的联合提取[J].农业环境科学学报,2023,42(6):1414-1422.
3黄鑫,张家俊,宗成庆.基于跨模态实体信息融合的神经机器翻译方法[J].自动化学报,2023,49(6):1170-1180. 被引量：4

计算机应用与软件

2023年第6期

浏览历史

内容加载中请稍等...

基于BERT-WWM预训练的跨文档三元组提取被引量：2

参考文献1

二级参考文献1

共引文献3

同被引文献15

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于BERT-WWM预训练的跨文档三元组提取 被引量：2

参考文献1

二级参考文献1

共引文献3

同被引文献15

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于BERT-WWM预训练的跨文档三元组提取被引量：2