期刊文献+
共找到9,014篇文章
< 1 2 250 >
每页显示 20 50 100
面向文本实体关系抽取研究综述
1
作者 任安琪 柳林 +1 位作者 王海龙 刘静 《计算机科学与探索》 CSCD 北大核心 2024年第11期2848-2871,共24页
信息抽取是知识图谱构建的基础,关系抽取作为信息抽取的关键流程和核心步骤,旨在从文本数据中定位实体并识别实体间的语义联系。因此提高关系抽取的效率可以有效提升信息抽取的质量,进而影响到知识图谱的构建以及后续的下游任务。关系... 信息抽取是知识图谱构建的基础,关系抽取作为信息抽取的关键流程和核心步骤,旨在从文本数据中定位实体并识别实体间的语义联系。因此提高关系抽取的效率可以有效提升信息抽取的质量,进而影响到知识图谱的构建以及后续的下游任务。关系抽取按照抽取文本长度可以分为句子级关系抽取和文档级关系抽取,两种级别的抽取方法在不同应用场景下各有优缺点。句子级关系抽取适用于较小规模数据集的应用场景,而文档级关系抽取适用于新闻事件分析、长篇报告或文章的关系挖掘等场景。不同于已有的关系抽取,介绍了关系抽取的基本概念以及领域内近年来的发展历程,罗列了两种级别关系抽取所采用的数据集,对数据集的特点进行概述;分别对句子级关系抽取和文档级关系抽取进行了阐述,介绍了不同级别关系抽取的优缺点,并分析了各类方法中代表模型的性能以及局限性;总结了当前研究领域中存在的问题并对关系抽取发展前景进行了展望。 展开更多
关键词 信息抽取 实体关系抽取 句子级关系抽取 文档级关系抽取 知识图谱构建
下载PDF
基于深度字词融合的小麦种质信息实体关系联合抽取
2
作者 刘合兵 贾笑笑 +3 位作者 时雷 熊蜀峰 马新明 席磊 《计算机工程与设计》 北大核心 2024年第4期1079-1086,共8页
为获得结构化的小麦品种表型和遗传描述,针对非结构化小麦种质数据中存在的实体边界模糊以及关系重叠问题,提出一种基于深度字词融合的小麦种质信息实体关系联合抽取模型WGIE-DCWF(wheat germplasm information extraction model based ... 为获得结构化的小麦品种表型和遗传描述,针对非结构化小麦种质数据中存在的实体边界模糊以及关系重叠问题,提出一种基于深度字词融合的小麦种质信息实体关系联合抽取模型WGIE-DCWF(wheat germplasm information extraction model based on deep character and word fusion)。模型编码层通过深度字词融合和上下文语义特征融合,提高密集实体特征识别能力;模型三元组抽取层建立层叠指针网络,提高重叠关系的提取能力。在小麦种质数据集和公开数据集上的一系列对比实验结果表明,WGIE-DCWF模型能够有效提高小麦种质数据实体关系联合抽取效果,同时拥有较好的泛化性,可以为小麦种质信息知识库构建提供技术支撑。 展开更多
关键词 小麦种质信息 字词融合 实体关系抽取 联合抽取 层叠指针网络 实体识别 关系抽取
下载PDF
AMFRel:一种中文电子病历实体关系联合抽取方法 被引量:1
3
作者 余肖生 李琳宇 +2 位作者 周佳伦 马洪彬 陈鹏 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第2期189-197,共9页
中文电子病历实体关系抽取是构建医疗知识图谱,服务下游子任务的重要基础。目前,中文电子病例进行实体关系抽取仍存在因医疗文本关系复杂、实体密度大而造成医疗名词识别不准确的问题。针对这一问题,提出了基于对抗学习与多特征融合的... 中文电子病历实体关系抽取是构建医疗知识图谱,服务下游子任务的重要基础。目前,中文电子病例进行实体关系抽取仍存在因医疗文本关系复杂、实体密度大而造成医疗名词识别不准确的问题。针对这一问题,提出了基于对抗学习与多特征融合的中文电子病历实体关系联合抽取模型AMFRel(adversarial learning and multi-feature fusion for relation triple extraction),提取电子病历的文本和词性特征,得到融合词性信息的编码向量;利用编码向量联合对抗训练产生的扰动生成对抗样本,抽取句子主语;利用信息融合模块丰富文本结构特征,并根据特定的关系信息抽取出相应的宾语,得到医疗文本的三元组。采用CHIP2020关系抽取数据集和糖尿病数据集进行实验验证,结果显示:AMFRel在CHIP2020关系抽取数据集上的Precision为63.922%,Recall为57.279%,F1值为60.418%;在糖尿病数据集上的Precision、Recall和F1值分别为83.914%,67.021%和74.522%,证明了该模型的三元组抽取性能优于其他基线模型。 展开更多
关键词 关系抽取 联合抽取 对抗学习 多特征融合 关系重叠
下载PDF
融合方面语义和网格标记的多语言意见元组抽取
4
作者 古文霞 早克热·卡德尔 +1 位作者 杨乾 艾山·吾买尔 《计算机科学》 CSCD 北大核心 2024年第4期324-333,共10页
面向方面的细粒度意见抽取(Aspect-oriented Fine-grained Opinion Extraction,AFOE)任务的目的是以意见对的形式抽取文本评论中的方面和意见词或者再抽取情感极性,形成意见三元组。以往的研究通常以管道方式抽取意见元素,容易出现错误... 面向方面的细粒度意见抽取(Aspect-oriented Fine-grained Opinion Extraction,AFOE)任务的目的是以意见对的形式抽取文本评论中的方面和意见词或者再抽取情感极性,形成意见三元组。以往的研究通常以管道方式抽取意见元素,容易出现错误传播的问题,而且大多数只关注方面词和意见词的单个子任务抽取,忽略了不同意见元素之间的相互影响和指示信息,导致意见挖掘任务不完整。此外,面向中文的意见元素抽取任务的研究较少。针对以上问题,文中提出了融合方面语义和网格标记的多语言意见元组抽取模型。首先,使用向内LSTM(Inward-LSTM)和向外LSTM(Outward-LSTM)编码方面词及其对应的上下文信息建立方面和候选意见词的关联,再结合全局信息生成特定方面语义特征的上下文表示,有利于提高下游意见元素抽取的性能。其次,使用网格标记方案的推理策略,利用方面和意见词之间的依赖指示信息进行更准确的抽取,以端到端的方式处理AFOE任务。相比基线模型,对于方面意见对抽取任务,改进的模型在中英文数据集上的F1值提高了0.89%~4.11%,对于三元组抽取任务提高了1.36%~3.11%,实验结果表明,改进的模型能有效地对中英文评论的意见元素进行抽取,性能显著优于基线模型。 展开更多
关键词 方面意见对抽取 三元组抽取 网格标记方案 方面语义 面向方面的细粒度意见抽取
下载PDF
基于双仿射注意力的迭代式开放域信息抽取
5
作者 李欣 邵靖淇 +2 位作者 王昊 何丽 段建勇 《计算机应用研究》 CSCD 北大核心 2024年第7期2046-2051,共6页
当前的开放域信息抽取(OpenIE)方法无法同时兼顾抽取结果的紧凑性和模型的性能,导致其抽取结果不能更好地被应用到下游任务中。为此,提出一个基于双仿射注意力进行表格填充及迭代抽取的模型。首先,该模型通过双仿射注意力学习单词之间... 当前的开放域信息抽取(OpenIE)方法无法同时兼顾抽取结果的紧凑性和模型的性能,导致其抽取结果不能更好地被应用到下游任务中。为此,提出一个基于双仿射注意力进行表格填充及迭代抽取的模型。首先,该模型通过双仿射注意力学习单词之间的方向信息、捕获单词对之间的相互作用,随后对二维表格进行填充,使句子中的成分相互共享并识别紧凑成分;其次,使用多头注意力机制将谓词和参数的表示应用于上下文的嵌入中,使谓词和参数的提取相互依赖,更好地链接关系成分和参数成分;最后,对于含有多个关系成分的句子,使用迭代抽取的方式在无须重新编码的情况下捕获每次提取之间固有的依赖关系。在公开数据集CaRB和Wire57上的实验表明,该方法比基线方法实现了更高的精度和召回率,F_(1)值提升了至少1.4%和3.2%,同时产生了更短、语义更丰富的提取。 展开更多
关键词 开放域信息抽取 双仿射注意力 紧凑性 多头注意力 迭代抽取
下载PDF
基于自适应损失函数的句子级远程监督关系抽取
6
作者 胡峰 杨新瑞 +2 位作者 汤成富 邓维斌 刘群 《智能系统学报》 CSCD 北大核心 2024年第3期697-706,共10页
远程监督关系抽取是一种关系抽取方法,现有方法主要采用多实例学习,在具有相同实体对的样例包上进行关系抽取。但是,包级方法只能缓解却并不能完全解决错误标签问题。基于此,文中首先分析了干净数据和噪声数据的分布,提出了一种新的自... 远程监督关系抽取是一种关系抽取方法,现有方法主要采用多实例学习,在具有相同实体对的样例包上进行关系抽取。但是,包级方法只能缓解却并不能完全解决错误标签问题。基于此,文中首先分析了干净数据和噪声数据的分布,提出了一种新的自适应损失函数;在此基础上,提出了一种基于自适应损失函数的句子级远程监督关系抽取方法。在公开数据集NYT-10以及基于TACRED的合成数据集上的实验结果表明:文中提出的方法优于对比文献中的方法,能够更有效地区分错误标签噪声样例和干净样例,提高了句子级远程监督关系抽取的准确率。 展开更多
关键词 自然语言处理 信息抽取 关系抽取 远程监督 噪声分离 噪声标注 负训练 自适应损失函数
下载PDF
面向小样本抽取式问答的多标签语义校准方法
7
作者 刘青 陈艳平 +2 位作者 邹安琪 秦永彬 黄瑞章 《应用科学学报》 CAS CSCD 北大核心 2024年第1期161-173,共13页
小样本抽取式问答任务旨在利用文章给定的上下文片段,抽取出真实的答案片段。其基线模型采用的方法只针对跨度进行学习,缺乏对全局语义信息的利用,在含有多组不同重复跨度的实例中存在着理解偏差等问题。为了解决上述问题,该文利用不同... 小样本抽取式问答任务旨在利用文章给定的上下文片段,抽取出真实的答案片段。其基线模型采用的方法只针对跨度进行学习,缺乏对全局语义信息的利用,在含有多组不同重复跨度的实例中存在着理解偏差等问题。为了解决上述问题,该文利用不同层级的语义提出了一种面向小样本抽取式问答任务的多标签语义校准方法。采用包含全局语义信息的头标签和基线模型中的特殊字符构成多标签进行语义融合,并利用语义融合门来控制全局信息流的引入,将全局语义信息融合到特殊字符的语义信息中。然后,利用语义筛选门对新融入的全局语义信息和该特殊字符的原有语义信息进行保留与更替,实现对标签偏差语义的校准。在8个小样本抽取式问答数据集中的56组实验结果表明:该方法在评价指标F1值上均明显优于基线模型,证明了所提方法的有效性和先进性。 展开更多
关键词 小样本抽取式问答 跨度抽取式问答 多标签语义融合 双门控机制 机器阅读理解
下载PDF
事件抽取方法综述:深度学习与预训练对比分析
8
作者 王嘉宾 罗俊仁 +2 位作者 周棪忠 王超 张万鹏 《计算机科学》 CSCD 北大核心 2024年第9期196-206,共11页
事件抽取是伴随着信息技术的发展而诞生的。随着人们对从繁多的日常信息中抽取出有用信息的需求日益增强,事件抽取的研究发展也越发受重视。首先,介绍了事件抽取的发展历程,理清了事件抽取的发展脉络;其次,介绍了事件抽取的2种范式,并... 事件抽取是伴随着信息技术的发展而诞生的。随着人们对从繁多的日常信息中抽取出有用信息的需求日益增强,事件抽取的研究发展也越发受重视。首先,介绍了事件抽取的发展历程,理清了事件抽取的发展脉络;其次,介绍了事件抽取的2种范式,并对管道型抽取和联合型抽取范式进行了对比分析;再次,围绕事件抽取的层级,分别从句子级事件抽取和篇章级事件抽取2个层面对近年来事件抽取的发展进行了梳理;然后,从传统型事件抽取方法、基于深度学习的事件抽取方法,以及基于预训练模型的事件抽取方法3个方面对事件抽取方法进行了对比分析;最后,介绍了事件抽取的典型应用场景,并根据事件抽取的发展现状,对未来事件抽取前沿发展进行了展望。 展开更多
关键词 事件抽取 论元 触发词 要素抽取 时序抽取 预训练
下载PDF
融合限定关系和交互信息的实体关系联合抽取模型
9
作者 唐瑞雪 秦永彬 陈艳平 《中文信息学报》 CSCD 北大核心 2024年第10期106-116,共11页
实体关系抽取作为信息抽取领域的核心任务,旨在从非结构化文本中自动抽取所有的关系三元组。现有研究较难处理句子中关系重叠的情况,存在识别冗余和语义依赖不足的问题。鉴于此,该文提出一种融合限定关系和交互信息的实体关系联合抽取... 实体关系抽取作为信息抽取领域的核心任务,旨在从非结构化文本中自动抽取所有的关系三元组。现有研究较难处理句子中关系重叠的情况,存在识别冗余和语义依赖不足的问题。鉴于此,该文提出一种融合限定关系和交互信息的实体关系联合抽取模型。该模型首先对句子进行关系预测,构成限定关系集。其次,利用限定关系分别地预测可能存在关系的头实体和尾实体,解决关系重叠问题,同时缓解冗余识别。为了加强句子中实体与关系的交互,利用注意力机制强化句子中关系有关信息,通过双仿射和卷积操作来构建评分矩阵。最后,通过评分矩阵对候选三元组进行校正,确定最终的关系三元组。实验结果表明,该模型在NYT和WebNLG数据集上F1值分别达到92.0%和88.7%,相比于所对比的基线模型F1值分别提高了2.8%和1.0%,验证了模型的有效性。 展开更多
关键词 实体关系抽取 联合抽取 重叠关系 限定关系 交互信息
下载PDF
面向无触发词文本的因果关系事件对联合抽取模型
10
作者 张国梁 朱桐 陈文亮 《中文信息学报》 CSCD 北大核心 2024年第5期76-87,共12页
事件因果关系抽取(Event Causality Extraction,ECE)是从文本中抽取出表示因果事件对的事件类型、事件要素及事件间的关系。之前的工作都在含有触发词的文本上进行,并且事件抽取和关系识别也都依靠触发词等事件主体。然而,现实中有许多... 事件因果关系抽取(Event Causality Extraction,ECE)是从文本中抽取出表示因果事件对的事件类型、事件要素及事件间的关系。之前的工作都在含有触发词的文本上进行,并且事件抽取和关系识别也都依靠触发词等事件主体。然而,现实中有许多文本没有触发词,因此该文的抽取任务则是在无触发词标注的文本上进行。该任务的难点在于不仅要抽取多个独立事件,还要判断相互间的因果关系,并且存在事件主体缺失、多事件对及事件类型重叠的问题。该文提出一种分阶段的联合抽取模型,在第一阶段,利用层叠结构模型识别出文本中的事件类型与因果关系;在第二阶段,利用“双定位”和阅读理解机制获得嵌入事件类型信息的句子表示,并通过多层二元标志解码器预测各事件要素的首尾位置。为缓解误差传播问题,该文将两阶段模型通过共享编码层的方式联合训练。实验表明,该文提出的方法可以在完全无规则的情况下有效抽取出无触发词文本中的因果事件对。 展开更多
关键词 事件因果关系抽取 事件抽取 关系抽取
下载PDF
基于ABBSAC模型的中文事件抽取方法
11
作者 陈泉林 贾珺 樊硕 《微电子学与计算机》 2024年第5期57-66,共10页
事件抽取作为信息抽取的重要一环,是非结构化文本转化为有价值的结构化文本的主要方式。针对目前事件抽取模型普遍训练时间长、模型体量大等问题,提出了一个基于ABBSAC的中文事件抽取模型。通过ALBERT预训练模型缩减模型体量,采用BiSRU+... 事件抽取作为信息抽取的重要一环,是非结构化文本转化为有价值的结构化文本的主要方式。针对目前事件抽取模型普遍训练时间长、模型体量大等问题,提出了一个基于ABBSAC的中文事件抽取模型。通过ALBERT预训练模型缩减模型体量,采用BiSRU++捕捉文本内部关联信息,并融合注意力机制提升模型精度,最后以CRF的输出作为抽取结果。基于新浪新闻自主构建了语料集,进行了对比实验。在获得较高准确率、召回率以及F1值的基础上,该模型训练速度提高了约10%,模型参数量裁剪了约82%,证明了所提模型的先进性。同时,在ACE05和DUEE基准测评数据集上,与前沿方法相比较,将触发词抽取的F1值分别提升了1.7%、0.3%,将论元角色抽取的F1值分别提升了5.4%、0.1%,有效提升了中文事件抽取任务的效能。 展开更多
关键词 中文事件抽取 ALBERT Bi-SRU++ 注意力机制 触发词抽取 论元角色抽取
下载PDF
基于事件时间论元抽取的文档级时序抽取方法研究
12
作者 肖彬 郁兴腾 戴诗伟 《北方工业大学学报》 2024年第3期84-92,共9页
事件时序关系识别任务属于关系抽取领域的一个分支,近年来受到越来越多的关注。目前,关于章级事件时序关系抽取的研究在现有神经网络方法中尚未得到充分深入探讨。因此,本文提出一种基于篇章事件时序关系矩阵的方法,利用语言学中的时间... 事件时序关系识别任务属于关系抽取领域的一个分支,近年来受到越来越多的关注。目前,关于章级事件时序关系抽取的研究在现有神经网络方法中尚未得到充分深入探讨。因此,本文提出一种基于篇章事件时序关系矩阵的方法,利用语言学中的时间论元理论来指导模型抽取效果;通过修改预训练阶段的词嵌入,将句子的时态、体态和时间副词作为额外信息融入事件触发词的词嵌入表达中;同时,模型还利用了事件时间论元抽取任务进行辅助训练,从而构建了具有增强时间特征的文本表达。研究发现通过将事件时间论元抽取任务融入模型训练过程,该模型在事件时序关系抽取任务上获得了比基线更好的效果。 展开更多
关键词 关系抽取 时序关系 事件时间论元 预训练 抽取矩阵
下载PDF
知识图谱中实体关系抽取方法研究 被引量:3
13
作者 张西硕 柳林 +2 位作者 王海龙 苏贵斌 刘静 《计算机科学与探索》 CSCD 北大核心 2024年第3期574-596,共23页
实体关系抽取作为知识图谱构建的基础得到了越来越多研究人员的关注。实体关系抽取能够自动、准确地从大量数据中获取知识,并以结构化形式表示和存储。因此,实体关系抽取的正确性直接影响到知识图谱构建的准确性和后续知识图谱应用效果... 实体关系抽取作为知识图谱构建的基础得到了越来越多研究人员的关注。实体关系抽取能够自动、准确地从大量数据中获取知识,并以结构化形式表示和存储。因此,实体关系抽取的正确性直接影响到知识图谱构建的准确性和后续知识图谱应用效果。然而,针对复杂结构、开放领域、多语言、多模态、小样本数据和实体关系联合抽取等不同研究热点,现存的实体关系抽取方法仍存在一些局限性。基于当前实体关系抽取研究热点领域将实体关系抽取分为复杂结构研究领域、开放领域、多语言研究领域、多模态研究领域、小样本数据研究领域和实体关系联合抽取六个方面,将每个方面按照具体问题进行分类并列举出一些解决方法。不仅系统梳理了每一个类别当前存在的问题和解决方法,还归纳了每个类别的研究成果,并从定量分析和定性分析两个维度,详细地分析了每个方法的优点和缺点。最后,总结了当前热点领域中待解决的问题,同时展望了知识图谱中实体关系抽取方法未来的发展趋势。 展开更多
关键词 知识图谱构建 实体抽取 关系抽取
下载PDF
基于双标注框架的实体关系联合抽取
14
作者 曾碧卿 蔡剑 李砚龙 《计算机工程与设计》 北大核心 2024年第6期1888-1895,共8页
实体关系抽取有流水线和联合抽取两种,联合抽取能更有效地抽取实体关系,流水线的适应能力更灵活。为解决实体关系抽取中的关系重叠问题,提出一种双标注实体关系抽取框架。使用联合解码的方式抽取自然文本中的主体实体,使用流水线方式抽... 实体关系抽取有流水线和联合抽取两种,联合抽取能更有效地抽取实体关系,流水线的适应能力更灵活。为解决实体关系抽取中的关系重叠问题,提出一种双标注实体关系抽取框架。使用联合解码的方式抽取自然文本中的主体实体,使用流水线方式抽取出客体实体。使用联合解码保证抽取精度的同时继承流水线的灵活性。所提模型在信息抽取数据集DUIE和远程监督数据集NYT上进行实验,其结果表明,该模型与基线模型相比具有竞争力。 展开更多
关键词 实体关系抽取 序列标注 联合关系抽取 关系重叠 信息抽取 注意力机制 自然语言处理
下载PDF
基于遗传算法优化Canny算子的织绣文物纹样抽取方法研究 被引量:1
15
作者 张宇 张健 齐林 《丝绸》 CAS CSCD 北大核心 2024年第6期1-12,共12页
织绣文物中的纹样彰显中国传统文化造型艺术的形式美感,是文创设计的重要素材源泉。针对传统Canny算子进行纹样边缘检测需人为确定阈值的问题,本文提出基于遗传算法自适应优化Canny算子阈值的方法,将边缘点、非边缘点类间梯度幅值方差... 织绣文物中的纹样彰显中国传统文化造型艺术的形式美感,是文创设计的重要素材源泉。针对传统Canny算子进行纹样边缘检测需人为确定阈值的问题,本文提出基于遗传算法自适应优化Canny算子阈值的方法,将边缘点、非边缘点类间梯度幅值方差设置为适应度函数,通过格雷码对阈值染色体编解码、锦标赛选择算法优选交叉变异后的阈值,求解最优适应度对应的高低阈值,用于纹样边缘检测;此外,运用形态学操作得到纹样的完整、精确轮廓;最后,添加Alpha通道抽取纹样前景。实验表明,上述方法在织绣纹样抽取精度和像素准确度(PA)上,优于传统Canny算子、混合蛙跳自适应Canny算子、Otsu法优化Canny算子等已有方法,可有效检测织绣文物图像中纹样真实边缘并完成纹样抽取。 展开更多
关键词 织绣文物 遗传算法 CANNY算子 边缘检测 纹样抽取 最优阈值
下载PDF
低资源场景事件抽取研究综述 被引量:2
16
作者 刘涛 蒋国权 +2 位作者 刘姗姗 刘浏 环志刚 《计算机科学》 CSCD 北大核心 2024年第2期217-237,共21页
事件抽取作为信息抽取的任务之一,旨在从非结构化文本中抽取出结构化事件信息。当前基于机器学习和深度学习的自动化信息抽取方法过度依赖于标注数据,而大多数领域的标准数据集规模很小且分布不均匀,因此低资源场景成为了限制自动化信... 事件抽取作为信息抽取的任务之一,旨在从非结构化文本中抽取出结构化事件信息。当前基于机器学习和深度学习的自动化信息抽取方法过度依赖于标注数据,而大多数领域的标准数据集规模很小且分布不均匀,因此低资源场景成为了限制自动化信息抽取性能的瓶颈。虽然,近年来众多学者针对低资源场景进行了深入研究,并取得了许多显著的成果,但目前针对该场景下的事件抽取研究综述比较缺乏。文中对现有的学术成果进行了较为全面的总结分析,首先介绍了相关任务的定义,并将低资源场景事件抽取任务分为3类;其次围绕此分类重点阐述了6种相关技术方法,包括基于迁移学习、基于提示学习、基于无监督学习、基于弱监督学习、基于数据与辅助知识增强、基于元学习的方法,并指出了当前方法的不足和未来改进的方向;然后介绍了相关数据集及评价指标,并对典型技术方法的实验结果进行了总结分析;最后从全局角度总结分析了当前低资源场景事件抽取工作面临的挑战及未来研究的趋势。 展开更多
关键词 事件抽取 低资源场景 数据处理 场景适应
下载PDF
融合多任务学习和实体遮掩的关系三元组抽取模型
17
作者 薛志豪 李永强 +1 位作者 赵永智 冯远静 《小型微型计算机系统》 CSCD 北大核心 2024年第4期845-852,共8页
针对流水线式三元组抽取模型中,命名实体识别任务里实体识别和实体分类两个子任务之间存在干扰,关系抽取任务中实体提及词对关系分类也存在干扰的问题,提出一种融合多任务学习和实体遮掩的关系三元组抽取模型.在命名实体识别任务中,先... 针对流水线式三元组抽取模型中,命名实体识别任务里实体识别和实体分类两个子任务之间存在干扰,关系抽取任务中实体提及词对关系分类也存在干扰的问题,提出一种融合多任务学习和实体遮掩的关系三元组抽取模型.在命名实体识别任务中,先利用预训练模型对输入句子进行特征编码表示,然后利用首尾指针标注进行实体识别,最后利用注意力机制融入实体类型信息进行实体分类.在关系抽取任务中,提出了一种实体遮掩的方法,先利用实体类型信息替换实体提及词,并在其前后插入实体标记,之后利用预训练模型对输入句子进行特征编码表示,最后利用头尾实体的特征表示进行关系分类.在SCIERC和SKE两个数据集上进行大量实验,实验结果表明,所提模型相较于基于实体标记方法的PURE模型整体性能提升了2.5和1.5个百分点.充分验证了在三元组抽取任务中,分解命名实体识别任务以及在关系抽取中用实体类型信息替换实体提及词的有效性. 展开更多
关键词 信息抽取 关系三元组抽取 多任务学习 实体遮掩 注意力机制 深度学习
下载PDF
基于深度学习的非结构化医学文本知识抽取
18
作者 耿飙 梁成全 +1 位作者 魏炜 朱长元 《计算机工程与设计》 北大核心 2024年第1期177-186,共10页
为解决一词多义和关系重叠问题,以糖尿病领域文本数据为对象,基于序列标注的新型标注策略,提出一种轻量级端到端神经模型。采用头部实体优先策略,使用BERT获取输入字向量,通过BiLSTM深度学习捕获时间特征和上下文相关性。引入multi_head... 为解决一词多义和关系重叠问题,以糖尿病领域文本数据为对象,基于序列标注的新型标注策略,提出一种轻量级端到端神经模型。采用头部实体优先策略,使用BERT获取输入字向量,通过BiLSTM深度学习捕获时间特征和上下文相关性。引入multi_head attention机制,采用CRF模型根据相邻标签的相互依赖关系得到最优预测序列。旨在将非结构化的医学文本转换成结构化的数据,在阿里云天池中文糖尿病标注数据集上进行综合实验,实验结果表明,该模型在医学文本知识抽取中具有优越的性能。 展开更多
关键词 深度学习 非结构化文本 医学文本 知识抽取 实体识别 关系抽取 序列标注
下载PDF
基于自注意力机制的中文金融事件元素抽取
19
作者 付安娜 刘旭红 +3 位作者 齐林 崔展齐 于俊洋 刘秀磊 《北京信息科技大学学报(自然科学版)》 2024年第2期57-61,76,共6页
针对中文金融事件元素抽取任务中多个代词指代同一个元素的问题,提出了基于自注意力机制的事件元素抽取模型。该模型在预处理阶段融入金融事件领域知识与事件类型知识,使得预训练模型可以根据事件类型信息获得更可靠的事件元素表示;然后... 针对中文金融事件元素抽取任务中多个代词指代同一个元素的问题,提出了基于自注意力机制的事件元素抽取模型。该模型在预处理阶段融入金融事件领域知识与事件类型知识,使得预训练模型可以根据事件类型信息获得更可靠的事件元素表示;然后,使用多头注意力机制挖掘新闻上下文不同元素指代词的指代含义,做到重叠元素间的指代消解;最后,使用双向长短期记忆网络与条件随机场挖掘新闻长文本的上下文特征表示,实现事件元素抽取。构建了中文金融事件语料库,通过与主流模型的对比实验验证了该模型的有效性。 展开更多
关键词 深度学习 金融事件抽取 语料库构建 事件元素抽取
下载PDF
基于图神经网络的关系抽取研究综述
20
作者 沈鑫怡 李华昱 +1 位作者 闫阳 张智康 《计算机系统应用》 2024年第3期1-11,共11页
在关系抽取任务中,通常利用构建依赖树或句法树来获得更深层和丰富的结构信息.图神经网络作为一种强大的图结构数据表示学习方法,可以更好地对这种复杂数据结构进行建模.本文介绍了基于图神经网络的关系抽取方法,旨在深入理解该领域的... 在关系抽取任务中,通常利用构建依赖树或句法树来获得更深层和丰富的结构信息.图神经网络作为一种强大的图结构数据表示学习方法,可以更好地对这种复杂数据结构进行建模.本文介绍了基于图神经网络的关系抽取方法,旨在深入理解该领域的最新研究进展和趋势.首先简要介绍了图神经网络的分类和结构,然后详细阐述了基于图神经网络的关系抽取方法的核心技术和应用场景,包括句子级和文档级方法,以及实体关系联合抽取方法.并分析和比较了各个方法的优缺点和性能表现,并探讨了未来可能的研究方向和挑战. 展开更多
关键词 关系抽取 图神经网络 图结构数据 实体关系联合抽取
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部