事件抽取是自然语言处理(Natural Language Processing,NLP)领域的一个研究热点。现有的事件抽取模型大多基于小规模训练集,无法应用于大规模开放领域。针对大规模开放域事件抽取中事件表征困难的问题,提出了一种基于Zipf’s共生矩阵分...事件抽取是自然语言处理(Natural Language Processing,NLP)领域的一个研究热点。现有的事件抽取模型大多基于小规模训练集,无法应用于大规模开放领域。针对大规模开放域事件抽取中事件表征困难的问题,提出了一种基于Zipf’s共生矩阵分解的事件向量计算方法。首先,从开放语料中提取事件元组作为事件标签,并对事件元组进行抽象、剪枝和消歧。然后,利用Zipf’s共生矩阵表示事件的上下文分布,利用主成分分析(Principal Component Analysis,PCA)对共生矩阵进行分解,得到初始事件向量,并利用自编码器对初始事件向量进行非线性变换。采用最近邻检测和事件检测两种任务对事件向量的性能进行测试,结果表明,基于Zipf’s共生矩阵分解得到的事件向量能够对事件之间的相似性和相关性信息进行全局性表征,避免编码过细而造成语义偏移。展开更多
FrameNet是一种著名的语义资源,不仅定义完备的框架体系,且提供丰富的标注语料,其数据经常被用于语义角色标注、事件检测、情感分析等NLP任务。受词义消歧(Word Sense Disambiguation,WSD)原理启发,提出一种基于Bert模型的框架类型检测...FrameNet是一种著名的语义资源,不仅定义完备的框架体系,且提供丰富的标注语料,其数据经常被用于语义角色标注、事件检测、情感分析等NLP任务。受词义消歧(Word Sense Disambiguation,WSD)原理启发,提出一种基于Bert模型的框架类型检测方法。与传统方法只考虑词元上下文信息不同,该方法同时考虑词元的解释性信息。方法利用序列标注模型提取词元的上下文信息;利用语句关系检测模型判断语句与词元定义之间的相关性。在FrameNet框架检测实验中分别与传统的序列标注模型和语句关系检测模型进行了对比。实验结果表明,文章模型性能优于传统模型,从而证明方法的有效性。展开更多
文摘事件抽取是自然语言处理(Natural Language Processing,NLP)领域的一个研究热点。现有的事件抽取模型大多基于小规模训练集,无法应用于大规模开放领域。针对大规模开放域事件抽取中事件表征困难的问题,提出了一种基于Zipf’s共生矩阵分解的事件向量计算方法。首先,从开放语料中提取事件元组作为事件标签,并对事件元组进行抽象、剪枝和消歧。然后,利用Zipf’s共生矩阵表示事件的上下文分布,利用主成分分析(Principal Component Analysis,PCA)对共生矩阵进行分解,得到初始事件向量,并利用自编码器对初始事件向量进行非线性变换。采用最近邻检测和事件检测两种任务对事件向量的性能进行测试,结果表明,基于Zipf’s共生矩阵分解得到的事件向量能够对事件之间的相似性和相关性信息进行全局性表征,避免编码过细而造成语义偏移。
文摘FrameNet是一种著名的语义资源,不仅定义完备的框架体系,且提供丰富的标注语料,其数据经常被用于语义角色标注、事件检测、情感分析等NLP任务。受词义消歧(Word Sense Disambiguation,WSD)原理启发,提出一种基于Bert模型的框架类型检测方法。与传统方法只考虑词元上下文信息不同,该方法同时考虑词元的解释性信息。方法利用序列标注模型提取词元的上下文信息;利用语句关系检测模型判断语句与词元定义之间的相关性。在FrameNet框架检测实验中分别与传统的序列标注模型和语句关系检测模型进行了对比。实验结果表明,文章模型性能优于传统模型,从而证明方法的有效性。