-
题名融合句法结构变换与词汇语义特征的文本蕴涵识别
被引量:5
- 1
-
-
作者
张志昌
姚东任
刘霞
陈松毅
鲁小勇
-
机构
西北师范大学计算机科学与工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第9期199-204,共6页
-
基金
国家自然科学基金资助项目(61163039
61163036
+2 种基金
61363058)
西北师范大学青年教师科研能力提升计划基金资助项目(NWNULKQN-10-2
NWNU-LKQN-12-23)
-
文摘
传统文本蕴涵识别方法仅停留在词汇级的识别,无法涉及句法、语义等方面,造成识别结果的F值较低。针对该问题,提出一种将句法结构的变换和传统词汇语义特征结合的中文文本蕴涵识别方法。对文本进行基于句法分析树变换的预处理,将句法分析中适用于文本蕴涵识别的特征加入到相关的统计和词汇语义特征中,使用统计机器学习的方法对由文本片段T和假设的文本片段H组成的文本对进行蕴涵关系分类,并经过语义规则的修正处理得到最终的识别结果。在NTCIR RITE3上的评测结果表明,与III&CYUT,Yamraj等相比,该方法能获得较高的F值。
-
关键词
中文文本蕴涵
句法结构变换
词汇语义特征
词汇统计特征
统计机器学习
-
Keywords
Chinese textual entailment
syntactic structure transformation
lexical semantic feature
lexical statisticalfeature
statistical machine learning
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-
-
题名结合语境与布朗聚类特征的上下位关系验证
被引量:1
- 2
-
-
作者
张志昌
陈松毅
刘鑫
马慧芳
-
机构
西北师范大学计算机科学与工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第2期145-150,共6页
-
基金
国家自然科学基金资助项目(61163039
61163036
+1 种基金
61363058)
西北师范大学青年教师科研能力提升计划基金资助项目(NWNU-LKQN-10-2)
-
文摘
对海量文本语料进行上下位语义关系自动抽取是自然语言处理的重要内容,利用简单模式匹配方法抽取得到候选上下位关系后,对其进行验证过滤是难点问题。为此,分别通过对词汇语境相似度与布朗聚类相似度计算,提出一种结合语境相似度和布朗聚类相似度特征对候选下位词集合进行聚类的上下位关系验证方法。通过对少量已标注训练语料的语境相似度和布朗聚类相似度进行计算,得到验证模型和2种相似度的结合权重系数。该方法无需借助现有的词汇关系词典和知识库,可对上下位关系抽取结果进行有效过滤。在CCF NLP&2012词汇语义关系评测语料上进行实验,结果表明,与模式匹配和上下文比较等方法相比,该方法可使F值指标得到明显提升。
-
关键词
上下位关系
语境相似度
布朗聚类相似度
点互信息
模式匹配
聚类验证
-
Keywords
hyponymy relation
context similarity
Brown clustering similarity
Point Mutual Information(PMI) pattern matching
clustering validation
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-