基于本体和依存句法的词汇语义关系标注及评价方法研究

Ontology and Dependency Syntax Based Word Semantic Relation Annotation and Its Evaluation

下载PDF

导出

摘要为弥补传统的语义标注方法在词语或句子成分之间关系描述方面的不足,该文提出了一种基于本体和依存句法的非结构化文本语义关系标注算法。算法以句子为单位,综合POS(Part of Speech)、语义辞典、语言学特征等因素对句子中词汇的语义关系进行识别,利用词语间的依存关系对词语进行语义组合,从而实现词汇语义关系标注。结合语义标注过程中的语义匹配度、语义丰富度等特征,设计了评价算法,用以衡量标注结果的正确性。实验结果表明,该标注算法能获得较高的准确率,在大规模语料下效果尤为显著。 In bridge the gap between words and syntactic components in current semantic annotation, a semantic an- notation method based on ontology and dependency syntax for unstructured text is proposed. Applied in the sentence level, this method employs the features including POS, semantic dictionary, and other linguistic features, and deter- mines the the lexical semantic relations by the dependency structure between them.. Meanwhile, an evaluation met- ric combing features like semantic similarity and semantic richness are designed, which is essentially the confidence of the method itself. Experimental results show that the semantic tagging algorithm can reach high accuracy espe- cially on large-scale corpus.

作者熊晶支丽平袁冬

机构地区安阳师范学院计算机与信息工程学院高效能服务器和存储技术国家重点实验室

出处《中文信息学报》 CSCD 北大核心 2015年第3期58-64,共7页 Journal of Chinese Information Processing

基金国家自然科学基金(60875081) 河南省科技发展计划重点攻关项目(132102210264)

关键词语义标注本体非结构化文本依存句法 semantic annotation ontology unstructured text dependency syntax

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献17

1李业刚,孙福振,李鉴柏,吕新宇.语义角色标注研究综述[J].山东理工大学学报（自然科学版）,2011,25(6):19-24. 被引量：5
2李军辉,王红玲,周国栋,朱巧明,钱培德.语义角色标注中句法特征的研究[J].中文信息学报,2009,23(6):11-18. 被引量：11
3丁伟伟,常宝宝.基于语义组块分析的汉语语义角色标注[J].中文信息学报,2009,23(5):53-61. 被引量：24
4古凌岚,孙素云.基于语义依存的中文本体非分类关系抽取方法[J].计算机工程与设计,2012,33(4):1676-1680. 被引量：7
5王鑫,穗志方.基于依存树距离识别论元的语义角色标注系统[J].中文信息学报,2012,26(2):40-45. 被引量：5
6徐靖,李军辉,朱巧明,李培峰.基于短语和依存句法结构的中文语义角色标注[J].计算机工程,2011,37(24):169-172. 被引量：4
7王步康,王红玲,袁晓虹,周国栋.基于依存句法分析的中文语义角色标注[J].中文信息学报,2010,24(1):25-29. 被引量：23
8陈波,姬东鸿,吕晨.基于特征结构的汉语主谓谓语句语义标注研究[J].中文信息学报,2012,26(3):22-26. 被引量：8
9陈叶旺,李文,彭鑫,赵文耘.基于本体的文档语义标注改进方法[J].东南大学学报（自然科学版）,2009,39(6):1109-1113. 被引量：19
10常平梅,李冠宇,张俊.基于本体集成的语义标注模型设计[J].计算机工程与设计,2010,31(5):1125-1129. 被引量：6

二级参考文献174

1陈耀东,王挺,陈火旺.浅层语义分析研究[J].计算机研究与发展,2008,45(z1):321-325. 被引量：12
2鲁川,缑瑞隆,刘钦荣.交易类四价动词及汉语谓词配价的分类系统[J].汉语学习,2000(6):7-17. 被引量：24
3陆俭明.新中国语言学50年[J].当代语言学,1999,1(4):1-13. 被引量：28
4周国光.汉语配价语法论略[J].南京师大学报（社会科学版）,1994(4):103-106. 被引量：30
5张敏,宋睿华,马少平.基于语义关系查询扩展的文档重构方法[J].计算机学报,2004,27(10):1395-1401. 被引量：55
6WANGPeng,XUBao-wen,LUjian-jiang,LiYan-hui,JIANGJian-hua.Bridge Ontology: A Multi-Ontologies-Based Approach for Semantic Annotation[J].Wuhan University Journal of Natural Sciences,2004,9(5):617-622. 被引量：2
7高凡,李景.Ontology及其与分类法、主题法的关系[J].图书馆理论与实践,2005(2):44-46. 被引量：20
8秦兵,刘挺,李生.多文档自动文摘综述[J].中文信息学报,2005,19(6):13-20. 被引量：51
9文勖,张宇,刘挺,马金山.基于句法结构分析的中文问题分类[J].中文信息学报,2006,20(2):33-39. 被引量：82
10田欣.基于知识本体的图书馆语义检索系统模型研究[J].情报杂志,2006,25(6):78-81. 被引量：12

共引文献165

1魏伟,郭崇慧,邢小宇.基于语义关联规则的试题知识点标注及试题推荐[J].数据分析与知识发现,2020,4(2):182-191. 被引量：9
2卢雪晖,徐会丹,李斌,陈思瑜.先秦词网构建及梵汉对比研究[J].中文信息学报,2023,37(3):36-45. 被引量：1
3刘亚慧,杨浩苹,李正华,张民.一种轻量级的汉语语义角色标注规范[J].中文信息学报,2020(4):10-20. 被引量：4
4吴云芳.V+V形成的并列结构[J].语言研究,2004,24(3):45-51. 被引量：4
5祁坤钰.《机器翻译用现代藏语语义词典》的设计研究[J].西北民族大学学报（自然科学版）,2004,25(3):33-37. 被引量：8
6孙斌.一种义项矩阵模型SMM[J].中文信息学报,2005,19(2):28-35. 被引量：3
7熊静娴,李生红.基于概念网络的文本信息监控技术[J].信息安全与通信保密,2005,27(10):57-59. 被引量：2
8唐运良.农村学校推广普通话之我见[J].基础教育研究,2005(8):10-11. 被引量：1
9吴云芳.并列成分中心语语义相似性考察[J].当代语言学,2005,7(4):305-315. 被引量：15
10吐尔根.伊布拉音,阿不里米提.阿不都热依木.维汉机器翻译词典的结构设计与实现(英文)[J].新疆大学学报（自然科学版）,2005,22(3):258-262. 被引量：4

1陆晓华,张宇,钱进.基于图数据库的电影知识图谱应用研究[J].现代计算机,2016,22(5):76-83. 被引量：8
2周玉新.命名实体识别研究发展综述[J].科技风,2016(16):99-99. 被引量：1
3祝伟华,卢熠,刘斌斌.基于HMM的Web信息抽取算法的研究与应用[J].计算机科学,2010,37(2):203-206. 被引量：12
4程洪涛.基于XML的非结构化文本数据转换研究与实现[J].现代计算机,2013,19(6):51-54. 被引量：3
5谢子超.非结构化文本的自动分类检索平台的研究与实现[J].软件,2015,36(11):112-114. 被引量：10
6李毅,胡金凤,王正友.一种面向中文依赖语法的观点挖掘模型[J].河北省科学院学报,2014,31(2):11-17.
7亓祥波,南琳,张福顺.基于元数据和XML的信息抽取与集成技术研究[J].信息与控制,2008,37(1):52-57. 被引量：10
8蓝荣贵,王勇,朱正东,李增智.模型驱动架构的语义组合Web服务的验证[J].计算机工程与应用,2011,47(8):51-55.
9王树锋,王文,费贤举.一种基于上下文信息的个性化推荐模型[J].常州工学院学报,2014,27(2):27-31. 被引量：1
10曾道建,来斯惟,张元哲,刘康,赵军.面向非结构化文本的开放式实体属性抽取[J].江西师范大学学报（自然科学版）,2013,37(3):279-283. 被引量：11

中文信息学报

2015年第3期

浏览历史

内容加载中请稍等...

基于本体和依存句法的词汇语义关系标注及评价方法研究

参考文献17

二级参考文献174

共引文献165

相关作者

相关机构

相关主题

浏览历史