中文语义角色标注的特征工程被引量：39

Feature Engineering for Chinese Semantic Role Labeling

下载PDF

导出

摘要基于统计机器学习的语义角色标注在自然语言处理领域越来越受到重视,丰富多样的特征直接决定语义角色标注系统的性能。本文针对中文的特点,在英文语义角色标注特征的基础上,提出了一些更有效的新特征和组合特征:例如,句法成分后一个词、谓语动词和短语类型的组合、谓语动词类别信息和路径的组合等,并在Chinese Proposition Bank(CPB)语料数据上,使用最大熵分类器进行了实验,系统F-Score由89.76%增加到91.31%。结果表明,这些新特征和组合特征显著提高了系统的性能。因此,目前进行语义角色标注应集中精力寻找丰富有效的特征。 In the natural language processing field, researchers have experienced a growth of interest in semantic role labeling by applying statistical and machine-learning methods. Using rich features is the most important part of semantic parsing system. In this paper, some new effective features and combination features are proposed, such as next word of the constituent, predicate and phrase type combination, predicate class and path combination, and so on. And then we report the experiments on the dataset from Chinese Proposition Bank （CPB）. After these new features used, the final system improves the F-Score from 89. 76% to 91. 31%. The results show that the performance of the system has a statistically significant increase. Therefore it is very important to find better features for semantic role labeling.

作者刘怀军车万翔刘挺

机构地区哈尔滨工业大学信息检索实验室

出处《中文信息学报》 CSCD 北大核心 2007年第1期79-84,共6页 Journal of Chinese Information Processing

基金自然科学基金(60575042 60503072 60675034)

关键词计算机应用中文信息处理语义分析语义角色标注特征工程最大熵分类器 computer application Chinese information processing semantic parsing semantic role labeling feature engineering maximum entropy classifier

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1S.Pradhan,K.Hacioglu,V.Krugler,et al.Support vector learning for semantic argument classification[J].Machine Learning Journal,2005,vol.60,no.1-3,11-39.
2N.Kwon,M.Fleischman,E.Hovy.Senseval automatic labeling of semantic roles using Maximum Entropy models[A].Senseval-3:Third International Workshop on the Evaluation of Systems for the Semantic Analysis of Text[C].Barcelona,Spain:Association for Computational Linguistics,2004,129 132.
3P.Koomen,V.Punyakanok,D.Roth,et al.Generalized Inference with Multiple Semantic Role Labeling Systems[A].In:Proceedings of the Ninth Conference on Computational Natural Language Learning (CoNLL-2005)[C].Ann Arbor,Michigan:Association for Computational Linguistics,2005,181 184.
4N.Xue,M.Palmer.Annotating the Propositions in the Penn Chinese Treebank[A].In:Proceedings of the Second SIGHAN Workshop on Chinese Language Processing[C].Sapporo,Japan:2003,47 54.
5M.Palmer,D.Gildea,P.Kingsbury.The Proposition Bank:An Annotated Corpus of Semantic Roles[J].Computational Linguistics,2005,31(1),71-106.
6V.Punyakanok,D.Roth,W.Yih.The Necessity of Syntactic Parsing for Semantic Role Labeling[A].In:Proceedings of CoNLL-04[C].2004,1117-1123.
7N.Xue,M.Palmer.Calibrating features for semantic role labeling[A].In:Proc.of the EMNLP-2004[C].Barcelona,Spain:2004.
8N.Xue,M.Palmer.Automatic semantic role labeling for Chinese verbs[A].In:Proc.IJCAI2005[C].Edinburgh,Scotland:2005.
9H.Sun and D.Jurafsky.Shallow semantic parsing of Chinese[A].In:Proceedings of NAACL 2004[C].Boston,USA:2004.
10N.Xue,F.Xia.The Bracketing Guidelines for the Penn Chinese Treebank[D],IRCS Report 00-08 University of Pennsylvania,Oct 2000.

同被引文献342

1陈耀东,王挺,陈火旺.浅层语义分析研究[J].计算机研究与发展,2008,45(z1):321-325. 被引量：12
2周强.汉语句法树库标注体系[J].中文信息学报,2004,18(4):1-8. 被引量：90
3张辉,孙茜,吴晓瑜.DELMIA虚拟装配技术在飞机研制中的应用[J].航空制造技术,2012,55(1):89-91. 被引量：7
4刘永丹,曾海泉,李荣陆,胡运发.基于语义分析的倾向性文本过滤[J].通信学报,2004,25(7):78-85. 被引量：34
5白妙青,郑家恒.动词与动词搭配方法的研究[J].计算机工程与应用,2004,40(27):70-72. 被引量：3
6由丽萍,张惠春.基于规则的中文框架元素自动标注方法研究[J].情报学报,2011,30(2):166-171. 被引量：2
7江荻.现代藏语动词的句法语义分类及相关语法句式[J].中文信息学报,2006,20(1):37-43. 被引量：16
8林颖,史晓东,郭锋.一种基于概率上下文无关文法的汉语句法分析[J].中文信息学报,2006,20(2):1-7. 被引量：11
9文勖,张宇,刘挺,马金山.基于句法结构分析的中文问题分类[J].中文信息学报,2006,20(2):33-39. 被引量：82
10吕德新,张桂平,蔡东风,朱江涛.基于SVM的疑问句问点语义角色标注[J].沈阳航空工业学院学报,2006,23(1):44-46. 被引量：4

引证文献39

1丁伟伟,常宝宝.基于最大熵原则的汉语语义角色分类[J].中文信息学报,2008,22(6):20-26. 被引量：11
2陈丽江,陈小荷.统计和规则结合识别动词的跨分句论元[J].计算机工程与应用,2009,45(16):40-42.
3丁伟伟,常宝宝.基于语义组块分析的汉语语义角色标注[J].中文信息学报,2009,23(5):53-61. 被引量：24
4邵艳秋,穗志方,吴云芳.基于词汇语义特征的中文语义角色标注研究[J].中文信息学报,2009,23(6):3-10. 被引量：7
5臧翰芬,韦向峰,张全.基于HNC理论的汉语辅语义块自动辨识研究[J].微计算机应用,2009,30(11):48-54. 被引量：1
6安强强,张蕾.基于依存树的中文语义角色标注[J].计算机工程,2010,36(4):161-163. 被引量：7
7龙波,郭文.基于FrameNet的汉语语义框架网络自动构造[J].现代计算机,2010,16(2):4-7. 被引量：1
8朱译翔.中文名词性谓词的语义角色标注的研究[J].福建电脑,2010,26(9):35-37. 被引量：1
9王鑫,孙薇薇,穗志方.基于浅层句法分析的中文语义角色标注研究[J].中文信息学报,2011,25(1):116-122. 被引量：10
10李世奇,赵铁军,李晗静,刘鹏远,刘水.基于特征组合的中文语义角色标注[J].软件学报,2011,22(2):222-232. 被引量：14

二级引证文献252

1王君泽,詹若贤,李怡,杜洪涛.融合主题与细粒度情感特征的气候变化微博舆情分析研究[J].信息技术与管理应用,2023(4):87-104. 被引量：1
2刘勘,李冶,石锴文.基于句法和语义关联的科技文献“问题—方法”联合抽取模型[J].知识管理论坛,2024(4):353-366.
3洪海蓝,李文林,杨涛,李玥,梅文静.基于知识图谱的海洋中药智能问答系统的设计与实现[J].世界科学技术-中医药现代化,2023(6):1935-1941. 被引量：4
4吴婷,孔芳.基于图注意力卷积神经网络的文档级关系抽取[J].中文信息学报,2021,35(10):73-80. 被引量：12
5刘亚慧,杨浩苹,李正华,张民.一种轻量级的汉语语义角色标注规范[J].中文信息学报,2020(4):10-20. 被引量：4
6李高翡,张洋,杨新凯,毛颖颖.基于集成学习的文本情感分析研究[J].计算机应用研究,2020,37(S01):50-51. 被引量：2
7史伟,付月.突发事件中网络评论的情感-主题随时间的演变研究[J].计算机科学,2022,49(S02):195-200.
8柏晓鹏.义类标注:必要性和可行性[J].语言学论丛,2020(1):116-134.
9臧翰芬,韦向峰,张全.基于HNC理论的汉语辅语义块自动辨识研究[J].微计算机应用,2009,30(11):48-54. 被引量：1
10龙波,郭文.基于FrameNet的汉语语义框架网络自动构造[J].现代计算机,2010,16(2):4-7. 被引量：1

1丁金涛,王红玲,周国栋,朱巧明,钱培德.语义角色标注中特征优化组合研究[J].计算机应用与软件,2009,26(5):17-21. 被引量：7
2汪红林,王红玲,周国栋.语义分析中谓词标识的特征工程[J].计算机工程与应用,2010,46(9):134-137. 被引量：7
3刘虎,刘卫东,杨萍.一种基于装备画像的武器装备数据化方法[J].兵器装备工程学报,2016,37(3):59-62.
4孟令恩,何彦青,李颖.中文语义角色标注在情报分析领域的应用研究[J].情报工程,2016,2(1):43-52.
5曾德胜,黄发良,潘传迪.面向产品垃圾评论识别的特征工程[J].福建师范大学学报（自然科学版）,2017,33(2):25-31. 被引量：1
6刘挺,车万翔,李生.基于最大熵分类器的语义角色标注[J].软件学报,2007,18(3):565-573. 被引量：73
7李泽魁,赵妍妍,秦兵,刘挺.中文微博情感倾向性分析特征工程[J].山西大学学报（自然科学版）,2014,37(4):570-579. 被引量：11
8安强强,张蕾.基于依存树的中文语义角色标注[J].计算机工程,2010,36(4):161-163. 被引量：7
9李林,吴跃,叶茂.基于概率图模型的图像整体场景理解特征工程综述[J].计算机应用研究,2015,32(12):3542-3550. 被引量：5
10张晓孪.基于语义角色标注的问答系统的研究与实现[J].计算机与数字工程,2012,40(7):38-40.

中文信息学报

2007年第1期

浏览历史

内容加载中请稍等...

中文语义角色标注的特征工程被引量：39

参考文献10

同被引文献342

引证文献39

二级引证文献252

相关作者

相关机构

相关主题

浏览历史

中文语义角色标注的特征工程 被引量：39

参考文献10

同被引文献342

引证文献39

二级引证文献252

相关作者

相关机构

相关主题

浏览历史

中文语义角色标注的特征工程被引量：39