期刊文献+

一种基于主动学习的框架元素标注 被引量:2

Active Learning for Frame Element Labeling
下载PDF
导出
摘要 框架元素标注是中文FrameNet众多任务中亟待解决的一个问题,目前仍主要采用有监督的机器学习方法,即依赖大规模人工标注的例句作为训练语料。但例句标注又是一件费时费力的工作,所以为了降低人工标注的代价,该文将主动学习应用到框架元素标注中,优先选择训练模型预测最不准的例句交由人工标注。该文以条件随机场为标注模型,并提出了进行样本选择时所依赖的准则。实验表明,一方面,与随机选择样本进行标注相比,当使用相同数量的例句训练模型时,主动学习使框架元素标注的性能最高提升4.83%;另一方面,主动学习使框架元素标注达到同等F值时只需更少的标注例句,人工标注量最高可减少30%。 The frame element labeling still mainly adopts supervised machine learning methods,which rely on examples of large-scale artificial marked as the training corpus,in order to reduce the cost of manual annotation,this paper presentan active learning aproach,which selects the most uncertain samples for annotation instead of the whole training corpus.Experimental results show that the frame elements labeling F values rise about 4.83 percent by active learning when using the same amount of training samples.In other words,for about the same labeling performance,we only need annotate 70% of the samples as compared to the usual random selection method.
作者 屠寒非 李茹 王智强 周铁峰 TU Hanfei LI Ru WANG Zhiqiang ZHOU Tiefeng(School of Computer & Information Technology,Shanxi University,Taiyuan, Shanxi 030006,China Key Laboratory of Ministry of Education for Computation Intelligence & Chinese Information Processing, Taiyuan, Shanxi 030006, China)
出处 《中文信息学报》 CSCD 北大核心 2016年第4期44-55,共12页 Journal of Chinese Information Processing
基金 国家自然科学基金(61373082) 山西省科技基础条件平台建设项目(2014091004-0103) 山西省回国留学人员科研资助项目(2013-015) 国家863计划项目(2015AA015407) 中国民航大学信息安全测评中心开放课题基金(CAAC-ISECCA-201402)
关键词 主动学习 框架元素标注 条件随机场 不确定性度量 active learning role labeling CRFs measure of uncertainty
  • 相关文献

参考文献6

二级参考文献90

  • 1黄河燕,陈肇雄.基于多策略的交互式智能辅助翻译平台总体设计[J].计算机研究与发展,2004,41(7):1266-1272. 被引量:12
  • 2刘挺,车万翔,李生.基于最大熵分类器的语义角色标注[J].软件学报,2007,18(3):565-573. 被引量:73
  • 3宋鑫颖 周志逵.一种基于SVM的主动学习文本分类方法.计算机科学,2006,:288-290.
  • 4刘开瑛,陈雪艳,李济洪.汉语框架元素自动标注实验报告[C]//第四届全国信息检索与内容安全学术会议,2008,1:48-55,.
  • 5Olsson Fredrik.A literature survey of active machine learning in the context of natural language processing[R].Swedish Institute of Computer Science.2009.
  • 6Min Tang,Xiaoqiang Luo,Salim Roukos. Active.Learning for Statistical Natural Language Parsing[C]//Proceedings of the 40th ACL.2002:120-127.
  • 7Ion Muslea,Steven Minton,Craig A.Knoblock.Active Learning with Multiple Views[J].Journal of Artificial Intelligence Research.2006,27:203-233.
  • 8Yoav Freund,H.Sebastian Seung.Selective Sampling Using the Query by Committee Algorithm[J].Machine Learning.1997,28:133-168.
  • 9Cynthia A.Thompson,Mary Elaine Califf,Raymond J.Mooney.Active Learning for Natural Language Parsing and Information Extraction[C]//Proceedings of the Sixteenth International Conference on Machine Learning.1999:406-414.
  • 10Rebecca Hwa.Sample Selecting for Statistical Parsing[J].Computational Linguistics.2004,30 (3):253-276.

共引文献133

同被引文献7

引证文献2

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部