期刊文献+

面向信息分析的专利术语抽取研究 被引量:15

Patent Term Extraction for Information Analysis
原文传递
导出
摘要 从信息分析的实际需求出发,对与电动汽车相关的5 405条专利数据进行术语抽取、生僻术语识别和字段比较研究。结果显示关键短语抽取的方法可行,互信息抽取的术语所在文档的平均文档长度更接近集合的平均文档长度;摘要和First Claim字段的术语存在一定差别,但对分类或聚类同等重要;生僻术语识别算法能够发现生僻词和高频词的对应关系。研究结论可以为专利文本挖掘和专利信息分析提供结果和方法,并为信息分析工作提供所需的参考术语。 Based on the actual need of information analysis, this paper studies 5405 pieces of patent data about electric vehicle by term extraction, rare term recognition and field comparison. The result reveals that key-phrase extraction is feasible ; that average length of the documents containing terms ranked by mutual information is closer to one of collection; that terms in abstract and those in first claim are different to a certain extent, but of equal importance to text categorization/clustering; the algorithm of rare term recognition can find the corresponding relationship between rare words and high frequency words. This paper provides results and methods for patent text mining and patent information analysis, and provides reference for information analysis.
作者 屈鹏 王惠临
出处 《图书情报工作》 CSSCI 北大核心 2013年第1期130-135,共6页 Library and Information Service
基金 第51批中国博士后科学基金面上资助一等资助项目"科技文本信息资源中术语抽取与基于术语的分类与聚类"(项目编号:2012M510040) 中国科学技术信息研究所学科建设项目"自然语言处理"(项目编号:XK2012-6)研究成果之一
关键词 术语抽取 文本挖掘 专利 信息分析 term extraction text mining patent information analysis
  • 相关文献

参考文献12

  • 1Tseng Yuenhsien, Lin Chijen, Lin Yui. Text mining techniques for patent analysis [ J ]. Information Processing and Management, 2007, 43(5) : 1216 -1247.
  • 2曲军伟,乔晓东,桂婕.自组织映射在专利文本聚类中的应用研究[J].数字图书馆论坛,2010(9):13-19. 被引量:8
  • 3刘玉琴,朱东华,吕琳.基于文本挖掘技术的产品技术成熟度预测[J].计算机集成制造系统,2008,14(3):506-510. 被引量:24
  • 4Yoon B, Park Y. A text-mining-based patent network: Analytical tool for high-technology trend [ J ]. Journal of High Technology Management Research, 2004, 15( 1 ) : 37 -50.
  • 5韩红旗,朱东华,汪雪锋.专利技术术语的抽取方法[J].情报学报,2011,30(12):1280-1285. 被引量:24
  • 6韩红旗,安小米,朱东华,汪雪锋.专利技术术语共现的战略图分析方法[J].计算机应用研究,2011,28(2):576-579. 被引量:24
  • 7Witten I H, Paynter G W, Frank E, et al. KEA: Practical automatic keyphrase extraction [ C ]//Proceedings of the 4th ACM Conference on Digital Libraries ( DL ' 99 ). New York : ACM Press, 1999 : 254 - 255.
  • 8Kelleher D, Luz S. Automatic hypertext keyphrase detection [ C ]// Proceedings of the 19th Intemational Joint Conference on Artificial Intelligence ( IJCAI ' 05 ). San Francisco: Morgan Kaufmann Publishers Inc. , 2005 : 1608 - 1609.
  • 9E1-Behagy S R, Rafea A. KP-Miner: A keyphrase extraction system for English and Arabic documents [ J ]. Information Systems, 2009, 34(1) : 132 -144.
  • 10Mihalcea R, Tarau P. TextRank: Bringing order in text[ C/OL]// Proceedings of the 2004 Conference cm Empirical Methods in Natural Language Processing (EMNLP'04). [2011 - 10 - 18]. http://www. aclweb, org/anthology-new/W/W04/ W04-3252. pdf.

二级参考文献37

共引文献74

同被引文献308

引证文献15

二级引证文献117

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部