期刊文献+

基于HMM的加权Textrank单文档的关键词抽取算法 被引量:12

Weighted Textrank keyword extraction single document based on hidden Markov model
下载PDF
导出
摘要 文中介绍了现有几种比较流行的关键词提取技术,提出了基于隐马尔科夫模型的加权Textrank的单文档关键词抽取算法。对比分析了三种算法的效果:基于词频的关键词提取算法,基于词性、位置、频度的关键词提取算法,加权Textrank算法。实验结果表明加权Textrank算法在单文档提取中有较好的效果,并且在单篇文章提取较少的关键词时准确率较高。 The article introduces several existing popular keyword extraction techniques,and puts forward a single document keyword extraction algorithm based on weighted Textrank based on hidden Markov model. Specifically,it includes comparative analysis of keyword extraction based on word frequency algorithm; comparative analysis of keyword extraction based on POS,location,frequency of keyword extraction algorithm; weighted Textrank algorithm results. The experiments show that the weighted Textrank algorithm has good performances in a single document extraction,and the extraction of keywords in less accuracy rate is high.
作者 方康 韩立新
出处 《信息技术》 2015年第4期114-116,120,共4页 Information Technology
关键词 抽取 隐马尔科夫模型 加权Textrank keyword extraction hidden Markov model weighted Textrank
  • 相关文献

参考文献6

  • 1Warme D M,Winter P,Zacharisen M.Exact Algorithms for Plane Steiner Tree Problems;A Computational Study[R].Technical Report:DIKU-TR-98/11,1998:119-125.
  • 2张瑾.基于改进TF-IDF算法的情报关键词提取方法[J].情报杂志,2014,33(4):153-155. 被引量:63
  • 3朱颖.浅谈HMM在词性标注中的应用[J].电脑开发与应用,2011,24(3):52-55. 被引量:3
  • 4Mihalcea R,Tarau P.TextRank:Bringing order into texts[C].Stroudsburg:ACL,2004.
  • 5Cormode G,Garofalakis M.Sketching probabilistic data streams[C].New York:ACM,2007:281-292.
  • 6Page L,Brin S,Motwani R,et al.The PageRank citation ranking:bringing order to the Web[C].7th International World Wide Web Conference,1998.

二级参考文献14

  • 1董梅,胡学钢.基于多特征选择的中文文本分类[J].计算机技术与发展,2007,17(7):117-119. 被引量:11
  • 2王蕾,杨季文.汉语未登录词识别现状及一种新识别方法介绍[J].计算机应用与软件,2007,24(8):213-215. 被引量:3
  • 3Lawrence R Babiner. A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition[C]. Proceedings of the IEEE, 1989, 77 (2) :45-47.
  • 4Garside R, Leech G. The Computational Analysis of English: A Corpus-based Approach [M ]. London.. Longman, 1989.
  • 5Rahiner L R. A Tutorial on Hidden Markov Models and Selected Application in Speech Recognition[C]// Proc IEEE, 1989: 257-286.
  • 6曾元显.关键词自动提取技术与相关词反馈.中国图书馆学报,1997,.
  • 7李原.中文文本分类中分词和特征选择方法研究[D].长春:吉林大学,2011.
  • 8Gerard Salton, Christopher Buckley. Term-weighting Approaches iu Automatic Text Retrieval [ J ]. Information Processing & Man- agement, 1988, 24(5 ) :513-523.
  • 9章成志.自动标引研究的回顾与展望[J].现代图书情报技术,2007(11):33-39. 被引量:39
  • 10沈志斌,白清源.文本分类中特征权重算法的改进[J].南京师范大学学报(工程技术版),2008,8(4):95-98. 被引量:14

共引文献64

同被引文献122

引证文献12

二级引证文献120

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部