期刊文献+

基于文本聚类的多文档自动文摘研究 被引量:5

Research on Multi-Document Automatic Abstracting Based on Text Clustering
下载PDF
导出
摘要 针对当前自动文摘方法的不足,提出了基于文本聚类的自动文摘实现方法.可以克服常规自动文摘方法的不足,使文摘的质量和效果得到大大的提高.将文本聚类引入自动文摘中,不但使单文档的文摘质量得到提高,而且能够实现多文档的自动文摘,这是现有的自动文摘技术所没有涉及的.实现了面向"塑料"行业的基于文本聚类的自动文摘系统TCAAS.实验表明该方法可行, 对自动文摘系统的设计具有借鉴意义和深入研究的价值.
出处 《计算机研究与发展》 EI CSCD 北大核心 2007年第z2期140-144,共5页 Journal of Computer Research and Development
基金 国家"八六三"高技术研究发展计划基金项目(2004AA1Z2450) 国家自然科学基金项目(70572090,60305009) 华北电力大学博士学位教师科研基金项目(H0585)
  • 相关文献

参考文献10

  • 1[1]P Brown,V Della.Class-based n-gram models of natural language.Computational Linguistics,2004,30(4):477-480
  • 2[2]B Terje,A Jon.Natural language analysis for semantic document modeling.Data and Knowledge Engineering,2005,42(1):45-62
  • 3[3]R Bellman,L A Kalaba.Abstraction and pattern classification.Journal of Mathematical Analysis and Applications,2005,52(1):1-7
  • 4[4]E Charniak.Statistical Techniques for Natural Language Parsing.AI Magazine,2005,26(4):33-43
  • 5[5]A Blum,J Lafferty,M Rwebangira,et al.Cluster kernels for semi-supervised learning.In:Proc of the 21st Int'lConf on Machine Learning.2004.92-100
  • 6[6]Y Jun,L Ning,Y Qiang.Mining adaptive ratio rules from distributed data sources.Data Mining and Knowledge Discovery,2006,(12):249-273
  • 7[7]L Michael.A comparison of document clustering techniques.KDD'2000,Beijin,2000
  • 8[8]H H Bock.Probabilistic models in cluster analysis.Computational Statistics & Data Analysis,2006,33(1):5-28
  • 9[9]C Cortes,V Vapnik.Support vector networks.Machine Learning,2005,30(1):273-297
  • 10[11]A Laura,A J Weljters.A rule-based approach for process discovery:Dealing with noise and imbalance in process logs.Data Mining and Knowledge Discovery,2006,(13):67-87

同被引文献55

引证文献5

二级引证文献29

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部