期刊文献+

文本内容主题的识别方法 被引量:8

An Approach to Text Topic Identification
下载PDF
导出
摘要 提出了一种基于知识的内容主题识别方法 ,其中采用基于统计和规则的技术进行主题特征识别 ,利用集聚公式进行主题特征集聚分析·通过引入领域知识库 ,将基于词汇的分析技术提升到领域知识计算层面·实验结果显示主题识别平均正确率为 70 % · A knowledge based approach to text topic identification was presented. The approach applies statistic based and knowledge based techniques in topic feature identification. The aggregation formulas are used in topic feature aggregation. Domain knowledge base is used to upgrade topic identification technique from lexical analysis to domain knowledge analysis. Experiment results show that the average accuracy of topic identification reaches 70% by this approach.
出处 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第5期425-427,共3页 Journal of Northeastern University(Natural Science)
基金 国家"八六三"高技术计划项目 (863 3 0 1 7 7 B)
关键词 主题分析 特征识别 特征集聚 领域知识 文本自动处理 自动语言处理 知识 内容识别 topic identification feature identification feature aggregation domain knowledge text automatic processing natural language processing
  • 相关文献

参考文献2

  • 1林鸿飞,高天,姚天顺.中文文本的可视化表示[J].东北大学学报(自然科学版),2000,21(5):501-504. 被引量:7
  • 2朱靖波.面向英汉机器翻译的统计消岐技术研究[M].沈阳:东北大学,1999..

二级参考文献2

共引文献6

同被引文献68

  • 1许建潮,胡明.中文Web文本的特征获取与分类[J].计算机工程,2005,31(8):24-25. 被引量:24
  • 2罗杰,陈力,夏德麟,王凯.基于新的关键词提取方法的快速文本分类系统[J].计算机应用研究,2006,23(4):32-34. 被引量:17
  • 3贾焰,王永恒,杨树强.基于本体论的文本挖掘技术综述[J].计算机应用,2006,26(9):2013-2015. 被引量:17
  • 4Boykin S, Merlino A. Machine learning of event segmentation for news on demand[J ]. Communications of the ACM, 2000,43(2) :35 - 41.
  • 5Luhn H P. A statistical approach to mechanized encoding and searching of literary information[J ]. IBM Journal, 1957, l0(1):309-317.
  • 6Edmundson H. New methods in automatic extracting [J]. Journal of the ACM, 1969,16 (2) : 264 - 285.
  • 7Salton G, James A, Buckley C. Automatic analysis, theme generation, and summarization of nmchine-readable texts[J]. Science, 1994,264 (3) : 1421 - 1426.
  • 8Lehnert W, Loiselle C. An introduction to plot unit[A]. Semantic Structures-advances in Natural Language Processing [C]. Hillsdale: Lawrence Erlbaum Associates, 1989.88 - 111.
  • 9Hearst A. Context and structure in autmnated full-text information accesx [ D]. Berkeley: University of California,1994.
  • 10Peter W F. Latent semantic analysis for text-based research, behavior research methods[ J ]. lnstruments and Computers,1996,28(2) : 197 - 202.

引证文献8

二级引证文献32

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部