摘要
提出了一种基于知识的内容主题识别方法 ,其中采用基于统计和规则的技术进行主题特征识别 ,利用集聚公式进行主题特征集聚分析·通过引入领域知识库 ,将基于词汇的分析技术提升到领域知识计算层面·实验结果显示主题识别平均正确率为 70 % ·
A knowledge based approach to text topic identification was presented. The approach applies statistic based and knowledge based techniques in topic feature identification. The aggregation formulas are used in topic feature aggregation. Domain knowledge base is used to upgrade topic identification technique from lexical analysis to domain knowledge analysis. Experiment results show that the average accuracy of topic identification reaches 70% by this approach.
出处
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2002年第5期425-427,共3页
Journal of Northeastern University(Natural Science)
基金
国家"八六三"高技术计划项目 (863 3 0 1 7 7 B)
关键词
主题分析
特征识别
特征集聚
领域知识
文本自动处理
自动语言处理
知识
内容识别
topic identification
feature identification
feature aggregation
domain knowledge
text automatic processing
natural language processing