期刊文献+

基于领域本体的文本资料聚类算法改进研究 被引量:3

Improvement of Texts Clustering Algorithm Based on the Domain-Ontology
原文传递
导出
摘要 针对由领域本体匹配产生的文本特征矩阵,描述了一种基于改进相似度计算公式的文本资料聚类算法。实验证明,当我们以生物医药领域的文本作为实验样本时,不管是从熵值还是从纯度来考虑,基于领域本体改进的聚类算法都要优于K-means算法和凝聚层次聚类算法。 This paper describes a new clustering method for texts based on an improved similarity calcula tion formula for text feature matrix which is generated by domain ontology matching.The experiment shows that: when they use texts in the field of bio-medicine as the experimental samples,the new cluster ing method for texts based on an improved similarity calculation formula is better than the K-means clus tering method and agglomerative hierarchical clustering method from entropy and purity considerations.
出处 《情报科学》 CSSCI 北大核心 2013年第6期129-134,共6页 Information Science
基金 国家自然科学基金(71201052) 湖南大学青年教师基金项目
关键词 文本挖掘 相似度 聚类 语义 text mining similarity clustering semantics
  • 相关文献

参考文献21

  • 1Feldman R, Dagan. Knowledge discovery in textual da- tabases[C].Proceedings of the First International Con- ference on Knowledge Discovery and Data Mining. Montreal Canada,1995:112-117.
  • 2刘远超,王晓龙,徐志明,关毅.文档聚类综述[J].中文信息学报,2006,20(3):55-62. 被引量:65
  • 3苏中,马少平,杨强,张宏江.基于Web-Log Mining的Web文档聚类[J].软件学报,2002,13(1):99-104. 被引量:29
  • 4Andreas H, Steffen S, Gerd S. Wordnet improves text document clustering[C]. Proceedings of the SiGIR 2003 Semantic Web Workshop. New York: ACM Press, 2003:541-544.
  • 5Christian Borgeh, Andreas Nflmberger. Experiments in Document Clustering using Cluster Specific Term Weights [C].27th German Conference on Artificial In- telligence.Ulm, Germany,2004.
  • 6孙爽,章勇.一种基于语义相似度的文本聚类算法[J].南京航空航天大学学报,2006,38(6):712-716. 被引量:18
  • 7Luo N, Zuo W L, Yuan F Y, Zhang J B, Zhang H J. Us- ing ontology semantics to improve text documents clus- tering [J]. Journal of Southeast University, 2006, (6): 370-374.
  • 8彭京,杨冬青,唐世渭,付艳,蒋汉奎.一种基于语义内积空间模型的文本聚类算法[J].计算机学报,2007,30(8):1354-1363. 被引量:44
  • 9冯少荣,肖文俊.基于语义距离的高效文本聚类算法[J].华南理工大学学报(自然科学版),2008,36(5):30-37. 被引量:15
  • 10Dino I, Kallimani V P, Lee L H. Using the self organizing map for clustering of text documents[J]. Expert Systems with Applications, 2009, (6):9584-9591.

二级参考文献154

共引文献242

同被引文献82

引证文献3

二级引证文献14

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部