摘要
网络的普及以及互联网技术的发展,使得各类网络应用迅速地发展,同时,由于这些应用产生了大量可以由计算机存储和处理的文本信息。在各类信息处理领域,都需要对文本进行组织处理,其中文本聚类应用非常广泛,我们针对中文文本信息的特点,提出了一种加入《知网》语义相似度计算,利用复杂网络中小世界网络模型提取关键字表示文本并利用复杂网络中图聚类的思想的中文文本聚类算法。
By the development of network and the popularity of Internet technology,the network application is developing rapidly,at the same time,because of these applications produces a large number of text information can be storied and processed by computer.All kinds of information processing need the text processing,in which text clustering widely used is.For characters of Chinese text information,we put forward a kind of algorithm based on HowNet to calculated semantic similarity,and using small world network model to extract keyword to indicate a Chinese text,finally using graph clustering based on complex networks to clustering Chinese text.
出处
《电子测试》
2014年第2期21-23,共3页
Electronic Test
基金
国家自然科学基金项目:(Grant No.61105064)
国家自然科学基金项目:(Grant No.61203311)
陕西省自然科学基础研究计划项目:(No.2011JM8007)
西安邮电大学校青年教师科研基金ZL2013-24
关键词
复杂网络
中文文本
文本聚类
Complex network
Chinese text
Clustering algorithm for text