摘要
WWW已经成为世界上是大的分布式信息系统,如何快速有效地搜索用户所需的资源一直是研究热点。Web挖掘也已经成为数据挖掘中相对成熟的一个分支。本文针对Web资源搜索中利用的相关Web挖掘技术做一个综述。文章首先对目前流行的Web内容挖掘方面的常用技术进行了研究分析,然后着重研究了Web结构挖掘技术,介绍并评价了多种算法模型。接着介绍了用户使用的挖掘,并提出了Web内容挖掘技术,结构挖掘技术和用户使用挖掘相结合,应用于开发智能型搜索引擎的趋势。
WWW is now the largest distributed information system in the world, and how to find useful information is always a hot topic for researchers. Web mining has become an important branch of data mining. This paper mainly discusses mining technologies used in Web searching. The paper begins with talking about popular technologies in Web content mining, and then focuses on algorithms and models on Web structure mining. Then Web usage mining is briefly discussed. In the end the author advances that the technologies in Web content mining, Web structure mining and Web usage mining will be combined to develop intelligent search engines.
出处
《计算机科学》
CSCD
北大核心
2005年第4期37-41,共5页
Computer Science