摘要
广泛地从Web获取信息是信息时代的一个重要特征。借助数据挖掘的知识,从Web日志中发现用户的访问模式,可以帮助管理站点,更好地满足用户的要求。本文介绍了从原始的日志数据中发现用户访问模式的方法,提出了数据预处理的方法和一种新的用于挖掘的数据结构——序列访问树SAT,以及基于此结构的挖掘算法。
It's an important feature of the information era to acquire information widely from Web. With the help of data mining, discovering Web logs can improve the organization of the Web sites and meet the users' purpose better. The article introduces the way of discovering user access patterns from the raw data in Web logs. It proposes the way of preprocessing data and a new data structure used in mining; i.e. Sequence Access Tree, as well as the mining algorithm based on the data structure.
出处
《广东自动化与信息工程》
2001年第4期52-55,共4页
Guangdong Automation & Information Engineering