摘要
Web使用挖掘并不是简单地把数据挖掘算法应用在Web日志上,由于WWW体系结构的特殊性(包括Web站点上物理路径和逻辑路径的不一致),必须采用一种新的框架来处理挖掘过程。整个挖掘过程可以分为两大部分:ECLF日志预处理和在预处理后的数据集上进行挖掘。文中从应用的角度出发,在分析了这两个过程的具体流程后,给出了一个完整的Web使用模式挖掘解决方案和从Web日志中挖掘关联规则的系统原型。
Web usage mining is not a data mining algorithm in Web log,but a new framework to mine rules because of complexity and particularity of WWW(Including the inconsistency of physical route and logic route in Web).The framework includes two parts: preprocessors for ECLF log and data mining on data set.After discussing flows of usual Web usage mining,a new integral and efficient solution for Web log mining is given. At last,a prototype system used the forenamed solution to mine association rules in Web usage data is given.
出处
《微机发展》
2005年第1期33-35,共3页
Microcomputer Development