-
题名基于Web日志的频繁偏爱路径挖掘算法
被引量:3
- 1
-
-
作者
蔡俊
宋顺林
-
机构
江苏大学计算机学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2009年第24期5615-5617,5621,共4页
-
文摘
为了挖掘出更能如实反映Web用户兴趣偏好的使用模式,充分考虑了用户在页面的停留时间和点击次数两个因素,给出了频繁偏爱路径的定义,并提出了频繁偏爱路径的挖掘算法,该方法在求得最大向前路径的基础上,迭代产生更长的候选频繁偏爱路径,通过计算候选路径的频繁偏爱支持度来判断其是否为频繁偏爱路径。利用真实日志数据进行实验,实验结果表明,该算法具有较高的覆盖率和准确性。
-
关键词
数据挖掘
用户会话
频繁偏爱支持度
最大向前路径
频繁偏爱路径
-
Keywords
data mining
user session
frequent and preferred support
maximum forward path
frequent and preferred path
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名读者访问序列模式的探索
- 2
-
-
作者
郑慧霞
王丽娜
钱庆
-
机构
中国医学科学院医学信息研究所
-
出处
《图书情报工作》
CSSCI
北大核心
2010年第S1期271-274,共4页
-
文摘
论述从网络日志数据中挖掘读者访问序列模式的数据准备和算法过程,初步构建了融合FS和NPPMA两种算法的Web访问序列挖掘模型。基于支持度的FS算法是网络访问序列挖掘的经典方法,但数据处理的过程和方法比较复杂,用时较长;而基于支持-偏爱度的NPPMA算法,在序列模式的计算上,同时考虑了访问频度和偏爱度,比FS算法更能准确挖掘出读者浏览的兴趣模式,而且具有数据处理简单的优点,大大节约了时间。
-
关键词
WEB日志挖掘
序列模式
数据预处理
频繁偏爱路径
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-