基于用户访问树的Web日志挖掘数据预处理被引量：8

Data Preprocessing in Web Log Mining Based on User Access Tree

下载PDF

导出

摘要在Web日志挖掘中数据预处理是整个挖掘过程的基础,直接影响日志挖掘的质量和结果。提出了一种基于用户访问树的Web日志挖掘数据预处理方法,该方法在处理过程中根据Web日志建立用户访问树,并利用用户访问树进行用户和事务识别,从而可以在缺乏网站拓扑结构的情况下准确地对Web日志进行预处理。 Data preprocessing is the basis of the whole process of data mining in Web log mining,which directly influences the quality of the Web log mining and its result. A method of data preprocessing in Web log mining based on the user access tree was proposed. The user access tree was created according to the Web logs in the preprocessing and it was used to identify the user and transaction. So the preprocessing can be worked well without the site topology.

作者刘加伶范军

机构地区重庆工学院重庆邮电大学计算机科学与技术学院

出处《计算机科学》 CSCD 北大核心 2009年第9期154-156,210,共4页 Computer Science

关键词 WEB日志挖掘数据预处理用户识别事务识别 Web log mining, Data preprocessing, User identification, Transaction identification

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献11

1易芝,汪林林,王练.基于关联规则相关性分析的Web个性化推荐研究[J].重庆邮电大学学报（自然科学版）,2007,19(2):234-237. 被引量：11
2纪良浩,王国胤,杨勇.基于协作过滤的Web日志数据预处理研究[J].重庆邮电学院学报（自然科学版）,2006,18(5):646-649. 被引量：9
3Pyle D.Data Preparation for Data Mining[M].San Francisco,CA:Morgan Kaufrnann Publishers Inc,1999:540.
4Cooley R,Mobasher B,Sfivastava J.Data Preparation for Mining World Wide Web Browsing Patterns[J].Journal of Knowledge and Information Systems,1999,1(1):32-57.
5代宇,刘宴兵,程瑶.基于异步Web Service调用的Web应用程序研究[J].重庆邮电大学学报（自然科学版）,2008,20(6):746-748. 被引量：6
6Marquardt C,Becker K,Ruiz D.A pre-processing tool for Web usage mining in the distance education domain[C]//Proceedings of the International Engineering and Applications Symposium (IDEAS'04).
7W.W.W.consortium.The Common Log File Format[EB/OL].http://www.w3.org/Daemon/User/Config/Logging.htmlJ HJ common-logfile-format,1995.
8费爱国,王新辉.一种基于Web日志文件的信息挖掘方法[J].计算机应用,2004,24(6):57-59. 被引量：24
9Catledge L,Pitkow J.Characterizing Browsing Behaviors on the World Wide Web[J].Computer Networks and ISCIN Systems,1995,27(6).
10Chen M S,Park J S,Yu P S.Efficient Data Mining for Path Traversal Patterns[J].IEEE Transaction on Knowledge and Data Engineering,1998,10(2):209-221.

二级参考文献36

1李凤慧.基于用户浏览行为挖掘的电子商务个性化推荐系统[J].潍坊学院学报,2004,4(2):66-67. 被引量：8
2刘建华.根据用户行为模式自动生成动态链接的方法[J].福建师范大学学报（自然科学版）,2004,20(4):32-34. 被引量：1
3向坚持,陈晓红,刘相滨,徐选华.基于Web Log的数据预处理研究[J].湖南师范大学自然科学学报,2004,27(4):33-36. 被引量：4
4庄力可,寇忠宝,张长水.网络日志挖掘中基于时间间隔的会话切分[J].清华大学学报（自然科学版）,2005,45(1):115-118. 被引量：24
5郑玲霞,李大学.基于用户聚类分析的网站导航结构智能优化研究与实现[J].重庆邮电学院学报（自然科学版）,2005,17(6):763-765. 被引量：5
6王听忠,王辉,武新梅.基于协同推荐的web日志预处理过程[J].微计算机信息,2006(01X):150-152. 被引量：4
7纪良浩,王国胤,杨勇.基于协作过滤的Web日志数据预处理研究[J].重庆邮电学院学报（自然科学版）,2006,18(5):646-649. 被引量：9
8易芝,汪林林,王练.基于关联规则相关性分析的Web个性化推荐研究[J].重庆邮电大学学报（自然科学版）,2007,19(2):234-237. 被引量：11
9胡方霞,曾一,高旻.Web Services技术应用与探讨[J].计算机科学,2007,34(3):75-77. 被引量：33
10[1]MOBASHER B,DAI H,LUO T,et al.Effective personalization based on association rule discovery from Web usage data[C]//.Proc of the 3td ACM workshop on Web information and data Management.New York:ACM Press,2001:9-15.

共引文献47

1吕佳.Web日志挖掘技术应用研究[J].重庆师范大学学报（自然科学版）,2006,23(4):39-44. 被引量：15
2王岚,翟正军.Web日志挖掘的预处理及路径补全算法的研究[J].微电子学与计算机,2006,23(8):113-116. 被引量：11
3习慧丹,严晖.概念格在Web日志挖掘中的应用[J].计算机系统应用,2006,15(9):21-24. 被引量：1
4王凯,渠芳,王辉.利用Web挖掘技术实现个性化推送服务[J].情报杂志,2006,25(11):86-88. 被引量：9
5吴绍忠.WEB信息挖掘与公安情报收集[J].中国人民公安大学学报（自然科学版）,2006,12(4):50-53. 被引量：14
6王伟伟,刘希玉,范建淑.房地产业中OLAP和数据挖掘技术的应用[J].山东师范大学学报（自然科学版）,2006,21(4):26-28. 被引量：2
7吕佳.基于免疫聚类的Web日志挖掘[J].重庆师范大学学报（自然科学版）,2007,24(2):32-35. 被引量：3
8易芝,汪林林,王练.基于关联规则相关性分析的Web个性化推荐研究[J].重庆邮电大学学报（自然科学版）,2007,19(2):234-237. 被引量：11
9吕佳.基于兴趣度的Web用户访问模式分析[J].计算机工程与设计,2007,28(10):2403-2404. 被引量：8
10梅中玲.基于Web信息挖掘的网络舆情分析技术[J].中国人民公安大学学报（自然科学版）,2007,13(4):85-88. 被引量：33

同被引文献67

1郭岩,白硕,于满泉.Web使用信息挖掘综述[J].计算机科学,2005,32(1):1-7. 被引量：50
2赵红玲,宋瀚涛,牛振东,刘桂山.Web日志挖掘中数据预处理的研究[J].计算机应用研究,2005,22(6):67-69. 被引量：20
3高卫华,谢康林.一种新的基于交叉性Web日志的事务识别算法[J].计算机仿真,2005,22(7):51-53. 被引量：3
4张小娣.一种改进的Web日志挖掘数据预处理方法[J].计算机工程与应用,2006,42(17):160-162. 被引量：5
5陈子军,王鑫昱,李伟.一种Web日志会话识别的优化方法[J].计算机工程,2007,33(1):95-97. 被引量：18
6马瑞民,李向云.Web日志挖掘中数据预处理技术的研究[J].计算机工程与设计,2007,28(10):2358-2360. 被引量：19
7李烈彪,张海鹏,周亚峰.Web日志挖掘中数据预处理方法的研究[J].计算机技术与发展,2007,17(7):45-48. 被引量：15
8熊忠阳,周亚峰.Web访问挖掘的预处理技术的研究[J].计算机技术与发展,2007,17(8):11-14. 被引量：19
9Cooley R, Mobasher B, Srivastava J. Data preparation for mining world wide web browsing patterns [ J ]. Knowledge and Information Systems, 1999,1 ( 1 ) :5-32.
10Facca F M, Lanzi P L. Mining Interesting Knowledge From Weblogs: a Survey [ J ]. Data and Knowledge Engineering, 2005,53 ( 3 ) :225-241.

引证文献8

1刘上力,赵劲强,聂勤务.Web使用挖掘中的数据预处理方法[J].郑州轻工业学院学报（自然科学版）,2010,25(4):71-74. 被引量：2
2周爱武,肖云,封军.Web日志挖掘数据预处理优化[J].计算机技术与发展,2011,21(1):42-45. 被引量：4
3曹智勇,陈妤倩.基于数据挖掘的网络教学决策支持系统研究[J].计算机光盘软件与应用,2012,15(15):269-270.
4许两有,许珠香.潜在狄利克雷分配模型在网络日志的应用[J].厦门大学学报（自然科学版）,2013,52(4):455-458.
5曾永忠,张帅,马忠权.一种基于用户会话的异常检测方法[J].计算机技术与发展,2014,24(7):141-144.
6张龙昌,张洪锐.数字资源云服务推荐系统设计[J].计算机技术与发展,2017,27(8):139-144. 被引量：1
7王钊,樊钊.基于多重特征的双层Web用户聚类方法[J].计算机应用研究,2018,35(1):93-96. 被引量：1
8王乐霞,方欢.基于K近邻的HTTP请求日志分类算法[J].赤峰学院学报（自然科学版）,2020,36(11):6-9.

二级引证文献8

1关德君.基于数据挖掘的网络教学平台决策支持系统研究[J].轻工科技,2013,29(11):74-75. 被引量：1
2李微娜,张启来,冯艳光.基于用户浏览行为的偏好兴趣挖掘推荐研究[J].中国科技博览,2012(33):187-187. 被引量：1
3曹智勇,陈妤倩.基于数据挖掘的网络教学决策支持系统研究[J].计算机光盘软件与应用,2012,15(15):269-270.
4夏青.数据挖掘中数据预处理的分析[J].科技风,2012(22):55-55.
5何源.基于本体的Web生物信息抽取方法研究[J].计算机与现代化,2013(5):172-175. 被引量：1
6罗维.web日志数据挖掘在服务器安全方面的应用探讨[J].科技创新导报,2017,14(24):155-155.
7周景.基于商业智能WLAN的用户画像分析系统的设计及应用[J].微型电脑应用,2019,35(8):143-145. 被引量：4
8刘岩.基于机器学习算法的图书馆书目协同推荐系统[J].现代电子技术,2020,43(14):180-182. 被引量：4

1牛晓晨.Web日志挖掘中网站拓扑结构获取技术的研究[J].电脑知识与技术,2011,7(1):4-6.
2何玉宝,刘正捷,田晓杰.网站拓扑结构提取技术的研究与应用[J].计算机工程,2006,32(1):157-159. 被引量：2
3孙华文,王大玲,于戈,鲍玉斌,王琢.Web挖掘及个性化推荐中网站拓扑结构的获取、分析及应用[J].小型微型计算机系统,2005,26(7):1225-1228. 被引量：3
4周爱武,肖云,封军.Web日志挖掘数据预处理优化[J].计算机技术与发展,2011,21(1):42-45. 被引量：4
5桑军,李丽.基于交友网站的日志挖掘和分析系统[J].数字技术与应用,2010,28(10):142-143.
6顾韵华,王兴,丁妮.Web应用安全扫描系统及关键技术研究[J].计算机工程与设计,2008,29(18):4715-4717. 被引量：7
7贝毅君,陈刚,董金祥.面向Web活跃用户的树型访问模式挖掘算法[J].浙江大学学报（工学版）,2009,43(6):1005-1013.
8孙霞.Web数据挖掘中频繁访问页组有趣性的研究[J].计算机与信息技术,2007(9):34-36. 被引量：1
9董祥和,仲丛友,董荣和.有趣Web日志关联规则挖掘算法[J].计算机工程与设计,2009,30(4):1036-1038. 被引量：3

计算机科学

2009年第9期

浏览历史

内容加载中请稍等...

基于用户访问树的Web日志挖掘数据预处理被引量：8

参考文献11

二级参考文献36

共引文献47

同被引文献67

引证文献8

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于用户访问树的Web日志挖掘数据预处理 被引量：8

参考文献11

二级参考文献36

共引文献47

同被引文献67

引证文献8

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于用户访问树的Web日志挖掘数据预处理被引量：8