本地缓存和代理服务器环境下的网络日志挖掘被引量：6

Web Usage Mining Under Local Caching and Proxy Server Environment

下载PDF

导出

摘要介绍了网络日志挖掘的基本概念，提出了一个网络日志挖掘通用系统的结构，分析了本地缓存和代理服务器对日志挖掘的影响，并给出了一种近似解决方案。这种方案通过网络拓扑结构和日志文件记录的结合，将杂乱无章的日志记录组合成具有语义信息的事务记录，从而使挖掘结果更有意义。 This paper introduces the conception of Web usage mining, and gives an architecture of generic Web usage mining system， also analyzes the influence of local caching and proxy server to the mining procedure, and gives an approximate solution. Using the topology of the Web site, this solution transforms the disorder Web access logs into semantical transactions and makes the mining result more meaningful.

作者李毅李石君

机构地区武汉大学计算机学院

出处《计算机工程》 CAS CSCD 北大核心 2003年第5期46-48,共3页 Computer Engineering

基金国家自然科学基金项目(60173045) 武汉大学青年科技基金项目(9910)

关键词网络日志数据挖掘本地缓存代理服务器 WWW 计算机网络 Web log Data mining Local caching Proxy server

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1[1]Zarane O R, Xin M, Han Jiawei, Discovery Web Access Patterns and Trends by Applying OLAP and Data Mining Technology on Web Logs.1998
2[2]Mobasher B, Jain N, Han E, et al. Web Mining: Pattern Discovery from World Wide Web Transactions. Minneapolis:Techn ical Report TR 96-050,University of Minnesota, Dept. of Computer Science, 1996
3[3]Luotonen A. The Common Log File Format.http://www.w3.org/pub/WWW/, 1995

同被引文献36

1吴金,齐欢.Pentium4处理器的内存层次分析[J].微机发展,2004,14(7):47-48. 被引量：2
2易法令,谢长生,万继光1.一种新的基于RAID的CACHE技术研究与实现[J].小型微型计算机系统,2004,25(12):2173-2178. 被引量：4
3Sander J,Ester M,Kriegel H P,et al.Density based clustering in spatial databases:the algorithm GDBSCAN and its applications[J].Data Mining and Knowledge Discovery,1998,2(2):169-194.
4Ester Martin,Kriegel Hans-Peter,Sander Jorg,et al.A density-based algorithm for discovering clusers in large spatial databases with noise[C]//Proceedings of 2nd International Conference on Knowledge Discovery and Data Mining(KDD-96).1996:226-231.
5(美)RafaelC.Gonzalez,(美)RichardE.Woods,(美)StevenL.Eddins著,阮秋琦等.数字图像处理[M]电子工业出版社,2005.
6林闯.随机Petri网和系统性能评价[M]清华大学出版社,2005.
7王立新著,王迎军.模糊系统与模糊控制教程[M]清华大学出版社,2003.
8(美)JohnL.Hennessy,(美)DavidA.Patterson著,郑纬民等.计算机系统结构[M]清华大学出版社,2002.
9林闯.随机 Petri 网和系统性能评价[M]清华大学出版社,2000.
10阎平凡,张长水.人工神经网络与模拟进化计算[M]清华大学出版社,2000.

引证文献6

1王艳清,李海峰.基于XML的网络日志分析[J].北京化工大学学报（自然科学版）,2004,31(6):98-100.
2罗兵,严圣华.图像增强模糊算法的协同进化优化[J].长江大学学报（自科版）（上旬）,2006,3(2):63-66.
3易法令,周贤善.数据缓冲技术的性能分析与应用[J].长江大学学报（自科版）（上旬）,2006,3(2):67-71.
4郭运宏.数据挖掘、Web挖掘与Web日志挖掘之研究[J].郑州铁路职业技术学院学报,2006,18(2):40-42. 被引量：3
5张沫,陈基漓,阮百尧.Web日志挖掘中数据预处理技术的研究[J].计算机与数字工程,2007,35(9):90-92. 被引量：2
6庞洋,徐巧凤.基于网格分区确定DBSCAN参数的方法[J].计算机与现代化,2010(5):16-18. 被引量：4

二级引证文献9

1欧阳烽.Web数据挖掘与高校数字图书馆个性化服务[J].现代情报,2008,28(1):103-104. 被引量：31
2田倩飞,左源瑞,廖鹏.Web使用挖掘中数据预处理的研究[J].西南师范大学学报（自然科学版）,2008,33(6):79-84. 被引量：2
3孙金华,谢彦麒.Web使用挖掘日志预处理算法设计[J].现代计算机,2009,15(8):7-10. 被引量：1
4赵文,夏桂书,苟智坚,闫振兴.一种改进的DBSCAN算法[J].四川师范大学学报（自然科学版）,2013,36(2):312-316. 被引量：17
5马健.一种新的空间数据挖掘系统的分析与研究[J].安康学院学报,2014,26(2):90-92. 被引量：3
6肖宏飞.基于web日志和web内容的混合信息推送方法研究[J].黄山学院学报,2018,20(5):40-45.
7肖宏飞.基于web挖掘的网站信息推送个性化服务研究——以“网页动画设计”课程网站的信息推送为案例[J].通化师范学院学报,2018,39(8):59-63. 被引量：2
8宋金玉,郭一平,王斌.DBSCAN聚类算法的参数配置方法研究[J].计算机技术与发展,2019,29(5):44-48. 被引量：19
9刘璐,王鹏,庞泽峰.基于连续聚类算法的5G站址敏捷规划方案[J].电信工程技术与标准化,2022,35(3):68-71. 被引量：4

1李明.网络日志挖掘技术探究[J].硅谷,2010,3(14):63-64.
2刘宗成,张忠林,田苗凤.基于关联规则的网络行为分析[J].电子科技,2015,28(9):16-18. 被引量：6
3郭正恩.基于用户兴趣的个性化推荐[J].光盘技术,2009(7):19-21. 被引量：1
4杨富华.网络日志预处理中优化的会话识别算法[J].计算机仿真,2011,28(4):123-125. 被引量：4
5庄力可,寇忠宝,张长水.网络日志挖掘中基于时间间隔的会话切分[J].清华大学学报（自然科学版）,2005,45(1):115-118. 被引量：24
6张兵.一种网络日志挖掘的高效算法[J].广西师范大学学报（自然科学版）,2006,24(1):26-29. 被引量：2
7黄建明,赵文静,王星星.基于十字链表的Apriori改进算法[J].计算机工程,2009,35(2):37-38. 被引量：25
8宋广佳,张艳明.基于十字链表的Apriori算法的实现[J].赤峰学院学报（自然科学版）,2012(18):32-34. 被引量：1
9王勇,刘奕群,张敏,马少平,茹立云.基于用户兴趣分析的网页生命周期建模[J].中文信息学报,2008,22(2):76-80. 被引量：5
10曹春华.协同办公共享便笺[J].电脑爱好者,2013(1):43-43.

计算机工程

2003年第5期

浏览历史

内容加载中请稍等...

本地缓存和代理服务器环境下的网络日志挖掘被引量：6

参考文献3

同被引文献36

引证文献6

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

本地缓存和代理服务器环境下的网络日志挖掘 被引量：6

参考文献3

同被引文献36

引证文献6

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

本地缓存和代理服务器环境下的网络日志挖掘被引量：6