基于BIPL的Web频繁访问模式挖掘

Mining frequent access patterns on Web mining based on BIPL algorithm

下载PDF

导出

摘要挖掘频繁访问模式是Web日志挖掘的一个重要任务。针对类Apriori算法和GITC算法的不足,提出了基于双亲链的单次扫描求交的Web频繁访问模式挖掘算法—BIPL,该算法首先对用户的访问模式两两进行交集运算,生成候选访问模式,并在求交集过程中保存各个候选访问模式的双亲模式,然后通过简单的求和运算,计算出各个候选访问模式的支持数。最后通过理论分析和实验验证,该算法是稳定的和高效的。 Mining frequent access patterns is an important task of Web log mining.In connection with the shortage of the similar Apriori algorithm and the GITC algorithm,the paper presents BIPL algorithm which is used to mine the Web frequent access patterns.The algorithm is based on parents list and intersection,and requests to scan the database only one times.h first gets the intersections of each two access patterns and gives the birth to candidate access patterns.And the parents access patterns of each candidate access pattern are saved in the process of intersection.Then the counts of all the candidate access patterns can be calculated easily through add operational.Finally,the algorithm is proved to be stable and efficient through theoretical analysis and experimental proof.

作者吴雅双张东站

机构地区厦门大学计算机科学系

出处《计算机工程与应用》 CSCD 北大核心 2008年第23期136-138,156,共4页 Computer Engineering and Applications

基金国家自然科学基金(No.50604012)~~

关键词 WEB日志挖掘交集关系频繁访问模式 Web log mining intersection relation frequent access pattern

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1韩家炜,孟小峰,王静,李盛恩.Web挖掘研究[J].计算机研究与发展,2001,38(4):405-414. 被引量：356
2Cooley R,Mobasher B,Srivastava J.Data preparation for mining World Wide Web browsing patterns[J].Knowledge and Information Systems, 1999,1 ( 1 ).
3王新,马万青,潘文林.基于Web日志的用户访问模式挖掘[J].计算机工程与应用,2006,42(21):156-158. 被引量：15
4欧阳一鸣,郭维,郭骏,孙超超.Web挖掘中基于GITC算法发现用户频繁访问模式[J].计算机工程与应用,2007,43(7):191-194. 被引量：1
5马盈仓.挖掘关联规则中Apriori算法的改进[J].计算机应用与软件,2004,21(11):82-84. 被引量：24
6徐健辉.生成频繁项集的逻辑“与”运算算法[J].计算机应用,2004,24(11):88-90. 被引量：5
7Chen M-S,Park J-S,Yu P S.Efficient data mining for path traversal patterns[J]JEEE Transactions on Knowledge and Data Engineering, 1998,10(2).

二级参考文献24

1徐健辉.生成频繁项集的逻辑“与”运算算法[J].计算机应用,2004,24(11):88-90. 被引量：5
2马盈仓.挖掘关联规则中Apriori算法的改进[J].计算机应用与软件,2004,21(11):82-84. 被引量：24
3陈敏,欧阳一鸣,刘红樱.Web挖掘中基于RD_Apriori算法发现用户频繁访问模式[J].微电子学与计算机,2005,22(5):4-7. 被引量：5
4欧阳一鸣,汪曦东,郭骏,刘红樱.Web使用挖掘数据预处理中的会话构造[J].计算机工程与应用,2005,41(25):148-151. 被引量：11
5欧阳一鸣,陈敏,刘红樱,胡学钢.Web挖掘中发现用户访问模式算法的改进与分析[J].模式识别与人工智能,2005,18(6):728-734. 被引量：2
6范明孟小峰.数据挖掘概念与技术[M].北京:机械工业出版社,2001..
7Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large databases[C].In:Proceedings of the ACM SIGMOD Conference on Management of Data,Washington D C,1993:207 ～216
8Cooley R,Mobasher B,Srivastava J.Web mining:information and pattern discovery on the World Wide Web[C].In:Tools with Artificial Intelligence,Proceedings,Ninth IEEE International Conference,1997:558～567
9Wang J ch,Huang Y,Wu G sh et al.Web mining:knowledge discovery on the Web[C].In:Systems,Man,and Cybernetics,IEEE SMC '99Conference Proceedings,1999 IEEE International Conference,1999:137～141
10De S K,Krishan P R.Clustering web transactions using rough approximation[J].Fuzzy Sets and Systems,2004;148:131～138

共引文献392

1杨洋.Web数据挖掘的分析与探讨[J].装备制造技术,2006(5):63-64. 被引量：1
2王志明,沙莎.Web文本挖掘技术在新闻主题检测中的应用研究[J].长沙大学学报,2007,21(5):58-60. 被引量：2
3阿静.政企互动打假树维权典范——爱普生打印机胜诉“骗保门”事件[J].办公自动化,2006(14):10-11.
4董德民.面向电子商务的Web使用挖掘及其应用研究[J].中国管理信息化（综合版）,2006,9(10):83-85. 被引量：1
5杜志文,曾文华.网格计算在文本分类中的应用[J].微电子学与计算机,2006,23(z1):221-222.
6张克君,李伯群,李欣,杨炳儒.基于DWLMS模型的分布式Web用户访问模式挖掘[J].清华大学学报（自然科学版）,2005,45(S1):1762-1766. 被引量：2
7万君,耿东辉.浅说电子商务中的数据挖掘技术[J].东北大学学报（自然科学版）,2004,25(z1):194-196. 被引量：1
8许亮,李明,梁素田,侯耕.数据挖掘技术在电子商务中的应用[J].甘肃科学学报,2002,14(S1):17-20. 被引量：1
9王丽娜.Web日志挖掘技术研究[J].光盘技术,2008(4):34-36. 被引量：2
10赵娜,臧景才.多标记传播聚类算法在电子商务中的应用[J].青海大学学报（自然科学版）,2009,27(1):85-88.

1郭维.Web日志挖掘中GITC算法的改进[J].计算机工程,2008,34(4):60-62. 被引量：3
2欧阳一鸣,郭维,郭骏,孙超超.Web挖掘中基于GITC算法发现用户频繁访问模式[J].计算机工程与应用,2007,43(7):191-194. 被引量：1
3姚青山,张春霞.基于关联规则的Web使用挖掘系统[J].河南科学,2008,26(3):329-332.
4许玲凤.基于WEB的数据挖掘技术[J].中小企业管理与科技,2015(28):208-208. 被引量：1
5范敏,黄席樾,石为人.基于Web挖掘的过程模型及算法[J].计算机应用,2005,25(3):646-648. 被引量：2
6魏榴花.基于Web日志的用户访问推荐系统的研究与实现[J].电脑知识与技术（过刊）,2010,0(30):8510-8512.
7宁慧,李红宇,吴培莲.Web日志中时态约束浏览模式挖掘算法研究[J].哈尔滨工业大学学报,2008,40(9):1474-1480. 被引量：3
8李海威,李小福,樊安之.Web使用挖掘及其在电子商务中的应用研究[J].现代计算机,2010,16(8):8-12.
9刘沛骞,郭海儒,袁玲玲.Web日志挖掘中的用户访问模式识别[J].雁北师范学院学报,2006,22(2):23-25. 被引量：2
10首届全球GITC互联网技术大会即将在京举办[J].数字通信世界,2013(11):46-46.

计算机工程与应用

2008年第23期

浏览历史

内容加载中请稍等...

基于BIPL的Web频繁访问模式挖掘

参考文献7

二级参考文献24

共引文献392

相关作者

相关机构

相关主题

浏览历史