基于模糊聚类的分布式Web日志挖掘方法被引量：3

Distributed Web Log Mining Method Based on Fuzzy Clustering

下载PDF

导出

摘要为了提高分布式Web日志挖掘能力,提出基于模糊聚类的分布式Web日志挖掘方法.构建分布式Web日志的关联规则分布集,采用模糊信息聚类分析方法进行分布式Web日志关联规则特征聚类处理,提取分布式Web日志性的多重关联特征量,结合重叠性迭代检测方法进行分布式Web日志挖掘过程中的自适应寻优,采用模糊关联规则调度方法进行分布式Web日志挖掘的负载均衡调度.通过计算邻接点的适应度函数,对相似度高的分布式Web日志关联规则进行合并处理,根据模糊信息聚类结果实现分布式Web日志挖掘优化.仿真结果表明,采用该方法进行分布式Web日志挖掘的精度较高,提高了分布式Web日志的推荐和信息检索能力. In order to improve the ability of distributed Web log mining,a distributed Web log mining method based on association rules and fuzzy clustering is proposed.Build distributed Web log distribution set of association rules,fuzzy clustering analysis method for distributed Web information log feature clustering,association rules extraction distributed Web log multiple correlation characteristics,combined with overlaps iterative detection method for distributed adaptive optimization of the process of Web log mining,scheduling method using fuzzy association rules on distributed load balance scheduling of the Web log mining.By calculating the fitness function of the adjacency points,the distributed Web log association rules with high similarity are combined,and the distributed Web log mining optimization is realized according to the fuzzy information clustering results.Simulation results show that the precision of distributed Web log mining using this method is high,and the ability of distributed Web log recommendation and information retrieval is improved.

作者陈宝国宋旸 CHEN Baoguo;SONG Yang(School of Computer Science,Huainan Normal University,Huainan 232000,China)

机构地区淮南师范学院计算机学院

出处《太原师范学院学报（自然科学版）》 2020年第3期54-58,共5页 Journal of Taiyuan Normal University:Natural Science Edition

基金 2018年安徽高校自然科学重点研究项目(KJ2018A0469) 淮南师范学院2019年度校级科学研究项目(2019XJYB14)。

关键词关联规则模糊聚类分布式 WEB日志挖掘 association rules fuzzy clustering distributed Web logs mining

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1汤俊伟,刘家帧,李瑞轩,李伟明.Android应用软件漏洞静态挖掘技术[J].华中科技大学学报（自然科学版）,2016,44(S1):20-24. 被引量：17
2唐小川,罗亮.基于析因设计的大数据相关关系挖掘算法[J].计算机应用,2018,38(9):2507-2510. 被引量：11
3孙鲁淼.基于分布式Web应用的大数据日志分析方法研究[J].电脑知识与技术,2019,15(1X):16-19. 被引量：7
4杨潇黎,蒋廷耀,金鑫,罗神.分布式web日志处理平台的研究与实现[J].信息通信,2019,32(3):146-148. 被引量：2
5贾晓莉,吴瑞,吴思颖.并行分布式的Web访问模式双层聚类[J].计算机工程与应用,2019,55(23):216-221. 被引量：3
6刘斌.基于Hadoop的WEB日志分析系统设计[J].安徽科技学院学报,2017,31(4):67-70. 被引量：2
7赵学健,孙知信,袁源.基于预判筛选的高效关联规则挖掘算法[J].电子与信息学报,2016,38(7):1654-1659. 被引量：34
8彭亚.基于云计算的Web日志挖掘模块设计[J].电脑与信息技术,2019,27(2):39-40. 被引量：3
9王林汝,姬艳.基于城域网HTTP日志的WebShell检测方法研究[J].江苏通信,2018,34(1):55-58. 被引量：2
10金晓民,张丽萍.基于最小生成树的多层次k-Means聚类算法及其在数据挖掘中的应用[J].吉林大学学报（理学版）,2018,56(5):1187-1192. 被引量：17

二级参考文献58

1吴瑞,宁玉富.基于模糊粗糙k-均值的用户访问模式的聚类[J].系统工程理论与实践,2007,27(7):116-121. 被引量：4
2SINGLA S and MALIK A. Survey on various improved Apriori algorithms[J]. International Journal of Advanced Research in Computer and Communication Engineering, 2014, 3(11): 8528-8531.
3MINAL G I and SURYAVANSHI N Y. Association rule mining using improved Apriori algorithm[J]. International Journal of Computer Applications, 2015, 112(4): 37-42.
4RAJESWARI K. Improved Apriori algorithm A comparative study using different objective measures[J]. International Journal of Computer Science and Information Technologies, 2015, 6(3): 3185-3191.
5ACHAR A, LAXMAN S, and SASTRY P S. A unified view of the Apriori-based algorithms for frequent episode discovery[J]. Knowledge & Information Systems, 2012, 31(2): 223-250.
6AGRAWAL R and SRIKANT R. Fast algorithms for mining association rules[C]. VLDB’94 Proceedings of the 20th International Conference on Very Large Data Bases, San Francisco, CA, USA, 1994: 487- 499.
7YANG Z, TANG W, SHINTEMIROV A, et al. Association rule mining-based dissolved gas analysis for fault diagnosis of power transformers[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part C: Applications and Reviews, 2009, 39(6): 597-610.
8ZHANG F, ZHANG Y, and BAKOS J D. Gpapriori: Gpu-accelerated frequent itemset mining[C]. 2011 IEEE International Conference on Cluster Computing, Austin, TX, USA, 2011: 590-594.
9ANGELINE M D and JAMES S P. Association rule generation using Apriori mend algorithm for student’s placement[J]. International Journal of Emerging Sciences, 2012, 2(1): 78-86.
10LI N, ZENG L, HE Q, et al. Parallel implementation of Apriori algorithm based on MapReduce[C]. 13th ACIS International Conference on Software Engineering, Artificial Intelligence, Networking and Parallel Distributed Computing (SNPD), Kyoto, Japan, 2012: 236-241.

共引文献86

1刘凌旗,张炜,王洪川.世界人工智能研究储量及技术热点分析——基于2013~2018年SCIE高质量数据[J].中国电子科学研究院学报,2020,15(2):115-124.
2张登和.冶炼废渣开发利用前景探讨[J].江苏地质,2000,24(1):55-58. 被引量：8
3王敏,李万春,扶彩霞,郭昱宁.基于Apriori算法的战术数据链层次关系挖掘[J].航天电子对抗,2018,34(6):29-33. 被引量：1
4林倩瑜.云服务环境下的大数据多标签属性分类技术[J].微电子学与计算机,2019,36(2):101-104. 被引量：14
5宋扬.嵌入式无线网络公共资源优化调度仿真研究[J].计算机仿真,2016,33(11):316-319. 被引量：5
6邓红.电子商务网络营销平台的安全性分析[J].现代电子技术,2017,40(7):88-91. 被引量：6
7丁颖,王爱菊,马文越,黄继海.Web异常数据挖掘的软件开发与改进研究[J].现代电子技术,2017,40(18):32-34. 被引量：3
8李青野,李杨.光突发交换网络冲突解决机制的设计[J].激光杂志,2017,38(11):143-146. 被引量：2
9郑广成.波动状态下光纤通信网络入侵信号的提纯方法设计[J].激光杂志,2017,38(12):146-149. 被引量：4
10张永梅,郭莎,季艳,马礼,张睿.基于网络的时空同现模式挖掘算法[J].计算机科学,2018,45(3):223-230. 被引量：1

同被引文献19

1彭亚.基于云计算的Web日志挖掘模块设计[J].电脑与信息技术,2019,27(2):39-40. 被引量：3
2刘磊,孙路强,周利霞,许贺.基于Syslog的网络日志管理平台[J].电子技术与软件工程,2019(5):12-14. 被引量：4
3金晓民,张丽萍.基于最小生成树的多层次k-Means聚类算法及其在数据挖掘中的应用[J].吉林大学学报（理学版）,2018,56(5):1187-1192. 被引量：17
4杨潇黎,蒋廷耀,金鑫,罗神.分布式web日志处理平台的研究与实现[J].信息通信,2019,32(3):146-148. 被引量：2
5任启军,商秀月,王子渊.铁路综合视频监控系统安全防护研究[J].铁道通信信号,2019,55(10):49-53. 被引量：9
6康海燕,李昊.基于Web日志的性格预测与群体画像方法研究[J].郑州大学学报（理学版）,2020,52(1):39-46. 被引量：11
7张家骏,高星宇.web流量日志数据分析系统的设计与实现[J].福建电脑,2020,36(1):71-73. 被引量：1
8王玉奇,高建华.一种基于关联规则的Web应用统计测试方法[J].计算机工程,2020,46(3):206-213. 被引量：7
9诸叶刚.铁路综合视频监控系统网络安全防护体系构建思路探讨[J].铁路通信信号工程技术,2020,17(6):71-76. 被引量：10
10汪洋,王小妮.视频监控数据安全与防护系统设计[J].传感器世界,2021,27(4):15-19. 被引量：1

引证文献3

1褚龙现,陈婉冰.基于Hadoop的Web日志分析系统设计[J].信息与电脑,2020,32(20):116-118. 被引量：4
2汪明霞,艾博慧,崔宁,唐潇.基于Q/CR 783.4—2021标准的铁路视频安全平台研究[J].铁道通信信号,2023,59(11):55-61.
3艾博慧.铁路综合视频一体化安全防护平台研究[J].铁路通信信号工程技术,2024,21(2):37-42. 被引量：1

二级引证文献5

1章逢欢,胡敬超,张雯,盛颖怡,沈健,周蓓.一种基于ELK的反向代理日志分析系统设计[J].电脑编程技巧与维护,2022(6):24-26. 被引量：1
2刘恋,洪剑珂,严格知,刘云,雷洲.基于Python的海量日志数据处理应用[J].信息与电脑,2022,34(11):31-34. 被引量：1
3李林国,查君琪,赵超,叶文,李淑敬.基于Hadoop平台的大数据可视化分析实现与应用[J].西安文理学院学报（自然科学版）,2022,25(3):53-58. 被引量：11
4杨小英.数据仓库Hive搭建与应用——以网站流量统计分析为例[J].信息与电脑,2023,35(21):70-72.
5董相奎.对铁路综合视频监控安全防护的思考[J].铁路通信信号工程技术,2024,21(6):53-57.

1徐明生,张雨,周司徒,练亚东.间歇性强脉冲储能电源控制系统研究[J].电源技术,2020,44(5):762-766.
2杨斐,黄红艳.物联网环境下舰船通信数据云隐写技术[J].舰船科学技术,2019,41(24):127-129.
3李云锋,郑勇平,刘洋.基于模糊信息聚类的应急管理资源调度模型[J].智能计算机与应用,2020,10(2):255-258. 被引量：2
4邹彪,王和平,孟小前,杨国柱,叶剑锋.基于激光点云技术的架空输电线路夜间巡检系统设计[J].信息技术,2020,44(7):44-47. 被引量：8
5王承涛,黄亮,谢超,徐佳,陈飞.多客户环境下IT运维资源调度模型研究[J].环境技术,2020,38(2):195-199.
6蔡小爱.基于蚁群算法的一卡通数据精准挖掘方法[J].齐齐哈尔大学学报（自然科学版）,2020,36(4):25-28. 被引量：1
7李艳.基于ERP的智能化会计一体化内部控制系统设计[J].长春师范大学学报,2020,39(6):98-103. 被引量：1
8江凌,严雯嘉.主体与对象:媒介逻辑主导下视频博客媒介化分析[J].中国编辑,2020(4):70-74. 被引量：3
9冯巧根.CPTPP的价值定位与政策选择——企业权益维护的视角[J].财会通讯,2020(13):3-9.
10倪冰苇,赵鸿萍,顾月清.基于词云图和层次聚类的天然产物研究热点分析[J].中国新药杂志,2020(12):1326-1333. 被引量：8

太原师范学院学报（自然科学版）

2020年第3期

浏览历史

内容加载中请稍等...

基于模糊聚类的分布式Web日志挖掘方法被引量：3

参考文献10

二级参考文献58

共引文献86

同被引文献19

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于模糊聚类的分布式Web日志挖掘方法 被引量：3

参考文献10

二级参考文献58

共引文献86

同被引文献19

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于模糊聚类的分布式Web日志挖掘方法被引量：3