期刊文献+
共找到642篇文章
< 1 2 33 >
每页显示 20 50 100
基于SVM-DT-MLP模型的Web日志异常流量检测研究 被引量:2
1
作者 魏璐露 程楠楠 《现代信息科技》 2024年第4期171-174,179,共5页
随着Web应用程序的普及,网络攻击和安全漏洞的风险日益增加。Web日志文件详细记录了网站运行信息,对日志中的流量进行分类从而检测出异常攻击流量是保障网页长期提供稳定、安全服务行之有效的方法之一。文中将Voting特征选择与Stacking... 随着Web应用程序的普及,网络攻击和安全漏洞的风险日益增加。Web日志文件详细记录了网站运行信息,对日志中的流量进行分类从而检测出异常攻击流量是保障网页长期提供稳定、安全服务行之有效的方法之一。文中将Voting特征选择与Stacking集成相结合,构建了SVM-DT-MLP模型,并将其用于Web日志异常流量检测。测试结果表明,SVM-DT-MLP模型的性能显著优于单一算法模型,其Precision(精确度)达到92.44%,Recall(召回率)达到92.43%,F1-Score(F1值)达到92.44%。这意味着该模型能够有效地检测出异常攻击流量,并在保障网页提供稳定和安全服务方面具有很好的效果。 展开更多
关键词 web日志 异常流量检测 Stacking集成 Voting特征选择 机器学习
下载PDF
结合网站内容和结构进行的Web日志挖掘 被引量:9
2
作者 江宝林 申展 +2 位作者 张川 葛家翔 胡运发 《计算机工程》 CAS CSCD 北大核心 2004年第16期30-32,共3页
提出一种以聚类为基础的Web日志挖掘方法:从Web日志事务、Web站点内容和Web站点结构3个不同方面来聚类页面集合,并通过将用户的访问记录和页面聚集进行匹配和相关度计算,来预测用户感兴趣的页面。
关键词 web日志挖掘 web日志事务 访问模式 聚类
下载PDF
Web日志挖掘技术应用研究 被引量:15
3
作者 吕佳 《重庆师范大学学报(自然科学版)》 CAS 2006年第4期39-44,共6页
随着Internet的迅速发展,W eb在人们的日常生活和工作中的地位日益显著。W eb日志挖掘就是通过对W eb日志记录的挖掘,发现用户访问的W eb页面的浏览模式,从而进一步分析和研究W eb日志记录中的规律,改进W eb站点的性能和组织结构,提供... 随着Internet的迅速发展,W eb在人们的日常生活和工作中的地位日益显著。W eb日志挖掘就是通过对W eb日志记录的挖掘,发现用户访问的W eb页面的浏览模式,从而进一步分析和研究W eb日志记录中的规律,改进W eb站点的性能和组织结构,提供个性化服务。本文首先分析了W eb日志的分布和特点,再对W eb日志挖掘中的两个阶段即数据预处理和日志挖掘算法做了详细介绍,最后对W eb日志挖掘技术做了展望。 展开更多
关键词 web日志挖掘 web日志 数据预处理 日志挖掘算法
下载PDF
Web日志挖掘系统 被引量:1
4
作者 王春霞 《河南教育学院学报(自然科学版)》 2005年第4期35-37,共3页
针对Web的日志记录进行分析,建立一个Web日志挖掘系统.网络管理人员根据Web日志的分析结果改进网站的设计,实现网站的有效管理以保证网络的安全.
关键词 web日志分析 数据挖掘 web日志挖掘系统
下载PDF
Web日志挖掘中的数据预处理技术研究
5
作者 马敏飞 《宁波广播电视大学学报》 2008年第1期120-124,共5页
对Web日志数据的预处理是Web日志挖掘的基础和关键。论文分析了Web日志挖掘处理的基本过程,分析讨论了Web日志挖掘中的数据预处理技术及其过程。
关键词 web日志 web日志挖掘 预处理
下载PDF
Web日志挖掘中的数据预处理技术研究 被引量:62
6
作者 赵伟 何丕廉 +1 位作者 陈霞 谢振亮 《计算机应用》 CSCD 北大核心 2003年第5期62-64,67,共4页
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文中深入探讨了数据预处理环节的主要任务,并介绍这个过程中一些特殊情况的处理方法。
关键词 数据挖掘 web日志挖掘 数据预处理
下载PDF
从Web日志中挖掘用户浏览偏爱路径 被引量:87
7
作者 邢东山 沈钧毅 宋擒豹 《计算机学报》 EI CSCD 北大核心 2003年第11期1518-1523,共6页
eb日志中包含了大量的用户浏览信息 ,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题 .作者在分析目前用户浏览模式挖掘算法存在的问题的基础上 ,利用提出的支持 偏爱度的概念 ,设计了网站访问矩阵 ,并基于这个矩阵提出... eb日志中包含了大量的用户浏览信息 ,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题 .作者在分析目前用户浏览模式挖掘算法存在的问题的基础上 ,利用提出的支持 偏爱度的概念 ,设计了网站访问矩阵 ,并基于这个矩阵提出了用户浏览偏爱路径挖掘算法 :先利用Web日志建立以引用网页URL为行、浏览网页URL为列、路径访问频度为元素值的网站访问矩阵 .该矩阵为稀疏矩阵 ,将该矩阵用三元组法来进行表示 .然后 ,通过对该矩阵进行支持 偏爱度计算得到偏爱子路径 .最后进行合并生成浏览偏爱路径 .实验表明该算法能准确地反映用户浏览兴趣 ,而且系统可扩展性较好 .这可以应用于电子商务网站的站点优化和个性化服务等 . 展开更多
关键词 INTERNET 拓扑结构 web日志 数据挖掘 网页浏览频度 用户浏览偏爱路径 电子商务
下载PDF
一个简单的Web日志挖掘系统 被引量:22
8
作者 杨怡玲 管旭东 +1 位作者 陆丽娜 尤晋元 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第7期932-935,共4页
在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序... 在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序列模式识别过程和算法 ,包括最大向前路径的识别和频繁遍历路径的发现 。 展开更多
关键词 数据挖掘 web日志挖掘 序列模式识别 SWLMS
下载PDF
Web日志挖掘技术进展 被引量:17
9
作者 陈新中 李岩 +2 位作者 杨炳儒 谢永红 张运涛 《系统工程与电子技术》 EI CSCD 北大核心 2003年第4期492-495,共4页
用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方... 用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方面都将起到重要的作用。概述了Web挖掘的概念、分类及其主要应用领域,详细介绍了Web日志挖掘的主要方法和用户访问模式挖掘算法及国内外最新研究进展。最后提出了Web用户访问信息挖掘研究的发展方向和趋势。 展开更多
关键词 AI 万维网 web挖掘 web日志挖掘
下载PDF
Web日志挖掘 被引量:30
10
作者 宋爱波 胡孔法 董逸生 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第1期15-18,共4页
提出了一种新颖的MBP算法 ,它利用关联规则挖掘发现的频繁项目集以加快速度 ,能找出所有满足阀值约束的频繁浏览路径 ,该算法是很有效的 .同时 ,针对Web浏览和日志文件固有的模糊性和不确定性 ,还讨论了Web页面的模糊聚类问题 .最后 。
关键词 web日志 数据挖掘 模糊聚类 推荐系统 自适应web站点 MBP算法 规则挖掘
下载PDF
Web日志挖掘中的会话识别方法 被引量:13
11
作者 周爱武 程博 +1 位作者 李孙长 夏松 《计算机工程与设计》 CSCD 北大核心 2010年第5期936-938,964,共4页
为更好地实现会话识别,从而为后续模式发现提供准确的挖掘数据,在分析现有常用的会话识别方法后,提出一种基于待挖掘站点首页的用户会话识别方法。该方法根据用户浏览站点的习惯,以站点首页作为用户新会话开始标识,并增强了用户会话的... 为更好地实现会话识别,从而为后续模式发现提供准确的挖掘数据,在分析现有常用的会话识别方法后,提出一种基于待挖掘站点首页的用户会话识别方法。该方法根据用户浏览站点的习惯,以站点首页作为用户新会话开始标识,并增强了用户会话的定义。最后利用数据库编程实现该方法,将识别出的会话存储在数据库中,便于后续数据挖掘使用。实验结果表明,该方法能识别出更多的用户会话,且识别会话的准确率也更高。 展开更多
关键词 数据预处理 web日志 会话识别 站点首页 数据库
下载PDF
基于Hadoop/Hive的web日志分析系统的设计 被引量:24
12
作者 刘永增 张晓景 李先毅 《广西大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第A01期314-317,共4页
互联网技术的迅速发展,使得web承载的信息量呈现出爆炸式增长的趋势,因此web日志的数据量也越来愈大。如何存储、处理大规模数据就成了新的挑战。云计算技术的出现,为这类问题的解决提供了一种思路。云计算将数据通过网络分布到集群的... 互联网技术的迅速发展,使得web承载的信息量呈现出爆炸式增长的趋势,因此web日志的数据量也越来愈大。如何存储、处理大规模数据就成了新的挑战。云计算技术的出现,为这类问题的解决提供了一种思路。云计算将数据通过网络分布到集群的各个计算节点上,从而完成大规模数据的存储和运算。Hadoop是一个用于构建云计算平台的流行的开源框架,广泛应用于海量数据的处理。但利用Hadoop处理数据,用户必须自己开发Map/Reduce程序。这种程序处于比较低的层次,用户不容易掌握,而且难于维护。Hive是一个基于Hadoop的开源数据仓库工具,它能够将文件映射成数据表,并提供类SQL语句,简化了用户的开发。利用Hadoop、Hive设计了一个用于处理web日志分析的系统,既充分利用了Hadoop的海量数据处理的能力,又降低了开发的难度。通过与单机实验的对比,证明系统是有效的和有价值的。 展开更多
关键词 web日志 云计算 HADOOP Hive
下载PDF
Web日志文件的异常数据挖掘算法及其应用 被引量:11
13
作者 赵泽茂 何坤金 +2 位作者 陈鹏 景雪琴 蒋霞东 《计算机工程》 CAS CSCD 北大核心 2003年第17期195-196,F003,共3页
从数量化角度给出了异常数据的一般性定义,以Web服务器日志文件数据为依据,讨论了挖掘异常数据的方法和途径;给出了基于距离的单指标的离散统计法和综合统计法,并结合校园网作了实际的分析处理。结果表明,该方法是可行的。
关键词 异常数据 数据挖掘 web日志 上网行为模式
下载PDF
Web日志挖掘中数据预处理的研究 被引量:20
14
作者 赵红玲 宋瀚涛 +1 位作者 牛振东 刘桂山 《计算机应用研究》 CSCD 北大核心 2005年第6期67-69,共3页
针对框架式页面存在的问题,对数据预处理过程进行了改进,在数据清洗和用户识别部分添加了页面过滤部分,同时对预处理过程中的页面过滤算法和用户识别策略也进行了改进。
关键词 数据挖掘 web日志挖掘 数据预处理
下载PDF
Web日志挖掘中的数据预处理技术 被引量:22
15
作者 李燕 冯博琴 鲁晓锋 《计算机工程》 CAS CSCD 北大核心 2009年第22期44-46,49,共4页
数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中... 数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中的记录引用信息较完整的情况下,该方法可以高效地获得用户的访问路径。 展开更多
关键词 web日志挖掘 数据预处理 用户会话识别 路径补充
下载PDF
基于Web日志的用户访问路径提取与分析 被引量:7
16
作者 刘颖 彭赓 +2 位作者 吕本富 陈杰 梅梅 《情报学报》 CSSCI 北大核心 2009年第4期548-556,共9页
线上购物相对线下购物的一个特点是可以将用户的购物过程记录到网站的Web日志中,为研究用户网上行为特征提供必要的数据支持。本文详细介绍了对Web日志数据进行预处理的一系列步骤和方法,并以某出版社网站18天的日志数据为实证,提取出... 线上购物相对线下购物的一个特点是可以将用户的购物过程记录到网站的Web日志中,为研究用户网上行为特征提供必要的数据支持。本文详细介绍了对Web日志数据进行预处理的一系列步骤和方法,并以某出版社网站18天的日志数据为实证,提取出用户的访问路径(访问页面的先后次序),分析路径信息得到用户在不同页面之间访问的转换概率,从而定量地衡量购物流程中各步骤之间的转换率和贡献率,提炼出用户最有可能的前向转换路径和后向转换路径,以期对网站流程优化和商品促销设置提供决策支持。 展开更多
关键词 web日志 数据预处理 访问路径 转换概率
下载PDF
Web日志挖掘技术的研究与应用 被引量:21
17
作者 肖立英 李建华 谭立球 《计算机工程》 CAS CSCD 北大核心 2002年第7期276-277,284,共3页
介绍了目前世界上两种主要的日志挖掘技术基于事务和基于数据立方体。同时,提出了一个基于日志挖掘技术的应Web (Web)Web用,即用户自适应的站点,介绍了这一系统的实现方法和主要特色。
关键词 web日志挖掘 数据挖掘 数据库 数据立方体
下载PDF
一种基于有向树挖掘Web日志中最大频繁访问模式的方法 被引量:9
18
作者 詹宇斌 殷建平 +2 位作者 张玲 龙军 程杰仁 《计算机应用》 CSCD 北大核心 2006年第7期1662-1665,共4页
提出了一种基于Apriori思想的挖掘最大频繁访问模式的s-Tree算法。该算法使用有向树表示用户会话,能挖掘出最大前向引用事务和用户的浏览偏爱路径;使用一种基于内容页面优先的支持度计算方法,能挖掘出传统算法不能发现的特定的用户访问... 提出了一种基于Apriori思想的挖掘最大频繁访问模式的s-Tree算法。该算法使用有向树表示用户会话,能挖掘出最大前向引用事务和用户的浏览偏爱路径;使用一种基于内容页面优先的支持度计算方法,能挖掘出传统算法不能发现的特定的用户访问模式;使用频繁模式树连接分层的频繁弧克服了图结构数据挖掘算法中直接连接两个频繁模式树要判断连接条件的缺点,同时采用预剪枝策略,降低了算法的开销。实验表明,s-Tree算法具有可扩展性,运行效率比直接采用图结构数据挖掘算法要高。 展开更多
关键词 web使用挖掘 最大频繁访问模式 有向树 web日志
下载PDF
基于Web日志挖掘的网站结构优化方法 被引量:12
19
作者 鲍钰 黄国兴 张召 《计算机工程》 CAS CSCD 北大核心 2003年第12期82-84,共3页
通过对Web日志信息的分析挖掘,以及辅助适量编程和两个算法:GTPFWLP(Get True Path From Web Log Path )和CBP(Confirm Backtrack Point),实现了回溯点和目标页的确定,并最终实现了网站物理结构的调整和再组织。
关键词 web日志 GTPFWLP CBP 支持度
下载PDF
基于Web日志的用户访问模式挖掘 被引量:15
20
作者 王新 马万青 潘文林 《计算机工程与应用》 CSCD 北大核心 2006年第21期156-158,共3页
Web日志挖掘是数据挖掘技术在Web日志数据存储中的应用。论文介绍了Web日志挖掘,在分析发现用户访问模式方法——类Apriori算法的基础上,给出一种基于粗糙集的用户访问模式聚类方法。
关键词 web日志挖掘 访问模式 粗糙集 聚类
下载PDF
上一页 1 2 33 下一页 到第
使用帮助 返回顶部