网站拓扑结构提取技术的研究与应用被引量：2

Research and Application of Web Topology Structure Extraction Technology

下载PDF

导出

摘要大多数的网站体积庞大、结构复杂,因此要考察与网站相关的问题比较有效的方法是进行网站信息可视化。而可视化的一个关键问题就是如何对网站拓扑结构等一些基础数据进行提取和表示。该文提出了一种网站拓扑结构及基本信息的提取方法。其中包括提取过程中一些复杂问题的解决方案、关键技术以及数据的表示和存储结构等。介绍了基于这种方法所开发的一个网站拓扑结构自动提取工具,以及利用该工具所进行的应用试验。 Most websites are voluminous and have the complex structures. So the effective way to review the questions associate with it is to make the information of website visualized. The key factor of visualization is how to extract and denote the information of the Web topology structure. This paper presents an approach to extract the Web topology and related information, which includes the solution of some complicated problem, the application of some key technologies, the denotation and storage of data. Based on the approach, the paper develops a tool to support Web topology extraction and carries out an experiment of Web topology extraction using this tool.

作者何玉宝刘正捷田晓杰

机构地区大连海事大学计算机学院欧盟可用性中国中心

出处《计算机工程》 EI CAS CSCD 北大核心 2006年第1期157-159,179,共4页 Computer Engineering

基金欧盟第5框架研发计划和国家中欧科技合作计划资助项目(IST-1999-29067)

关键词网站拓扑结构数据提取十字链表 Website Topology structure Data extraction Cross-linked list

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1Pirolli P, Pitkow J, Rao R. Silk from a Sow's Ear: Extracting Useable Structures from the Web[C]. Conference on Human Factors in Computing Systems(CHI96), Vancouver, Canada, 1996-04-13.
2Togawa S, Kanenishi K, Yano Y. Web Browsing Activity Visualization System for Administrator Assistance Using Browsing Information[C].Human-computer Interaction(Volumel). London: Lawrence Erlbaum Associates Publishers, 2003:863-867.
3Zilse R, Moraes A D. An Ergonomical Analysis of the Information Architecture of Website: Developers vs Users, a Case Study of Brazilian University's Websites[M]. Human-computer Interaction(Volume 1). London: Lawrence Erlbaum Associates Publishers, 2003:878-882.
4HyperText Markup Language(HTML)[EB/OL]. http://www.w3.org/MarkUp/, 2004-03-21.
5曹志英刘正捷刘刚.网站可用性设计指南[J].计算机世界,2001,36(89).

同被引文献7

1孙华文,王大玲,于戈,鲍玉斌,王琢.Web挖掘及个性化推荐中网站拓扑结构的获取、分析及应用[J].小型微型计算机系统,2005,26(7):1225-1228. 被引量：3
2[1]Efficiently mining tree traversal patterns in a Web environment(115-117 Vol.1)TENCON '98.1998 IEEE Region 10 International Conference Global Connectivity in Energy,Computer,Communication and Control.
3[2]Chen M.S..Data Mining for Path Traversal Patterns in a Web Environment,In International Conference on Distributed Computing Systems,U.S.A.1996.
4TANASA Doru.TROUSSE Bfigitte.Advanced data pre-processing for intersites Web usage mining[J].IEEE Intelli-gent Systems,2004(3/4):59-65.
5Chakrabarti S.Data mining for hypertext:A tutorial survey[J].SIGKDD Explorations,2000,1 (2):1-11.
6符翔,金瓯.一种WEB日志挖掘的数据预处理方法[J].计算机系统应用,2010,19(8):204-207. 被引量：3
7张健沛,刘建东,杨静.基于Web的日志挖掘数据预处理方法的研究[J].计算机工程与应用,2003,39(10):191-193. 被引量：33

引证文献2

1曹明,闪四清.基于web日志挖掘的数据预处理研究[J].科技资讯,2007,5(4):103-105. 被引量：5
2牛晓晨.Web日志挖掘中网站拓扑结构获取技术的研究[J].电脑知识与技术,2011,7(1):4-6.

二级引证文献5

1孙名松,王艳丽,唐亮.一种改进的Web日志数据预处理研究[J].自动化技术与应用,2008,27(3):23-25. 被引量：4
2金艳云,李红兵.个性化学习系统中Web日志挖掘的数据预处理[J].福建电脑,2008,24(12):157-157.
3杨富华.网络日志预处理中优化的会话识别算法[J].计算机仿真,2011,28(4):123-125. 被引量：4
4钟磊.基于网络信息的潜在恐怖分子挖掘模型仿真[J].计算机仿真,2014,31(7):313-316. 被引量：9
5夏双成.汽车气压监测传感参数高效挖掘仿真[J].计算机仿真,2014,31(8):176-179.

1牛晓晨.Web日志挖掘中网站拓扑结构获取技术的研究[J].电脑知识与技术,2011,7(1):4-6.
2刘加伶,范军.基于用户访问树的Web日志挖掘数据预处理[J].计算机科学,2009,36(9):154-156. 被引量：8
3孙华文,王大玲,于戈,鲍玉斌,王琢.Web挖掘及个性化推荐中网站拓扑结构的获取、分析及应用[J].小型微型计算机系统,2005,26(7):1225-1228. 被引量：3
4周爱武,肖云,封军.Web日志挖掘数据预处理优化[J].计算机技术与发展,2011,21(1):42-45. 被引量：4
5桑军,李丽.基于交友网站的日志挖掘和分析系统[J].数字技术与应用,2010,28(10):142-143.
6顾韵华,王兴,丁妮.Web应用安全扫描系统及关键技术研究[J].计算机工程与设计,2008,29(18):4715-4717. 被引量：7
7贝毅君,陈刚,董金祥.面向Web活跃用户的树型访问模式挖掘算法[J].浙江大学学报（工学版）,2009,43(6):1005-1013.
8孙霞.Web数据挖掘中频繁访问页组有趣性的研究[J].计算机与信息技术,2007(9):34-36. 被引量：1
9董祥和,仲丛友,董荣和.有趣Web日志关联规则挖掘算法[J].计算机工程与设计,2009,30(4):1036-1038. 被引量：3

计算机工程

2006年第1期

浏览历史

内容加载中请稍等...

网站拓扑结构提取技术的研究与应用被引量：2

参考文献5

同被引文献7

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

网站拓扑结构提取技术的研究与应用 被引量：2

参考文献5

同被引文献7

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

网站拓扑结构提取技术的研究与应用被引量：2