期刊文献+

搜索引擎中网络蜘蛛的设计与实现 被引量:8

Design and Implementation of Web Spider in Search Engine
下载PDF
导出
摘要 文章从搜索引擎的应用出发,探讨了网络蜘蛛在搜索引擎中的作用和地位,提出了网络蜘蛛的功能和设计要求。在对网络蜘蛛系统结构和工作原理所作分析的基础上,研究了线程调度、页面爬取、解析等策略和算法,并使用Java实现了一个网络蜘蛛的程序,对其运行结果做了分析。 The paper,discussing from the application of the search engine,searches the importance and function of Web spider in the search engine,and puts forward its demand of function and design.On the base of analyzing Web Spider's system structure and working elements,this paper also researches the method and strategy of multithreading scheduler,Web page crawling and HTML parsing. And then,a program of Web page crawling based on Java is applied and analyzed.
作者 刘刚 于力超
出处 《电脑与信息技术》 2007年第4期36-39,45,共5页 Computer and Information Technology
关键词 网络蜘蛛 线程池 哈希表 广度优先 Web spider thread pool Hash table breadth first
  • 相关文献

参考文献5

  • 1李晓明,闷宏飞,王继民.搜索引擎—原理、技术与系统[M].北京:科学出版社,2004.
  • 2Heaton J.网络机器人Java编程指南[M].北京:电子工业出版社,2002.
  • 3崔泽永,常晓燕.搜索引擎的Web Robot技术与优化[J].微机发展,2004,14(4):99-101. 被引量:6
  • 4Shaffer C.数据结构与算法分析(JAVA版)[M].北京:电子工业出版社,2002.
  • 5Osterloh H.TCP/IP Primer Plus[M].北京:人民邮电出版社,2000.

二级参考文献4

共引文献8

同被引文献43

引证文献8

二级引证文献18

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部