期刊文献+

Hidden Web信息获取 被引量:3

下载PDF
导出
摘要 如今Web上越来越多的信息可以通过查询接口获得,但为了获取某Hidden Web站点的页面,用户不得不键入一系列的关键词。由于没有直接指向Hidden Web页面的静态链接,当前大多搜索引擎不能发现和索引这些页面。然而,研究表明,由Hidden Web站点提供的高质量的信息对许多用户来说非常有价值。文章通过研究针对特定类型的表单,建立一个有效的Hidden Web爬虫,以便获取Hidden Web后台数据库信息。
出处 《计算机时代》 2007年第5期54-56,共3页 Computer Era
  • 相关文献

参考文献7

  • 1Bin He,Mitesh Patel,Zhen Zhang,Kevin Chen-Chuan Chang.Accessing the Hidden Web:A Survey,2004.
  • 2Kevin Chen-Chuan Chang, Bin He, Chengkai Li, Mitesh Patel, Zhen Zhang. Structured Databases on the Web:Observations and Implications,2004.
  • 3Ajit C.Tamhane and Dorothy D.Dunlop. Statistics and Data Analysis: From Elementary to Intermediate. Prentice-Hall,New Jersey,2000.
  • 4A.H.F. Laender, B. Ribeiro-Neto, A.S. da Silva, J.S. Teixeira,A brief survey of Web data extraction tools, SIGMOD Record 31(2),2002.
  • 5D.M. Campbell, W.R. Chen, and Randy D. Smith. Copy detection system for digital documents. In Proceedings of the IEEE Advances in Digital Libraries,pages78-88, Washington,DC, May,2000.
  • 6J.Cope, N.Craswell, and D.Hawking. Automated discovery of search interfaces on the web. In 14th Australasian conference on Database technologies,2003.
  • 7S. Raghavan, and H. Garcia-Molina. Crawling the hidden web. In VLDB, Rome, Italy, September 2001.

同被引文献29

引证文献3

二级引证文献40

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部