期刊文献+

Deep Web研究现状与展望 被引量:1

A Review on Deep Web Research and Prospects
下载PDF
导出
摘要 随着Deep Web数量和规模的快速增长,通过对其发起查询请求以得到存储在后台数据库中的相关信息,日渐成为用户获取信息的主要方式。为了方便用户有效地利用Deep Web中的信息,越来越多的研究者致力于这一领域的研究,重点之一是Deep Web后台数据库的数据集成。由于Deep Web后台数据库存储的主要是文本信息,使得从文本处理角度出发,针对Deep Web中存储的内容进行查询与检索的研究具有十分广阔的应用前景。本文对Deep Web的研究现状进行了较为详细的分析,同时对研究的发展方向进行了展望。 With the rapid increase in numbers and scales of deep web sites on the Internet,search for data or information from deep web sites by submiting queries to and obtaining results from the backend databases has become a major means in information retrieval from the Web.This area has attracted many researchers to devote their efforts on development of technologies to make better use of information in th deep web.One challenge is searching for and integration of data from various databases in deep web.Since deep web is dominated by text data,research and development of technologies for text information retrieval from deep web have a broad application potential.In this paper,we review the state-of-the-art of deep web research in details and propose some future research directions.
作者 高明 黄哲学
出处 《集成技术》 2012年第3期47-54,共8页 Journal of Integration Technology
关键词 DEEP WEB WEB数据库 查询接口 WEB数据集成 deep web web database query interface web data integration
  • 相关文献

参考文献11

二级参考文献158

  • 1王茹,宋瀚涛,陆玉昌.基于树自动机的网页数据抽取[J].北京理工大学学报,2004,24(9):790-793. 被引量:6
  • 2孟涛,闫宏飞,王继民.Web网页信息变化的时间局部性规律及其验证[J].情报学报,2005,24(4):398-406. 被引量:8
  • 3孟涛,王继民,闫宏飞.网页变化与增量搜集技术[J].软件学报,2006,17(5):1051-1067. 被引量:22
  • 4梅宏,申峻嵘.软件体系结构研究进展[J].软件学报,2006,17(6):1257-1275. 被引量:141
  • 5李海波,战德臣,徐晓飞.基于工作流引擎的构件组装体系结构[J].软件学报,2006,17(6):1401-1410. 被引量:38
  • 6Pinto D, McCallum A, Wei X. Table extraction using conditional random fields [C] //Proc of the 26th Annual Int ACM SIGIR Conf on Research and Development in Information Retrieval. New York: ACM, 2003:235-242
  • 7Wang Y, Hu J. A machine learning based approach for table detection on the Web [C]//Proc of the 11th Int Conf on World Wide Web. New York: ACM, 2002:242-250
  • 8Wang Jiying, Lochovsky F. Data extraction and label assignment for Web databases [C]//Proc of the 12th Int Conf on World Wide Web. New York: ACM, 2003:187-196
  • 9Zhai Y, Liu B. Web data extraction based on partial tree alignment [C] //Proc of the 14th Int Conf on World Wide Web. New York: ACM, 2005:76-85
  • 10Liu B, Grossman R L, Zhai Yanhong. Mining data records in Web pages [C] //Proc of the 9th Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2003: 601- 606

共引文献195

同被引文献13

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部