期刊文献+

Deep Web数据集成中的实体识别方法 被引量:4

Entity Identification for Deep Web Data Integration
下载PDF
导出
摘要 互联网上存在着大量可访问的Web数据库,不同web数据库之间存在着内容上的重叠.来自不同web数据库的记录虽然在网页上的表现形式不同,但是可能描述的是同一实体.因此实体识别是Deep web数据集成中数据合并过程里一个必不可少的环节,而且是一个很具有挑战性的工作.对该问题进行了深入的探讨,提出了一种新颖的方法自动完成实体识别,该方法克服了传统的实体识别工作以模式匹配为前提的弊端,并且与领域无关.实验表明,该方法在Deep web环境下可以达到相当高的准确性.
出处 《计算机研究与发展》 EI CSCD 北大核心 2006年第z3期46-53,共8页 Journal of Computer Research and Development
基金 国家自然科学基金项目(60573091,60273018) 国家自然科学基金面上项目(60573091) 国家"九七三"重点基础研究发展规划基金项目(2003CB317000) 教育部科学技术重点基金项目(03044) 教育部新世纪优秀人才支持计划基金项目
  • 相关文献

参考文献7

  • 1[1]Kevin Chen-Chuan Chang,Bin He,Chengkai Li,et al.Structured databases on the Web:Observations and implications.SIGMOD Record,2004,33(3):61-70
  • 2[2]W Frakes,R Baeza-Yates.Information Retrieval:Data Structures and Algorithms.Englewood Cliffs,NJ:Prentice Hall,1992
  • 3[3]W William.Cohen:Integration of heterogeneous databases without common domains using queries based on textual similarity.SIGMOD Conf,Seattle,Washington,1998
  • 4[4]Sunita Sarawagi.Anuradha bhamidipaty.Interactive deduplication using active learning.KDD,Edmonton,Alberta,Canada,2002
  • 5[5]E Winkler.The state of record linkage and current research problems.http://www.census.gov/srd/www/hyyear.html,1999
  • 6[6]Sheila Tejada,Craig A Knoblock,Steven Minton.Learning domain-independent string transformation weights for high accuracy object identification.KDD,Acapulco,Mexico,2002
  • 7[7]A Doan A,Y Lu,Y Lee,et al.Object matching for information integration:A profiler-based approach.IIWeb,2003

同被引文献45

引证文献4

二级引证文献31

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部