期刊文献+

基于DOM的数字图书馆Web资源信息提取服务模型之研究

DOM based Digital Library Servings for Information Extraction on the Web
下载PDF
导出
摘要 针对万维网上用于表达Web页面信息的HTML语言存在的缺点 ,提出了一种基于DOM的数字图书馆Web资源信息提取服务模型 ,即以文档对象模型DOM为基础 ,把所要提取的信息在DOM层次结构中的路径作为信息提取的“坐标” ,设计了一种归纳学习算法来半自动地生成提取规则 ,然后根据提取规则生成Java类 ,生成的Java类可以作为Web包装器软件的重要组成部分。此模型是研究异型数据源系统中组合查询处理的重要组成部分。
作者 刘平兰
机构地区 中南林学院
出处 《情报杂志》 CSSCI 北大核心 2002年第11期37-38,共2页 Journal of Intelligence
  • 相关文献

参考文献6

  • 1[1]URL:http://www. muc.saiccom[EB/OL].
  • 2[2]Florescu D, Levy A Y, Mendelzon A. Database techniques for the World-Wide Web: A Survery. In: ACM The SIGMOD Record, 1998.
  • 3[3]Pemberton S et al. XHTML 1.0: The extensible hypertext markup language.In: Http://www. w3. org/MarkUp/
  • 4[4]Cattell R G G. The Object Database Standard ODMG-93. San Matero, Cali-fornia: Morgan Kaufmann Publishers,1994
  • 5[5]Mitchell T. Machine Learning. New York: McGraw Hill,1997
  • 6[6]Birbeck M et al. Professional XML. Wrox Press Inc, 2000

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部