基于DOM的数字图书馆Web资源信息提取服务模型之研究

DOM based Digital Library Servings for Information Extraction on the Web

下载PDF

导出

摘要针对万维网上用于表达Web页面信息的HTML语言存在的缺点 ,提出了一种基于DOM的数字图书馆Web资源信息提取服务模型 ,即以文档对象模型DOM为基础 ,把所要提取的信息在DOM层次结构中的路径作为信息提取的“坐标” ,设计了一种归纳学习算法来半自动地生成提取规则 ,然后根据提取规则生成Java类 ,生成的Java类可以作为Web包装器软件的重要组成部分。此模型是研究异型数据源系统中组合查询处理的重要组成部分。

作者刘平兰

机构地区中南林学院

出处《情报杂志》 CSSCI 北大核心 2002年第11期37-38,共2页 Journal of Intelligence

关键词 DOM 信息提取 XML 提取规则数字图书馆 WEB资源

分类号 G250.76 [文化科学—图书馆学]

引文网络
相关文献

参考文献6

1[1]URL:http://www. muc.saiccom[EB/OL].
2[2]Florescu D, Levy A Y, Mendelzon A. Database techniques for the World-Wide Web: A Survery. In: ACM The SIGMOD Record, 1998.
3[3]Pemberton S et al. XHTML 1.0: The extensible hypertext markup language.In: Http://www. w3. org/MarkUp/
4[4]Cattell R G G. The Object Database Standard ODMG-93. San Matero, Cali-fornia: Morgan Kaufmann Publishers,1994
5[5]Mitchell T. Machine Learning. New York: McGraw Hill,1997
6[6]Birbeck M et al. Professional XML. Wrox Press Inc, 2000

1吴伟,刘友华.基于DOM的Web信息自动抽取[J].现代图书情报技术,2004(2):68-71. 被引量：4
2姜明强,顾君忠.基于DOM的结构化搜索引擎[J].计算机应用研究,2000,17(6):52-55. 被引量：1
3方丹琼.浅析文艺主持和新闻主播所用语言的异同[J].新闻传播,2013(9):292-292.
4李欣荣.基于DOM中间件技术在数字图书馆资源发现中的应用[J].现代情报,2007,27(2):85-86.
5窦永堂.当心新闻集中的“异型品”[J].新闻世界,2003(1):47-47.
6赵汉阳.同质异型一案三备— 一次教研活动的启示[J].少儿美术,2009(1):14-15.
7刘凡馨.基于Ajax技术的参考咨询平台的设计与实现[J].数字图书馆论坛,2006(11):46-49. 被引量：1
8沈鸥.DOAJ医学OA期刊的统计与分析[J].图书馆界,2009(4):62-65. 被引量：4
9严文昊.基于XML的Web数据挖掘在数字图书馆中的应用[J].数字图书馆论坛,2005(12):32-35.
10《知识管理论坛》被DOAJ收录[J].图书情报工作,2017,61(3):66-66.

情报杂志

2002年第11期

浏览历史

内容加载中请稍等...

基于DOM的数字图书馆Web资源信息提取服务模型之研究

参考文献6

相关作者

相关机构

相关主题

浏览历史