摘要
针对万维网上用于表达Web页面信息的HTML语言存在的缺点 ,提出了一种基于DOM的数字图书馆Web资源信息提取服务模型 ,即以文档对象模型DOM为基础 ,把所要提取的信息在DOM层次结构中的路径作为信息提取的“坐标” ,设计了一种归纳学习算法来半自动地生成提取规则 ,然后根据提取规则生成Java类 ,生成的Java类可以作为Web包装器软件的重要组成部分。此模型是研究异型数据源系统中组合查询处理的重要组成部分。
出处
《情报杂志》
CSSCI
北大核心
2002年第11期37-38,共2页
Journal of Intelligence