摘要
从Web页面中挖掘有价值的信息是数字图书馆技术应用的一个重要方式。目前Web页面信息描述大多数是用XML表示的,Web数据抽取技术是Web信息挖掘的关键,文章提出了一种面向HTML或XML描述的Web页面的Web数据抽取模型并阐述了实现过程。
Worthy information mining from web data is important application of digital library technology, currently Web data information depiction almost uses XML. Web data extraction is a key procedure of Web information mining, This article proposes a Web data extraction model described with HTML or XML and discusses the achieving procedure.
出处
《四川图书馆学报》
CSSCI
2009年第3期46-49,共4页
Journal of The Library Science Society of Sichuan