Web抽取技术在数字图书馆中的应用被引量：2

Web Extraction Technology Application in Digital Libray

下载PDF

导出

摘要从Web页面中挖掘有价值的信息是数字图书馆技术应用的一个重要方式。目前Web页面信息描述大多数是用XML表示的,Web数据抽取技术是Web信息挖掘的关键,文章提出了一种面向HTML或XML描述的Web页面的Web数据抽取模型并阐述了实现过程。 Worthy information mining from web data is important application of digital library technology, currently Web data information depiction almost uses XML. Web data extraction is a key procedure of Web information mining, This article proposes a Web data extraction model described with HTML or XML and discusses the achieving procedure.

作者宋玉忠

机构地区西华大学图书馆

出处《四川图书馆学报》 CSSCI 2009年第3期46-49,共4页 Journal of The Library Science Society of Sichuan

关键词 WEB数据抽取 HTML XML 数字图书馆信息挖掘 Web data extraction HTML XML digital library information minning

分类号 G250.7 [文化科学—图书馆学]

引文网络
相关文献

参考文献4

1谢来福,易素君,王志萍,邱立峻.使用XML实现DXF图形文件的数据挖掘[J].工程图学学报,2008,29(3):151-155. 被引量：3
2冀高峰,汤庸,道炜,吴桂宾,黄帆,王鹏.基于XML的自动学习Web信息抽取[J].计算机科学,2008,35(3):87-90. 被引量：10
3王新颖,吴钊.基于XML的Web挖掘模型研究[J].情报杂志,2008,27(6):58-59. 被引量：1
4李哲琦,张莹.基于XML的Web半结构化信息抽取[J].长春理工大学学报（自然科学版）,2007,30(1):66-68. 被引量：3

二级参考文献20

1徐振航,刘莉芹.XML与面向Web的数据挖掘技术[J].软件世界,2000(10):120-122. 被引量：16
2王新英,陈语林.数据抽取、转换、装载综述[J].企业技术开发,2004,23(8):3-5. 被引量：18
3尤玉林,张宪民.一种可靠的数据仓库中ETL策略与架构设计[J].计算机工程与应用,2005,41(10):172-174. 被引量：46
4张云.谈数据仓库建设中的ETL过程[J].计算机系统应用,2005,14(8):77-79. 被引量：3
5崔建群,何炎祥,郑世珏,吴黎兵.基于XML的Web数据挖掘关键技术的研究[J].计算机工程,2006,32(20):43-44. 被引量：10
6王新颖.Web挖掘在电子商务系统中的应用[J].商场现代化,2007(03S):81-82. 被引量：1
7Line Eikvil:网上信息抽取技术纵览
8胡东东,孟小峰.一种基于树结构的Web数据自动抽取方法
9Birbeck M,et al.XML高级编程
10黄泳瑜,徐蕙英.XML网页设计应用基础教程

共引文献13

1陈俊彬,曹树金.基于Heritrix的Web信息抽取[J].图书情报工作,2009,53(9):112-115. 被引量：6
2柳佳刚,陈山,贺令亚.基于本体和DOM相结合的Web信息抽取器[J].现代图书情报技术,2009(5):44-49. 被引量：5
3都艺兵,林培光.基于Deep Web的图书搜索引擎系统设计[J].计算机与数字工程,2009,37(9):105-106. 被引量：2
4柳佳刚,龙军,李泽军.一种用于Web信息抽取的页面信息本体自动学习方法[J].计算技术与自动化,2011,30(1):119-123. 被引量：2
5吴一占,马静,谭胜.基于本体学习与动态内容识别的信息抽取系统自优化研究[J].情报学报,2011,30(5):487-494. 被引量：1
6王存昕,蒋文蓉.针对淘宝商家客户管理系统的研究与开发[J].上海第二工业大学学报,2011,28(2):165-170. 被引量：2
7李荣,胡志军,郑家恒.基于遗传算法和隐马尔可夫模型的Web信息抽取的改进[J].计算机科学,2012,39(3):196-199. 被引量：8
8朱焱,朱凯.xScraper:基于Web-Harvest技术批量与深度获取无结构化Web信息[J].计算机科学,2012,39(12):145-148.
9杜建军,郭新宇,陆声链,温维亮,肖伯祥.基于语义驱动的日光温室图纸三维建模方法[J].农业工程学报,2013,29(A01):190-196. 被引量：2
10李文,郑邦习,邓武.基于XML和DOM技术的Web信息抽取模型[J].大连交通大学学报,2013,34(3):96-99. 被引量：1

同被引文献27

1邹凯,汪全莉.智能搜索引擎与数字图书馆个性化服务[J].情报科学,2004,22(7):874-877. 被引量：8
2史艳梅.个性化服务中挖掘用户兴趣的CMPS[J].现代图书情报技术,2005(3):85-87. 被引量：6
3黎琳,赵英.Web内容挖掘在数字图书馆中的应用[J].图书馆学研究,2006(2):19-21. 被引量：9
4潘小枫.数据挖掘技术及其在数字图书馆建设中的运用[J].图书馆理论与实践,2006(4):105-106. 被引量：14
5柳炳祥,邓欢军,高淑妍,陈欢欢.基于数据挖掘的图书馆个性化服务系统[J].现代情报,2007,27(3):108-109. 被引量：12
6曹强.图书馆个性化信息服务模型的设计与实现[J].情报杂志,2007,26(4):80-83. 被引量：25
7致斋主.云图书馆就是图书馆云[EB/OL].[2009-09-24].http://www.linhq.net/archives/48.
8杨亚华.基于知识管理与知识挖掘中的参考咨询服务探讨[J].科技情报开发与经济,2007,17(29):28-30. 被引量：3
9张英,赵艳君.数字图书馆中多媒体数据挖掘的体系结构和方法[J].现代情报,2008,28(1):92-94. 被引量：10
10欧阳烽.Web数据挖掘与高校数字图书馆个性化服务[J].现代情报,2008,28(1):103-104. 被引量：31

引证文献2

1唐吉深.图书馆数据挖掘技术研究现状述评[J].图书馆界,2011(1):42-44. 被引量：15
2李文阔,李永先.数据挖掘在数字图书馆中的应用研究综述[J].新世纪图书馆,2012(2):30-33. 被引量：10

二级引证文献24

1李文阔,李永先.数据挖掘在数字图书馆中的应用研究综述[J].新世纪图书馆,2012(2):30-33. 被引量：10
2水静,张瑞.二分网络在高校图书馆云计算中的实现研究[J].现代情报,2012,32(9):94-96. 被引量：3
3李兴建.聚类、关联规则与高校图书馆服务创新[J].边疆经济与文化,2013(4):160-161.
4杨洋,骞大闯.数据挖掘在高校图书馆的应用研究[J].兰台世界（中旬）,2013(9):36-37. 被引量：1
5宋丽花.数据挖掘技术在读者服务优化中的应用[J].现代商贸工业,2013,25(23):164-165. 被引量：3
6张瑞,水静.基于移动设备的数字图书馆检索新技术研究[J].现代情报,2013,33(11):49-51. 被引量：2
7张艳.数据和知识挖掘技术的图书馆服务策略分析[J].技术与创新管理,2014,35(4):397-400.
8厍睿.数据挖掘技术在数字化图书馆中的应用[J].电子世界,2014(15):78-78. 被引量：2
9王虹.基于大数据舆情分析的图书馆信息增值服务[J].河南图书馆学刊,2014,34(9):125-127. 被引量：2
10陈红云.浅谈数字图书馆与数据挖掘[J].无线互联科技,2014,11(10):199-199.

1马春元.Java与Web页中的图书情报应用程序小块[J].现代图书情报技术,1997(3):11-13.
2叶新友,晁成春.数据挖掘技术在高校图书馆中的应用[J].新世纪图书馆,2005(1):50-51. 被引量：14
3翁畅平.基于XML的数字图书馆信息组织[J].科技情报开发与经济,2008,18(16):12-14. 被引量：5
4余肖生.网络信息资源组织形式比较研究[J].情报杂志,2003,22(4):61-62. 被引量：2
5吴绍忠.WEB信息挖掘与公安情报收集[J].中国人民公安大学学报（自然科学版）,2006,12(4):50-53. 被引量：14
6张克菊,韩毅.关系抽取技术的发展与应用——以生物信息学为例[J].情报科学,2010,28(1):102-106. 被引量：1
7高波.电子资源引用信息的元数据抽取[J].科技情报开发与经济,2007,17(27):72-73.
8于波,宋麟.利用全文检索技术实现Web页的搜索[J].数理医药学杂志,2003,16(5):447-448.
9邢国春,贾秀华.基于Web信息资源的Multi-agent数据挖掘透明性模式研究[J].情报科学,2010,28(11):1693-1696.
10董其军.一种以用户为中心的智能化数字图书馆系统[J].四川图书馆学报,2002(2):24-28. 被引量：15

四川图书馆学报

2009年第3期

浏览历史

内容加载中请稍等...

Web抽取技术在数字图书馆中的应用被引量：2

参考文献4

二级参考文献20

共引文献13

同被引文献27

引证文献2

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

Web抽取技术在数字图书馆中的应用 被引量：2

参考文献4

二级参考文献20

共引文献13

同被引文献27

引证文献2

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

Web抽取技术在数字图书馆中的应用被引量：2