Java XML与面向Web的智能数据抽取被引量：8

Intelligence Data Extraction Based on Java XML and Web

下载PDF

导出

摘要采用标准Web技术———HTML,XML和Java,开发一种基于Web用Java把Web数据转换为XML的数据挖掘方法.该方法标识数据源并把它映射成XHTML,根据一定的相关关系查找数据内的引用点并进行智能数据抽取,将数据映射成XML.这种数据抽取方法比较简单,通过选择可靠的数据源以及在这些数据源中选取与内容相关但与格式无关的锚点,可以较为方便地建立一个强壮的数据抽取系统. A method for web-based data mining is developed using the standard technologies of the web--HTML,XML, and Java. convert existing web pages into XML with XML. The data extraction method is very simple only by selecting some reliable data resources and anchor-points which are dependent on those data resources and content of web pages, but independent of the form of web pages.

作者文艺刘循

机构地区四川大学计算机学院

出处《四川大学学报（自然科学版）》 CAS CSCD 北大核心 2004年第2期315-318,共4页 Journal of Sichuan University(Natural Science Edition)

关键词 XML XEITML XSL 数据抽取 XML XHTML XSL data extraction

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1HarjinderS Gll(美)著王仲谋刘书舟译.数据仓库-客户/服务器计算指南[M].北京：清华大学出版社,1997..

共引文献1

1员巧云.基于数据仓库的决策支持系统研究[J].情报探索,2005(1):3-5. 被引量：4

同被引文献43

1李云亮,李相枢.NET环境下两种Web报表解决方案的对比分析[J].计算机应用研究,2004,21(6):212-214. 被引量：21
2王娟,魏应彬.用JDOM实现数据库到XML文档的转换[J].现代计算机,2004,10(7):79-81. 被引量：1
3李旭华.基于关系数据库的XML数据存储的研究[J].嘉应学院学报,2004,22(3):61-64. 被引量：4
4钟巧华.数据仓库的数据抽取技术研究[J].计算机工程,2004,30(B12):62-63. 被引量：11
5马玉春,孙冰.半结构化信息抽取在股票交易中的应用研究[J].情报科学,2005,23(9):1376-1380. 被引量：2
6王志琪,王永成.HTML文件的文本信息预处理技术[J].计算机工程,2006,32(5):46-48. 被引量：12
7谢佳,王克峰.XML在数据交换中的应用[J].现代电子技术,2006,29(9):108-109. 被引量：2
8肖厚新,唐常杰,张婷,金朋纬,乔少杰.BTCS:基于二叉遍历的XML文档编码模式[J].四川大学学报（自然科学版）,2006,43(3):532-537. 被引量：7
9袁新颜.简析XML与HTML的结合[J].电脑知识与技术,2007(4):263-264. 被引量：1
10吕锋,余丽.基于XML的Web数据抽取研究[J].计算机技术与发展,2007,17(6):53-55. 被引量：5

引证文献8

1刘立华,叶念渝.基于XML的软件系统信息交流[J].兵工自动化,2005,24(2):43-44.
2徐正权,王治国.对工作流元模型的扩展及其应用研究[J].计算机工程与科学,2006,28(4):80-83. 被引量：2
3姜军平,褚伟丽.基于JDOM技术实现数据库和XML文档数据互换的研究[J].山东科技大学学报（自然科学版）,2006,25(3):88-91. 被引量：3
4林碧英,刘丽钦.基于XML的语义层报表模型的研究与实现[J].四川大学学报（自然科学版）,2010,47(4):723-728.
5钱程,阳小兰.HTML到XML转换研究[J].计算机与现代化,2011(8):39-41. 被引量：2
6文俊浩,向益其,李朋.ICD数据导出及代码自动生成方法研究与应用[J].四川大学学报（自然科学版）,2011,48(4):783-788.
7张志强,杨在义,叶安胜,王伟钧.股票交易数据文件的抽取算法研究[J].成都大学学报（自然科学版）,2014,33(3):262-265.
8张志强,王伟钧,郑加林,杨晋浩.一种混沌状态数据包的数据抽取算法设计与实现[J].成都大学学报（自然科学版）,2018,37(1):45-48. 被引量：1

二级引证文献8

1田世海,高长元.高技术虚拟企业运行过程元模型及应用[J].情报杂志,2007,26(5):5-9. 被引量：1
2遇运良,薛林福,张婷婷,马金苹,刘世翔.基于录井标记语言的录井资料管理信息系统[J].世界地质,2008,27(4):432-437.
3贾君枝,卫荣娟,罗林强.《汉语主题词表》XML文档的自动生成研究[J].现代图书情报技术,2009(5):50-54. 被引量：4
4卢远征,叶晓彤.XML的DOM树结构在WEB挖掘中的应用[J].四川理工学院学报（自然科学版）,2013,26(3):64-67. 被引量：2
5李超建,朱晓姝.一种基于XML的中间转码模型设计与仿真[J].微电子学与计算机,2013,30(10):161-164. 被引量：1
6叶茂华.基于工作流的某高校财务审批管理系统分析与设计[J].无线互联科技,2017,14(19):129-130. 被引量：1
7王振铎.应用JDOM实现XML动态交互的JSP实现[J].电脑知识与技术,2009,5(3X):2163-2166. 被引量：2
8余向前.基于XML的电力营销数据智能抽取方法研究[J].自动化仪表,2023,44(1):92-95. 被引量：2

1周峰.一种面向Web的数据挖掘技术研究[J].山东商业职业技术学院学报,2008,8(5):93-95.
2王亚芬.智能数据抽取技术在决策支持系统中的应用研究[J].情报学报,1996,15(2):89-94. 被引量：1
3王建丽,丁振国.一种基于XML的Web数据挖掘技术[J].西安科技学院学报,2002,22(3):337-340. 被引量：8
4董立,尤枫,赵恒永.基于用户定制的数据帧处理技术[J].计算机工程与设计,2007,28(12):3003-3005. 被引量：6
5隗华,陈晓鸥.一种格式无关的视频序列关键帧提取策略[J].计算机应用,2003,23(z1):189-190. 被引量：4
6刘勇,黄广君,郭跟成,娄颖.用ADO实现客户机和服务器端程序的代码重用[J].河南科技大学学报（自然科学版）,2003,24(3):76-78. 被引量：1
7李晓玮.浅谈Web数据挖掘技术[J].电脑知识与技术,2013,9(8):4992-4993.
8陈平昌.Delphi使用SQL查询[J].广西商业高等专科学校学报,2003,20(4):93-95.
9常波,王振友.超想-3000TB综合实验/仿真系统编程的改进[J].山东理工大学学报（自然科学版）,2006,20(1):99-102.
10冯佳捷,王瑞.中文分词技术对中文搜索引擎的查准率及查全率的影响[J].计算机光盘软件与应用,2013,16(6):184-184. 被引量：4

四川大学学报（自然科学版）

2004年第2期

浏览历史

内容加载中请稍等...

Java XML与面向Web的智能数据抽取被引量：8

参考文献1

共引文献1

同被引文献43

引证文献8

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

Java XML与面向Web的智能数据抽取 被引量：8

参考文献1

共引文献1

同被引文献43

引证文献8

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

Java XML与面向Web的智能数据抽取被引量：8