期刊文献+

基于HTMLParser的Web文献信息提取 被引量:3

Information Extraction of Web Document Based on Htmlparser
下载PDF
导出
摘要 基于HTMLParser对网页进行解析,可抽取标签间的Link、image、meta和title等信息。使用HTMLParser来提取Web文献中的题名、关键字、摘要、作者、来源等信息,清洗后存入MySql数据库当中,以备后续数据挖掘使用。对此进行了论述。 Web anlalyzing based on HTMLParser could extract the information of Link,image,meta and title of the links.Using HTMLParser extracts the information of title,key words,abstract,author,sources,ect.in Web document,when store in MySql database after cleaning,prepare for follow-up data mining.
作者 龚真平
出处 《软件导刊》 2011年第2期14-15,共2页 Software Guide
关键词 HTMLPARSER Web文献 信息提取 HTMLParser Web Document Information Extraction
  • 相关文献

参考文献1

二级参考文献10

同被引文献18

引证文献3

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部