期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于Android和网页解析的教务系统设计与实现
1
作者 郭一晶 李兆才 《计算机时代》 2014年第6期38-40,43,共4页
介绍了基于Android系统开发的教务系统。该系统可帮助厦门大学嘉庚学院教师Android用户便捷访问教务系统和校园资源。在Eclipse开发环境下,使用Http通信协议、开源jsoup解析、json解析和SQLite数据库等开发技术完成系统开发,系统主要功... 介绍了基于Android系统开发的教务系统。该系统可帮助厦门大学嘉庚学院教师Android用户便捷访问教务系统和校园资源。在Eclipse开发环境下,使用Http通信协议、开源jsoup解析、json解析和SQLite数据库等开发技术完成系统开发,系统主要功能包括查询课程表、查询课程班信息、查看考试安排、查看今日课程、查看天气、查看开课通知单、查询学生评教、查看学院新闻和摇一摇点名等。 展开更多
关键词 教务系统 ANDROID平台 网页解析 SQLITE数据库
下载PDF
领域本体驱动的招投标网页解析方法 被引量:2
2
作者 马冬雪 宋设 +1 位作者 谢振平 刘渊 《计算机应用》 CSCD 北大核心 2020年第6期1574-1579,共6页
针对正则表达式解析招投标网页效率低下的问题,提出了一种基于招投标领域本体的网页自动化解析新方法。首先,分析了招投标网页文本的结构特征;其次,构建了招投标本体的轻量级领域知识模型;最后,给出一种招投标网页元素语义匹配与抽取算... 针对正则表达式解析招投标网页效率低下的问题,提出了一种基于招投标领域本体的网页自动化解析新方法。首先,分析了招投标网页文本的结构特征;其次,构建了招投标本体的轻量级领域知识模型;最后,给出一种招投标网页元素语义匹配与抽取算法,实现招投标网页的自动化解析。实验结果表明,新方法通过自适应的解析,准确率、召回率分别可达到95.33%、88.29%,与正则表达式方法相比,分别提高了3.98个百分点和3.81个百分点。所提方法可实现自适应地对招投标网页中语义信息的结构化解析抽取,能够较好地满足实用性能要求。 展开更多
关键词 招投标 领域本体 网页解析 解析模型 知识图谱
下载PDF
Android解析网页课表的算法设计与实现
3
作者 申圣兵 姚方元 《电脑知识与技术》 2016年第4X期215-216,共2页
该文通过对常见校园APP中提取网页课表的技术进行了分析,介绍了其核心的算法及具体实现,最后提出了进一步完善的方法。
关键词 校园APP 网页课表 网页解析
下载PDF
HtmIParser提取网页信息的设计与实现 被引量:6
4
作者 黄颖 黄治平 《江西理工大学学报》 CAS 2007年第6期26-28,35,共4页
互联网上信息量的激增,迫切需要一些自动化的工具帮助人们在海量信息源中迅速找到真正需要的信息,如标题、链接、email和图片等,而HTML语言所表述的web页面经浏览器分析后只适合浏览,不适合作为一种数据交换的方式由机器处理,文中详细... 互联网上信息量的激增,迫切需要一些自动化的工具帮助人们在海量信息源中迅速找到真正需要的信息,如标题、链接、email和图片等,而HTML语言所表述的web页面经浏览器分析后只适合浏览,不适合作为一种数据交换的方式由机器处理,文中详细介绍了如何使用HtmlParser来提取网页当中的超链接信息,将其清洗后存入SQL数据库当中,以备后续工作使用。 展开更多
关键词 HTMLPARSER 信息提取 网页解析
下载PDF
基于HtmlParser的网页信息提取 被引量:4
5
作者 李伟 黄颖 《兵工自动化》 2007年第7期41-41,56,共2页
基于HTMLParser对HTML进行网页解析,可抽取标签间的Link、image、meta和title等信息。即使用HtmlParser来提取网页当中的超链接信息,提取首页URL信息,分析所有URL对应的页面并提取Link信息,信息清洗后存入SQL数据库当中,以备后续工作使用。
关键词 HTMLPARSER 信息抽取 网页解析
下载PDF
基于模拟登录数据抓取与解析技术的WEB应用系统集成方式研究 被引量:1
6
作者 韦智勇 《北京印刷学院学报》 2017年第4期35-37,共3页
目目前不同应用系统集成主要采用开发专用接口、面向SOA服务等传统的集成框架进行,存在周期长、成本高昂、费用高、复杂度高等问题。本文在分析模拟登录web数据抓取与解析技术的原理及实现框架基础上,设计了一种应用系统抓取数据排队算... 目目前不同应用系统集成主要采用开发专用接口、面向SOA服务等传统的集成框架进行,存在周期长、成本高昂、费用高、复杂度高等问题。本文在分析模拟登录web数据抓取与解析技术的原理及实现框架基础上,设计了一种应用系统抓取数据排队算法,最后提出一种基于B/S模拟登录数据抓取与解析技术的web应用系统集成方法。该应用集成方法在某电网企业多个web应用系统集成的应用取得良好效果,验证了技术的可行性。且该技术在开发周期、成本、难度等方面优于现有的应用系统集成方式。 展开更多
关键词 应用系统集成 模拟登录 数据抓取 网页解析 排队算法
下载PDF
热销图书爬取数据的BeautifulSoup库解析 被引量:2
7
作者 鞠慧 《福建电脑》 2021年第5期133-134,共2页
BeautifulSoup库是python语言关于网络爬虫爬取页面解析的第三方库。它能根据html、xml以及html5lib语法建立解析树,进而高效解析网页内容。本文从基本元素、网页内容遍历提取方法入手介绍BeautifulSoup库的工作原理,并结合电商平台最... BeautifulSoup库是python语言关于网络爬虫爬取页面解析的第三方库。它能根据html、xml以及html5lib语法建立解析树,进而高效解析网页内容。本文从基本元素、网页内容遍历提取方法入手介绍BeautifulSoup库的工作原理,并结合电商平台最新的图书销售数据为实例,进行爬取信息的解析展示。 展开更多
关键词 网络爬虫 网页解析 BeautifulSoup库
下载PDF
基于Web的新闻文本分类技术的研究 被引量:7
8
作者 胡凌云 胡桂兰 +1 位作者 徐勇 李龙澍 《安徽大学学报(自然科学版)》 CAS 北大核心 2010年第6期66-70,共5页
从Web新闻网页中挖掘出有用的知识是当前研究的热点问题,将Web新闻网页进行解析,在此基础上进行Web新闻文本分类处理,可在一定程度上解决此问题.针对Web新闻网页的结构特点,提出了基于Web的新闻文本分类系统的实现框架.实验结果表明,基... 从Web新闻网页中挖掘出有用的知识是当前研究的热点问题,将Web新闻网页进行解析,在此基础上进行Web新闻文本分类处理,可在一定程度上解决此问题.针对Web新闻网页的结构特点,提出了基于Web的新闻文本分类系统的实现框架.实验结果表明,基于KNN算法的分类系统具有较好的分类效果. 展开更多
关键词 网页解析 文本 分类
下载PDF
盲人浏览器的设计与实现 被引量:11
9
作者 董清富 《计算机工程》 CAS CSCD 北大核心 2001年第2期110-111,共2页
以中文为主要语言的万维网网络资源日益丰富,然而视障者由于视觉上的不便在使用这些资源时存在诸多困难,如无法直接"浏览"网页内容,无法使用鼠标点击超链接,等等。盲人浏览器就是为了帮助视障者更好地使用这些资源而设计... 以中文为主要语言的万维网网络资源日益丰富,然而视障者由于视觉上的不便在使用这些资源时存在诸多困难,如无法直接"浏览"网页内容,无法使用鼠标点击超链接,等等。盲人浏览器就是为了帮助视障者更好地使用这些资源而设计实现的。盲人浏览器有以下特点:通过语音合成技术,将网页中所有的文本内容朗读出来;用键盘"点击"超链接实现网页跳转;针对中文用户特点设计了多种功能。盲人浏览器经过多方测试和不断完善,现在已有成熟产品。 展开更多
关键词 盲人浏览器 人机接口 网页朗读 网页解析 WWW 设计
下载PDF
基于Python的健康数据爬虫设计与实现 被引量:9
10
作者 程增辉 夏林旭 刘茂福 《软件导刊》 2019年第2期60-63,共4页
在网络健康资讯研究中,数据获取是首先要解决的问题,但传统抓取工具无法满足多变的数据源,研究高效爬取健康资讯内容新方法迫在眉睫。基于Python的网络健康资讯抓取方案,整合多个数据源,抓取内容更为全面;利用WebDriver和Python的Selen... 在网络健康资讯研究中,数据获取是首先要解决的问题,但传统抓取工具无法满足多变的数据源,研究高效爬取健康资讯内容新方法迫在眉睫。基于Python的网络健康资讯抓取方案,整合多个数据源,抓取内容更为全面;利用WebDriver和Python的Selenium库,能够较好地应对复杂网络状况,通过多线程技术极大提高爬虫效率。对抓取的癌症数据进行统计分析,对多线程效率进行对比分析,显示爬虫具有良好的适应性。基于Py?thon的网络健康咨询抓取方案能快速抓取网络资讯,为后续科研打下基础。 展开更多
关键词 爬虫 多数据源 PYTHON 网页解析
下载PDF
基于Selenium WebDriver的自动交互式数据采集技术研究 被引量:3
11
作者 侯志江 《图书情报导刊》 2017年第4期57-61,共5页
针对现有数据采集方法的不足,提出了基于Selenium WebDriver的自动化交互式数据采集技术,并以京东某众筹项目话题信息的采集为例,验证了该方案的有效性。实验结果表明,该方案可以解决现代Ajax网页动态生成数据的采集问题,是一种交互功... 针对现有数据采集方法的不足,提出了基于Selenium WebDriver的自动化交互式数据采集技术,并以京东某众筹项目话题信息的采集为例,验证了该方案的有效性。实验结果表明,该方案可以解决现代Ajax网页动态生成数据的采集问题,是一种交互功能强大、具有较强灵活性和通用性的数据采集技术。 展开更多
关键词 数据采集 WebDriver 网页解析 动态内容获取
下载PDF
基于教育技术领域的网络信息采集系统设计 被引量:1
12
作者 赵磊磊 杨永 《中国教育信息化(高教职教)》 2014年第10期87-89,共3页
为了应对网络大数据的挑战,本文通过对教育技术网站的页面布局和网页源码的分析,结合正则表达式和网页解析开源类库的使用,实现了网络信息的准确匹配提取和人本化信息采集,在一定程度上有利于有效获取教育技术最新新闻动态,从而有助于... 为了应对网络大数据的挑战,本文通过对教育技术网站的页面布局和网页源码的分析,结合正则表达式和网页解析开源类库的使用,实现了网络信息的准确匹配提取和人本化信息采集,在一定程度上有利于有效获取教育技术最新新闻动态,从而有助于提高机构和个人的业务决策能力。 展开更多
关键词 教育技术 信息采集 正则表达式 网页解析
下载PDF
IPTV机顶盒嵌入式浏览器的设计与实现
13
作者 李美 《牡丹江大学学报》 2009年第1期107-109,114,共4页
本文主要是根据嵌入式浏览器的需求,对嵌入式浏览器系统进行设计与实现。根据嵌入式浏览器的系统设计,把浏览器分为网络通讯模块、JavaScript解析模块和GUI模块。网络通讯模块负责浏览器与网络的数据交互。JavaScript解析模块负责解析... 本文主要是根据嵌入式浏览器的需求,对嵌入式浏览器系统进行设计与实现。根据嵌入式浏览器的系统设计,把浏览器分为网络通讯模块、JavaScript解析模块和GUI模块。网络通讯模块负责浏览器与网络的数据交互。JavaScript解析模块负责解析网页。Layout模块负责对解析出来的数据进行布局。GUI模块负责调用图形库函数,将生成的数据在屏幕上显示出来。对嵌入式浏览器的测试结果表明,整个系统达到了预期的所有功能,对JavaScript的支持良好,显示效果与主流桌面浏览器相差不大。 展开更多
关键词 IPTV 嵌入式浏览器 网页解析 JAVASCRIP
下载PDF
电子商务网络资讯管理系统的设计与实现
14
作者 穆翠霞 周琳琳 《电脑开发与应用》 2014年第4期12-15,共4页
为了采集和管理电子商务类课程教学相关的网络资源,同时为文本聚类研究收集实验数据,采用Struts框架、Java语言和mysql后台数据库,设计和开发了电子商务网络资讯管理平台,实现了网页内容提取、网页关键词提取、资源检索、资源下载和评... 为了采集和管理电子商务类课程教学相关的网络资源,同时为文本聚类研究收集实验数据,采用Struts框架、Java语言和mysql后台数据库,设计和开发了电子商务网络资讯管理平台,实现了网页内容提取、网页关键词提取、资源检索、资源下载和评论等功能。系统满足了辅助课程教学和提供课题研究实验数据的实际需要,功能简洁实用,界面友好,运行稳定。 展开更多
关键词 网页解析 关键词提取 分词 STRUTS 管理系统
下载PDF
电子政务网站智能评估系统的研究与实现 被引量:5
15
作者 寿文卉 范文慧 《系统仿真学报》 CAS CSCD 北大核心 2011年第8期1629-1633,共5页
针对电子政务网站人工绩效评估评估时间长、评估要点分类不准确和评估尺度客观性不高的现状,提出并开发了辅助评估人员的电子政务网站智能评估系统,基于网络协议实现了网站本地化;深入研究了网页源码实现方式,通过网页源码解析技术实现... 针对电子政务网站人工绩效评估评估时间长、评估要点分类不准确和评估尺度客观性不高的现状,提出并开发了辅助评估人员的电子政务网站智能评估系统,基于网络协议实现了网站本地化;深入研究了网页源码实现方式,通过网页源码解析技术实现了网页源码内在信息的挖掘;构建了评估系统的关键词库,确保了评估所需关键词的全面性、准确性;利用知识库实现了评估经验的积累,方便评估人员的学习与继承;基于知识对网站进行自动评估打分,给出了决策意见。智能评估系统在实践中大幅度的减轻了人工劳动,提高了电子政务网站评估的效率。 展开更多
关键词 电子政务 网页解析 智能评估 知识库
原文传递
基于WebDriver的定向网络爬虫设计与实现 被引量:9
16
作者 时永坤 《软件》 2016年第9期94-97,共4页
随着Web 2.0的兴起,网络上的海量信息迎来了爆发性地增长。从网络上的公开数据中提取有效信息成为了数据挖掘领域的新热点。数据获取是数据分析的第一步。Web 2.0时代的网站在内容和形态方面发生了深刻的变化,对传统的以静态页面分析为... 随着Web 2.0的兴起,网络上的海量信息迎来了爆发性地增长。从网络上的公开数据中提取有效信息成为了数据挖掘领域的新热点。数据获取是数据分析的第一步。Web 2.0时代的网站在内容和形态方面发生了深刻的变化,对传统的以静态页面分析为基础的网络爬虫提出了新的挑战。本文利用Web Driver实现了一个定向网络爬虫,该爬虫能够自动采集指定网页数据,支持Ajax等动态技术,能够对简单验证码进行识别,并绕过爬虫检测。利用该爬虫对全国企业信用信息系统进行爬取,取得了良好效果。 展开更多
关键词 网络爬虫 网页解析 动态内容获取
下载PDF
基于Android平台的校园助手APP设计与实现 被引量:7
17
作者 罗杰 王兴柱 +2 位作者 冷迅 何易升 孙航宇 《软件导刊》 2016年第12期51-52,共2页
为满足信息查询需求,基于Android平台,使用数据抓包、Cookies模拟登陆、Jsoup数据解析、SQLite数据库等技术设计开发了校园助手系统。系统实现了教务管理接入、成绩查询、空教室查询、课表查询等功能。用户无需注册,使用教务系统学号、... 为满足信息查询需求,基于Android平台,使用数据抓包、Cookies模拟登陆、Jsoup数据解析、SQLite数据库等技术设计开发了校园助手系统。系统实现了教务管理接入、成绩查询、空教室查询、课表查询等功能。用户无需注册,使用教务系统学号、密码即可登录。提供了一个全天候、准确、便捷的校园信息实时查询平台。 展开更多
关键词 校园助手 Jsoup网页解析 教务系统 SQLITE数据库 ANDROID STUDIO
下载PDF
基于android的校园客户端的设计与实现
18
作者 毛东航 刘强 +2 位作者 马思明 陈思琪 费晓清 《电子世界》 2017年第14期127-127,129,共2页
随着移动互联网以及智能手机的快速发展,以前只能在PC上处理的事务渐渐被转移到移动终端,我们逐渐迈入移动互联网的时代。本设计将实现Android端访问教务管理系统,比如进行课表查询、学生选课、成绩查询以及教学评价等,并且在教务查询... 随着移动互联网以及智能手机的快速发展,以前只能在PC上处理的事务渐渐被转移到移动终端,我们逐渐迈入移动互联网的时代。本设计将实现Android端访问教务管理系统,比如进行课表查询、学生选课、成绩查询以及教学评价等,并且在教务查询的基础上还添加了查询天气、定位、查校园资讯、智能机器人聊天等一系列功能,该APP的实现对提升教学管理服务工作的信息化水平、改善师生互动效率有一定的应用价值。 展开更多
关键词 ANDROID Httpwatch 网页解析
下载PDF
基于JSSh的动态网页获取研究与实现 被引量:4
19
作者 万久士 李翔 林祥 《信息安全与通信保密》 2010年第4期93-95,共3页
网络媒体监控系统需要采集大量的动态网页。提出了基于JSSh(JavaScript Shell Server)的动态网页获取方案,将动态网页的解析工作交给有成熟网页排版功能的Web浏览器,最后通过实验证明,基于JSSh的动态网页获取方案的普适性很强,并且可靠... 网络媒体监控系统需要采集大量的动态网页。提出了基于JSSh(JavaScript Shell Server)的动态网页获取方案,将动态网页的解析工作交给有成熟网页排版功能的Web浏览器,最后通过实验证明,基于JSSh的动态网页获取方案的普适性很强,并且可靠性高。实验表明,该方案的获取效率也符合网络媒体监管系统对于信息采集实效性的要求。 展开更多
关键词 动态网页解析 JavaScript脚本服务器 网页排版引擎
原文传递
新浪微博数据挖掘方案 被引量:120
20
作者 廉捷 周欣 +1 位作者 曹伟 刘云 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第10期1300-1305,共6页
随着新浪微博用户群体的增长,新浪微博的数据获取是微博研究首先需要解决的问题。该文提出了基于新浪微博API与基于页面解析的新浪微博数据获取方案。程序逻辑控制API调用方法与频率,获取JSON对象并解析实现高效数据获取。同时将传统的... 随着新浪微博用户群体的增长,新浪微博的数据获取是微博研究首先需要解决的问题。该文提出了基于新浪微博API与基于页面解析的新浪微博数据获取方案。程序逻辑控制API调用方法与频率,获取JSON对象并解析实现高效数据获取。同时将传统的网络爬虫结合网页解析技术结合API同时使用,解决了因API接口开放不完善,且因在返回结果数量上限与调用频率方面的限制,导致不能有效实现新浪微博数据的全面获取的问题。经过实验测试,通过2套方案的结合可以实现新浪微博数据高效全面的获取。 展开更多
关键词 新浪微博 新浪API 数据检索 网页解析
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部