期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于Rhino的JavaScript动态页面解析研究与实现 被引量:18
1
作者 金晓鸥 钟宝燕 李翔 《计算机技术与发展》 2008年第2期1-4,50,共5页
面对互联网上占据全国页面总数50%以上的动态页面,当前网络舆情管控工作中的信息采集环节对以动态页面为主要发布形态的互联网媒体无法实现信息获取。鉴于此,文中提出了基于Rhino实现JavaScript动态页面解析的整体方案。实验结果表明该... 面对互联网上占据全国页面总数50%以上的动态页面,当前网络舆情管控工作中的信息采集环节对以动态页面为主要发布形态的互联网媒体无法实现信息获取。鉴于此,文中提出了基于Rhino实现JavaScript动态页面解析的整体方案。实验结果表明该方案充分丰富了互联网舆情管控工作的数据源对象,是实现动态页面内超链接网络地址递归获取和网页主体内容提取行之有效的解决方案。 展开更多
关键词 脚本解释引擎Rhino JavaScript动态页面 动态页面解析
下载PDF
一种动态页面采集技术研究
2
作者 闫谦时 《计算机光盘软件与应用》 2010年第8期116-116,共1页
随着web2.0技术的飞速发展,Internet上动态网页的数量越来越多。为当前互联网媒体内容监控工作带来了很大的挑战。基于此,本文扩展了原有互联网媒体内容监控系统的网络爬虫,嵌入了动态页面采集程序,进一步丰富了系统的信息采集来... 随着web2.0技术的飞速发展,Internet上动态网页的数量越来越多。为当前互联网媒体内容监控工作带来了很大的挑战。基于此,本文扩展了原有互联网媒体内容监控系统的网络爬虫,嵌入了动态页面采集程序,进一步丰富了系统的信息采集来源,为做好互联网媒体内容监控工作打下了良好的基础。 展开更多
关键词 JAVASCFIPT 动态页面解析 DOM RHINO
下载PDF
基于高级搜索页面的动态表单搜索 被引量:1
3
作者 李海滨 许南山 《计算机系统应用》 2011年第10期180-183,共4页
根据表单项前的文字信息反映表单项输入信息的特点,提出通过解析表单项动态填充表单的方法,解决了应用网站自身高级搜索页面对同一类型的多个网站进行搜索的问题。针对图书类的网站进行研究,利用动态解析表单获得结果页面,对其进行解析... 根据表单项前的文字信息反映表单项输入信息的特点,提出通过解析表单项动态填充表单的方法,解决了应用网站自身高级搜索页面对同一类型的多个网站进行搜索的问题。针对图书类的网站进行研究,利用动态解析表单获得结果页面,对其进行解析并加权排序,最后按照统一的显示格式展现。根据实验结果验证了算法设计的正确性,可利用本算法对多个同类型的网站借助其自身搜索进行搜索查询。 展开更多
关键词 表单解析 动态填充 结果页面解析 结果项排序
下载PDF
基于语料库和网络的新词自动识别 被引量:11
4
作者 刘建舟 何婷婷 骆昌日 《计算机应用》 CSCD 北大核心 2004年第7期132-134,共3页
汉语自动分词是进行中文信息处理的基础。目前 ,困扰汉语自动分词的一个主要难题就是新词自动识别 ,尤其是非专名新词的自动识别。同时 ,新词自动识别对于汉语词典的编纂也有着极为重要的意义。文中提出了一种新的新词自动识别的方法。... 汉语自动分词是进行中文信息处理的基础。目前 ,困扰汉语自动分词的一个主要难题就是新词自动识别 ,尤其是非专名新词的自动识别。同时 ,新词自动识别对于汉语词典的编纂也有着极为重要的意义。文中提出了一种新的新词自动识别的方法。这个方法用到了互信息和log likelihoodratio两个参数的改进形式。主要分三个阶段完成 :先从网络上下载丰富的语料 ,构建语料库 ;然后采用统计的方法进行多字词识别 ;最后与已有的词表进行对照 ,判定新词。 展开更多
关键词 抽取多字词 页面解析 动态语料库
下载PDF
基于微信公众平台的教务信息查询系统设计与实现 被引量:21
5
作者 曲广强 关晓辉 +2 位作者 王建元 杨永清 孙悦 《东北电力大学学报》 2015年第6期100-105,共6页
腾讯公司在微信的基础上增加了微信公众平台功能模块,通过这一平台,个人和企业都可以打造一个微信的公众号,并实现和特定群体的文字、图片、语音的全方位沟通、互动。本文以微信公众平台开发为基础,利用PHP,WebService等技术,完成了基... 腾讯公司在微信的基础上增加了微信公众平台功能模块,通过这一平台,个人和企业都可以打造一个微信的公众号,并实现和特定群体的文字、图片、语音的全方位沟通、互动。本文以微信公众平台开发为基础,利用PHP,WebService等技术,完成了基于微信公众平台的教务信息查询系统的设计与实现。文中对于开发过程中所遇到的微信公众平台接口、数据源问题、图文模式回复功能等进行重点的阐述。 展开更多
关键词 微信公众平台 WEBSERVICE 页面解析
下载PDF
网络化制造资源垂直搜索引擎的研究与应用 被引量:6
6
作者 张建 程锦 《计算机应用》 CSCD 北大核心 2007年第5期1116-1118,共3页
着重研究了网络化制造资源垂直搜索系统的主题爬虫和中文分词技术。通过在主题爬虫中增加评价网页模块,优先爬行与主题相似度高的网页中的链接,提高了爬虫的工作效率。在对中文分词词典进行分层存储的基础上,通过一种改进的简洁的中文... 着重研究了网络化制造资源垂直搜索系统的主题爬虫和中文分词技术。通过在主题爬虫中增加评价网页模块,优先爬行与主题相似度高的网页中的链接,提高了爬虫的工作效率。在对中文分词词典进行分层存储的基础上,通过一种改进的简洁的中文分词词典匹配算法,有效地改善了分词的速度与精度,并缩减了索引库,增强了用户的响应。 展开更多
关键词 网络化制造 制造资源 垂直搜索引擎 页面解析
下载PDF
元搜索引擎中搜索结果的采集与处理 被引量:2
7
作者 李建廷 《电子科技》 2010年第6期64-66,共3页
元搜索引擎与基本成员搜索引擎之间的信息交换,是元搜索引擎技术实现的难题,针对这一问题,选择Google和Baidu基本搜索引擎,实现了对这两个基本搜索引擎的检索、结果采集、生成搜索记录的过程,并对采集、处理后的检索结果进行排序,供用... 元搜索引擎与基本成员搜索引擎之间的信息交换,是元搜索引擎技术实现的难题,针对这一问题,选择Google和Baidu基本搜索引擎,实现了对这两个基本搜索引擎的检索、结果采集、生成搜索记录的过程,并对采集、处理后的检索结果进行排序,供用户进行二次检索。 展开更多
关键词 元搜索引擎 结果排序 页面解析
下载PDF
基于XML的富媒体发布流程的优化及比较
8
作者 杨锦程 羌亮 叶涵敏 《上海电力学院学报》 CAS 2009年第2期173-175,199,共4页
介绍了富媒体内容对网络服务器所带来的负载压力.在对负载类型进行统计分析的基础上,详细阐述了优化后富媒体发布方式的页面解析规则、实现过程,以及安全性设置.并测试和比较了传统发布方式和优化后的发布方式对服务器造成的负载压力.
关键词 富媒体 页面解析 安全性
下载PDF
基于Web的定向信息采集系统的设计与实现 被引量:1
9
作者 宋凯伦 邱广华 李珊 《福建电脑》 2011年第11期18-19,3,共3页
互联网的快速发展,导致信息采集技术的不断进步。为解决针对不同Web网站的定向信息采集问题,本文介绍了一种基于Web的定向信息采集系统的实现,经实践证明,该系统具备良好的通用性,采集准确率高。
关键词 信息采集 定向采集 页面解析
下载PDF
快速的中文网页分类方法实现 被引量:1
10
作者 朱志宁 黄青松 《山西电子技术》 2008年第4期7-9,共3页
详细介绍了一种快速的中文网页分类系统的设计与实现,通过解析出网页的主要内容、网页的Title、网页的Meta标签内容和指向该网页的父网页上的锚文本,并根据这些信息用VSM法将网页分类。实验结果表明,本文的方法可以使中文网页分类性能... 详细介绍了一种快速的中文网页分类系统的设计与实现,通过解析出网页的主要内容、网页的Title、网页的Meta标签内容和指向该网页的父网页上的锚文本,并根据这些信息用VSM法将网页分类。实验结果表明,本文的方法可以使中文网页分类性能速度得到大的提高且能保持较高的准确率。 展开更多
关键词 页面解析 文本分类 网页分类 VSM分类器
下载PDF
HTMLParser提取网页超链接研究 被引量:1
11
作者 郎凤举 《电脑编程技巧与维护》 2010年第2期74-75,共2页
每个网页中都存在许多超链接,很多网页的有用信息都存在于超链接中,如何有效地获取这些超链接成为Web挖掘的一个重要步骤。提出了利用HTMLParser开源工具实现Web页面解析,提取网页的超链接,从而获取有用信息,为下一步开发搜索引擎做准备。
关键词 HTMLPARSER 页面解析 信息提取
下载PDF
基于微信公众平台构建在线教务信息系统的应用研究 被引量:2
12
作者 任建吉 《科技视界》 2020年第14期1-3,共3页
在“互联网+教育”的背景下,将互联网技术和教务信息系统相结合,可方便用户随时随地查询教务信息,提高信息获取便利性。文章提出以微信公众平台融合传统的教务信息系统,利用PHP,Web Service等技术构建基于微信公众平台的在线教务信息系... 在“互联网+教育”的背景下,将互联网技术和教务信息系统相结合,可方便用户随时随地查询教务信息,提高信息获取便利性。文章提出以微信公众平台融合传统的教务信息系统,利用PHP,Web Service等技术构建基于微信公众平台的在线教务信息系统平台,实现课程表查询,考试成绩查询,空闲教室查询,并结合实际使用情况提出了一定的思考与建议。 展开更多
关键词 教务信息系统 微信公众平台 Web Service 页面解析
下载PDF
电力企业信息系统统一待办提醒工具研究 被引量:1
13
作者 罗序良 《机电信息》 2018年第33期56-57,共2页
采用selenium、爬虫、xpath页面解析等技术模拟用户登录企业信息系统,并读取各系统相应的待办列表,以完成从前台页面抓取待办事项数据的任务。开发Windows桌面控件,此桌面控件采用C#语言编写,长期显示在操作系统桌面上,用于各信息系统... 采用selenium、爬虫、xpath页面解析等技术模拟用户登录企业信息系统,并读取各系统相应的待办列表,以完成从前台页面抓取待办事项数据的任务。开发Windows桌面控件,此桌面控件采用C#语言编写,长期显示在操作系统桌面上,用于各信息系统待办事项的推送归集显示。 展开更多
关键词 待办提醒 桌面控件 页面解析 爬虫
下载PDF
面向虚拟现实内容的网络爬虫系统的设计与实现
14
作者 文天乐 《中国高新科技》 2017年第19期39-41,共3页
文章详细介绍了网络爬虫系统的设计与实现,利用软件工程的相关测试方法,对系统进行了功能和性能上的测试。通过大量测试,发现网络爬虫该系统基本满足设计要求,具有爬取、分析、存储虚拟现实内容数据的功能,且可以满足性能的要求。
关键词 爬虫系统:AJAX 页面解析 哈希去重
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部