期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
大数据时代下爬虫技术的兴起 被引量:8
1
作者 黄聪 李格人 罗楚 《计算机光盘软件与应用》 2013年第17期79-80,83,共3页
大数据时代下,人类社会的数据正以前所未有的速度增长。问卷调查法、访谈法等传统的数据收集方法,因样本容量小、信度低等局限已无法满足高质量研究的需求,相比较而言,编写爬虫程序获取到的海量数据更为真实、全面,在信息繁荣的互联网... 大数据时代下,人类社会的数据正以前所未有的速度增长。问卷调查法、访谈法等传统的数据收集方法,因样本容量小、信度低等局限已无法满足高质量研究的需求,相比较而言,编写爬虫程序获取到的海量数据更为真实、全面,在信息繁荣的互联网时代更为行之有效。因此编写爬虫程序成为大数据时代信息收集的必备技能。本文主要介绍爬虫原理、scrapy爬虫框架,并以歌词爬取为例,详细讲解使用scrapy爬取数据的步骤。 展开更多
关键词 大数据 爬虫 scrapy 歌词爬取
下载PDF
基于Web Services构建动态电子商务系统的研究
2
作者 李格人 刘希良 +1 位作者 李晓端 曹卫东 《电子商务》 2012年第11期46-48,共3页
现代电子商务系统需要在不同企业的异构平台间完成数据收集、传递和处理,传统的EDI模式已不能满足这种需求。本文通过研究Web Services的整体架构和技术特性,结合电子商务的发展趋势,提出了基于Web Services的可重用的、柔性的电子商务... 现代电子商务系统需要在不同企业的异构平台间完成数据收集、传递和处理,传统的EDI模式已不能满足这种需求。本文通过研究Web Services的整体架构和技术特性,结合电子商务的发展趋势,提出了基于Web Services的可重用的、柔性的电子商务体系结构,这种结构可以动态地将不同的应用组合成新的商务流程。 展开更多
关键词 动态电子商务系统 WEB SERVICES
下载PDF
基于OpenShift的非均衡数据完整性评估
3
作者 王帅 邢延 +1 位作者 蔡延光 李格人 《电脑编程技巧与维护》 2014年第2期36-38,共3页
设计并实现了一个基于OpenShift云计算环境的数据质量评估平台,对非均衡数据的完整性常规指标和专用指标具有评估功能。
关键词 云计算 非均衡数据 OpenShift环境 数据完整性 数据质量
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部