期刊文献+

大数据时代下爬虫技术的兴起 被引量:8

下载PDF
导出
摘要 大数据时代下,人类社会的数据正以前所未有的速度增长。问卷调查法、访谈法等传统的数据收集方法,因样本容量小、信度低等局限已无法满足高质量研究的需求,相比较而言,编写爬虫程序获取到的海量数据更为真实、全面,在信息繁荣的互联网时代更为行之有效。因此编写爬虫程序成为大数据时代信息收集的必备技能。本文主要介绍爬虫原理、scrapy爬虫框架,并以歌词爬取为例,详细讲解使用scrapy爬取数据的步骤。
出处 《计算机光盘软件与应用》 2013年第17期79-80,83,共3页 Computer CD Software and Application
基金 "十二五"国家科技支撑计划课题(2011BAD13B11) 广东工业大学教学质量工程项目(402102283) 广东省特色专业(20102100)
  • 相关文献

参考文献6

  • 1维克托?迈尔?舍恩伯格;肯尼思?库克耶.大数据时代:生活、工作与思维的大变革[M]杭州:浙江人民出版社,201234-35.
  • 2The Economist. Data,data,everywhere-A special report on managing information[EB/OL].http://www.economist.com/node/15557443,2012.
  • 3Manyika J,Chui M,Brown B. Big data:The next frontier for innovation, competition, and productivity[OL].http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation,2012.
  • 4孙瑞.2012年数据管理优先度调查:数据增长速度加快.
  • 5Scrapy developers. Architecture overview[EB/OL].http://doc.scrapy.org/en/latest/topics/architecture.html,2013.
  • 6Times N Y. The age of big data[EB/OL].http://www.nytimes.com/2012/02/12/sunday-review/big-datas-impact-in-the-world.html pagewanted=all&_r=0,2012.

同被引文献49

引证文献8

二级引证文献88

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部