期刊文献+

基于Hadoop平台的海量数据分析和处理 被引量:3

下载PDF
导出
摘要 从海量数据中迅速提取有效信息是应用软件开发者们在项目开发中遇到的最大难题。该问题的出发点是在分析Hadoop集群技术组合的关键技术基础和其他现有的分布式存储和计算研究的基础上,以及它们的商业需求和实际的硬件和软件编程能力。提出了一种基于模型和数据结构设计程序的大规模Hadoop数据处理方法,在组织和使用编程方法的几个过程中,介绍了模型的开发、日志数据预处理模型及其在大型网站中的应用。
作者 张趁香
出处 《电脑编程技巧与维护》 2019年第1期95-97,共3页 Computer Programming Skills & Maintenance
基金 2018年江苏省高职院校青年教师企业实践计划项目(计划编号:2018QYSJ084)阶段性成果
  • 相关文献

参考文献1

二级参考文献5

  • 1Goklany I M. The Improving State of the World: Why We're Living Longer, Healthier, More Comfortable Lives on a Cleaner Planet. Washington: Cato Institute, 2006.
  • 2Hey H, Tansley S, Tolle K. The Fourth Paradigm: Data-Intensive Scientific Discovery. Washington: Microsoft Research, 2009.
  • 3National Science Foundation Advisory Committee for Cyber infrastructure Task Force on Grand Challenges Final Report. https://www.nsf.gov/cise/aci/taskforces/ TaskForceRepor t_randChallenges.pd f, 2011.
  • 4Kyrola A, Blelloch G, Guestrin C. GraphChi: large-scale graph computation on just a PC. Proceedings of the 10th USENIX Symposium on Operating Systems Design and Implementation, Hollywood, CA, USA, 2012.
  • 5Xu W, Huang L, Fox A, et al. Detecting large-scale system problems by mining console logs. Proceedings of the 22nd ACM Symposium on Operating Systems Principles, Big Sky, Montana, LISA, 2009.

共引文献5

同被引文献26

引证文献3

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部