基于SparkR的大数据分析平台设计被引量：2

下载PDF

导出

摘要电信运营商在以DPI数据为基础,结合IT系统数据、网元平台数据刻画用户特征的过程中,面临着数据分析与挖掘效率低下的问题。通过分析数据挖掘效率低下的原因,结合DPI数据的特点,基于开源大数据分析与挖掘技术SparkR构建大数据分析平台,提升用户行为分析与挖掘的效率。通过大数据分析平台,使得电信运营商具备PB级数据分析与挖掘的能力。

作者何美斌胡精英

机构地区中国电信集团江西分公司

出处《电子技术与软件工程》 2016年第21期184-184,共1页 ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING

关键词 DPI数据大数据分析与挖掘 SPA rkR

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1浅谈分布式计算的开发与实现(一).http://www.cnblogs.com/mushroom/p/4959904.html.2015.
2SparkR (R on Spark).http: //spark. apache, org/docs/lat es t/spa rkr. html, 2016.
3刘志强,顾荣,袁春风,黄宜华.基于SparkR的分类算法并行化研究[J].计算机科学与探索,2015,9(11):1281-1294. 被引量：14

二级参考文献19

1刘华元,袁琴琴,王保保.并行数据挖掘算法综述[J].电子科技,2006,19(1):65-68. 被引量：15
2Dean J,Ghemawat S.Map Reduce:simplified data processing on large clusters[J].Communications of the ACM,2008,51(1):107-113.
3Zaharia M,Chowdhury M,Das T,et al.Resilient distributed datasets:a fault-tolerant abstraction for in-memory cluster computing[C]//Proceedings of the 9th USENIX Conference on Networked Systems Design and Implementation,San Jose,USA,Apr 25-27,2012.Berkeley,CA,USA:USENIX Association,2012.
4The R Foundation.The R project for statistical computing[EB/OL].[2014-10-06].http://www.r-project.org/.
5Amplab-extras.Spark R(R frontend for Spark)[EB/OL].[2014-09-25].http://amplab-extras.github.io/Spark R-pkg/.
6Liu Chuang.Research on classification algorithms based on multicore computing[D].Nanjing:Nanjing University of Aeronautics and Astronautics,2011.
7Jin Lei,Wang Zhaokang,Gu Rong,et al.Training large scale deep neural networks on the Intel Xeon Phi many-core coprocessor[C]//Proceedings of the 2014 IEEE 28th International Parallel&Distributed Processing Symposium Workshops(Par Learning),Phoenix,USA,May 19-25,2014.Piscataway,NJ,USA:IEEE,2014:1622-1630.
8Woodsend K,Gondzio J.Hybrid MPI/Open MP parallel linear support vector machine training[J].Journal of Machine Learning Research,2009,10:1937-1953.
9Narang A,Gupta R,Joshi A,et al.Highly scalable parallel collaborative filtering algorithm[C]//Proceedings of the 2010International Conference on High Performance Computing,Dona Paula,Dec 19-22,2010.Piscataway,NJ,USA:IEEE,2010:1-10.
10The Apache Software Foundation.Apache Mahout:scalable machine learning and data mining[EB/OL].(2014)[2014-10-06].http://mahout.apache.org/.

共引文献13

1李坤,刘鹏,吕雅洁,张国鹏,黄宜华.基于Spark的LIBSVM参数优选并行化算法[J].南京大学学报（自然科学版）,2016,52(2):343-352. 被引量：21
2李帅,吴斌,杜修明,陈玉峰.基于Spark的BIRCH算法并行化的设计与实现[J].计算机工程与科学,2017,39(1):35-41. 被引量：11
3曹耀辉.基于Spark平台的电商推荐系统的设计分析[J].自动化与仪器仪表,2017(7):100-103. 被引量：3
4庄荣,李玲娟.基于Spark的CVFDT分类算法并行化研究[J].计算机技术与发展,2018,28(6):35-38. 被引量：3
5张睿敏,张琪淼,杜叔强,贾桂霞.大数据环境下基于Spark的Bayes分类算法研究[J].工业仪表与自动化装置,2018(3):116-118. 被引量：2
6刘斌,何进荣,耿耀君,王最.并行机器学习算法基础体系前沿进展综述[J].计算机工程与应用,2017,53(11):31-38. 被引量：10
7刘鹏,王学奎,黄宜华,孟磊,丁恩杰.基于Spark的极限学习机算法并行化研究[J].计算机科学,2017,44(12):33-37. 被引量：6
8谭旭杰,邓长寿,吴志健,彭虎,朱鹊桥.云环境下求解大规模优化问题的协同差分进化算法[J].智能系统学报,2018,13(2):243-253. 被引量：1
9LIU Peng,ZHAO Hui-han,TENG Jia-yu,YANG Yan-yan,LIU Ya-feng,ZHU Zong-wei.Parallel naive Bayes algorithm for large-scale Chinese text classification based on spark[J].Journal of Central South University,2019,26(1):1-12. 被引量：22
10王燕,曹建芳,李艳飞.融合混合优化组合的大规模场景图像分类算法[J].计算机技术与发展,2019,29(9):86-91. 被引量：2

同被引文献9

1邢英俊.基于Spark的大数据挖掘技术的研究[J].电脑知识与技术,2017,13(6):19-20. 被引量：2
2刘雪.利用大数据挖掘技术搭建国库数据分析平台的实践研究[J].现代经济信息,2018,0(1):342-343. 被引量：1
3颜磊,祁冰.基于Android平台的移动学习系统大数据挖掘技术研究[J].现代电子技术,2017,40(19):142-144. 被引量：23
4王黎,吕殿基.基于Spark框架的大数据局部频繁项集挖掘算法设计[J].微型电脑应用,2021,37(4):130-132. 被引量：7
5戴宏亮,钟国金,游志铭,戴宏明.基于Spark的舆情情感大数据分析集成方法[J].计算机科学,2021,48(9):118-124. 被引量：12
6吴会环,王晓柢.基于数据挖掘技术的自然资源大数据整合优化方法[J].自动化技术与应用,2021,40(8):100-104. 被引量：4
7张元鸣,虞家睿,陆佳炜,高飞,肖刚.基于Spark Streaming的视频大数据并行处理方法[J].计算机工程与科学,2021,43(10):1736-1743. 被引量：6
8黄志,苏传程,苏晓红.大数据环境下Spark性能优化分析研究与应用[J].气象科技,2022,50(1):51-58. 被引量：9
9曹猛.基于Spark核心架构的大数据平台技术研究与实践[J].中国战略新兴产业,2018(7X):130-130. 被引量：3

引证文献2

1李艳红.基于Spark平台的大数据挖掘技术分析[J].科技资讯,2018,16(27):7-8. 被引量：3
2曹海平.依托于Spark平台的大数据挖掘技术分析[J].软件,2022,43(7):84-86. 被引量：3

二级引证文献6

1吴磊,欧阳赫明.基于Spark的分布式健康大数据分析系统设计与实现[J].软件导刊,2020,19(7):99-102. 被引量：1
2张博.基于Spark平台的大数据挖掘技术分析[J].无线互联科技,2021,18(2):99-100. 被引量：2
3王源,陈智勇.基于Spark+Flask的大数据可视化系统设计与实现[J].科学与信息化,2022(22):73-76.
4宁毅,陈金龙,罗德明,赵仲达.基于SpringBoot+Spark+Vue的旅游大数据分析平台的设计与实现[J].无线互联科技,2024,21(7):60-67.
5方隽,吴腾云,梁玉旋,王文耀,杨邦杰.面向复杂制造业协同云平台的高速数据传输技术[J].电子设计工程,2024,32(20):172-176.
6殷俊,李仁旺.基于大数据技术的传动轴磨削加工过程中碳足迹的核算[J].建模与仿真,2023,12(6):5924-5935.

1Gil Kirkpatrick,程波(译).关注服务器性能微软SPA通过预测来帮助你管理服务器[J].Windows IT Pro Magazine（国际中文版）,2007(3):51-53.
2GilKirkpatrick 程波(译).关注服务器性能微软SPA通过预测来帮助你管理服务器[J].Windows IT Pro Magazine（国际中文版）,2007,0(C00):174-176.
3SEICA发布VIVA集成平台[J].中国电子商情（空调与冷冻）,2005(3):20-20.
4刘承启,邓庚盛,江婕,徐健锋.基于用户行为分析的搜索引擎研究[J].计算机与现代化,2008(9):75-77. 被引量：2
5数字家庭的文件管家[J].微型计算机,2007(04Z):12-12.
6曙光建立EB级云存储实验室[J].金融电子化,2014,0(7):96-96.
7王万军,晏燕.基于SPA数排序的一种可能度方法[J].统计与决策,2015,31(6):79-80.
8陆书恒.基于VPN技术的网元远程维护技术应用[J].民营科技,2010(9):41-41.
9仇亚东,宋丽芳.基于Lucene的Flash网络检索研究[J].中国教育技术装备,2015,0(2):41-42.
10米热古丽·克比尔.数据挖掘在校园网的应用[J].电脑知识与技术,2015,0(8):145-146.

电子技术与软件工程

2016年第21期

浏览历史

内容加载中请稍等...

基于SparkR的大数据分析平台设计被引量：2

参考文献3

二级参考文献19

共引文献13

同被引文献9

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于SparkR的大数据分析平台设计 被引量：2

参考文献3

二级参考文献19

共引文献13

同被引文献9

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于SparkR的大数据分析平台设计被引量：2