期刊文献+

云计算环境下基于X-means优化聚类的海量多源异构数据分类 被引量:1

Massive multi-source heterogeneous data classification based on x-means optimization clustering in cloud computing environment
下载PDF
导出
摘要 大数据分类算法在处理海量多源异构数据时存在精度差、效率低等问题,为此提出了一种在云计算环境下基于X-means的优化聚类算法。先构建云计算框架体系,包括用户层、应用层、平台层、资源层和后台管理层;基于RF优化算法对多源异构数据集做融合预处理,降低泛化误差的同时也能实现对数据集的粗分类;基于X-means优化聚类算法计算出数据聚类数量上下限值,不但提升数据训练的效率和降低算法的复杂度,还使距离平均误差值得到较好的控制。在实验室搭建了1个master节点和5个slave节点的云框架,实验结果显示,提出的分类算法在处理海量多源异构数据集时具有更强的分类精度和抗漂移性,同时在分类效率方面也具有一定优势。
作者 陶迎松 TA0 Yingsong
出处 《北部湾大学学报》 2024年第2期40-46,共7页 Journal of BeiBu Gulf University
基金 安徽省高校科研项目(自科类)重点项目(2022AH052795)。
  • 相关文献

参考文献12

二级参考文献110

共引文献53

同被引文献7

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部