摘要
为了提高聚类的准确度,对传统聚类挖掘算法进行分析、改进和优化,在云计算Hadoop平台上进行DBIK-means算法的并行化,降低了算法的时间复杂度,提高了计算效率.通过实验验证,结果表明DBIK-means算法具有高效、准确、稳定、安全等特性,适合大规模数据集的聚类挖掘.
In order to improve the accuracy of clustering,the paper analyzes and optimizes the traditional clustering mining algorithm and tries to realize the parallelization of DBIK-means algorithm based on the Hadoop platform. The experiment shows that DBIK-means algorithm is efficient,accurate,stable and safe,and more suitable for the clustering mining of Big data.
出处
《通化师范学院学报》
2016年第4期9-12,65,共5页
Journal of Tonghua Normal University
基金
安徽省教育厅2016年度高校自然科学研究重点项目"大中型企业员工绩效评价理论模型信息化研究与实现"(KJ2016A134)
关键词
HADOOP
云计算平台
大数据
聚类挖掘算法
并行化
Hadoop
Cloud Computing Platform
Bid data
Clustering Mining Algorithm
parallelization