期刊导航
期刊开放获取
重庆大学
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
Hadoop平台下基于快速搜索与密度峰值查找的聚类算法
被引量:
2
1
作者
郭友雄
黄添强
+1 位作者
林玲鹏
黄维
《福建师大福清分校学报》
2018年第2期37-44,109,共9页
针对K-means并行化算法中需要人为初始化起始中心点以及每次迭代都要重复计算所有点与中心点距离的低效率问题提出了一种基于快速搜索与密度峰值查找的并行化算法.采用了"化整为一"原则对算法进行并行化处理,即将每个节点的Ma...
针对K-means并行化算法中需要人为初始化起始中心点以及每次迭代都要重复计算所有点与中心点距离的低效率问题提出了一种基于快速搜索与密度峰值查找的并行化算法.采用了"化整为一"原则对算法进行并行化处理,即将每个节点的Map阶段得到的局部CFSFDP聚类结果集中的每个簇视为一个待聚类样本点,在Reduce阶段将这些样本点再进行一次CFSFDP聚类,从而能够快速的将相似的簇聚集在一起归并为同类别.采用Hadoop平台下的并行编程方法,以海量的新闻信息聚类进行实验.实验结果显示,嵌入了基于快速搜索与密度峰值查找的聚类算法后,相对于传统的K-means并行化算法在效率与聚类的结果准确度上都有着明显的提升.
展开更多
关键词
HADOOP
快速搜索与密度峰值查找
聚类
MAPREDUCE
下载PDF
职称材料
题名
Hadoop平台下基于快速搜索与密度峰值查找的聚类算法
被引量:
2
1
作者
郭友雄
黄添强
林玲鹏
黄维
机构
福建师范大学
软件学院
福建师范大学福建省大数据挖掘与应用工程技术研究中心
出处
《福建师大福清分校学报》
2018年第2期37-44,109,共9页
基金
国家自然科学基金项目(61070062
61502103)
+4 种基金
福建省高校产学合作科技重大项目(2015H6007)
福州市科技计划项目(2014-G-76)
福建省高等学校新世纪优秀人才支持计划(JAI1038)
福建省科学厅K类基金项目(2011007)
福建省教育厅A类基金项目(JA10064)
文摘
针对K-means并行化算法中需要人为初始化起始中心点以及每次迭代都要重复计算所有点与中心点距离的低效率问题提出了一种基于快速搜索与密度峰值查找的并行化算法.采用了"化整为一"原则对算法进行并行化处理,即将每个节点的Map阶段得到的局部CFSFDP聚类结果集中的每个簇视为一个待聚类样本点,在Reduce阶段将这些样本点再进行一次CFSFDP聚类,从而能够快速的将相似的簇聚集在一起归并为同类别.采用Hadoop平台下的并行编程方法,以海量的新闻信息聚类进行实验.实验结果显示,嵌入了基于快速搜索与密度峰值查找的聚类算法后,相对于传统的K-means并行化算法在效率与聚类的结果准确度上都有着明显的提升.
关键词
HADOOP
快速搜索与密度峰值查找
聚类
MAPREDUCE
Keywords
Hadoop
fast search and density peak lookup
clustering
MapReduce
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
Hadoop平台下基于快速搜索与密度峰值查找的聚类算法
郭友雄
黄添强
林玲鹏
黄维
《福建师大福清分校学报》
2018
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部