-
题名基于人工鱼群的自适应密度峰值聚类算法
- 1
-
-
作者
何凯琳
张正军
位雅
唐莉
-
机构
南京理工大学数学与统计学院
景德镇学院信息工程学院
-
出处
《计算机工程与设计》
北大核心
2024年第1期110-119,共10页
-
基金
国家自然科学基金项目(61773014)。
-
文摘
针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,根据两个相邻簇的簇间边界区域密度与簇平均密度构造簇间合并规则,利用人工鱼群算法寻找使改进轮廓系数指标达到最大值时的最优截断距离d_(c)。在合成数据集和真实数据集上的实验结果表明,AFSADPC算法具有较好的聚类效果。
-
关键词
密度峰值
聚类算法
人工鱼群算法
截断距离
幂律分布
簇合并策略
轮廓系数
-
Keywords
density peaks
clustering algorithm
artificial fish swarm algorithm
cutoff distance
power-law distribution
cluster merging strategy
silhouette coefficient
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于相对密度的密度峰值聚类算法
被引量:3
- 2
-
-
作者
位雅
张正军
何凯琳
唐莉
-
机构
南京理工大学数学与统计学院
景德镇学院信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第6期53-61,共9页
-
基金
国家自然科学基金(61773014)。
-
文摘
密度峰值聚类算法在处理密度不均匀的数据集时易将低密度簇划分到高密度簇中或将高密度簇分为多个子簇,且在样本点分配过程中存在误差传递问题。提出一种基于相对密度的密度峰值聚类算法。引入自然最近邻域内的样本点信息,给出新的局部密度计算方法并计算相对密度。在绘制决策图确定聚类中心后,基于对簇间密度差异的考虑,提出密度因子计算各个簇的聚类距离,根据聚类距离对剩余样本点进行划分,实现不同形状、不同密度数据集的聚类。在合成数据集和真实数据集上进行实验,结果表明,该算法的FMI、ARI和NMI指标较经典的密度峰值聚类算法和其他3种聚类算法分别平均提高约14、26和21个百分点,并且在簇间密度相差较大的数据集上能够准确识别聚类中心和分配剩余的样本点。
-
关键词
聚类
密度峰值
相对密度
密度因子
聚类距离
自然最近邻
-
Keywords
clustering
density peak
relative density
density factor
clustering distance
natural nearest neighborhood
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-