题名 基于共享近邻加权局部线性嵌入的轴承故障诊断
1
作者
刘庆强
孙艳茹
刘远红
吴丽
机构
东北石油大学电气信息工程学院
大庆油田有限责任公司天然气分公司培训中心
出处
《江苏大学学报(自然科学版)》
CAS
北大核心
2024年第1期85-91,118,共8页
基金
海南省自然科学基金资助项目(623MS071)。
文摘
针对传统局部线性嵌入算法在挖掘局部流形结构时未充分考虑样本邻居分布信息,且在降维过程中默认样本具有相同的重要性导致提取鉴别特征不明显的问题,提出基于共享近邻的加权局部线性嵌入(weighted local linear embedding based on shared neighbors,SN-WLLE)算法,并用于滚动轴承故障诊断.该算法首先使用余弦距离划分样本邻域;其次计算样本邻域对相似度用以评估样本共享近邻信息,并结合样本的6种邻居分布修正局部结构挖掘,提高多共享近邻的k近邻重构准确性;接着从多流形的角度评估样本点与近邻点间的稀疏分布一致性,以获得样本的重要性指标,并在低维空间保持该信息,进而提取准确的鉴别特征;最后结合KNN分类器构建出完备的轴承故障诊断模型.采用凯斯西储大学轴承数据集和实验室测试平台轴承数据集,从可视化评估、定量聚类评估、故障识别精度评估及鲁棒性评估等方面进行分析.结果表明:SN-WLLE算法的F值保持在108以上水准,平均故障识别精度最低可达0.9734,不仅具有较好的类内紧致性与类间可分性,还对近邻参数k具有低敏感性.
关键词
滚动轴承
特征提取
故障诊断
局部线性嵌入
余弦距离
共享近邻
稀疏分布
Keywords
rolling bearing
feature extraction
fault diagnosis
local linear embedding
cosine distance
shared neighbors
sparse distribution
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
TH133.3
[机械工程—机械制造及自动化]
题名 一种基于共享近邻的密度聚类算法
2
作者
郑喜臣
杨易扬
机构
广东工业大学计算机学院
出处
《计算机应用与软件》
北大核心
2024年第2期264-270,共7页
基金
国家自然科学基金项目(61603101)。
文摘
针对经典的快速漂移(Quick Shift)算法在偏移过程中需要人为地指定领域值,导致在复杂数据集上表现不佳等问题,提出一种改进的共享近邻密度聚类算法(QS-SNN)。该聚类算法基于共享近邻(SNN),计算出样本点之间的相似度;通过相似度衡量得到样本点的局部密度矩阵;通过在SNN领域中对样本点进行快速偏移,得到最终的聚类结果。在多个数据集上进行实验,结果分析表明,该算法比传统的Quick shift算法以及其他的聚类算法在准确度上有了较大的提升。
关键词
密度聚类
共享近邻
快速漂移
Keywords
Density clustering
Shared-nearest-neighbors
Quick shift
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
题名 面向流形数据的共享近邻密度峰值聚类算法
被引量:2
3
作者
赵嘉
马清
肖人彬
潘正祥
韩龙哲
机构
南昌工程学院信息工程学院
华中科技大学人工智能与自动化学院
山东科技大学计算机科学与工程学院
出处
《智能系统学报》
CSCD
北大核心
2023年第4期719-730,共12页
基金
国家自然科学基金项目(52069014,61962036)。
文摘
流形数据由一些弧线状或环状的类簇组成,其特点是同一类簇的样本间距离差距较大。密度峰值聚类算法不能有效识别流形类簇的类簇中心且分配剩余样本时易引发样本的连续误分配问题。为此,本文提出面向流形数据的共享近邻密度峰值聚类(density peaks clustering based on shared nearest neighbor for manifold datasets,DPC-SNN)算法。提出了一种基于共享近邻的样本相似度定义方式,使得同一流形类簇样本间的相似度尽可能高;基于上述相似度定义局部密度,不忽略距类簇中心较远样本的密度贡献,能更好地区分出流形类簇的类簇中心与其他样本;根据样本的相似度分配剩余样本,避免了样本的连续误分配。DPC-SNN算法与DPC、FKNNDPC、FNDPC、DPCSA及IDPC-FA算法的对比实验结果表明,DPC-SNN算法能够有效发现流形数据的类簇中心并准确完成聚类,对真实以及人脸数据集也有不错的聚类效果。
关键词
密度峰值
聚类分析
流形数据
K近邻
共享近邻
样本相似度
数据挖掘
图像处理
Keywords
density peaks
clustering analysis
manifold data
K nearest neighbor
shared nearest neighbor
manifold data
sample similarity
data mining
image processing
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 结合共享近邻和流形距离的自适应谱聚类算法
4
作者
张喜梅
解滨
米据生
徐童童
张祎玲
机构
河北师范大学计算机与网络空间安全学院
河北师范大学供应链大数据分析与数据安全河北省工程研究中心
河北师范大学河北省网络与信息安全重点实验室
河北师范大学数学科学学院
出处
《计算机科学》
CSCD
北大核心
2023年第10期59-70,共12页
基金
国家自然科学基金(62076088)
北京市自然科学基金(Z210002)。
文摘
谱聚类算法是建立在图论的基础上,将聚类问题转化为图的划分问题,能识别任意形状的类簇且易于实现,因此比传统聚类算法具有更强的适应性。然而,该算法中常用的距离度量不能同时考虑全局和局部一致性,且易受到噪声影响;聚类结果依赖由输入数据构造的相似度矩阵,且通过特征分解得到松弛划分矩阵和离散化过程的两步独立策略难以得到一个共同最优解。因此,提出一种结合共享近邻和流形距离的自适应谱聚类算法(SNN-MSC),引入一种新的具有指数项和比例因子的流形距离,可以灵活调整同一流形内数据的相似度和不同流形之间数据的相似度之比,并将密度因子纳入流形距离度量中,以消除噪声影响;采用共享近邻重新定义相似度度量,能挖掘数据点之间的空间结构和局部关系;同时,对拉普拉斯矩阵施加秩约束,使相似度矩阵中的连通分量完全等于簇个数,能够在优化求解过程中自适应优化数据相似度矩阵和聚类结构,无须再进行离散化操作。在人工数据集和UCI真实数据集上的对比实验显示,所提算法在多个聚类有效性指标上能体现出更好的性能。
关键词
谱聚类
流形距离
共享近邻
秩约束
自适应
Keywords
Spectral clustering
Manifold distance
Shared nearest neighbor
Rank constraint
Adaptation
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 基于共享近邻和优化关联策略的边界剥离聚类
5
作者
冯洁净
侯新民
机构
中国科学技术大学大数据学院
中国科学技术大学数学科学学院
中国科学院吴文俊数学重点实验室(中国科学技术大学)
出处
《计算机系统应用》
2023年第10期147-156,共10页
基金
国家自然科学基金(12071453)
量子通信与量子计算机重大项目(2021ZD0302904)。
文摘
边界剥离聚类算法(BP)是一种基于密度的聚类算法,它通过逐渐剥离边界点来揭示聚类的潜在核心,已经被证明是一种十分有效的聚类手段.然而,BP算法仍存在一些不足之处:一方面,数据点的局部密度仅考虑了距离特征,使得边界点的确定不够合理;另一方面,BP算法中的关联策略容易误判异常值,并且在分配边界点时容易产生连带错误.为此,本文提出了一种基于共享近邻和优化关联策略的边界剥离聚类算法(SOBP).该算法使用了基于共享近邻的局部密度函数来更好地探索数据点之间的相似性,同时优化了BP算法中的关联策略,使得每次迭代中边界点不再仅与一个非边界点进行关联,并进一步采用了边界点与非边界点、已剥离边界点之间的双重关联准则.在一些数据集上的测试表明,相较于其他6种经典算法,该算法在评估指标上表现更佳.
关键词
边界剥离聚类算法
共享近邻
局部密度
关联策略
Keywords
border peeling clustering algorithm
shared nearest neighbors
local density
association strategy
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
题名 基于共享近邻的自适应谱聚类
被引量:15
6
作者
刘馨月
李静伟
于红
尤全增
林鸿飞
机构
计算机科学与技术学院大连理工大学
软件学院大连理工大学
出处
《小型微型计算机系统》
CSCD
北大核心
2011年第9期1876-1880,共5页
基金
国家自然科学基金项目(60873180)资助
文摘
谱聚类是一种极具竞争力的聚类算法.相似度定义对谱聚类算法的性能有至关重要的影响.本文用两点的共享近邻数目表征局部密度,从而获知隐含的簇结构信息.将这一信息与自调节的高斯核函数结合,提出了基于共享近邻的自适应相似度及相应的谱聚类算法.它满足聚类假设的要求,具有局部密度的自适应性,能有效识别数据点之间的内在联系.典型人工和真实数据集上的实验结果证明了算法的有效性.
关键词
聚类
谱聚类
相似度度量
共享近邻
Keywords
clustering
spectral clustering
similarity measure
shared nearest neighbors
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于网格的共享近邻聚类算法
被引量:7
7
作者
刘敏娟
柴玉梅
机构
郑州大学信息工程学院
出处
《计算机应用》
CSCD
北大核心
2006年第7期1673-1675,共3页
基金
河南省自然科学基金资助项目(021105110)
文摘
提出了一种基于网格的共享近邻聚类算法(Grid-based shared NearestNeighbor algorithm,GNN)。该算法主要利用网格技术去除数据集中的部分孤立点或噪声,使用密度阈值处理技术来处理网格的密度阈值,使用中心点技术提高聚类效率。GNN算法仅对数据集进行一遍扫描,且能处理任意形状和大小的聚类。实验表明,GNN有较好的可扩展性,其精度和效率明显地好于共享近邻SNN算法。
关键词
基于网格
共享近邻
中心点
Keywords
grid-based
shared nearest neighbor
center
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 面向大数据集的共享近邻聚类研究
被引量:5
8
作者
潘章明
陈尹立
机构
广东金融学院计算机科学与技术系
出处
《小型微型计算机系统》
CSCD
北大核心
2014年第1期50-54,共5页
基金
广东省教育部产学研结合项目(2011B090400466)资助
广东省教育科学规划项目(2010tjk119)资助
广东金融学院校级课题项目(11XJ04-03)资助
文摘
共享近邻(SNN)相似度能有效克服由高维和多密度等因素引起的聚类有效性问题,但计算效率不高.基于分治策略,提出一种改进的共享近邻聚类算法(DC-SNN).采用软划分策略将数据集分割为多个小规模子集,降低了计算SNN相似矩阵时需要搜索的数据点数量,同时,也避免了子集分割边界对数据点K近邻产生的不利影响.根据在子集中定义的核心数据点和扩展数据点,给出了子集中SNN相似矩阵的计算方法和合并策略,从而确保了以子集SNN相似矩阵表示整个数据集SNN相似矩阵的有效性.实验结果表明,DC-SNN算法能够在确保聚类精度不变的情况下,显著提高共享近邻聚类的效率.
关键词
共享近邻
分治法
大数据集
聚类分析
Keywords
shared nearest neighbor
divide and conquer
large dataset
clustering analysis
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于密度系数和共享近邻的谱聚类
被引量:3
9
作者
张涛
葛洪伟
机构
江南大学轻工过程先进控制教育部重点实验室
江南大学物联网工程学院
出处
《小型微型计算机系统》
CSCD
北大核心
2017年第8期1829-1833,共5页
基金
国家自然科学基金项目(61305017)资助
江苏省普通高效研究生科研创新计划项目(KYLX15_1169)资助
江苏省高校优势学科建设工程资助项目资助
文摘
针对self-tuning谱聚类算法采用自适应高斯核计算相似度的方法对一些复杂结构的数据集无法正确聚类的问题,提出一种基于密度系数和共享近邻的谱聚类算法.首先计算每个样本点的密度系数,由密度系数阈值计算样本点的权值和加权的自适应核参数;然后根据密度系数阈值优化互为K近邻图并计算样本点之间共享近邻点的个数;最后根据核参数和共享近邻点的个数计算所有样本点之间的相似度并进行聚类.分别在人工数据集和真实数据集上进行实验,结果表明本文方法在处理一些复杂结构的数据集时可以得到更优越的聚类效果.
关键词
密度系数
共享近邻
相似度
谱聚类
Keywords
density coefficient
shared nearest neighbor
similarity
spectral clustering
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 一种基于共享近邻亲和度的聚类算法
被引量:3
10
作者
邱保志
辛杭
机构
郑州大学信息工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2018年第18期184-187,222,共5页
基金
河南省基础与前沿基金(No.152300410191)
文摘
为解决密度聚类算法在处理高维和多密度数据集时聚类结果不精确的问题,提出一种基于共享近邻亲和度(SNNA)的聚类算法。该算法引入k近邻和共享近邻,定义共享近邻亲和度作为对象的局部密度度量。算法首先根据亲和度来提取核心点,然后利用广度优先搜索算法对核心点进行聚类,最后对非核心点进行指派即完成整个数据集的聚类。实验结果表明,该算法能够发现任意形状、大小、密度的聚类;与同类算法相比,SNNA算法在处理高维数据时具有较高的聚类准确率。
关键词
聚类
密度
共享近邻
亲和度
数据挖掘
Keywords
clustering
density
shared nearest neighbor
affinity
data mining
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 基于共享近邻相似度的密度峰聚类算法
被引量:8
11
作者
鲍舒婷
孙丽萍
郑孝遥
郭良敏
机构
安徽师范大学计算机与信息学院
网络与信息安全安徽省重点实验室(安徽师范大学)
出处
《计算机应用》
CSCD
北大核心
2018年第6期1601-1607,共7页
基金
国家自然科学基金资助项目(61602009
61772034)
+1 种基金
安徽省自然科学基金资助项目(1608085MF145
1508085QF133)~~
文摘
密度峰聚类是一种基于密度的高效聚类方法,但存在对全局参数dc敏感和需要人工干预决策图进行聚类中心选择的缺陷。针对上述问题,提出了一种基于共享近邻相似度的密度峰聚类算法。首先,该算法结合欧氏距离和共享近邻相似度进行样本局部密度的定义,避免了原始密度峰聚类算法中参数dc的设置;其次,优化聚类中心的选择过程,能够自适应地进行聚类中心的选择;最后,将样本分配至距其最近并拥有较高密度的样本所在的簇中。实验结果表明,在UCI数据集和模拟数据集上,该算法与原始的密度峰聚类算法相比,准确率、标准化互信息(NMI)和F-Measure指标分别平均提高约22.3%、35.7%和16.6%。该算法能有效地提高聚类的准确性和聚类结果的质量。
关键词
密度峰聚类
K近邻
共享近邻
局部密度
相似性度量
Keywords
density peaks clustering
k nearest neighbors
shared near neighbors
local density
similarity measure
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 引入共享近邻加权图的Chameleon算法
被引量:6
12
作者
薛文娟
刘培玉
刘栋
机构
山东师范大学信息科学与工程学院
山东省分布式计算机软件新技术重点实验室
出处
《计算机应用》
CSCD
北大核心
2012年第10期2884-2887,共4页
基金
国家自然科学基金资助项目(60873247)
山东省高新自主创新专项工程项目(2008ZZ28)
山东省自然科学基金资助项目(ZR2009GZ007)
文摘
针对Chameleon算法中采用距离函数度量数据点间的相似度,导致距离相近的两个点可能仅拥有很少的共同特征,最小二分实际操作困难,合并时需要人工指定阈值以及一旦合并完成后不能撤销的问题,对Chameleon算法进行改进,提出一种引入共享近邻加权图(WSnnG)的Chameleon算法。该算法以数据对象间的共享近邻数来衡量相似度,进一步构造WSnnG,再利用网络模块性评价函数指导最小二分,然后以结构等价相似度作为合并的依据,最后通过引入内聚度度量函数解决合并后不能撤销的问题。在UCI数据集及4个二维人造数据集上的实验结果表明,该算法在聚类精度和运行时间方面具有更好的效果。
关键词
共享近邻 加权图
最小二分
网络模块性评价函数
结构等价相似度
内聚度度量函数
Keywords
Weighted Shared nearest neighbors Graph (WSnnG)
minimum half
network module evaluation function
structural equivalence similarity degree
cohesion measure
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
TP309
[自动化与计算机技术—计算机系统结构]
题名 基于加权共享近邻与累加序列的密度峰值算法
被引量:3
13
作者
王芙银
张德生
肖燕婷
机构
西安理工大学理学院
出处
《计算机工程》
CAS
CSCD
北大核心
2022年第4期61-69,共9页
基金
国家自然科学基金青年科学基金项目(11801438)。
文摘
密度峰值聚类(DPC)算法在对密度分布差异较大的数据进行聚类时效果不佳,聚类结果受局部密度及其相对距离影响,且需要手动选取聚类中心,从而降低了算法的准确性与稳定性。为此,提出一种基于加权共享近邻与累加序列的密度峰值算法DPC-WSNN。基于加权共享近邻重新定义局部密度的计算方式,以避免截断距离选取不当对聚类效果的影响,同时有效处理不同类簇数据集分布不均的问题。在原有DPC算法决策值的基础上,生成一组累加序列,将累加序列的均值作为聚类中心和非聚类中心的临界点从而实现聚类中心的自动选取。利用人工合成数据集与UCI上的真实数据集测试与评估DPC-WSNN算法,并将其与FKNN-DPC、DPC、DBSCAN等算法进行比较,结果表明,DPC-WSNN算法具有更好的聚类表现,聚类准确率较高,鲁棒性较强。
关键词
密度峰值聚类算法
局部密度
加权共享近邻
累加序列
聚类中心
Keywords
Density Peak Clustering(DPC)algorithm
local density
weighted shared nearest neighbor
accumulated sequence
clustering center
分类号
TP301
[自动化与计算机技术—计算机系统结构]
题名 基于共享近邻的成对约束谱聚类算法
被引量:6
14
作者
王小玉
丁世飞
机构
中国矿业大学计算机科学与技术学院
中国科学院计算技术研究所智能信息处理重点实验室
出处
《计算机工程与应用》
CSCD
北大核心
2019年第2期142-147,共6页
基金
国家自然科学基金(No.61379101
No.61672522)
文摘
谱聚类算法是基于谱图划分理论的一种机器学习算法,它能在任意形状的样本空间上聚类且收敛于全局最优解。但是传统的谱聚类算法很难正确发现密度相差比较大的簇,参数的选取要靠多次实验和个人经验。结合半监督聚类的思想,在给出一部分监督信息的前提下,提出了一种基于共享近邻的成对约束谱聚类算法(Pairwise Constrained Spectral Clustering Based on Shared Nearest Neighborhood,PCSC-SN)。PCSC-SN算法是用共享近邻去衡量数据对之间的相似性,用主动约束信息找到两个数据点之间的关系。在数据集UCI上做了一系列的实验,实验结果证明,与传统的聚类算法相比,PCSC-SN算法能够获得更好的聚类效果。
关键词
半监督聚类
谱聚类
共享近邻
成对约束
Keywords
semi-supervised clustering
spectral clustering
shared neighbors
paired constraints
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于共享近邻的多视角谱聚类算法
被引量:2
15
作者
宋艳
殷俊
机构
上海海事大学信息工程学院
出处
《计算机应用》
CSCD
北大核心
2020年第11期3211-3216,共6页
基金
国家自然科学基金资助项目(61603243)
中国博士后科学基金资助项目(2017M611503)。
文摘
为了解决谱聚类算法中相似矩阵的构造不能满足簇内数据点高度相似的问题,给出一种基于共享近邻的多视角谱聚类算法(MV-SNN)。首先,算法通过提高共享近邻个数多的两个数据点的相似度,使同簇的数据之间的相似度更高;然后,将改进后的多个视角的相似矩阵进行相加从而整合得到全局相似矩阵;最后,为了解决一般谱聚类算法在后期仍需要通过k均值聚类算法进行数据点划分的问题,给出拉普拉斯矩阵秩约束的方法,从而直接通过全局相似矩阵得到最终的类簇结构。实验结果表明,对比其他几种多视角谱聚类算法,MV-SNN算法在三个聚类衡量标准:准确度、纯度和归一化互信息上的性能提高了1%~20%,在聚类时间上减少了50%左右,可见MV-SNN算法的聚类性能更好,用时更短。
关键词
无监督学习
多视角聚类
相似矩阵
谱聚类
共享近邻
Keywords
unsupervised learning
multi-view clustering
similarity matrix
spectral clustering
shared neighbor
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 面向高维的共享近邻聚类内部指标
被引量:1
16
作者
张龙义
钟才明
机构
宁波大学信息科学与工程学院
宁波大学科学技术学院
出处
《计算机应用》
CSCD
北大核心
2021年第S01期93-100,共8页
基金
国家自然科学基金面上项目(61976134)。
文摘
针对因使用基于距离的相似性度量,传统聚类内部指标随着数据维数的增加而性能下降的问题,提出了一种基于共享近邻相似度的聚类内部指标。首先,利用共享近邻相似度和k最近邻(kNN)方法,估计数据点的密度,构建融合密度的共享近邻相似度图。然后,根据融合密度的共享近邻相似度图,利用最大流算法,计算出类内相似度和类间分离度,并结合两者计算出聚类内部指标。通过对人工数据集和真实数据集的测试表明,与9个基于距离的传统聚类内部指标相比,该指标能更准确评估数据集的最佳划分和预测数据集的最佳类数。因此,该指标处理复杂类结构和高维数据的能力优于所对比的其他聚类内部指标。
关键词
聚类内部指标
聚类
共享近邻 相似度
高维诅咒
有效性指标
Keywords
clustering internal index
clustering
Shared Nearest-Neighbor similarity(SNN)
curse of dimensionality
validity index
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 基于P系统的共享近邻聚类算法及其面部图像处理应用
被引量:8
17
作者
王鑫
刘希玉
顾飞
机构
山东师范大学商学院
出处
《激光杂志》
北大核心
2019年第3期74-78,共5页
基金
国家自然科学基金项目(No.61876101
No.61806114
+3 种基金
No.61602285
No.61602284
No.61502283
No.61472231)
文摘
共享近邻聚类(SNN)是一种基于图的聚类算法,能够在不预设聚类数目的前提下,很好得区分彼此相似的邻近簇。然而SNN因计算开销太大,不适于处理大数据量、高属性维数据。P系统是一种并行分布式生物计算模型,具有与图灵机等价的强大计算能力。本文将SNN与P系统相结合,设计了一种含有多促进剂和多抑制剂的类细胞P系统,提出了基于该系统的膜聚类算法,称为共享近邻膜聚类算法(SNN-P)。最后,用Olivetti Face数据集验证了SNN-P在人脸识别中的有效性。理论分析表明SNN-P相比于传统聚类算法具有极低的时间复杂度,实验结果表明SNN-P对面部图像具有良好的识别能力。
关键词
膜计算
P系统
共享近邻
聚类分析
图像处理
Keywords
membrane computing
P systems
shared nearest neighbor
clustering analysis
image processing
分类号
TN911
[电子电信—通信与信息系统]
题名 一种基于共享近邻的密度峰值聚类算法
被引量:4
18
作者
刘奕志
程汝峰
梁永全
机构
山东科技大学计算机科学与工程学院
山东省智慧矿山信息技术重点实验室
出处
《计算机科学》
CSCD
北大核心
2018年第2期125-129,146,共6页
基金
国家自然科学基金(61203305
61433012)
+2 种基金
山东省自然科学基金(ZR2015FM013)
山东省重点研发计划(攻关)(2016GSF120012)
山东省"泰山学者"攀登计划资助
文摘
基于加权K近邻的密度峰值发现算法(FKNN-DPC)是一种简单、高效的聚类算法,能够自动发现簇中心,并采用加权K近邻的思想快速、准确地完成对非簇中心样本的分配,在各种规模、任意维度、任意形状的数据集上都能得到高质量的聚类结果,但其样本分配策略中的权重仅考虑了样本间的欧氏距离。文中提出了一种基于共享近邻的相似度度量方式,并以此相似度改进样本分配策略,使得样本的分配更符合真实的簇归属情况,从而提高聚类质量。在UCI真实数据集上进行实验,并将所提算法与K-means,DBSCAN,AP,DPC,FKNN-DPC等算法进行对比,验证了其有效性。
关键词
聚类
共享近邻
相似性度量
密度峰值
Keywords
Clustering
Shared nearest neighbors
Similarity measure
Density peak
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 结合共享近邻和共享逆近邻的密度峰聚类
被引量:1
19
作者
周欢欢
张征
张琦
机构
西华师范大学数学与信息学院
出处
《西华师范大学学报(自然科学版)》
2022年第1期108-115,共8页
基金
西华师范大学基本科研业务费项目(19B045)。
文摘
密度峰聚类算法是一种基于密度的新型高效聚类算法,但是存在截断距离难以确定、局部密度定义过于简单和聚类分配策略容错能力差等问题。针对上述问题,提出了一种结合共享近邻和共享逆近邻的密度峰聚类算法。首先,该算法利用样本的共享近邻和共享逆近邻构造新的相似度计算方法;然后,重新定义了局部密度计算公式,避免了截断距离的选取问题;最后,提出了新的分配策略。实验中,在人工数据集和UCI数据集上进行测试,同时与SNNDPC、DPC、FKNN-DPC、AP、OPTICS、DBSCAN和K-means算法进行比较。实验结果表明:密度峰聚类改进算法的聚类结果整体优于其他算法,同时克服了DPC算法中分配策略可能存在的链式错误分配问题。
关键词
共享近邻
共享 逆近邻
密度峰聚类算法
相似度
局部密度
Keywords
shared nearest neighbor
shared inverse nearest neighbor
density peak clustering algorithm
similarity
local density
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 黄山铜镍矿床成矿靶区预测的共享近邻法研究
20
作者
罗晓春
徐人棪
机构
成都地质学院应用数学系
出处
《成都地质学院学报》
CSCD
1992年第2期111-115,共5页
文摘
应用共享近邻法对新疆黄山铜镍矿区进行了成矿靶区预测研究,选用了Cu,Ni,Co,V,Ti等土壤化探数据和超基性岩相作为变量进行分析,最终计算结果与实际地质情况基本吻合。
关键词
共享近邻 法
铜矿
镍矿
成矿
预测
Keywords
neighbour-sharing method
metallogenetic forecasting process
分类号
P618.410.5
[天文地球—矿床学]