期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
面向大型数据集的局部敏感哈希K−means算法 被引量:2
1
作者 魏峰 马龙 《工矿自动化》 CSCD 北大核心 2023年第3期53-62,共10页
大型数据集高效处理策略是煤矿安全监测智能化、采掘智能化等煤矿智能化建设的关键支撑。针对K−means算法面对大型数据集时聚类高效性及准确性不足的问题,提出了一种基于局部敏感哈希(LSH)的高效K−means聚类算法。基于LSH对抽样过程进... 大型数据集高效处理策略是煤矿安全监测智能化、采掘智能化等煤矿智能化建设的关键支撑。针对K−means算法面对大型数据集时聚类高效性及准确性不足的问题,提出了一种基于局部敏感哈希(LSH)的高效K−means聚类算法。基于LSH对抽样过程进行优化,提出了数据组构建算法LSH−G,将大型数据集合理划分为子数据组,并对数据集中的噪声点进行有效删除;基于LSH−G算法优化密度偏差抽样(DBS)算法中的子数据组划分过程,提出了数据组抽样算法LSH−GD,使样本集能更真实地反映原始数据集的分布规律;在此基础上,通过K−means算法对生成的样本集进行聚类,实现较低时间复杂度情况下从大型数据集中高效挖掘有效数据。实验结果表明:由10个AND操作与8个OR操作组成的级联组合为最优级联组合,得到的类中心误差平方和(SSEC)最小;在人工数据集上,与基于多层随机抽样(M−SRS)的K−means算法、基于DBS的K−means算法及基于网格密度偏差抽样(G−DBS)的K−means算法相比,基于LSH−GD的K−means算法在聚类准确性方面的平均提升幅度分别为56.63%、54.59%及25.34%,在聚类高效性方面的平均提升幅度分别为27.26%、16.81%及7.07%;在UCI标准数据集上,基于LSH−GD的K−means聚类算法获得的SSEC与CPU消耗时间(CPU−C)均为最优。 展开更多
关键词 智慧矿山 大型数据集 k−means聚类 局部敏感哈希 噪声点筛选 密度偏差抽样
下载PDF
基于组合赋权和聚类方法的膨胀土边坡防护工程健康诊断模型与应用 被引量:8
2
作者 谢彦初 汪磊 +3 位作者 孙德安 张磊 刘传新 徐永福 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第1期258-268,共11页
为了对膨胀土边坡防护工程的健康状态进行精准、快速评价,参考现有的研究成果和行业规范,选取表征膨胀土边坡防护工程健康状态的指标,提出一种基于组合赋权和二分K−means聚类方法的膨胀土边坡防护工程健康诊断模型。该模型结合改进层次... 为了对膨胀土边坡防护工程的健康状态进行精准、快速评价,参考现有的研究成果和行业规范,选取表征膨胀土边坡防护工程健康状态的指标,提出一种基于组合赋权和二分K−means聚类方法的膨胀土边坡防护工程健康诊断模型。该模型结合改进层次分析法确定的主观权重和CRITIC赋权法确定的客观权重,计算出组合权重,然后对指标数据进行量化处理,再运用二分K−means聚类算法确定膨胀土边坡防护工程的健康等级。最后,以南京市郊区某一膨胀土边坡防护工程为实例,将本文提出的健康诊断模型与模糊层次分析法(FAHP)以及高斯混合聚类方法(GMC)的计算结果进行对比分析。研究结果表明:采用本文所提健康诊断模型能对不同破损程度的防护工程进行准确的健康评价;与其他2种方法相比,本文所提模型的诊断结果与现场勘察结果更吻合,反映了防护工程的真实健康状态,可为膨胀土边坡防护工程的科学养护和修缮决策提供参考依据。 展开更多
关键词 膨胀土边坡 防护工程 健康诊断 改进层次分析法 二分k−means聚类 CRITIC赋权法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部