期刊文献+
共找到5,862篇文章
< 1 2 250 >
每页显示 20 50 100
光伏波动平抑下改进K-means的电池储能动态分组控制策略
1
作者 余洋 陆文韬 +3 位作者 陈东阳 刘霡 夏雨星 郑晓明 《电力系统保护与控制》 EI CSCD 2024年第7期1-11,共11页
针对电池储能系统(battery energy storage system,BESS)进行光伏波动平抑时寿命损耗高及荷电状态(state of charge,SOC)一致性差的问题,提出了光伏波动平抑下改进K-means的BESS动态分组控制策略。首先,采用最小最大调度方法获取光伏并... 针对电池储能系统(battery energy storage system,BESS)进行光伏波动平抑时寿命损耗高及荷电状态(state of charge,SOC)一致性差的问题,提出了光伏波动平抑下改进K-means的BESS动态分组控制策略。首先,采用最小最大调度方法获取光伏并网指令。其次,设计了改进侏儒猫鼬优化算法(improved dwarf mongoose optimizer,IDMO),并利用它对传统K-means聚类算法进行改进,加快了聚类速度。接着,制定了电池单元动态分组原则,并根据电池单元SOC利用改进K-means将其分为3个电池组。然后,设计了基于充放电函数的电池单元SOC一致性功率分配方法,并据此提出BESS双层功率分配策略,上层确定电池组充放电顺序及指令,下层计算电池单元充放电指令。对所提策略进行仿真验证,结果表明,所设计的IDMO具有更高的寻优精度及更快的寻优速度。所提BESS平抑光伏波动策略在有效平抑波动的同时,降低了BESS运行寿命损耗并提高了电池单元SOC的均衡性。 展开更多
关键词 电池储能系统 波动平抑 功率分配 改进侏儒猫鼬优化算法 改进k-means聚类算法
下载PDF
基于特征分箱和K-Means算法的用户行为分析方法
2
作者 殷丽凤 路建政 《云南民族大学学报(自然科学版)》 CAS 2024年第2期251-257,共7页
针对网购用户所产生的购物行为进行分析,首先通过数据处理构建客户关系管理模型(RFM模型),在此模型的基础上采用特征分箱法和K-Means聚类两种方法对用户进行细分,并对2种模型结果进行比较分析,讨论二者的差异性和具体的应用范围和意义.... 针对网购用户所产生的购物行为进行分析,首先通过数据处理构建客户关系管理模型(RFM模型),在此模型的基础上采用特征分箱法和K-Means聚类两种方法对用户进行细分,并对2种模型结果进行比较分析,讨论二者的差异性和具体的应用范围和意义.其中,基于特征分箱法的RFM模型将变量转化到相似的尺度上并将变量离散化,使得用户分类标签更加清晰,也可依据各类标签分类出不同类型的用户.K-Means算法通过轮廓系数评估聚类算法质量以至于选取最优K值.本文实验分析结果可为运营商提供更加可靠直观的数据,使得运营商可以根据不同用户的不同行为进行市场细分,进而进行精准营销和服务设置. 展开更多
关键词 特征分箱 k-means算法 用户行为 RFM模型 网购
下载PDF
基于改进K-means与机器视觉的档案数据分析技术
3
作者 崔雨晴 《电子设计工程》 2024年第2期191-195,共5页
为了提升医疗信息系统对健康档案数据的分析效率,文中采用图像采集、降噪、配准与差分等技术提取医疗图像信息,进而有效提升信息系统的数据采集效率。同时还对传统的K-means算法加以改进,并提出了一种基于类间、类内距离的聚类初始化评... 为了提升医疗信息系统对健康档案数据的分析效率,文中采用图像采集、降噪、配准与差分等技术提取医疗图像信息,进而有效提升信息系统的数据采集效率。同时还对传统的K-means算法加以改进,并提出了一种基于类间、类内距离的聚类初始化评价指标体系(BWP),将其应用于采集到的档案数据中,以实现快速的聚类分析。将所提算法在CUDA计算平台上进行了实现,测试结果表明,该方法的聚类精度和运行效率较现有算法均有显著提升。此外,改进后K-means算法的正确聚类样本数量占比提升了4.88%,高于现有的主流指标体系,且当聚类数k的取值为16或32时,运行时间大幅降低。 展开更多
关键词 档案数据 k-means CUDA 机器视觉 图像处理
下载PDF
加入跳跃连接的深度嵌入K-means聚类
4
作者 李顺勇 胥瑞 李师毅 《计算机系统应用》 2024年第1期11-21,共11页
现有的深度聚类算法大多采用对称的自编码器来提取高维数据的低维特征,但随着自编码器训练次数的不断增加,数据的低维特征空间在一定程度上发生了扭曲,这样得到的数据低维特征空间无法反映原始数据空间中潜在的聚类结构信息.为了解决上... 现有的深度聚类算法大多采用对称的自编码器来提取高维数据的低维特征,但随着自编码器训练次数的不断增加,数据的低维特征空间在一定程度上发生了扭曲,这样得到的数据低维特征空间无法反映原始数据空间中潜在的聚类结构信息.为了解决上述问题,本文提出了一种新的深度嵌入K-means算法(SDEKC).首先,在低维特征提取阶段,在对称的卷积自编码器中相对应的编码器与解码器之间以一定的权重加入两个跳跃连接,以减弱解码器对编码器的编码要求同时突出卷积自编码器的编码能力,这样可以更好地保留原始数据空间中蕴含的聚类结构信息;其次,在聚类阶段,通过一个标准正交变换矩阵将低维数据空间转换为一个新的揭示聚类结构信息的空间;最后,本文以端到端的方式采用贪婪算法迭代优化数据的低维表示及其聚类,在6个真实数据集上验证了本文提出新算法的有效性. 展开更多
关键词 跳跃连接 深度学习 卷积自编码器 嵌入k-means
下载PDF
基于改进K-means算法的物流配送中心选址研究
5
作者 姚佼 吴秀荣 +3 位作者 李皓 谢贝贝 王诗璇 梁益铭 《物流科技》 2024年第5期10-13,19,共5页
针对传统K-means算法需要主观设定K值及无法处理类别型数据问题,文章运用肘部法及轮廓系数法确定合理K值,对类别型数据采取独热编码(One-Hot Encoding)转换为可以处理的连续型数据,并将其运用到在物流配送中心选址中;并综合考虑多种类... 针对传统K-means算法需要主观设定K值及无法处理类别型数据问题,文章运用肘部法及轮廓系数法确定合理K值,对类别型数据采取独热编码(One-Hot Encoding)转换为可以处理的连续型数据,并将其运用到在物流配送中心选址中;并综合考虑多种类别的影响因素,构建了相应的影响因素指标体系,提出的模型能够识别输入数据的数值型及类别型数据,实现样本的有效聚类。相关的案例分析结果表明,相比传统K-means聚类,文章的改进K-means算法选址结果可使物流总成本降低8.76%,运营成本降低14.85%,固定成本降低8.09%,效果显著。 展开更多
关键词 物流配送中心选址 k-means聚类算法 肘部法 轮廓系数法 独热编码
下载PDF
基于K-means-LSTM模型的证券股价预测
6
作者 肖田田 《科技和产业》 2024年第3期210-215,共6页
鉴于股票数据具有非平稳、非线性等特征,传统的统计模型无法精准预测股票价格的未来趋势。针对这个问题,构建一种混合深度学习方法来提高股票预测性能。首先,通过将距离算法修改为DTW(动态时间归整),令K-means聚类算法拓展为更适用于时... 鉴于股票数据具有非平稳、非线性等特征,传统的统计模型无法精准预测股票价格的未来趋势。针对这个问题,构建一种混合深度学习方法来提高股票预测性能。首先,通过将距离算法修改为DTW(动态时间归整),令K-means聚类算法拓展为更适用于时间序列数据的K-means-DTW,聚类出价格趋势相似的证券;然后,通过聚类数据来训练LSTM(长短时记忆网络)模型,以实现对单支股票价格的预测。实验结果表明,混合模型K-means-LSTM表现出更好的预测性能,其预测精度和稳定性均优于单一LSTM模型。 展开更多
关键词 股票价格预测 k-means DTW(动态时间归整) k-means-LSTM(K均值-长短时记忆网络)混合模型
下载PDF
面向众核处理器的阴阳K-means算法优化
7
作者 周天阳 王庆林 +4 位作者 李荣春 梅松竹 尹尚飞 郝若晨 刘杰 《国防科技大学学报》 EI CAS CSCD 2024年第1期93-102,共10页
传统阴阳K-means算法处理大规模聚类问题时计算开销十分昂贵。针对典型众核处理器的体系结构特征,提出了一种阴阳K-means算法高效并行加速实现。该实现基于一种新内存数据布局,采用众核处理器中的向量单元来加速阴阳K-means中的距离计算... 传统阴阳K-means算法处理大规模聚类问题时计算开销十分昂贵。针对典型众核处理器的体系结构特征,提出了一种阴阳K-means算法高效并行加速实现。该实现基于一种新内存数据布局,采用众核处理器中的向量单元来加速阴阳K-means中的距离计算,并面向非一致内存访问(non-unified memory access, NUMA)特性进行了针对性的访存优化。与阴阳K-means算法的开源多线程实现相比,该实现在ARMv8和x86众核平台上分别获得了最高约5.6与8.7的加速比。因此上述优化方法在众核处理器上成功实现了对阴阳K-means算法的加速。 展开更多
关键词 k-means 非一致内存访问 向量化 众核处理器 性能优化
下载PDF
基于K-means算法的建筑群震害分析模型缩减方法
8
作者 陈夏楠 张令心 +1 位作者 林旭川 王祺 《世界地震工程》 2024年第1期72-79,共8页
基于建筑群模型和弹塑性时程分析的精细化城市震害模拟技术能够为防震减灾及应急救援决策提供必要的依据和参考。为了减小城市建筑群震害模拟的计算量和计算时间,本文提出一种基于聚类算法的建筑群模型缩减方法。该方法采用K-means聚类... 基于建筑群模型和弹塑性时程分析的精细化城市震害模拟技术能够为防震减灾及应急救援决策提供必要的依据和参考。为了减小城市建筑群震害模拟的计算量和计算时间,本文提出一种基于聚类算法的建筑群模型缩减方法。该方法采用K-means聚类算法,首先基于建筑结构属性向量对建筑群进行聚类,将相似的建筑结构聚为一组;然后从每组选取一个代表建筑组成建筑群缩减模型,通过减少需要分析的建筑结构数量来减少建筑群震害模拟的计算量。本文对传统的K-means算法进行改进,通过设定组内建筑结构的差异上限自动调整聚类分组数量;提出将具体地震动作用下结构地震损伤指数作为结构属性向量进行聚类,并通过算例对比分别采用两种缩减模型,即基于损伤指数聚类的缩减模型与基于结构力学模型参数聚类的缩减模型,计算结构损伤状态准确程度。对比结果表明:在聚类分组数量相同的情况下,基于损伤指数的分组明显优于基于模型参数的分组,采用模型缩减方法能够在保证足够计算精度前提下显著减少建筑群震害模拟计算量和计算时间。 展开更多
关键词 城市建筑群 k-means算法 模型缩减 结构模型参数 地震损伤指数
下载PDF
基于参数化角编码的量子K-means算法
9
作者 冯微军 郭躬德 林崧 《量子电子学报》 CAS CSCD 2024年第1期113-124,共12页
结合K-means算法和角编码技术,提出了一种无需量子随机存储(QRAM)的量子K-means算法。该算法利用量子操作的并行性,仅需对数数量的时间复杂度就能完成数据的加载;并且通过对输入数据进行参数预处理操作,确定数据分量的参数阈值,解决了... 结合K-means算法和角编码技术,提出了一种无需量子随机存储(QRAM)的量子K-means算法。该算法利用量子操作的并行性,仅需对数数量的时间复杂度就能完成数据的加载;并且通过对输入数据进行参数预处理操作,确定数据分量的参数阈值,解决了样本不同特征尺度差异的问题。该算法由编码数据、相似度度量、量子最小值搜索和质心迭代更新四个主要步骤组成,细致描述了这些步骤所涉及的算子和线路构建,并对关键线路进行了仿真模拟。实验结果和经典预测结果一致,验证了所提量子K-means算法的可靠性。此外,理论分析表明所提出算法相比于经典算法在运行时间上有平方级加速。 展开更多
关键词 量子光学 量子k-means算法 角编码 量子相位估计 多量子比特交换测试
下载PDF
一种基于K-means聚类算法的沙尘天气客观识别方法
10
作者 段赛男 焦瑞莉 吴成来 《气候与环境研究》 CSCD 2024年第2期178-192,共15页
鉴于以往基于污染物浓度时间序列进行分析的沙尘天气识别方法在判断标准上存在一定的主观性,本文提出一种基于K-means聚类算法的沙尘天气客观识别方法。本方法利用环境监测总站的PM2.5和PM10小时浓度资料进行聚类,首先选取最优的分类数... 鉴于以往基于污染物浓度时间序列进行分析的沙尘天气识别方法在判断标准上存在一定的主观性,本文提出一种基于K-means聚类算法的沙尘天气客观识别方法。本方法利用环境监测总站的PM2.5和PM10小时浓度资料进行聚类,首先选取最优的分类数目K进行聚类,其次对聚类结果中离散程度较高的类别进行再次聚类,直到无需分类。将本方法应用于西安市2018年2~4月沙尘天气的识别中,结果表明,本方法可有效识别主要沙尘天气。此外,利用本方法可得到沙尘天气典型特征:PM2.5占PM10浓度的比例小于43.5%、PM10浓度高于228μg/m^(3,)符合沙尘天气期间PM10浓度较高且以粗颗粒物为主的物理特征。总体上看,本方法物理基础清晰,可操行性强,适用于大规模数据处理,具有较好的实用价值和应用前景。 展开更多
关键词 沙尘天气识别 k-means 聚类 客观识别 PM2.5 PM10
下载PDF
基于随机森林算法和K-means算法的网络攻击识别方法
11
作者 荣文晶 高锐 +2 位作者 赵弘洋 云雷 彭辉 《电子产品可靠性与环境试验》 2024年第1期8-12,共5页
5G网络与核电的深度融合能够提升核电厂生产安全管控水平,减少人为事故,促进核电行业安全和经济发展。但由于网络的接入,为核电安全生产带来了一定的安全风险,恶意攻击者会通过向核电5G网络发起攻击进而破坏核电生产。为了解决核电5G网... 5G网络与核电的深度融合能够提升核电厂生产安全管控水平,减少人为事故,促进核电行业安全和经济发展。但由于网络的接入,为核电安全生产带来了一定的安全风险,恶意攻击者会通过向核电5G网络发起攻击进而破坏核电生产。为了解决核电5G网络场景下面临的网络异常和恶意攻击的问题,提出了一种在核电5G网络场景下基于随机森林算法和K-means算法的实时网络异常检测和网络攻击识别方法,对于提高核电网络安全具有重要的意义。 展开更多
关键词 随机森林算法 k-means算法 网络异常检测 网络攻击识别
下载PDF
基于改进的K-means聚类分区均匀化空间学习索引
12
作者 傅晨华 张丰 +1 位作者 胡林舒 王立君 《浙江大学学报(理学版)》 CAS CSCD 2024年第2期153-161,195,共10页
传统空间索引的体量随数据量的增加而膨胀,查询效率较低。学习索引的体量不随数据量的增加而膨胀,同时避免了层级比较查询,性能优异。将学习索引应用于空间索引存在2个难点:一是选取合适的降维方法实现空间数据的排序;二是对降维后数据... 传统空间索引的体量随数据量的增加而膨胀,查询效率较低。学习索引的体量不随数据量的增加而膨胀,同时避免了层级比较查询,性能优异。将学习索引应用于空间索引存在2个难点:一是选取合适的降维方法实现空间数据的排序;二是对降维后数据序列进行有效的简化分布计算,使其易于拟合。基于此,提出了一种网格混合聚类分区学习索引(grid-ml),用z曲线进行降维,用双层网格结构优化查询策略,用改进的K-means聚类算法进行数据分区,实现数据分布均匀化。对比实验发现,grid-ml构建速度快、存储空间小、查询效率高,较传统空间索引优势显著。 展开更多
关键词 学习索引 k-means聚类 空间填充曲线 空间索引
下载PDF
基于SVD-K-means算法的软扩频信号伪码序列盲估计
13
作者 张慧芝 张天骐 +1 位作者 方蓉 罗庆予 《系统工程与电子技术》 EI CSCD 2024年第1期326-333,共8页
针对通信中软扩频信号伪码序列盲估计困难的问题,提出一种奇异值分解(singular value decomposition,SVD)和K-means聚类相结合的方法。该方法先对接收信号按照一倍伪码周期进行不重叠分段构造数据矩阵。其次对数据矩阵和相似性矩阵分别... 针对通信中软扩频信号伪码序列盲估计困难的问题,提出一种奇异值分解(singular value decomposition,SVD)和K-means聚类相结合的方法。该方法先对接收信号按照一倍伪码周期进行不重叠分段构造数据矩阵。其次对数据矩阵和相似性矩阵分别进行SVD完成对伪码序列集合规模数的估计、数据降噪、粗分类以及初始聚类中心的选取。最后通过K-means算法优化分类结果,得到伪码序列的估计值。该算法在聚类之前事先确定聚类数目,大大减少了迭代次数。同时实验结果表明,该算法在信息码元分组小于5 bit,信噪比大于-10 dB时可以准确估计出软扩频信号的伪码序列,性能较同类算法有所提升。 展开更多
关键词 软扩频信号 盲估计 奇异值分解 k-means
下载PDF
结合人工蜂群与K-means聚类的特征选择
14
作者 孙林 刘梦含 薛占熬 《计算机科学与探索》 CSCD 2024年第1期93-110,共18页
K-means聚类是一种简捷高效、收敛速度快且易于实现的统计分析方法,但是传统的K-means聚类算法对初始聚类中心的选取敏感且易陷入局部最优,同时多数无监督特征选择算法容易忽视特征之间的联系。为此,提出了一种结合人工蜂群与K-means聚... K-means聚类是一种简捷高效、收敛速度快且易于实现的统计分析方法,但是传统的K-means聚类算法对初始聚类中心的选取敏感且易陷入局部最优,同时多数无监督特征选择算法容易忽视特征之间的联系。为此,提出了一种结合人工蜂群与K-means聚类的特征选择方法。首先,为了使同一簇中样本的相似度高而不同簇中样本的相似度低,基于簇内聚集度和簇间离散度构建了新的适应度函数,更好地反映各样本的特性,进而构建了蜜源被选择新的概率表达式;其次,设计了随着迭代次数的增加而数值逐渐减小的权重,提出了使蜂群搜索范围动态缩进的蜜源位置更新表达式;然后,为了弥补传统的欧氏距离在计算距离时仅考虑向量之间的累积差异而表现出的局限性,构造了同时考虑样本影响程度不同以及样本的相似性的加权欧氏距离表达式;最后,引入标准差和距离相关系数,定义了特征区分度与特征代表性,以二者之积度量特征重要性。实验结果表明,所提算法加快了人工蜂群算法的收敛速度并提高了K-means算法的聚类效果,同时也有效地提升了特征选择的分类效果。 展开更多
关键词 特征选择 人工蜂群 k-means聚类 特征重要度
下载PDF
基于改进K-means聚类和皮尔逊相关系数户变关系异常诊断
15
作者 周纲 黄瑞 +3 位作者 刘度度 张芝敏 胡军华 高云鹏 《电测与仪表》 2024年第3期76-82,152,共8页
用电信息采集系统易出现台区户变关系错误问题,传统诊断技术主要针对少用户台区出现异常用户情况,但对于多达数百用户台区,存在多相邻台区异常用户特征提取难题。文中首先通过主成分分析对GIS系统获取台区总表和用户电表电压数据实现降... 用电信息采集系统易出现台区户变关系错误问题,传统诊断技术主要针对少用户台区出现异常用户情况,但对于多达数百用户台区,存在多相邻台区异常用户特征提取难题。文中首先通过主成分分析对GIS系统获取台区总表和用户电表电压数据实现降维,建立改进K-means聚类提取电压数据特征,提出改进皮尔逊相关系数算法分析待检测用户,据此建立基于改进K-means聚类和改进皮尔逊相关系数的户变关系异常诊断方法,实现多异常用户所属正确台区诊断。实际算例分析结果表明,文中提出算法在识别同一台区一个及多个异常用户、不同台区多个异常用户情况下均能有效实现异常用户的准确检测与分析,相比传统检测方法,实现简单且准确性更高。 展开更多
关键词 户变关系 GIS系统 主成分分析 改进k-means聚类
下载PDF
基于BERT-LDA和K-means聚类的绘画作品价值评估指标体系构建
16
作者 李天义 刘勤明 《软件工程》 2024年第1期68-73,共6页
针对目前绘画领域缺乏标准的价值评估指标体系,提出了基于BERT-LDA和K-means聚类的绘画作品价值要素挖掘方法。运用超平面法对绘画文献进行了停用词筛选,基于BERT-LDA模型构建了包含文本语义信息的融合特征向量,运用K-means算法对融合... 针对目前绘画领域缺乏标准的价值评估指标体系,提出了基于BERT-LDA和K-means聚类的绘画作品价值要素挖掘方法。运用超平面法对绘画文献进行了停用词筛选,基于BERT-LDA模型构建了包含文本语义信息的融合特征向量,运用K-means算法对融合特征向量进行降维可视化,随之构建了绘画作品价值评估指标体系。结果表明,基于BERT-LDA模型和K-means算法识别的主题及主题词相比传统LDA模型的查准率、查全率和F值分别提升了28.5%、10%和21.5%。通过随机森林等算法对指标体系进行验证,验证了构建的绘画作品价值评估指标体系的科学性。 展开更多
关键词 BERT-LDA 融合特征向量 k-means聚类 绘画 指标体系
下载PDF
基于狄利克雷多项式过程模型与K-means结合的菌群分析
17
作者 彭显 贺建峰 《生物信息学》 2024年第1期47-57,共11页
群体分型是一种有助于更好的理解人类身心健康等复杂生物学问题的有效方法,聚类是一种为了对样本分组来降低复杂性的定义肠型的方法,而传统K-means聚类算法的K值选取无法确定,本文在传统K-means聚类算法的基础上进行了改进,并公开数据... 群体分型是一种有助于更好的理解人类身心健康等复杂生物学问题的有效方法,聚类是一种为了对样本分组来降低复杂性的定义肠型的方法,而传统K-means聚类算法的K值选取无法确定,本文在传统K-means聚类算法的基础上进行了改进,并公开数据集上进行了验证,实验表明改进算法能够解决K值选取无法确定的问题,且聚类结果的稳定性、准确性和聚类质量都得到显著提高。将改进后的模型运用于肠道菌群OTUs数据,发现不仅能够有效地区分2-型糖尿病患者样本间的相似性,而且能鉴定出影响菌群结构异质性最大的OTUs菌,为临床解决2-型糖尿病问题提供了一种新的思路。 展开更多
关键词 k-means算法 狄利克雷过程混合模型 菌群分析 群体分型 聚类
下载PDF
基于改进K-means数据聚类算法的网络入侵检测
18
作者 黄俊萍 《成都工业学院学报》 2024年第2期58-62,97,共6页
随着入侵手段的不断更新和升级,传统入侵检测方法准确率下降、检测时间延长,无法满足网络防御要求。为此,提出一种经过改进K均值(K-means)数据聚类算法,以应对不断升级的网络入侵行为。先以防火墙日志为基础转换数值,然后基于粒子群算... 随着入侵手段的不断更新和升级,传统入侵检测方法准确率下降、检测时间延长,无法满足网络防御要求。为此,提出一种经过改进K均值(K-means)数据聚类算法,以应对不断升级的网络入侵行为。先以防火墙日志为基础转换数值,然后基于粒子群算法求取最优初始聚类中心,实现K-means数据聚类算法的改进;最后以计算得出的特征值为输入项,实现对网络入侵行为的精准检测。结果表明:K-means算法改进后较改进前的戴维森堡丁指数更小,均低于0.6,达到了改进目的。改进K-means算法各样本的准确率均高于90%,相对更高,检测时间均低于10 s,相对更少,说明该方法能够以高效率完成更准确的网络入侵检测。 展开更多
关键词 改进k-means数据聚类算法 防火墙日志 入侵检测特征 粒子群算法 网络入侵检测
下载PDF
基于改进SVD++算法和K-means++算法的小文件合并方案
19
作者 张广龙 尹铁源 《长江信息通信》 2024年第1期55-60,共6页
文章提出了一种基于改进SVD++算法和K-means++算法的小文件合并方案。通过引入自适应学习率函数和基于并行分组的SVD++算法,优化了小文件的合并过程,以提高Hadoop存储小文件的效率。同时,利用K-means++算法对合并后的文件进行聚类,优化... 文章提出了一种基于改进SVD++算法和K-means++算法的小文件合并方案。通过引入自适应学习率函数和基于并行分组的SVD++算法,优化了小文件的合并过程,以提高Hadoop存储小文件的效率。同时,利用K-means++算法对合并后的文件进行聚类,优化了数据存储方式,降低了存储空间的浪费。在Hadoop平台上进行的实验表明,该方案在保持数据处理准确性和稳定性的同时,显著提升了Hadoop存储与处理小文件的性能。 展开更多
关键词 HADOOP 小文件合并 SVD++算法 k-means++算法
下载PDF
基于k-means算法的高速公路服务区分类研究
20
作者 毛俊飞 张冲 +2 位作者 高超 刘兴国 王光亚 《交通技术》 2024年第2期73-80,共8页
截至2023年6月,我国高速公路的建设规模已达到17.73万公里,位居全球之首。根据国家公路网的长远规划预计到2035年,我国的高速公路总长度将达到16.2万公里,现如今已经提前完成规划,基本形成一个现代化、高质量的国家公路网络。这不仅在... 截至2023年6月,我国高速公路的建设规模已达到17.73万公里,位居全球之首。根据国家公路网的长远规划预计到2035年,我国的高速公路总长度将达到16.2万公里,现如今已经提前完成规划,基本形成一个现代化、高质量的国家公路网络。这不仅在新的发展格局中发挥着重要作用,而且对推动经济发展具有关键性的支持作用。在这个背景下,高速公路服务区的分类成为了一个研究重点。它对于理解不同类型服务区周边的土地利用、客流变化规律、发展趋势和建设规划具有重要意义。为了深入分析这一课题,本文采用了聚类分析方法。通过收集服务区附近的兴趣点(POI)、交通枢纽等关键设施的数据,作为研究的主要变量。在对数据进行Z-Score标准化处理后,本研究运用了主成分分析和k-means聚类方法对高速公路服务区进行了细致的分类。根据我们的分析结果,这些服务区可以分为四类:综合型服务区、融合型生产服务区、旅游型服务区以及工业型生产服务区。这一分类不仅为我们后续的深入研究奠定了基础,而且为服务区未来的发展方向提供了参考。 展开更多
关键词 聚类分析 主成分分析 k-means聚类 高速公路服务区
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部