期刊文献+
共找到42,686篇文章
< 1 2 250 >
每页显示 20 50 100
基于一致性图的权重自适应多视角谱聚类算法
1
作者 王丽娟 邢津萍 +3 位作者 尹明 郝志峰 蔡瑞初 温雯 《计算机工程》 CAS CSCD 北大核心 2024年第2期122-131,共10页
随着移动设备和互联网的普及,多视角数据的采集和分享变得更加容易,其可以从多个视角更准确地描述数据。目前,一些多视角聚类算法忽略了不同视角间的一致性潜在知识和不同视角的重要性。针对该问题,提出一种平衡视角间一致性信息的多视... 随着移动设备和互联网的普及,多视角数据的采集和分享变得更加容易,其可以从多个视角更准确地描述数据。目前,一些多视角聚类算法忽略了不同视角间的一致性潜在知识和不同视角的重要性。针对该问题,提出一种平衡视角间一致性信息的多视角聚类算法。首先通过调节视角权重学习视角间一致的共享相似度矩阵,提升共享矩阵的一致性,其中相关性强的视角具有的一致性信息更多,视角权重越大,在一致性学习中发挥的作用越大,而差异性大的视角其权重越小,在学习中发挥的作用越小。其次学习视角间的一致性样本嵌入以及不同视角的特征嵌入,并将特征嵌入中包含的多样性特征信息迁移到样本嵌入中,以此促进样本嵌入的一致性表达。在不同视角特征中包含多样性信息,可补充上述共享相似度矩阵学习中单一样本关系的不足。因此,采用二部图协同聚类,通过建立样本数据、样本嵌入和特征嵌入的关系图,学习样本的特征嵌入,并将其迁移到样本嵌入中。最后将图学习、谱聚类和特征嵌入学习整合到统一的框架中进行联合优化,得到最优的样本嵌入。实验结果表明,通过对样本嵌入进行K-means聚类,将该算法运行于5个真实数据集并与7种聚类算法对比,其中在3-Sources、Yale、MRSCV1数据集上的正确率均高于对比算法5%以上,验证了该算法的有效性。 展开更多
关键词 多视角聚类 一致性学习 权重自适应 协同聚类 聚类
下载PDF
基于信念子簇切割的模糊聚类算法
2
作者 丁雨 张瀚霖 +1 位作者 罗荣 孟华 《计算机应用》 CSCD 北大核心 2024年第4期1128-1138,共11页
信念峰值聚类(BPC)算法是一种基于模糊视角的密度峰值聚类(DPC)算法的新变体,它用模糊数学的观点刻画数据的分布特征与相关性。但BPC算法的信念值计算主要基于局部数据点信息,未考察数据集整体的分布和结构,且原始的分配策略鲁棒性弱。... 信念峰值聚类(BPC)算法是一种基于模糊视角的密度峰值聚类(DPC)算法的新变体,它用模糊数学的观点刻画数据的分布特征与相关性。但BPC算法的信念值计算主要基于局部数据点信息,未考察数据集整体的分布和结构,且原始的分配策略鲁棒性弱。针对以上问题,提出一种基于信念子簇切割的模糊聚类算法(BSCC),所提算法结合了信念峰值和谱方法。首先,通过局部信念信息将数据集划分为众多高纯度子簇;其次,将子簇视作新样本,通过簇间的相似关系,利用谱方法进行割图聚类,从而耦合局部信息与全局信息;最后,将子簇内的点分配至子簇所在类簇以完成最终聚类。与BPC算法相比,BSCC在带有多子簇结构的数据集上具有明显优势,如在americanflag数据集和Car数据集上的准确率(ACC)分别提高了16.38个百分点和21.35个百分点。在合成数据集和真实数据集上的聚类实验结果表明,BSCC在调整兰德系数(ARI)、归一化互信息(NMI)和ACC这3个评价指标上整体优于BPC和其他7种聚类算法。 展开更多
关键词 聚类分析 密度峰值聚类 信念峰值聚类 聚类 信念子簇 子簇合并
下载PDF
结合聚类边界采样的主动学习
3
作者 胡峰 李路正 +1 位作者 代劲 刘群 《智能系统学报》 CSCD 北大核心 2024年第2期482-492,共11页
主动学习是一种机器学习方法,需要选择最有价值的样本进行标注。目前,主动学习在应用时面临着一些挑战,其依赖分类器的先验假设,这容易导致分类器性能意外下降,同时需要一定规模的样本作为启动条件。聚类可以降低问题规模,是主动学习的... 主动学习是一种机器学习方法,需要选择最有价值的样本进行标注。目前,主动学习在应用时面临着一些挑战,其依赖分类器的先验假设,这容易导致分类器性能意外下降,同时需要一定规模的样本作为启动条件。聚类可以降低问题规模,是主动学习的一种有效手段。为此,结合密度聚类边界采样,开展主动学习方法的研究。针对容易产生分类错误的聚类边界区域,通过计算样本密度,提出一种密度峰值聚类边界点采样方法;在此基础上,给出密度熵的定义,并利用密度熵对聚类边界区域进行启发式搜索,提出一种基于聚类边界采样的主动学习方法。试验结果表明,与文献中的5种主动学习算法相比,该算法能够以更少标记量获得同等甚至更高的分类性能,是一种有效的主动学习算法;在标记不足,无标签样本总量20%的情况下,算法在Accuracy、F-score等指标上取得较好的结果。 展开更多
关键词 主动学习 机器学习 聚类边界 密度峰值聚类 几何采样 信息熵 版本空间 主动聚类
下载PDF
结合软约束的演化数据流模糊聚类算法
4
作者 代少升 边志奇 袁中明 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第2期287-298,共12页
多源局部放电检测中,不同类型的局放信号同时存在且不断变化使得信号的分离更具挑战,而这种情况同样存在于许多数据流的聚类分析场景中。为了能够适应类簇内的不均匀密度和类簇间的重叠边界问题,同时对数据流的漂移和演化进行及时跟踪,... 多源局部放电检测中,不同类型的局放信号同时存在且不断变化使得信号的分离更具挑战,而这种情况同样存在于许多数据流的聚类分析场景中。为了能够适应类簇内的不均匀密度和类簇间的重叠边界问题,同时对数据流的漂移和演化进行及时跟踪,提出了一种结合软约束的实时数据流模糊聚类算法。算法引入2种模糊性软约束来描述微簇距离和密度上的不确定度,通过阈值划分出核心微簇、边界微簇和离群微簇;在类簇边缘使用模糊隶属度,给予微簇分属不同类簇的可能性,保证类簇的完整性并提高聚类效果;使用两阶段的流程结构和2种时间窗口模型,赋予算法具有对可变化数据流的适应能力和更低的时间空间占用率。在多种数据集上的实验表明,该算法相比同类型算法在聚类效果上提升了1%~3%,且平均运行时间缩短5%~20%,在实际硬件平台的测试中也验证了算法的聚类分离性能。 展开更多
关键词 数据流聚类 密度聚类 模糊聚类 概念漂移 局部放电
下载PDF
基于三支决策的灰色可能度聚类方法及应用
5
作者 杜俊良 刘思峰 +2 位作者 刘勇 李志远 张维亮 《运筹与管理》 CSCD 北大核心 2024年第1期23-28,共6页
针对经典的灰色可能度聚类评估模型难以判定决策对象的灰类归属和过度聚类等问题,利用三支决策的思想和方法,通过引入三支灰类的概念描述决策对象和灰类之间的不确定聚类关系;将其代替灰色定权聚类中的灰类和严格的聚类关系,构建基于三... 针对经典的灰色可能度聚类评估模型难以判定决策对象的灰类归属和过度聚类等问题,利用三支决策的思想和方法,通过引入三支灰类的概念描述决策对象和灰类之间的不确定聚类关系;将其代替灰色定权聚类中的灰类和严格的聚类关系,构建基于三支决策的灰色可能度聚类方法,并采用决策粗糙集中的贝叶斯推理确定聚类阈值;最后,以案例验证所提方法的有效性和合理性。结果表明:本文所构建的模型是经典灰色可能度聚类评估模型的拓展和泛化,可以有效避免过度聚类,降低决策风险,提高聚类可靠性。 展开更多
关键词 灰色聚类 三支决策 不确定聚类 聚类阈值
下载PDF
跳跃跟踪SSA交叉迭代AP聚类算法
6
作者 黄鹤 李文龙 +3 位作者 杨澜 王会峰 高涛 陈婷 《电子学报》 EI CAS CSCD 北大核心 2024年第3期977-990,共14页
针对传统近邻传播聚类算法以数据点对之间的相似度作为输入度量,由于需要预设偏向参数p和阻尼系数λ,算法精度无法精确控制的问题,提出了一种跳跃跟踪麻雀搜索算法优化的交叉迭代近邻传播聚类方法.首先,针对麻雀搜索算法中发现者和加入... 针对传统近邻传播聚类算法以数据点对之间的相似度作为输入度量,由于需要预设偏向参数p和阻尼系数λ,算法精度无法精确控制的问题,提出了一种跳跃跟踪麻雀搜索算法优化的交叉迭代近邻传播聚类方法.首先,针对麻雀搜索算法中发现者和加入者位置更新不足的问题,设计了一种跳跃跟踪优化策略,通过考虑偏好阻尼因子的跳跃策略设计大步长更新发现者,增加麻雀搜索算法的全局勘探能力和寻优速度,加入者设计动态小步长跟踪领头雀更新位置,同时,利用自适应种群划分机制更新发现者和加入者的比重,增加算法的后期局部开发能力和寻优速度;其次,设计基于扰动因子的Tent映射,在此基础上增加3个参数,使映射分布范围增大,并避免了陷入小周期点和不稳周期点;最后,引入轮廓系数作为评价函数,跳跃跟踪麻雀搜索算法自动寻找较优的p和λ,代替手动输入参数,并融合基于扰动因子的Tent映射优化近邻传播算法,交叉迭代确定最优簇数.使用多种算法聚类University of California Irvine数据集的10种公共数据集,仿真结果表明,本文提出的聚类算法与经典近邻传播算法、基于差分改进的仿射传播聚类算法、基于麻雀搜索算法优化的近邻传播聚类算法和进化近邻传播算法相比具有更优的搜索效率以及聚类精度.对国家信息数据进行了聚类分析,提出的方法更加准确有效合理,具有较好的应用价值. 展开更多
关键词 近邻传播聚类 改进Tent映射 改进麻雀搜索算法 轮廓系数 聚类数据集
下载PDF
基于三阶张量的大规模数据谱聚类集成算法
7
作者 仵匀政 杜韬 +2 位作者 周劲 陈迪 王心耕 《大数据》 2024年第3期133-148,共16页
为了降低大规模数据谱聚类计算负担,进一步提高聚类的准确性和鲁棒性,提出了一种基于三阶张量的大规模数据谱聚类集成算法。首先,提出一种混合代表最近邻近似方法构造数据间的稀疏亲和子矩阵;然后将稀疏亲和子矩阵表示为二部图,通过图... 为了降低大规模数据谱聚类计算负担,进一步提高聚类的准确性和鲁棒性,提出了一种基于三阶张量的大规模数据谱聚类集成算法。首先,提出一种混合代表最近邻近似方法构造数据间的稀疏亲和子矩阵;然后将稀疏亲和子矩阵表示为二部图,通过图分割的方法得到初步聚类结果;最后,提出三阶张量集成方法,将多个聚类结果进行融合,得到最终的聚类结果。在大规模的真实数据集和合成数据集上验证,相较经典的谱聚类算法、聚类集成算法以及近年来对其改进的算法,该算法表现出更优异的性能。 展开更多
关键词 数据聚类 大规模数据 聚类 三阶张量 聚类集成
下载PDF
基于机器学习的茶树DNA聚类算法
8
作者 杨小平 倪萍 +4 位作者 诸葛天秋 罗跃新 郭春雨 庞月兰 吴雨婷 《广西大学学报(自然科学版)》 CAS 北大核心 2024年第2期386-399,共14页
为了研究茶树基因序列的聚类问题,设计一种基于累计方差贡献率进行改进的核主成分分析(KPCA)与k均值(k-means)++聚类算法相结合的降维聚类算法(KPCA-k-means++)。将基因库数据集筛选分组后,利用k-mers算法提取基因数据的数据特征,根据... 为了研究茶树基因序列的聚类问题,设计一种基于累计方差贡献率进行改进的核主成分分析(KPCA)与k均值(k-means)++聚类算法相结合的降维聚类算法(KPCA-k-means++)。将基因库数据集筛选分组后,利用k-mers算法提取基因数据的数据特征,根据累计方差贡献率的占比大于85%的标准确定降维主元个数对KPCA进行降维改进并采用k-means++算法对降维后数据聚类,通过CH(Calinski-Harabaze Index)指标和响应时间分析聚类结果。结果表明:在单独聚类、KPCA聚类、改进PCA聚类、改进KPCA聚类4种处理方式中,改进KPCA-k-means++算法在不同处理方式和不同样本数的对比下,CH指标均为最高,与未改进时相比平均高出33%。在响应时间方面,改进KPCA-k-means++算法与同样改进PCA-k-means++算法在不同聚类数和样本数的对比下响应时间均较短。改进KPCA-k-means++算法能够保证对于茶树的基因序列的聚类准确率和聚类速度,表现出极好的聚类稳定性。 展开更多
关键词 核主成分分析 累计方差贡献率 K均值聚类算法 基因聚类
下载PDF
基于组合相似度动态聚类和词熵的网络话题在线检测
9
作者 郭慧 王亚楠 +2 位作者 王欣艳 魏艺泽 王养廷 《情报杂志》 北大核心 2024年第5期159-166,共8页
[研究目的]为实现网络热点话题的在线检测,提升增量式聚类算法的聚类效果,提出了基于组合相似度的动态聚类算法,同时通过计算词熵实现主题词提取和演化跟踪。[研究方法]通过CIFG-BiLSTM-CRF模型实现文本的命名实体识别,计算文本与话题... [研究目的]为实现网络热点话题的在线检测,提升增量式聚类算法的聚类效果,提出了基于组合相似度的动态聚类算法,同时通过计算词熵实现主题词提取和演化跟踪。[研究方法]通过CIFG-BiLSTM-CRF模型实现文本的命名实体识别,计算文本与话题的实体相似度,再取文本词向量与话题中心余弦相似度的最大值作为词向量相似度,二者结合判断文本所属话题。在聚类过程中利用时间窗口策略实现话题中心和成员文本的动态更新。同时,计算文本词熵,生成话题的词熵和列表,实现话题主题词提取和演化跟踪。实验以新冠疫情新闻为数据实现话题在线检测,并展示了话题主题词的演化和跟踪过程。[研究结论]实验表明,与传统相似度计算方法相比,组合相似度能够获得更好的聚类效果,聚类过程中提取出的话题主题词也正确地反映了原始数据的热点话题内容。 展开更多
关键词 网络话题 在线话题检测 增量式聚类 主题词提取 组合相似度 动态聚类算法 词熵
下载PDF
基于类簇合并的无参数密度峰值聚类算法
10
作者 刘天娇 王胜景 袁永生 《现代电子技术》 北大核心 2024年第8期1-8,共8页
密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚... 密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚类算法(NDPCCM)。首先根据样本点两两之间的相似度的分布特征将其分为类内相似度和类间相似度两种类型,并利用类内相似度自动确定截断相似度,避免了人为设置参数;接着根据簇中心权值的下降趋势自动选择初始类簇中心,得到初始类簇;最后通过合并初始类簇对初步聚类结果进行优化,提高了聚类的准确性。在人工数据集和UCI真实数据集上,将所提算法与DPC、DBSCAN、K-means算法进行对比实验。结果表明所提算法无需输入参数就能够自动得到类簇,且聚类性能优于其他算法。 展开更多
关键词 聚类分析 密度峰值聚类算法 初始 簇合并 相似度 聚类性能
下载PDF
局部标准差优化的密度峰值聚类算法
11
作者 谢娟英 张文杰 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期47-62,共16页
密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密... 密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密簇和稀疏簇;此外,DPC算法的一步分配策略使得一旦有一个样本分配错误,将导致更多样本的错误分配,产生“多米诺骨牌效应”。针对这些问题,提出一种新的样本局部密度定义,采用局部标准差指数定义样本局部密度,克服DPC的密度定义缺陷;采用两步分配策略代替DPC的一步分配策略,克服DPC的“多米诺骨牌效应”,得到ESDTS-DPC算法。与DPC及其改进算法KNN-DPC、FKNN-DPC、DPC-CE和经典密度聚类算法DBSCAN的实验比较显示,提出的ESDTS-DPC算法具有更好的聚类准确性。 展开更多
关键词 密度峰值聚类 标准差 局部密度 分配策略 聚类
下载PDF
基于大数据聚类的通信网络安全态势预测技术
12
作者 陈功平 王红 《淮阴师范学院学报(自然科学版)》 CAS 2024年第1期20-26,共7页
传统通信网络安全态势预测技术缺乏大数据支撑,难以对发生的攻击进行详细分类和追踪,导致在进行长时间的态势预测中收敛过慢,准确度降低.提出一种基于大数据聚类的通信网络安全态势预测技术.分析通信网络的属性以及特点,选择安全态势描... 传统通信网络安全态势预测技术缺乏大数据支撑,难以对发生的攻击进行详细分类和追踪,导致在进行长时间的态势预测中收敛过慢,准确度降低.提出一种基于大数据聚类的通信网络安全态势预测技术.分析通信网络的属性以及特点,选择安全态势描述一级指标,将数据标准化处理之后,细分出二级指标;优化大数据聚类算法,计算最优聚类数量、确定聚类中心,建立关联规则库并优化预测流程,完成基于大数据聚类的通信网络安全态势预测技术的设计.通过实验结果表明,与两种传统的安全态势预测技术相比,设计的技术收敛速度更快,全体数据点没有出现残差扩散的现象,并且数据完整度较高. 展开更多
关键词 大数据聚类 通信网络 安全态势 描述指标 聚类优化 收敛速度
下载PDF
基于覆盖树的自适应均值漂移聚类算法
13
作者 温柳英 庞柯 《计算机工程与设计》 北大核心 2024年第2期452-458,共7页
为解决均值漂移聚类算法聚类效果依赖于带宽参数的主观选取,以及处理密度变化大的数据集时聚类结果精确度问题,提出一种基于覆盖树的自适应均值漂移聚类算法MSCT(MeanShift based on Cover-Tree)。构建一个覆盖树数据集,在计算漂移向量... 为解决均值漂移聚类算法聚类效果依赖于带宽参数的主观选取,以及处理密度变化大的数据集时聚类结果精确度问题,提出一种基于覆盖树的自适应均值漂移聚类算法MSCT(MeanShift based on Cover-Tree)。构建一个覆盖树数据集,在计算漂移向量过程中结合覆盖树数据集获得新的漂移向量结果KnnShift,在不同数据密度分布的数据集上都能自适应产生带宽参数,所有数据点完成漂移过程后获得聚类结果。实验结果表明,MSCT算法的聚类效果整体上优于MS、DBSCAN等算法。 展开更多
关键词 聚类 均值漂移 覆盖树 滑动窗口 最近邻 密度聚类 机器学习
下载PDF
基于凝聚层次聚类算法的ATT&CK模型改进
14
作者 徐明迪 崔峰 《计算机与数字工程》 2024年第1期201-205,239,共6页
在应用ATT&CK模型(网络攻击模型)进行网络安全威胁分析的过程中,ATT&CK模型提供的技术集合过于复杂。针对ATT&CK模型应用复杂的问题,论文对模型的技术集进行聚类简化研究,提出了基于聚类算法的模型改进方法,首先对ATT&C... 在应用ATT&CK模型(网络攻击模型)进行网络安全威胁分析的过程中,ATT&CK模型提供的技术集合过于复杂。针对ATT&CK模型应用复杂的问题,论文对模型的技术集进行聚类简化研究,提出了基于聚类算法的模型改进方法,首先对ATT&CK模型的技术集合进行量化和聚类趋势评估,然后对量化的数据应用凝聚层次聚类算法得到简化的聚类结果,最后通过实验验证模型改进有效性。 展开更多
关键词 网络攻击模型 ATT&CK 聚类算法 层次聚类
下载PDF
基于重频熵的自适应方位聚类算法研究
15
作者 沈路 褚心童 +2 位作者 杜冶 杨启伦 赵巍 《电子信息对抗技术》 2024年第2期40-45,共6页
针对传统方位聚类算法由于采用固定门限而难以准确对密集方位目标进行准确分选的难题,提出一种基于重频熵的自适应方位聚类算法。算法首先定义了重频熵数学模型,然后采用一系列不同的方位门限对脉冲进行聚类,并依据重频熵对不同方位门... 针对传统方位聚类算法由于采用固定门限而难以准确对密集方位目标进行准确分选的难题,提出一种基于重频熵的自适应方位聚类算法。算法首先定义了重频熵数学模型,然后采用一系列不同的方位门限对脉冲进行聚类,并依据重频熵对不同方位门限的脉冲聚类结果进行度量,最后选取最优方位门限对脉冲进行聚类处理。仿真和实际数据验证表明,本算法可处理得到准确的聚类结果,与传统聚类算法相比本算法在密集信号环境下的聚类准确率可提升15%以上。 展开更多
关键词 重频熵 方位聚类 信号分选 自适应 脉冲聚类
下载PDF
基于近邻传播聚类的电商商品信息个性化推送研究
16
作者 张博君 《中国信息界》 2024年第2期246-248,共3页
引言.在当今数字化时代的电商环境中,向用户提供个性化的商品信息推送成为关键任务。近邻传播聚类是一种先进的数据聚类方法,可以有效地对用户和商品信息进行分类,实现精准的个性化推送。近邻传播聚类是一种基于数据相似性的聚类算法,... 引言.在当今数字化时代的电商环境中,向用户提供个性化的商品信息推送成为关键任务。近邻传播聚类是一种先进的数据聚类方法,可以有效地对用户和商品信息进行分类,实现精准的个性化推送。近邻传播聚类是一种基于数据相似性的聚类算法,能够在海量数据中发掘出数据的内在结构,为电商商品信息个性化推送提供有力支持。为了更好地应用近邻传播聚类算法进行电商商品信息个性化推送,本文开发了一种基于近邻传播聚类的电商商品信息个性化推送系统[1]。 展开更多
关键词 近邻传播聚类 个性化推送 数据聚类 聚类算法 数据相似性 海量数据 数字化时代 商品信息
下载PDF
一种修正评分偏差并精细聚类中心的协同过滤推荐算法
17
作者 马鑫 段刚龙 《统计与决策》 北大核心 2024年第4期23-27,共5页
协同过滤作为国内外学者普遍关注的推荐算法之一,受评分失真、数据稀疏等问题影响,算法推荐效果不尽如人意。为解决上述问题,文章提出了一种改进的聚类协同过滤推荐算法。首先,该算法利用无监督情感挖掘技术将评论情感映射为一个固定区... 协同过滤作为国内外学者普遍关注的推荐算法之一,受评分失真、数据稀疏等问题影响,算法推荐效果不尽如人意。为解决上述问题,文章提出了一种改进的聚类协同过滤推荐算法。首先,该算法利用无监督情感挖掘技术将评论情感映射为一个固定区间中的值,通过加权修正用户评分偏差;然后,构建修正后用户-产品评分矩阵的数据场,利用启发式寻优算法计算最佳聚类数和最优初始聚类中心,进而对用户进行划分聚类,结合最近邻用户相似性与评分产生推荐结果;最后,基于三个自建真实数据集对所提算法性能和有效性进行全面评估。实验结果表明,改进算法在精度Precision、召回率Recall和F1-Score评价指标上的表现均优于其他算法,能够有效应对数据稀疏的问题,提升推荐系统的推荐效果。 展开更多
关键词 评分偏差 随机初始聚类中心 协同过滤 评论情感挖掘 数据场聚类
原文传递
基于交互基函数的数据流聚类算法研究
18
作者 黄承宁 李莉 +1 位作者 姜丽莉 徐平平 《计算机技术与发展》 2024年第3期28-34,共7页
聚类是数据挖掘的有效工具,数据流聚类成为当前研究热点,目前很多数据流聚类算法已经被提出,但大部分算法将距离作为相似度度量标准,存在对噪点敏感问题,且聚类效果不理想。为了增强数据流聚类算法的灵活性并提升聚类质量,该文将分数阶... 聚类是数据挖掘的有效工具,数据流聚类成为当前研究热点,目前很多数据流聚类算法已经被提出,但大部分算法将距离作为相似度度量标准,存在对噪点敏感问题,且聚类效果不理想。为了增强数据流聚类算法的灵活性并提升聚类质量,该文将分数阶交互基函数(IBFs)引入数据流聚类,结合模糊ART算法对其进行了扩展,生成柔性决策边策略,提出了新颖的数据流聚类算法IBFs_ART。该算法首先对到达的数据点根据特征之间的相关性通过预计算函数特征扩展,并对原有特征进行分数阶变换,之后再基于交互基函数进行数据流聚类。交互基函数可生成灵活的决策边界且不需要指定软件,预计算函数可以在任何算法中实现,其可用于数据流聚类算法的任何扩展。经过实验表明,使用IBFs实现了较低计算成本生成灵活决策边界来找到最优聚簇,在相同警戒参数下实现了更高聚类质量和纯度,较传统聚类算法拥有更高的聚类精度、对称度量和更小的错误率。 展开更多
关键词 聚类 数据流 数据流聚类 交互基函数 模糊自适应谐振理论
下载PDF
农业机器人采摘目标识别技术研究——基于FCM模糊聚类算法 被引量:1
19
作者 冯高峰 《农机化研究》 北大核心 2024年第3期30-33,41,共5页
介绍了FCM(Fuzzy C-Means)模糊聚类算法的原理,采用权重分配的方法对该算法进行了改进,通过建立模糊的相似矩阵,对目标对象的特征聚类图进行分析,并引入隶属度矩阵对FCM算法进行优化,以加快算法的迭代速度。实验结果表明:农业机器人采... 介绍了FCM(Fuzzy C-Means)模糊聚类算法的原理,采用权重分配的方法对该算法进行了改进,通过建立模糊的相似矩阵,对目标对象的特征聚类图进行分析,并引入隶属度矩阵对FCM算法进行优化,以加快算法的迭代速度。实验结果表明:农业机器人采用该方法对农作物轮廓分割识别度较高,算法计算效率较快,验证了其可靠性,该方法可用于目标农作物的分割和目标识别。 展开更多
关键词 农业机器人 FCM 模糊聚类 隶属度矩阵 目标识别
下载PDF
基于HDBSCAN算法的终端区航迹聚类
20
作者 王志伟 刘继新 +1 位作者 杨宋瑞雪 田文 《计算机仿真》 2024年第1期44-47,348,共5页
针对机场终端区运行环境复杂,空中交通流密度分布不均的问题,提出了一种基于快速动态时间规整(FastDTW)和层次密度聚类(HDBSCAN)算法识别具有密度差异的交通流,以挖掘终端空域的交通流模式。结合航迹的多维特征,对原始航迹数据进行重采... 针对机场终端区运行环境复杂,空中交通流密度分布不均的问题,提出了一种基于快速动态时间规整(FastDTW)和层次密度聚类(HDBSCAN)算法识别具有密度差异的交通流,以挖掘终端空域的交通流模式。结合航迹的多维特征,对原始航迹数据进行重采样;利用Fast DTW方法构建航迹相似度矩阵,应用HDBSCAN方法对输入矩阵进行聚类。运用终端区真实航迹数据进行仿真验证,仿真结果表明,上述方法可以实现航迹精细化聚类,有效识别不同密度的空中交通流。 展开更多
关键词 航空运输 航迹聚类 动态时间规整 层次密度聚类
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部