期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
一种有效的不确定数据概率频繁项集挖掘算法 被引量:8
1
作者 刘立新 张晓琳 毛伊敏 《计算机应用研究》 CSCD 北大核心 2012年第3期841-843,共3页
针对PFIM算法中频繁概率计算方法的局限性,且挖掘时需要多次扫描数据库和生成大量候选集的不足,提出EPFIM(efficient probabilistic frequent itemset mining)算法。新提出的频繁概率计算方法能适应数据流等项集的概率发生变化时的情况... 针对PFIM算法中频繁概率计算方法的局限性,且挖掘时需要多次扫描数据库和生成大量候选集的不足,提出EPFIM(efficient probabilistic frequent itemset mining)算法。新提出的频繁概率计算方法能适应数据流等项集的概率发生变化时的情况;通过不确定数据库存储在概率矩阵中,以及利用项集的有序性和逐步删除无用事物来提高挖掘效率。理论分析和实验结果证明了EPFIM算法的性能更优。 展开更多
关键词 不确定数据 可能世界 期望支持度 概率频繁项集
下载PDF
基于有序树的不确定数据最大频繁项挖掘算法 被引量:7
2
作者 刘卫明 蒯海龙 +1 位作者 陈志刚 毛伊敏 《计算机工程与应用》 CSCD 北大核心 2015年第24期145-149,共5页
针对UF-tree中项集存在的数据和路径冗余的问题,设计了有序的压缩不确定树SCUF-tree,在节点中存储元素的不同支持度,达到压缩存储空间和方便移植已有的确定数据最大频繁项集算法的目的。结合最大频繁项集挖掘算法MMFI的设计思想,提出了... 针对UF-tree中项集存在的数据和路径冗余的问题,设计了有序的压缩不确定树SCUF-tree,在节点中存储元素的不同支持度,达到压缩存储空间和方便移植已有的确定数据最大频繁项集算法的目的。结合最大频繁项集挖掘算法MMFI的设计思想,提出了一种挖掘不确定最大频繁项集算法UMMFI算法,并采取逐层逐个的NBN策略挖掘不确定最大频繁项集。实验结果表明,UMMFI算法具有较好的时空效益和适应性。 展开更多
关键词 不确定数据的最大频繁项集 不确定数据最大频繁项挖掘(UMMFI)算法 有序的压缩不确定树(SCUF-tree) 逐层逐个地处理节点(NBN)策略
下载PDF
项约束先过滤的最大频繁项集挖掘算法 被引量:8
3
作者 姚全珠 李如琼 王美君 《计算机工程》 CAS CSCD 2012年第4期73-75,共3页
在稠密型数据库中,现有最大频繁项集挖掘算法效率低、耗时长,挖掘结果模糊,不利于用户使用。为此,提出一种项约束先过滤的最大频繁项集挖掘算法——VCM。利用项包含约束过滤数据库,使用垂直数据表示数据集,采用深度优先的挖掘策略对数... 在稠密型数据库中,现有最大频繁项集挖掘算法效率低、耗时长,挖掘结果模糊,不利于用户使用。为此,提出一种项约束先过滤的最大频繁项集挖掘算法——VCM。利用项包含约束过滤数据库,使用垂直数据表示数据集,采用深度优先的挖掘策略对数据库进行最大频繁相集的挖掘。实验结果表明,该算法快速有效,尤其在挖掘具有长模式的稠密数据库时优势明显。 展开更多
关键词 关联规则 最大频繁项集 项约束 垂直数据格式 深度优先 稠密数据库
下载PDF
基于矩阵的不确定数据频繁项集快速挖掘算法 被引量:5
4
作者 刘芝怡 常睿 《南京理工大学学报》 EI CAS CSCD 北大核心 2015年第4期420-425,共6页
针对CUF-growth算法中项集的期望支持度估算值过大,且挖掘过程中需要反复递归构造条件CUF-tree导致挖掘效率降低这一问题,提出UFIM-Matrix(Uncertain frequent itemset mining-matrix)算法。该算法不需要建立树结构,而是利用计算项集估... 针对CUF-growth算法中项集的期望支持度估算值过大,且挖掘过程中需要反复递归构造条件CUF-tree导致挖掘效率降低这一问题,提出UFIM-Matrix(Uncertain frequent itemset mining-matrix)算法。该算法不需要建立树结构,而是利用计算项集估算期望支持度的新方法和矩阵结构来产生规模更小候选项集,能在一定程度上减少计算开销,提高挖掘效率。最后的实验结果也表明了新算法性能更优。 展开更多
关键词 不确定数据 频繁项集 期望支持度 快速挖掘
下载PDF
分布式数据库的精简频繁模式集及其挖掘算法 被引量:2
5
作者 贾泂 刘群 姜晗 《浙江师范大学学报(自然科学版)》 CAS 2010年第2期132-137,共6页
对分布式数据库关联规则的挖掘与精简表示进行了研究,把频繁闭项集和最大频繁项集的概念推广到分布式数据库中,提出了在分布式环境下的频繁模式集的精简表示方法,以及一种基于各站点的全局大项目集的全局频繁闭项集和全局最大频繁项集... 对分布式数据库关联规则的挖掘与精简表示进行了研究,把频繁闭项集和最大频繁项集的概念推广到分布式数据库中,提出了在分布式环境下的频繁模式集的精简表示方法,以及一种基于各站点的全局大项目集的全局频繁闭项集和全局最大频繁项集的挖掘算法.该算法具有占用空间少、通信量小等特点.最后用实例进行了证明. 展开更多
关键词 分布式数据库 关联规则的精简 频繁闭项集 最大频繁项集 全局最大频繁项集
下载PDF
一种不确定性数据中最大频繁项集挖掘方法 被引量:1
6
作者 汪金苗 张龙波 +1 位作者 闫光辉 王凤英 《山东理工大学学报(自然科学版)》 CAS 2013年第5期17-21,27,共6页
不确定性数据挖掘已经成为数据挖掘领域的新热点,频繁项集挖掘是重点研究的问题之一.但是目前出现的挖掘算法大多集中在完全频繁项集,而用于最大频繁项集和频繁闭项集的算法尚不多见.文中研究了一种基于UF-Tree的用于不确定性数据中挖... 不确定性数据挖掘已经成为数据挖掘领域的新热点,频繁项集挖掘是重点研究的问题之一.但是目前出现的挖掘算法大多集中在完全频繁项集,而用于最大频繁项集和频繁闭项集的算法尚不多见.文中研究了一种基于UF-Tree的用于不确定性数据中挖掘最大频繁项集的算法,该挖掘过程分为两个步骤,第一步先得到以频繁1-项集为后缀的局部最大频繁项集,第二步得到所有的全局最大频繁项集,实验证明该算法性能良好且特别适用于稠密型、事务长度较小的数据集. 展开更多
关键词 不确定数据 最大频繁项集 UF—Tree
下载PDF
基于有序FP-tree结构和投影数据库的最大频繁模式挖掘算法 被引量:1
7
作者 王利军 唐立 《淮阴师范学院学报(自然科学版)》 CAS 2020年第1期35-39,44,共6页
OPFP-MAX是基于有序FP-tree结构和投影数据库的最大频繁模式挖掘算法。有序FP-tree结构不仅可以减少空间的浪费,而且由于树结构的有序性,在挖掘数据时可以减少挖掘事务项的数量,从而加快挖掘效率。算法采用垂直投影方案实现数据分解,基... OPFP-MAX是基于有序FP-tree结构和投影数据库的最大频繁模式挖掘算法。有序FP-tree结构不仅可以减少空间的浪费,而且由于树结构的有序性,在挖掘数据时可以减少挖掘事务项的数量,从而加快挖掘效率。算法采用垂直投影方案实现数据分解,基于投影数据库创建局部树结构,从而进一步减少对系统空间资源的浪费。采用优化策略加快挖掘效率。实验验证了算法的可行性和优越性。 展开更多
关键词 有序FP-tree 投影数据库 最大频繁项集
下载PDF
一种挖掘不确定数据最大模式的深度优先算法 被引量:3
8
作者 李雨明 邱卫东 +1 位作者 徐赛赛 郭英凯 《计算机工程》 CAS CSCD 北大核心 2015年第7期204-209,共6页
不确定性数据挖掘是数据挖掘领域的研究热点,但其应用于最大频繁项集的算法较少。根据不确定数据挖掘的特点,把挖掘确定性数据最大频繁模式的Gen Max算法扩展到不确定数据中,提出一种U-Gen Max算法。对Tid集进行扩展,在id域的基础上增... 不确定性数据挖掘是数据挖掘领域的研究热点,但其应用于最大频繁项集的算法较少。根据不确定数据挖掘的特点,把挖掘确定性数据最大频繁模式的Gen Max算法扩展到不确定数据中,提出一种U-Gen Max算法。对Tid集进行扩展,在id域的基础上增加概率域,实现垂直数据格式转换。在频繁项集判断方面加入前置判断来剪枝非频繁项集,相比直接计算置信度的方式,降低了计算量。基于栈式结构给出多步回退剪枝新策略,从而避免Gen M ax算法只能单步回退的缺陷。实验结果证明,该算法计算性能良好,可适用于各种情况下的稀疏数据集与支持度较高情况下的稠密数据集。 展开更多
关键词 不确定数据 频繁项集 最大模式 垂直格式 剪枝策略 置信度
下载PDF
挖掘不确定数据的最大频繁项集 被引量:2
9
作者 唐向红 杨全纬 郑阳 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第9期29-34,共6页
针对不确定数据频繁项集挖掘效率低和准确度不高的问题,提出了一种基于改进的频繁模式树(FPtree)和遗传算法(GA)挖掘不确定数据概率频繁项集的方法,即UFPGA(基于频繁模式树和遗传的挖掘算法).该算法根据不确定数据的构成特征,改进频繁... 针对不确定数据频繁项集挖掘效率低和准确度不高的问题,提出了一种基于改进的频繁模式树(FPtree)和遗传算法(GA)挖掘不确定数据概率频繁项集的方法,即UFPGA(基于频繁模式树和遗传的挖掘算法).该算法根据不确定数据的构成特征,改进频繁模式树方法挖掘不确定数据频繁项集,采用缩小变异空间和增加育种算子的遗传算法搜索最大频繁项集,收缩了搜索范围,提高了挖掘效率.实验结果表明:该方法在时间复杂度方面有很好的优越性,对大规模的不确定数据挖掘提供了一种有效的技术手段. 展开更多
关键词 数据挖掘 不确定数据 频繁项集 最大频繁项集 频繁模式树 遗传算法
原文传递
分布式全局最大频繁项集更新挖掘算法 被引量:2
10
作者 杨君锐 杨莉 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第12期85-88,106,共5页
提出了针对数据水平分布的分布式数据集下的全局最大频繁项集更新挖掘算法(UDMFI),用于解决当最小支持度阈值发生变化时全局最大频繁项集的更新挖掘问题.通过提出的带项目头表的频繁模式树(HFP-Tree)来存储数据,然后根据最小支持度阈值... 提出了针对数据水平分布的分布式数据集下的全局最大频繁项集更新挖掘算法(UDMFI),用于解决当最小支持度阈值发生变化时全局最大频繁项集的更新挖掘问题.通过提出的带项目头表的频繁模式树(HFP-Tree)来存储数据,然后根据最小支持度阈值变小时,原最大频繁项集的集合中的元素一定是新最大频繁项集的集合中某些元素的子集的特性,以及最小支持度阈值变大时,原最大频繁项集中的一些最大频繁项集将可能不再是新最大频繁项集的集合中的最大频繁项集的特性,充分利用已挖掘的结果,从而减少挖掘过程中的费用.实验结果表明该算法具有较好的效率. 展开更多
关键词 数据挖掘 分布式数据集 数据存储 最大频繁项集 更新挖掘
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部