-
题名基于不确定数据的可能频繁闭序列模式挖掘
被引量:7
- 1
-
-
作者
李立波
白树仁
陈磊
张威
-
机构
湖南大学信息科学与工程学院
国家超级计算长沙中心
-
出处
《计算机应用研究》
CSCD
北大核心
2016年第4期983-988,共6页
-
基金
国家科技支撑计划资助项目(2012BAH09B02)
长沙市重点科技计划资助项目(K1204006-11-1)
-
文摘
对于不确定数据的频繁序列模式挖掘,会导致可能频繁模式数量的指数级出现,其中有些无用的挖掘结果会引起频繁序列的冗余。针对上述不足,提出了可能频繁闭序列模式(p-FCSPs)的定义,以及一种基于不确定数据的可能频繁闭序列挖掘算法U-FCSM。此算法中,基于一种元组不确定数据模型计算序列的可能频繁性,应用BIDE算法的闭序列思想判断可能频繁序列是否是可能频繁闭序列模式;为了减少搜索空间与避免冗余的计算,应用了几个剪枝与边界技术。U-FCSM算法的有效性与效率通过大量的实验得以表明。
-
关键词
不确定数据
可能频繁闭序列模式
概率频繁
不确定数据挖掘
闭序列模式
序列模式增长
-
Keywords
uncertain databases
probabilistically frequent closed sequential patterns
probabilistic frequentness
uncertain data mining
closed sequential patterns
sequential pattern growth
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于有序树的不确定数据最大频繁项挖掘算法
被引量:7
- 2
-
-
作者
刘卫明
蒯海龙
陈志刚
毛伊敏
-
机构
江西理工大学信息工程学院
江西理工大学资源与环境工程学院
中南大学软件学院
江西理工大学应用科学学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2015年第24期145-149,共5页
-
基金
江西省自然科学基金(No.20122BAB201045)
国家自然科学基金(No.41362015
No.61073186)
-
文摘
针对UF-tree中项集存在的数据和路径冗余的问题,设计了有序的压缩不确定树SCUF-tree,在节点中存储元素的不同支持度,达到压缩存储空间和方便移植已有的确定数据最大频繁项集算法的目的。结合最大频繁项集挖掘算法MMFI的设计思想,提出了一种挖掘不确定最大频繁项集算法UMMFI算法,并采取逐层逐个的NBN策略挖掘不确定最大频繁项集。实验结果表明,UMMFI算法具有较好的时空效益和适应性。
-
关键词
不确定数据的最大频繁项集
不确定数据最大频繁项挖掘(UMMFI)算法
有序的压缩不确定树(SCUF-tree)
逐层逐个地处理节点(NBN)策略
-
Keywords
maximal frequent itemsets in uncertain databases
Mining Maximal Frequent Items from Uncertain data(UMMFI) algorithm
Sequential Compressed Uncertain Frequent pattern tree(SCUF-tree)
Node By Node(NBN)strategy
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-