摘要
针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证明,该算法可以完整高效地挖掘频繁模式,并且实现均衡负载。
In order to improve the performance of mining the frequent pattern in parallel.This article introduces a new parallel algorithm based on FP-growth for mining frequent pattern.The algorithm distributes the work fairly among each computing node, and each node returns the result after mining.According to the experimental results,the algorithm achieves a good performance and load balance.
出处
《计算机工程与应用》
CSCD
北大核心
2010年第4期125-126,229,共3页
Computer Engineering and Applications
基金
云南省自然科学基金No.2007G079M
云南省教育厅科学研究基金项目No.6Y0159
云南财经大学校科研基金~~