摘要
关联规则是数据挖掘的重要研究内容之一 ,而传统算法生成的关联规则之间存在着大量的冗余规则 .本文提出了一种通用的由最大频繁项目集生成无冗余关联规则的 GNRR算法 ,利用规则之间的冗余关系 ,按一定顺序挖掘不同的规则 ,消除了规则之间的冗余性 ,使发现的规则数目呈指数倍减少 .
The discovery of association rules is an important research topic in data mining, but the traditional association rules discovery algorithm produces too many redundant rules. This paper presented a general algorithm for mining non-redundant rules from the largest frequent item sets using the redundant relationship of rules. The algorithm eliminates the redundancy among the rules and reduces the number of rules exponentially.
出处
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2001年第2期256-258,共3页
Journal of Shanghai Jiaotong University
关键词
数据挖掘
关联规则
冗余性
发现
生成算法
Algorithms
Associative processing
Data reduction
Information management
Redundancy