摘要
数据流具有连续、实时、有序及无限等特点,使用传统的数据挖掘技术来处理数据流的分类面临着严重的挑战,很难处理数据流中的概念漂移问题。文章结合现有的决策树分类挖掘算法,提出了自适应集成分类器方法,构建了数据流概念漂移的自适应集成分类模型,通过不断更新训练样例的权重与属性类别,将训练样例从现有的数据集中分离出来,并被确定为新类别属性的训练样例,以达到对数据流中概念漂移现象的有效检测,仿真结果也证明该方法的适应性和可靠性。
出处
《统计与决策》
CSSCI
北大核心
2016年第7期13-17,共5页
Statistics & Decision
基金
教育部博士点基金资助项目(20123718120004)
全国统计科研计划项目(2012LY183)
山东省软科学项目(2014RKB01506)