期刊文献+
共找到300篇文章
< 1 2 15 >
每页显示 20 50 100
面向不同类型概念漂移的两阶段自适应集成学习方法 被引量:1
1
作者 郭虎升 张洋 王文剑 《计算机研究与发展》 EI CSCD 北大核心 2024年第7期1799-1811,共13页
大数据时代,流数据大量涌现.概念漂移作为流数据挖掘中最典型且困难的问题,受到了越来越广泛的关注.集成学习是处理流数据中概念漂移的常用方法,然而在漂移发生后,学习模型往往无法对流数据的分布变化做出及时响应,且不能有效处理不同... 大数据时代,流数据大量涌现.概念漂移作为流数据挖掘中最典型且困难的问题,受到了越来越广泛的关注.集成学习是处理流数据中概念漂移的常用方法,然而在漂移发生后,学习模型往往无法对流数据的分布变化做出及时响应,且不能有效处理不同类型概念漂移,导致模型泛化性能下降.针对这个问题,提出一种面向不同类型概念漂移的两阶段自适应集成学习方法(two-stage adaptive ensemble learning method for different types of concept drift,TAEL).该方法首先通过检测漂移跨度来判断概念漂移类型,然后根据不同漂移类型,提出“过滤-扩充”两阶段样本处理机制动态选择合适的样本处理策略.具体地,在过滤阶段,针对不同漂移类型,创建不同的非关键样本过滤器,提取历史样本块中的关键样本,使历史数据分布更接近最新数据分布,提高基学习器有效性;在扩充阶段,提出一种分块优先抽样方法,针对不同漂移类型设置合适的抽取规模,并根据历史关键样本所属类别在当前样本块上的规模占比设置抽样优先级,再由抽样优先级确定抽样概率,依据抽样概率从历史关键样本块中抽取关键样本子集扩充当前样本块,缓解样本扩充后的类别不平衡现象,解决当前基学习器欠拟合问题的同时增强其稳定性.实验结果表明,所提方法能够对不同类型的概念漂移做出及时响应,加快漂移发生后在线集成模型的收敛速度,提高模型的整体泛化性能. 展开更多
关键词 流数据 概念漂移 集成学习 漂移类型 过滤阶段 扩充阶段
下载PDF
面向业务过程的概念漂移检测技术综述
2
作者 赵海燕 戎小玉 +1 位作者 曹健 陈庆奎 《计算机集成制造系统》 EI CSCD 北大核心 2024年第10期3431-3446,共16页
针对业务过程随时间发生变化的概念漂移现象,研究有效的漂移检测方法,以实现变更的早期检测与管理,系统分析了业务过程概念漂移检测的现有研究,总结了目前研究实验中常用的评估指标、数据集合成方法和真实数据集,讨论了不同方法的优缺... 针对业务过程随时间发生变化的概念漂移现象,研究有效的漂移检测方法,以实现变更的早期检测与管理,系统分析了业务过程概念漂移检测的现有研究,总结了目前研究实验中常用的评估指标、数据集合成方法和真实数据集,讨论了不同方法的优缺点及其适用场景,并通过实验对不同方法进行了比较。最后,对业务过程概念漂移未来的研究方向进行了展望。 展开更多
关键词 业务过程 概念漂移 业务过程视角 业务过程模型
下载PDF
非平衡概念漂移数据流主动学习方法
3
作者 李艳红 王甜甜 +1 位作者 王素格 李德玉 《自动化学报》 EI CAS CSCD 北大核心 2024年第3期589-606,共18页
数据流分类研究在开放、动态环境中如何提供更可靠的数据驱动预测模型,关键在于从实时到达且不断变化的数据流中检测并适应概念漂移.目前,为检测概念漂移和更新分类模型,数据流分类方法通常假设所有样本的标签都是已知的,这一假设在真... 数据流分类研究在开放、动态环境中如何提供更可靠的数据驱动预测模型,关键在于从实时到达且不断变化的数据流中检测并适应概念漂移.目前,为检测概念漂移和更新分类模型,数据流分类方法通常假设所有样本的标签都是已知的,这一假设在真实场景下是不现实的.此外,真实数据流可能表现出较高且不断变化的类不平衡比率,会进一步增加数据流分类任务的复杂性.为此,提出一种非平衡概念漂移数据流主动学习方法 (Active learning method for imbalanced concept drift data stream, ALM-ICDDS).定义基于多预测概率的样本预测确定性度量,提出边缘阈值矩阵的自适应调整方法,使得标签查询策略适用于类别数较多的非平衡数据流;提出基于记忆强度的样本替换策略,将难区分、少数类样本和代表当前数据分布的样本保存在记忆窗口中,提升新基分类器的分类性能;定义基于分类精度的基分类器重要性评价及更新方法,实现漂移后的集成分类器更新.在7个合成数据流和3个真实数据流上的对比实验表明,提出的非平衡概念漂移数据流主动学习方法的分类性能优于6种概念漂移数据流学习方法. 展开更多
关键词 数据流分类 主动学习 概念漂移 多类不平衡
下载PDF
基于自适应深度集成网络的概念漂移收敛方法
4
作者 郭虎升 孙妮 +1 位作者 王嘉豪 王文剑 《计算机研究与发展》 EI CSCD 北大核心 2024年第1期172-183,共12页
概念漂移是流数据挖掘领域中的一个重要且具有挑战性的难题.然而,目前的方法大多仅能够处理线性或简单的非线性映射,深度神经网络虽然有较强的非线性拟合能力,但在流数据挖掘任务中,每次只能在新得到的1个或一批样本上进行训练,学习模... 概念漂移是流数据挖掘领域中的一个重要且具有挑战性的难题.然而,目前的方法大多仅能够处理线性或简单的非线性映射,深度神经网络虽然有较强的非线性拟合能力,但在流数据挖掘任务中,每次只能在新得到的1个或一批样本上进行训练,学习模型难以实时调整以适应动态变化的数据流.为解决上述问题,将梯度提升算法的纠错思想引入含概念漂移的流数据挖掘任务之中,提出了一种基于自适应深度集成网络的概念漂移收敛方法(concept drift convergence method based on adaptive deep ensemble networks,CD_ADEN).该模型集成多个浅层神经网络作为基学习器,后序基学习器在前序基学习器输出的基础上不断纠错,具有较高的实时泛化性能.此外,由于浅层神经网络有较快的收敛速度,因此所提出的模型能够较快地从概念漂移造成的精度下降中恢复.多个数据集上的实验结果表明,所提出的CD_ADEN方法平均实时精度有明显提高,相较于对比方法,平均实时精度有1%~5%的提升,且平均序值在7种典型的对比算法中排名第一.说明所提出的方法能够对前序输出进行纠错,且学习模型能够快速地从概念漂移造成的精度下降中恢复,提升了在线学习模型的实时泛化性能. 展开更多
关键词 流数据 概念漂移 梯度提升 深度学习 快速适应
下载PDF
基于混合特征提取的流数据概念漂移处理方法
5
作者 郭虎升 刘艳杰 王文剑 《计算机研究与发展》 EI CSCD 北大核心 2024年第6期1497-1510,共14页
大数据时代,越来越多的数据以数据流的形式产生,由于其具有快速、无限、不稳定及动态变化等特性,使得概念漂移成为流数据挖掘中一个重要但困难的问题.目前多数概念漂移处理方法存在信息提取能力有限且未充分考虑流数据的时序特性等问题... 大数据时代,越来越多的数据以数据流的形式产生,由于其具有快速、无限、不稳定及动态变化等特性,使得概念漂移成为流数据挖掘中一个重要但困难的问题.目前多数概念漂移处理方法存在信息提取能力有限且未充分考虑流数据的时序特性等问题.针对这些问题,提出一种基于混合特征提取的流数据概念漂移处理方法(concept drift processing method of streaming data based on mixed feature extraction,MFECD).该方法首先采用不同尺度的卷积核对数据进行建模以构建拼接特征,采用门控机制将浅层输入和拼接特征融合,作为不同网络层次输入进行自适应集成,以获得能够兼顾细节信息和语义信息的数据特性.在此基础上,采用注意力机制和相似度计算评估流数据不同时刻的重要性,以增强数据流关键位点的时序特性.实验结果表明,该方法能有效提取流数据中包含的复杂数据特征和时序特征,提高了数据流中概念漂移的处理能力. 展开更多
关键词 流数据 概念漂移 特征融合 注意力机制 样本特征 时序特征
下载PDF
基于概念漂移发现的业务过程异常检测方法
6
作者 孙晋永 许乾 +2 位作者 闻立杰 孙志刚 邓文伟 《计算机集成制造系统》 EI CSCD 北大核心 2024年第8期2708-2721,共14页
现有的业务过程异常检测方法假定业务过程固定不变,忽视因出现概念漂移而导致业务过程模型变化的情况,以致现有的异常检测方法准确率下降。提出一种使用事件日志、基于概念漂移发现的业务过程异常检测方法。构建结合概念漂移发现方法和... 现有的业务过程异常检测方法假定业务过程固定不变,忽视因出现概念漂移而导致业务过程模型变化的情况,以致现有的异常检测方法准确率下降。提出一种使用事件日志、基于概念漂移发现的业务过程异常检测方法。构建结合概念漂移发现方法和基于循环神经网络的业务过程异常检测模型,从事件日志中提取事件序列特征数据集,使用该模型中的事件预测模块来预测事件发生的概率,根据事件发生的概率分布来计算事件日志中每个案例的异常分数。异常分数大于设定的异常评分阈值的事件所在的案例被认为是候选异常案例。使用霍夫丁不等式来判断概念漂移是否已发生,并使用双层滑动窗口机制来获取概念漂移案例的发生位置,从候选异常案例提取概念漂移案例。使用增量学习将概念漂移案例用于更新事件预测模块,使过程异常检测模型能够辨别概念漂移案例与真正异常案例,更准确地检测出真正的业务过程异常。实验结果表明,与主流的业务过程异常检测方法相比,所提异常检测方法可以较准确地发现业务过程中的概念漂移,能够更准确地检测出业务过程中发生的异常,对提高业务过程运行的平稳性有积极意义。 展开更多
关键词 业务过程 异常检测 概念漂移 滑动窗口 异常评分阈值
下载PDF
网络异常检测领域概念漂移问题研究综述
7
作者 杜冠瑶 郭勇杰 +2 位作者 龙春 赵静 万巍 《数据与计算发展前沿》 CSCD 2024年第1期162-178,共17页
【目的】随着网络技术的快速发展和广泛应用,网络异常检测作为保护网络安全和维护系统正常运行的手段变得越来越重要。然而,网络中异常行为和攻击手段不断变化,给异常检测带来了新的挑战。其中,概念漂移问题是网络异常检测领域中受到广... 【目的】随着网络技术的快速发展和广泛应用,网络异常检测作为保护网络安全和维护系统正常运行的手段变得越来越重要。然而,网络中异常行为和攻击手段不断变化,给异常检测带来了新的挑战。其中,概念漂移问题是网络异常检测领域中受到广泛关注的难点之一。【方法】本综述旨在对网络异常检测领域中概念漂移问题进行研究分析和总结。与前人的研究相比,本文将专注于网络异常检测领域的流数据。【文献范围】首先,对概念漂移进行详细介绍,包括定义、产生原因和特点。通过对概念漂移的全面理解,可以为后续的检测方法提供指导。其次,系统性地介绍了概念漂移检测方法,主要包括基于统计的方法、机器学习方法和深度学习方法等,并对比了各类方法的优缺点和适用场景。最后,探讨了概念漂移在未来可能的研究方向。【结论】本文聚焦于网络异常检测领域的概念漂移问题,通过详细介绍概念漂移的定义、产生原因和特点,以及深入分析和总结针对流数据概念漂移的检测方法,为未来研究方向提供了有价值的参考和指导。 展开更多
关键词 概念漂移 网络异常检测 数据分布 模型更新
下载PDF
交通流数据的概念漂移探析
8
作者 李玲玲 辛浩 《淮北职业技术学院学报》 2024年第2期113-116,共4页
概念漂移在很大程度上影响着交通流预测的结果,当数据分布或属性发生了变化,而模型的参数和结构没有及时调整时,模型预测结果的准确性就会大幅度下降,甚至完全失效。研究交通流数据及特点,概念漂移及检测步骤、检测方法,对交通流数据概... 概念漂移在很大程度上影响着交通流预测的结果,当数据分布或属性发生了变化,而模型的参数和结构没有及时调整时,模型预测结果的准确性就会大幅度下降,甚至完全失效。研究交通流数据及特点,概念漂移及检测步骤、检测方法,对交通流数据概念漂移发现和检测模型的建立、后期调整和优化交通流预测模型具有重要意义。 展开更多
关键词 交通流数据 概念漂移 检测
下载PDF
基于动态样本选择的概念漂移自适应预测方法
9
作者 代劲 李昊 王国胤 《电子学报》 EI CAS CSCD 北大核心 2024年第9期3228-3239,共12页
概念漂移是影响流数据挖掘性能的重要因素,当前主要通过增量更新或重训练模型进行处理,但对已有知识并未充分利用.从综合利用全体样本出发,本文构建了一种基于动态样本选择的概念漂移自适应分类方法.该方法在新样本到来时进行基于局部... 概念漂移是影响流数据挖掘性能的重要因素,当前主要通过增量更新或重训练模型进行处理,但对已有知识并未充分利用.从综合利用全体样本出发,本文构建了一种基于动态样本选择的概念漂移自适应分类方法.该方法在新样本到来时进行基于局部一致性的漂移检测,在发现漂移发生时去除区域内的噪声样本,当检测到新概念出现时,对历史相似概念进行重用.最后,对区域内不同类别样本进行多代表点归纳,并同步更新预测模型.本文在含有不同漂移类型的合成数据集上进行去噪效果验证,并在真实数据集上进行预测任务.实验结果表明,该方法可以有效去除因概念漂移而形成的漂移噪声,有效提升了预测模型性能,整体预测表现优于流行的概念漂移自适应模型. 展开更多
关键词 概念漂移 局部漂移检测 流数据 样本选择 样本去噪 自适应预测
下载PDF
业务过程概念漂移检测算法的质量评估框架 被引量:1
10
作者 李婷 刘聪 +4 位作者 徐兴荣 张帅鹏 闻立杰 林雷蕾 曾庆田 《计算机集成制造系统》 EI CSCD 北大核心 2024年第8期2722-2734,共13页
现有研究工作大多关注概念漂移的检测,缺少对已有漂移检测算法的质量评估。因此,为更好评估过程模型的动态变更对业务过程的影响,提出了一个用于评估业务过程中概念漂移检测算法质量的通用框架,并针对不同应用需求提出了4种评价指标。... 现有研究工作大多关注概念漂移的检测,缺少对已有漂移检测算法的质量评估。因此,为更好评估过程模型的动态变更对业务过程的影响,提出了一个用于评估业务过程中概念漂移检测算法质量的通用框架,并针对不同应用需求提出了4种评价指标。通过公开数据集和4种主流的漂移检测算法对所提评估框架以及四种评价指标进行比较分析,表明该框架具备一定的针对性与有效性,能够满足当前业务过程的实际需求。 展开更多
关键词 概念漂移 漂移检测 过程模型 通用框架 评价指标
下载PDF
基于聚簇模型重用的概念漂移数据流半监督分类算法 被引量:1
11
作者 康伟 黎利辉 文益民 《计算机科学》 CSCD 北大核心 2024年第4期124-131,共8页
带概念漂移的半监督数据流分类任务中,仅有少部分的数据被标记,这给分类器的训练、概念漂移的检测以及分类器对新概念的适应带来了巨大的挑战。现有的半监督聚簇分类算法仅对分类器池中的聚簇模型进行简单的增量更新,未能有效重用历史... 带概念漂移的半监督数据流分类任务中,仅有少部分的数据被标记,这给分类器的训练、概念漂移的检测以及分类器对新概念的适应带来了巨大的挑战。现有的半监督聚簇分类算法仅对分类器池中的聚簇模型进行简单的增量更新,未能有效重用历史聚簇模型。因此,文中提出了一种新的聚簇模型重用的半监督分类算法,称为CDCMR。首先,数据流以数据块的形式到来,对数据块分完类后,训练一个簇数自适应确定的聚簇模型。其次,通过计算分类器池中的各组件分类器与聚簇模型之间的相似度,挑选多个组件分类器。再次,用当前数据块对挑选出来的组件分类器进行模型重用后,与聚簇模型集成。然后,将分类器池划分为新旧更替和多样性最大化分类器池进行更新。最后,对下一个数据块的样本进行集成分类。在多个人工和真实数据集上进行实验,结果表明,所提算法1)能有效适应概念漂移,与现有方法相比其性能有显著性提升。 展开更多
关键词 数据流 半监督学习 概念漂移 聚簇模型重用 集成学习
下载PDF
在线深度神经网络的弱监督概念漂移检测方法
12
作者 马乾骏 郭虎升 王文剑 《小型微型计算机系统》 CSCD 北大核心 2024年第9期2094-2101,共8页
流数据作为大数据的重要形式广泛存在于实际问题中,由于流数据中数据分布变化产生概念漂移,容易导致模型的泛化性能下降,且在实际应用问题中,数据标记成本较高,难以获得强监督的信息.针对以上问题,本文提出一种基于在线深度神经网络的... 流数据作为大数据的重要形式广泛存在于实际问题中,由于流数据中数据分布变化产生概念漂移,容易导致模型的泛化性能下降,且在实际应用问题中,数据标记成本较高,难以获得强监督的信息.针对以上问题,本文提出一种基于在线深度神经网络的弱监督概念漂移检测(Weakly supervised conceptual drift detection method based on online deep neural network,WSCDD)方法.该方法设计了一种在线深度神经网络模型,采用Hedge反向传播方法在线学习网络深度,并通过设计Dropout层在模型预测时引入随机性,利用蒙特卡罗方法量化深度神经网络模型的预测不确定性,通过自适应滑动窗口技术检测弱监督环境下概念漂移的发生,并使模型适应新的概念.实验结果表明,该方法可以准确检测数据流中概念漂移的发生,在漂移发生后能够快速收敛到新的数据分布,提高了学习模型的泛化性能. 展开更多
关键词 流数据 概念漂移 弱监督 深度神经网络 蒙特卡罗方法 预测不确定性
下载PDF
一种基于局部分类精度的概念漂移数据流分类算法
13
作者 张玲 马士伦 +1 位作者 黎利辉 文益民 《广西科学》 CAS 北大核心 2024年第1期100-109,共10页
概念漂移数据流分类是一个极具挑战性的问题。当新概念出现时,该概念下的学习样本过少,无法对分类器进行及时调整,进而导致分类精度不高。为了解决该问题,本文提出一种基于局部分类精度的概念漂移数据流分类算法——LA-MS-CDC。第一,LA-... 概念漂移数据流分类是一个极具挑战性的问题。当新概念出现时,该概念下的学习样本过少,无法对分类器进行及时调整,进而导致分类精度不高。为了解决该问题,本文提出一种基于局部分类精度的概念漂移数据流分类算法——LA-MS-CDC。第一,LA-MS-CDC将k-means聚类和局部分类精度算法结合,从分类器池中挑选出最优源领域分类器;第二,将最优源领域分类器与目标领域分类器加权集成,进而对样本分类;第三,根据分类样本的真实标签分别计算各分类器的损失,并对目标领域和源领域的分类器权重进行更新;第四,再利用该分类样本对目标领域分类器、最优源领域分类器进行更新;最后,完成分类器池的更新。在公开数据集上的实验结果表明,LA-MS-CDC能够有效地将源领域知识迁移到目标领域,与现有方法相比,其分类效果具有显著性提升。算法代码可在https://gitee.com/ymw12345/LAMSCDC上获取。 展开更多
关键词 概念漂移 多源在线迁移学习 局部分类精度 集成学习 多样性
下载PDF
基于概念漂移的预测性业务流程监控方法
14
作者 黄华 杨子仪 +1 位作者 李小龙 李闯 《计算机应用》 CSCD 北大核心 2024年第10期3167-3176,共10页
为解决现有的业务流程监控(BPM)方法的模型精度随时间下降和实时性较差的问题,提出一种基于概念漂移的预测性业务流程监控(PPM)方法。首先,对事件日志数据进行预处理及编码;其次,利用双向长短时记忆(BiLSTM)网络模型从前后方向捕获足够... 为解决现有的业务流程监控(BPM)方法的模型精度随时间下降和实时性较差的问题,提出一种基于概念漂移的预测性业务流程监控(PPM)方法。首先,对事件日志数据进行预处理及编码;其次,利用双向长短时记忆(BiLSTM)网络模型从前后方向捕获足够的序列信息以构建业务流程模型,并利用注意力机制充分考虑不同事件对预测结果的贡献程度,赋予事件日志不同的权重,从而减少噪声对预测结果的影响;最后,将正在执行的实例输入构建的模型,得到预测的执行结果,并将这些结果作为历史数据对模型微调。在8个公开且真实的数据集上的测试结果表明,所提方法的平均预测准确率相较于支持向量机(SVM)、逻辑回归(LR)和随机森林(RF)等已有的BPM方法提升了5.4%~23.8%,且早期性和时间性能都优于现有的研究方法。 展开更多
关键词 概念漂移 预测性业务流程监控 业务流程管理 事件日志 双向长短时记忆 注意力机制
下载PDF
概念漂移数据流全工况预测模型研究
15
作者 丰升彬 《中文科技期刊数据库(全文版)工程技术》 2024年第2期0208-0211,共4页
数据流中概念漂移问题是数据驱动建模领域面临的一大挑战,近年来受到广泛的关注。本文提出一种应对数据流中概念漂移问题的自适应预测算法,采用聚类思想选择建模样本,并利用RBF神经网络建立对象全局非线性模型。实验结果表明该算法具有... 数据流中概念漂移问题是数据驱动建模领域面临的一大挑战,近年来受到广泛的关注。本文提出一种应对数据流中概念漂移问题的自适应预测算法,采用聚类思想选择建模样本,并利用RBF神经网络建立对象全局非线性模型。实验结果表明该算法具有较好的实时预测能力和自适应能力,同时相比已有的采用滑动窗技术的概念漂移算法能够更好地反映对象全工况范围的非线性关系。 展开更多
关键词 概念漂移 建模样本选择 全工况模型
下载PDF
基于多元区域集划分的工业数据流概念漂移检测 被引量:2
16
作者 韩光洁 赵腾飞 +2 位作者 刘立 张帆 徐政伟 《电子学报》 EI CAS CSCD 北大核心 2023年第7期1906-1916,共11页
为了快速适应非平稳环境中工业数据流的分布变化,需要在非结构化和噪声干扰的数据中准确、实时的完成概念漂移的检测.本文提出了一种基于多元区域集划分的工业数据流概念漂移检测算法(Concept Drift detection-Multivariate region set ... 为了快速适应非平稳环境中工业数据流的分布变化,需要在非结构化和噪声干扰的数据中准确、实时的完成概念漂移的检测.本文提出了一种基于多元区域集划分的工业数据流概念漂移检测算法(Concept Drift detection-Multivariate region set Partition,CDMP).首先基于实例模糊密度进行多元区域集划分,根据划分的若干模糊分区集合,识别概念漂移发生的区域.概念漂移的持续发生会显著降低基于多元区域集构建的模型的分类性能,CDMP通过构建多元历史模型池来保留具有多样性的历史模型,以降低模型调整或再训练造成的性能损耗,同时保证概念漂移检测中准确性.CDMP在不同数据集上进行了性能测试.实验结果表明,CDMP实现了对历史模型多样性的保留和重用,能够在不同噪声水平的工业物联网环境中实现对重现型、突发型等多类型概念漂移的准确检测. 展开更多
关键词 工业物联网 概念漂移 多元区域集 实例模糊分区 多样性历史模型
下载PDF
概念漂移下的系统日志在线异常检测模型 被引量:2
17
作者 吕宗平 梁婷婷 +3 位作者 顾兆军 刘春波 王双 王志 《计算机应用与软件》 北大核心 2023年第10期314-321,共8页
针对在线系统的动态日志中存在的概念漂移问题,提出一种结合置信度的系统日志在线异常检测模型(COP)。按照时间顺序模拟Hadoop分布式文件系统日志,使用滑动窗口以日志块的方式接收日志并进行预处理;获取一定时间内的日志作为预先知识并... 针对在线系统的动态日志中存在的概念漂移问题,提出一种结合置信度的系统日志在线异常检测模型(COP)。按照时间顺序模拟Hadoop分布式文件系统日志,使用滑动窗口以日志块的方式接收日志并进行预处理;获取一定时间内的日志作为预先知识并计算p值;使用一致性预测得分计算置信度,根据预先知识中获得的显著性水平过滤异常日志;建立当前与之前日志数据之间的联系,动态更新校准集并输出一个可信的检测结果。实验结果表明,COP与用于模拟增量学习的重训练异常检测模型相比,得到的在线检测结果和时间性能更优。 展开更多
关键词 概念漂移 在线学习 一致性预测 异常检测 滑动窗口 置信度
下载PDF
基于在线集成的概念漂移自适应分类方法
18
作者 郭虎升 丛璐 +1 位作者 高淑花 王文剑 《计算机研究与发展》 EI CSCD 北大核心 2023年第7期1592-1602,共11页
针对流数据中概念漂移发生后,在线学习模型不能对分布变化后的数据做出及时响应且难以提取数据分布的最新信息,导致学习模型收敛较慢的问题,提出一种基于在线集成的概念漂移自适应分类方法(adaptive classification method for concept ... 针对流数据中概念漂移发生后,在线学习模型不能对分布变化后的数据做出及时响应且难以提取数据分布的最新信息,导致学习模型收敛较慢的问题,提出一种基于在线集成的概念漂移自适应分类方法(adaptive classification method for concept drift based on online ensemble,AC_OE).一方面,该方法利用在线集成策略构建在线集成学习器,对数据块中的训练样本进行局部预测以动态调整学习器权重,有助于深入提取漂移位点附近流数据的演化信息,对数据分布变化进行精准响应,提升在线学习模型对概念漂移发生后新数据分布的适应能力,提高学习模型的实时泛化性能;另一方面,利用增量学习策略构建增量学习器,并随新样本的进入进行增量式的训练更新,提取流数据的全局分布信息,使模型在平稳的流数据状态下保持较好的鲁棒性.实验结果表明,该方法能够对概念漂移做出及时响应并加速在线学习模型的收敛速度,同时有效提高学习器的整体泛化性能. 展开更多
关键词 流数据 概念漂移 在线集成 增量学习 自适应模型
下载PDF
基于McDiarmid边界的自适应加权概念漂移检测方法 被引量:2
19
作者 胡阳 孙自强 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第3期419-428,共10页
针对概念漂移主动检测方法检测延迟高,易出现漏检、误报的问题,提出了一种基于McDiarmid边界的自适应加权概念漂移检测方法。引入衰减函数对分类结果加权,赋予旧数据更低权值,提升新数据的影响力。利用McDiarmid不等式得到加权分类正确... 针对概念漂移主动检测方法检测延迟高,易出现漏检、误报的问题,提出了一种基于McDiarmid边界的自适应加权概念漂移检测方法。引入衰减函数对分类结果加权,赋予旧数据更低权值,提升新数据的影响力。利用McDiarmid不等式得到加权分类正确率的置信边界,在检测到分类正确率下降超过置信边界时调节衰减因子时,实现权值的动态改变。实验主要与DDM(Drift Detection Method)、RDDM(Reactive Drift Detection Method)、HDDM(Drift Detection Method based on the Hoeffding's inequality)、FHDDM(Fast Hoeffding Drift Detection Method)和窗口(ADWIN)算法对比,结果表明,该算法具有最低的误报率和漏检率,且平均检测延迟和正确率在6种算法中排前2。 展开更多
关键词 概念漂移 主动检测方法 数据流分类 McDiarmid边界 衰减算法
下载PDF
概念漂移复杂数据流分类方法综述 被引量:1
20
作者 穆栋梁 韩萌 +2 位作者 李昂 刘淑娟 高智慧 《计算机应用》 CSCD 北大核心 2023年第6期1664-1675,共12页
传统分类器难以应对含概念漂移的复杂类型数据流分类这一难题,且得到的分类效果往往不尽如人意。针对不同类型数据流中处理概念漂移的方法,从不平衡、概念演化、多标签和含噪声4个方面对概念漂移复杂数据流分类方法进行了综述。首先,对... 传统分类器难以应对含概念漂移的复杂类型数据流分类这一难题,且得到的分类效果往往不尽如人意。针对不同类型数据流中处理概念漂移的方法,从不平衡、概念演化、多标签和含噪声4个方面对概念漂移复杂数据流分类方法进行了综述。首先,对基于块的和基于在线的学习方式对不平衡概念漂移数据流、基于聚类和基于模型的学习方式对概念演化概念漂移数据流、基于问题转换和基于算法适应的学习方式对多标签概念漂移数据流和含噪声概念漂移数据流这四个方面的分类方法进行了分析介绍;然后,对所提到概念漂移复杂数据流分类方法的实验结果及性能指标进行了详细的对比和分析;最后,给出了现有方法的不足和下一步研究方向。 展开更多
关键词 数据流分类 复杂数据流 概念漂移 不平衡数据流 概念演化
下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部