期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于蒙特卡洛树搜索的数值目标子群发现算法
1
作者 关承彬 何振峰 《计算机系统应用》 2024年第5期195-202,共8页
MonteCloPi算法是一种基于蒙特卡洛树搜索(Monte Carlo tree search,MCTS)的任意时间子群发现算法,旨在使用MCTS策略构建非对称的最佳优先搜索树来发现高质量的多样性模式集,但是限制了目标为二值变量.为此,本文结合了数值目标的特点,... MonteCloPi算法是一种基于蒙特卡洛树搜索(Monte Carlo tree search,MCTS)的任意时间子群发现算法,旨在使用MCTS策略构建非对称的最佳优先搜索树来发现高质量的多样性模式集,但是限制了目标为二值变量.为此,本文结合了数值目标的特点,通过为置信度上界(upper confidence bound,UCB)公式选取合适的C值、动态调整各个样本的拓展权重并对搜索树进行剪枝、使用自适应top-k均值更新策略,将MonteCloPi算法拓展到了数值目标.最后,在UCI数据集、全国健康与营养调查(national health and nutrition examination survey,NHANES)听力测试数据集上的实验结果表明本文的算法相比其他算法可以发现更高质量的多样性模式集,并且最优子群的可解释性也更好. 展开更多
关键词 蒙特卡洛树搜索 子群发现 数值目标 任意时间算法
下载PDF
入侵检测不平衡样本子群发现数据简化策略 被引量:2
2
作者 边婧 彭新光 +1 位作者 王颖 付东来 《计算机应用研究》 CSCD 北大核心 2014年第7期2123-2126,共4页
为突破数据不平衡对算法的限制,更好地将子群发现技术应用到数据不平衡领域,设计了一个适合入侵检测数据集与子群发现算法的数据简化策略。实例简化阶段,应用均匀分布随机点定理与数据空间稀疏度构造属性相异度函数,借鉴稀有类信息仿制... 为突破数据不平衡对算法的限制,更好地将子群发现技术应用到数据不平衡领域,设计了一个适合入侵检测数据集与子群发现算法的数据简化策略。实例简化阶段,应用均匀分布随机点定理与数据空间稀疏度构造属性相异度函数,借鉴稀有类信息仿制技术并结合进化学习实例选择算法提出稀有类拓展实例选择算法;属性简化阶段,采用主成分分析法,针对数据集特点保留相关兴趣特征以提高算法发现效率。实验证明,此方法适用于子群发现算法,能有效减少时间开销并提高规则发现效果。 展开更多
关键词 子群发现 不平衡数据集 数据简化 实例选择 特征选择
下载PDF
基于多维数据集的异常子群发现技术 被引量:11
3
作者 张静恬 伍赛 +2 位作者 陈刚 寿黎但 陈珂 《计算机学报》 EI CSCD 北大核心 2019年第8期1671-1685,共15页
非频繁项集是未被标准化的频繁项集产生算法(如APRIORI以及FP-Growth算法)提取的所有项集.在数据集上挖掘有意义的非频繁项集是数据挖掘的重要工作之一.目前,基于传统数据集的非频繁项集挖掘研究主要集中在负相关、负模式以及间接关联... 非频繁项集是未被标准化的频繁项集产生算法(如APRIORI以及FP-Growth算法)提取的所有项集.在数据集上挖掘有意义的非频繁项集是数据挖掘的重要工作之一.目前,基于传统数据集的非频繁项集挖掘研究主要集中在负相关、负模式以及间接关联等方面,且主要是对整个数据集上的性质进行分析,而没有对数据集的切片进行分析.该文提出了一种新的模式,试图找到符合如下条件的特定子群,其描述的数据集切片上存在某些特殊项集,这些项集在整个数据集上并非频繁项集,但是在该数据集切片上却是频繁项集.根据用户要求自动找出这些异常子群以及其对应项集的算法在数据分析中有着十分重要的意义.该文提出的解决方案由两部分组成:候选产生阶段以及查询交互阶段.前者是一个脱机处理的过程,而后者则是在线实时反馈的过程.在候选产生阶段,该文提出了一种基于多维数据集高效产生频繁项集以及显著子群并有效建立索引的算法.根据索引,在查询交互阶段,该文提出的算法框架可以快速准确地返回给定查询对应的异常子群以及对应项集.基于多个真实数据集的实验表明,该文提出的方案可以根据用户要求实时返回有意义的异常子群以及对应项集.此外,该文提出的算法在多维数据集上的挖掘效率比UTMTU算法提升了数倍. 展开更多
关键词 频繁项集挖掘 子群发现 多维数据集 数据挖掘 异常检测
下载PDF
基于复合分析算法的智能电表数据应用 被引量:4
4
作者 杨雷 侯慧娟 郅擎宇 《自动化仪表》 CAS 2023年第4期95-101,105,共8页
随着智能电表使用的普及化,其带来的海量数据得到了广泛关注。对这些数据的分析可获得众多有价值的信息。用户用电量预测是泛在电力物联网建设的核心内容。利用智能电表海量数据实现用户用电量的精准预测,是智能电表数据的重要应用方向... 随着智能电表使用的普及化,其带来的海量数据得到了广泛关注。对这些数据的分析可获得众多有价值的信息。用户用电量预测是泛在电力物联网建设的核心内容。利用智能电表海量数据实现用户用电量的精准预测,是智能电表数据的重要应用方向之一。提出了基于模糊聚类、子群发现和长短期记忆(LSTM)神经网络相结合的复合算法,利用海量智能电表数据实现了用户用电量精准预测。首先,通过模糊聚类将区域内用户按用电量进行合理分类。然后,采用Apriori子群发现算法深度挖掘各子类中影响用电量的关联性因素,将各子类的相似日关联性因素和历史用电量作为LSTM的训练数据完成神经网络的训练。最后,实现了目标日的用电量精准预测。算例分析表明,该算法有效、可行。与其他预测方法相比,该算法剔除了非关联因素的影响,预测精度明显提高,实现了智能电表海量数据的高效利用。 展开更多
关键词 电力物联网 智能电表 复合分析算法 模糊聚类 子群发现 用电量预测
下载PDF
基于集成特征选择的FSSD算法 被引量:3
5
作者 张崟 何振峰 《计算机系统应用》 2022年第3期275-281,共7页
FSSD(fast and efficient subgroup set discovery)是一种子群发现算法,旨在短时间内提供多样性模式集,然而此算法为了减少运行时间,选择域数量少的特征子集,当特征子集与目标类不相关或者弱相关时,模式集质量下降.针对这个问题,提出一... FSSD(fast and efficient subgroup set discovery)是一种子群发现算法,旨在短时间内提供多样性模式集,然而此算法为了减少运行时间,选择域数量少的特征子集,当特征子集与目标类不相关或者弱相关时,模式集质量下降.针对这个问题,提出一种基于集成特征选择的FSSD算法,它在预处理阶段使用基于ReliefF(Relief-F)和方差分析的集成特征选择来获得多样性和相关性强的特征子集,再使用FSSD算法返回高质量模式集.在UCI数据集、全国健康和营养调查报告(NHANES)数据集上的实验结果表明,改进后的FSSD算法提高了模式集质量,归纳出更有趣的知识.在NHANES数据集上,进一步分析模式集的特征有效性和阳性预测值. 展开更多
关键词 子群发现 集成特征选择 RELIEFF 方差分析
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部