期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
Top-k probabilistic prevalent co-location mining in spatially uncertain data sets 被引量:5
1
作者 Lizhen WANG Jun HAN +1 位作者 Hongmei CHEN Junli LU 《Frontiers of Computer Science》 SCIE EI CSCD 2016年第3期488-503,共16页
A co-location pattern is a set of spatial features whose instances frequently appear in a spatial neighborhood. This paper efficiently mines the top-k probabilistic prevalent co-locations over spatially uncertain data... A co-location pattern is a set of spatial features whose instances frequently appear in a spatial neighborhood. This paper efficiently mines the top-k probabilistic prevalent co-locations over spatially uncertain data sets and makes the following contributions: 1) the concept of the top-k prob- abilistic prevalent co-locations based on a possible world model is defined; 2) a framework for discovering the top- k probabilistic prevalent co-locations is set up; 3) a matrix method is proposed to improve the computation of the preva- lence probability of a top-k candidate, and two pruning rules of the matrix block are given to accelerate the search for ex- act solutions; 4) a polynomial matrix is developed to further speed up the top-k candidate refinement process; 5) an ap- proximate algorithm with compensation factor is introduced so that relatively large quantity of data can be processed quickly. The efficiency of our proposed algorithms as well as the accuracy of the approximation algorithms is evaluated with an extensive set of experiments using both synthetic and real uncertain data sets. 展开更多
关键词 spatial co-location mining top-k probabilistic prevalent co-location mining spatially uncertain data sets matrix methods
原文传递
基于频繁项集挖掘的异常用电行为监测系统
2
作者 李晓民 魏爽 王玉东 《电子设计工程》 2024年第22期133-136,141,共5页
由于在构建异常用电行为监测系统时,需要处理大量的异常数据,且取样参量存在相似性,增大计算量,导致监测能力较低。为提升电网主机对异常用电行为的监测能力,设计基于频繁项集挖掘的异常用电行为监测系统。根据频繁项集提取异常用电信... 由于在构建异常用电行为监测系统时,需要处理大量的异常数据,且取样参量存在相似性,增大计算量,导致监测能力较低。为提升电网主机对异常用电行为的监测能力,设计基于频繁项集挖掘的异常用电行为监测系统。根据频繁项集提取异常用电信号不确定数据集,研究异常用电的行为特征,分析异常用电行为。根据电网监测规则与异常用电信号监测模块,实现监测功能,设计异常用电行为监测系统。实验结果表明,文中方法可以精准监测到第5 s时电路负荷发生的突增,说明该方法的监测结果可靠性较高。 展开更多
关键词 频繁项集挖掘 异常用电行为 不确定数据集 用电规律 监测规则 耗电量
下载PDF
基于边界和距离的离群点检测 被引量:24
3
作者 江峰 杜军威 +1 位作者 眭跃飞 曹存根 《电子学报》 EI CAS CSCD 北大核心 2010年第3期700-705,共6页
近年来,离群点检测已经引起人们的广泛关注.离群点检测在网络入侵检测、信用卡欺诈、电子商务犯罪、医疗诊断以及反恐等诸多领域都具有十分重要的作用.离群点检测的目的是为了发现数据集中的一小部分对象,与数据集中其余的大部分对象相... 近年来,离群点检测已经引起人们的广泛关注.离群点检测在网络入侵检测、信用卡欺诈、电子商务犯罪、医疗诊断以及反恐等诸多领域都具有十分重要的作用.离群点检测的目的是为了发现数据集中的一小部分对象,与数据集中其余的大部分对象相比,这一小部分对象有着特殊的行为或者具有反常的属性.针对现有的离群点检测方法不能有效处理不确定与不完整数据的问题,本文将粗糙集中边界的概念与Knorr等所提出的基于距离的离群点检测方法结合在一起,在粗糙集的框架中提出一种新的离群点定义与检测方法.针对于该方法,我们设计出相应的离群点检测算法BDOD,并且通过在临床诊断数据集上所进行的实验,验证了算法BDOD的有效性.实验结果表明本文的方法为处理离群点检测中的不确定与不完整数据问题提供了一条新的途径. 展开更多
关键词 数据挖掘 离群点检测 粗糙集 不确定与不完整数据
下载PDF
满足均匀分布的不确定数据关联规则挖掘算法 被引量:18
4
作者 陈爱东 刘国华 +3 位作者 费凡 周宇 万小妹 貟慧 《计算机研究与发展》 EI CSCD 北大核心 2013年第S1期186-195,共10页
云计算为大数据提供了展示和共享的平台.为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,如何挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布... 云计算为大数据提供了展示和共享的平台.为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,如何挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布特性,这一特性不利于精确查询,但可为关联规则的挖掘提供便利条件.首先,依据泛化值之间可能的相交或包含关系,将泛化值进行分层聚类,为了保存与不确定数据集挖掘相关的重要信息,给出了构建不确定频繁模式树的算法,在此基础上,提出了频繁项集挖掘子算法(data mining algorithm for uncertain frequent item-sets,UFI-DM)和关联规则生成子算法(algorithm for generating association rules,GAR),分别用于挖掘频繁项集和生成关联规则,最后,通过理论分析和实验比对,论证了算法的可行性和有效性. 展开更多
关键词 大数据 均匀分布不确定数据 数据挖掘 关联规则 频繁项集
下载PDF
基于模糊理论的不确定轨迹模式挖掘 被引量:2
5
作者 李帆 夏士雄 张磊 《微电子学与计算机》 CSCD 北大核心 2011年第8期70-73,共4页
轨迹模式挖掘是轨迹数据知识发现的一个重要课题.由于定位设备的局限性,采集到的轨迹数据具有不确定性.着眼于不确定轨迹数据模式挖掘,通过引入模糊集方法,提出不确定轨迹数据模式挖掘方法.首先用均匀网格划分对象的运动平面,基于对象... 轨迹模式挖掘是轨迹数据知识发现的一个重要课题.由于定位设备的局限性,采集到的轨迹数据具有不确定性.着眼于不确定轨迹数据模式挖掘,通过引入模糊集方法,提出不确定轨迹数据模式挖掘方法.首先用均匀网格划分对象的运动平面,基于对象实际位置的概率分布计算轨迹点相对于每个网格的隶属度,通过不确定轨迹兴趣区域发现算法,得到所有的不确定兴趣区域,然后在此基础上进行轨迹模式挖掘.实验展示了所提出的不确定轨迹数据模式挖掘方法进行模式挖掘的效果. 展开更多
关键词 不确定轨迹数据 模糊集 网格 不确定轨迹模式
下载PDF
不确定模糊ID3算法及其在滑坡危险性评价中应用研究 被引量:1
6
作者 毛伊敏 陈华彬 +2 位作者 李忠利 彭喆 毛丁慧 《江西理工大学学报》 CAS 2017年第5期92-98,共7页
针对传统的决策树区域滑坡预测模型难以刻画诱发因子雨量值的问题,提出了不确定模糊ID3决策树模型.首先设计了面积积分法,结合复合型隶属度函数将不确定属性模糊化以刻画雨量值,并结合ID3决策树算法,构造区域滑坡危险性预测模型,对延安... 针对传统的决策树区域滑坡预测模型难以刻画诱发因子雨量值的问题,提出了不确定模糊ID3决策树模型.首先设计了面积积分法,结合复合型隶属度函数将不确定属性模糊化以刻画雨量值,并结合ID3决策树算法,构造区域滑坡危险性预测模型,对延安市宝塔区进行滑坡危险性预测.实验数据结果证明,该模型的预测精度达到了可信要求,高于模糊ID3决策树预测模型;与不确定决策树算法和不确定多分类支持向量机算法相比,不确定模糊ID3算法具有预测精度收敛快和受样本数量影响较小等优势,具备较强的实践意义. 展开更多
关键词 不确定数据 模糊集 决策树 滑坡 危险性预测
下载PDF
海量不确定数据集中离群点快速检测方法仿真 被引量:4
7
作者 林雪 《计算机仿真》 北大核心 2021年第6期378-382,共5页
由于传统离群点检测方法未对离群点进行判定,从而导致出现了检测速度慢、检测误差大的问题,为此提出一种海量不确定数据集中离群点快速检测的方法。优先判定出不确定数据集中的离群点,利用点排序识别聚类结构(Ordering points to identi... 由于传统离群点检测方法未对离群点进行判定,从而导致出现了检测速度慢、检测误差大的问题,为此提出一种海量不确定数据集中离群点快速检测的方法。优先判定出不确定数据集中的离群点,利用点排序识别聚类结构(Ordering points to identify the clustering structure)算法完成,确定待检测离群点所需参数,计算出离群点的离群属性,根据离群属性计算结果,引入邻域密度构建离群点快速检测模型,设定模型中离群点检测阈值,实现不确定数据集中离群点的快速检测。由仿真结果得出,与传统检测方法相比,提出的方法算法运行耗时降低了50%以上,离群点的判定准确度更高,漏检、误检率大大降低,实现了离群点精度高、速度快的检测,对数据挖掘与预处理有显著的实践意义。 展开更多
关键词 不确定数据集 离群点快速检测 离群属性 邻域密度 离群点聚类
下载PDF
分布式不确定数据上的概率Skyline计算 被引量:8
8
作者 王晓伟 黄九鸣 贾焰 《计算机科学与探索》 CSCD 2010年第10期951-960,共10页
提出了分布式不确定数据上概率skyline的低通信开销算法。首先给出了一种间接的对象分布信息——剪枝空间,分布节点通过共享全局剪枝空间,能够减少通信开销。为了降低传输剪枝空间带来的额外通信开销,对表示剪枝空间的虚拟对象集合进行... 提出了分布式不确定数据上概率skyline的低通信开销算法。首先给出了一种间接的对象分布信息——剪枝空间,分布节点通过共享全局剪枝空间,能够减少通信开销。为了降低传输剪枝空间带来的额外通信开销,对表示剪枝空间的虚拟对象集合进行基于距离的压缩。与基本算法相比,100个分布节点时,在真实数据集上节省了69%的通信开销;在均匀、正相关、反相关三种标准模拟数据上分别节省60.5%、41.8%、24.5%的通信开销。 展开更多
关键词 分布式不确定数据 概率skyline 剪枝空间 虚拟对象集合
下载PDF
决策粗糙集理论研究现状与展望 被引量:82
9
作者 于洪 王国胤 姚一豫 《计算机学报》 EI CSCD 北大核心 2015年第8期1628-1639,共12页
经典Pawlak粗糙集理论中的核心概念上、下近似集是通过集合相交非空和包含来定义的.由于缺乏对错误的容忍能力,其实际应用受到了限制.20世纪90年代初,Yao等人结合贝叶斯决策理论提出了决策粗糙集模型.近年来,该模型逐渐得到重视,并在不... 经典Pawlak粗糙集理论中的核心概念上、下近似集是通过集合相交非空和包含来定义的.由于缺乏对错误的容忍能力,其实际应用受到了限制.20世纪90年代初,Yao等人结合贝叶斯决策理论提出了决策粗糙集模型.近年来,该模型逐渐得到重视,并在不确定性信息处理方面得到了广泛应用.该文首先就为什么要提出决策粗糙集模型、该模型具有什么特点以及该模型中需要解决的几个问题进行了详细讨论.然后,总结了国内外关于决策粗糙集模型的研究现状和进展,详细分析了存在的挑战性问题,并深入探讨了未来的研究方向. 展开更多
关键词 粗糙集 决策粗糙集 三支决策 数据分析 不确定性 智能信息处理
下载PDF
基于数据不确定性的变压器故障诊断研究
10
作者 杨杰明 沈胜楠 +2 位作者 董玉坤 曲朝阳 刘志颖 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2017年第3期57-60,共4页
针对采集的变压器油中溶解气体数据的波动性和不确定性,通过引入蒙特卡洛算法进行数据处理.根据油中溶解气体试验,将处理后的变压器油中溶解气体数据进行两两比值.分别根据变压器运行规程、DGA知识以及模糊c均值聚类法对气体含量和比值... 针对采集的变压器油中溶解气体数据的波动性和不确定性,通过引入蒙特卡洛算法进行数据处理.根据油中溶解气体试验,将处理后的变压器油中溶解气体数据进行两两比值.分别根据变压器运行规程、DGA知识以及模糊c均值聚类法对气体含量和比值进行离散化处理,再进行属性约简,并将约简结果作为神经网络的前置输入,对神经网络训练及故障进行诊断.实验结果表明,该方法可以对变压器故障进行准确判定,具有更好的工程实用性. 展开更多
关键词 不确定数据 蒙特卡洛 粗糙集 神经网络
下载PDF
基于模糊集的消费者偏好识别
11
作者 刘晓红 刘颢祯 《西南民族大学学报(自然科学版)》 CAS 2019年第4期428-433,共6页
从信息管理的数据结构讲,消费者偏好是异构数据的集合.在分析消费者偏好识别问题的基础上,采用基于[0,1]的模糊集处理消费者偏好的异构数据;根据对某种商品的选择程度,提出消费者的群体协调关系;根据消费者群体的偏好和关系程度,基于不... 从信息管理的数据结构讲,消费者偏好是异构数据的集合.在分析消费者偏好识别问题的基础上,采用基于[0,1]的模糊集处理消费者偏好的异构数据;根据对某种商品的选择程度,提出消费者的群体协调关系;根据消费者群体的偏好和关系程度,基于不确定决策准则,建立商家的有效服务关系及策略.通过示例说明基于消費者偏好识别的服务程序应用. 展开更多
关键词 消费者偏好 异构数据 模糊集 不确定决策
下载PDF
船舶避碰过程不确定信息消除算法
12
作者 李先强 《舰船科学技术》 北大核心 2018年第7X期34-36,共3页
船舶避碰过程会生成大量的不确定信息,扰乱船舶重新起航的数据使用,传统不确定信息消除算法能去除粗糙集数据以外的不确定信息,针对粗糙集内的不确定信息无法去除,为此提出船舶避碰过程不确定信息消除算法。利用多属性标定不确定信息范... 船舶避碰过程会生成大量的不确定信息,扰乱船舶重新起航的数据使用,传统不确定信息消除算法能去除粗糙集数据以外的不确定信息,针对粗糙集内的不确定信息无法去除,为此提出船舶避碰过程不确定信息消除算法。利用多属性标定不确定信息范围,设置定义计算对不确定信息进行标定,使用比值计算形式去除不确定信息中的粗糙集数据,通过差值计算去除以标定的不确定信息,实现船舶避碰过程不确定信息消除。实验数据表明,设计的不确定信息消除算法比传统消除算法的去除能力要强,并且能够去除粗糙集中不确定信息。 展开更多
关键词 船舶避碰 不确定信息 消除算法 粗糙集数据
下载PDF
基于粗糙模糊集的不确定数据流聚类算法 被引量:2
13
作者 姜元凯 郑洪源 《计算机科学与探索》 CSCD 2014年第12期1494-1501,共8页
为解决高维和高不确定级别的数据流聚类问题,提出了一种针对不确定数据流的聚类算法HFMicro。引入粗糙模糊集理论,定义了一种新的不确定数据流模型,并利用隶属程度的上、下近似来描述微簇。根据粗糙模糊集间的相似程度来选择最合适的微... 为解决高维和高不确定级别的数据流聚类问题,提出了一种针对不确定数据流的聚类算法HFMicro。引入粗糙模糊集理论,定义了一种新的不确定数据流模型,并利用隶属程度的上、下近似来描述微簇。根据粗糙模糊集间的相似程度来选择最合适的微簇。使用动态衰减窗口模型提高算法的效率和聚类效果。由于采用了离线聚类模式,使得算法具有较好的实时性。实验结果表明,该算法能够很好地处理高维和高不确定级别的数据流,同时兼容存在级不确定性和属性级不确定性,与现有算法相比效果更好。 展开更多
关键词 不确定数据流 粗糙模糊集 聚类 隶属度
下载PDF
一种基于模糊集和概率分布的不确定XML模型及其代数运算 被引量:4
14
作者 胡磊 严丽 《计算机科学》 CSCD 北大核心 2020年第7期21-30,共10页
XML作为一种信息表示和交换的事实标准已被广泛用作不同应用之间的统一数据交换格式,其在实际应用中已经发挥着重要的作用。由于现实中很多信息包含有不确定性,而经典的XML不能表示和处理不确定信息,因此有必要对经典XML模型进行扩展。... XML作为一种信息表示和交换的事实标准已被广泛用作不同应用之间的统一数据交换格式,其在实际应用中已经发挥着重要的作用。由于现实中很多信息包含有不确定性,而经典的XML不能表示和处理不确定信息,因此有必要对经典XML模型进行扩展。考虑到现实世界的复杂性,不确定信息往往同时包含有随机不确定性和模糊不确定,而概率理论和模糊集理论是处理不确定信息的有力工具,因此文中在现有的模糊XML和概率XML数据模型的基础上,综合利用概率和模糊理论建立一个新的不确定XML模型和相关代数,所提出的新的不确定性XML模型既能与现有的XML模型兼容,又能表达更复杂的不确定信息。 展开更多
关键词 XML模型 不确定数据模型 模糊集 概率分布 代数运算
下载PDF
凝聚中心犹豫度恒定的模糊层次聚类算法 被引量:8
15
作者 王志飞 陆亿红 《小型微型计算机系统》 CSCD 北大核心 2021年第1期20-26,共7页
传统的模糊方法已无法解决数据本身不确定性的问题,犹豫模糊集方法却行之有效.原有的犹豫模糊层次聚类算法没有考虑犹豫模糊集对权值的影响,缺乏合理的权重计算方法,并且算法的时间复杂度和空间复杂度都为指数级.为了更有效地解决聚类... 传统的模糊方法已无法解决数据本身不确定性的问题,犹豫模糊集方法却行之有效.原有的犹豫模糊层次聚类算法没有考虑犹豫模糊集对权值的影响,缺乏合理的权重计算方法,并且算法的时间复杂度和空间复杂度都为指数级.为了更有效地解决聚类分析问题,本文提出一种凝聚中心犹豫度恒定的模糊层次聚类算法(FHCA),首先设计了一种基于数据集本身信息的权重公式,可以得到更加合理的权重分配.此外还提出了新的簇中心的计算公式,不仅使聚类过程中,簇中心的犹豫度具有不变性,还将原有算法的时间复杂度以及空间复杂度从指数级降至线性级,并且聚类的质量不劣于原有的聚类算法. 展开更多
关键词 犹豫模糊集合 聚类 数据挖掘 不确定数据
下载PDF
面向属性的RST在数据挖掘中的应用 被引量:3
16
作者 朱定华 魏媛媛 魏长华 《华中理工大学学报》 CSCD 北大核心 2000年第2期80-83,共4页
基于对 RST的基本概念和近似空间的形式描述 ,定义了不确定信息系统 ,并引入面向对象属性的泛化和约简操作算法 .在此基础上 ,提出了一个面向属性的 RST的数据挖掘方法 ,即基于系统的关系数据库形成差别矩阵 ,并对差别矩阵施行最佳约简... 基于对 RST的基本概念和近似空间的形式描述 ,定义了不确定信息系统 ,并引入面向对象属性的泛化和约简操作算法 .在此基础上 ,提出了一个面向属性的 RST的数据挖掘方法 ,即基于系统的关系数据库形成差别矩阵 ,并对差别矩阵施行最佳约简和核操作 ,给出在逻辑意义下的决策规则 ,从而完成领域的知识发现 . 展开更多
关键词 粗集理论 数据挖掘 不确定信息系统 面向属性
下载PDF
不确定性数据频繁项集挖掘算法 被引量:2
17
作者 张常品 刘广钟 《计算机系统应用》 2014年第11期160-164,共5页
由于不确定性数据大量存在于传感器网络,移动计算,军事,电信等应用领域,传统的频繁项集挖掘算法难以适用到不确定性数据挖掘.为了解决这个问题,本文提出了一种快速有效的算法,该算法基于可能世界模型,只需要扫描一次数据库,且没有建树... 由于不确定性数据大量存在于传感器网络,移动计算,军事,电信等应用领域,传统的频繁项集挖掘算法难以适用到不确定性数据挖掘.为了解决这个问题,本文提出了一种快速有效的算法,该算法基于可能世界模型,只需要扫描一次数据库,且没有建树的过程,通过实验证明,我们提出的算法比UF_Growth算法效率更高. 展开更多
关键词 频繁项集 不确定性数据 频繁模式 关联规则 可能世界模型
下载PDF
粗糙集理论及其在管理决策中的应用浅析 被引量:1
18
作者 李秀竹 《信息技术》 2007年第7期141-142,共2页
在管理决策过程中,人们经常接受到这样的信息,这些信息不能用精确的集合表示,从它们的特征上看,这类信息是粗糙的,不完备的。粗糙集理论是分析和处理不完备信息的有效工具,现就粗糙集理论本身的发展和其在管理学领域的最新应用进行分析... 在管理决策过程中,人们经常接受到这样的信息,这些信息不能用精确的集合表示,从它们的特征上看,这类信息是粗糙的,不完备的。粗糙集理论是分析和处理不完备信息的有效工具,现就粗糙集理论本身的发展和其在管理学领域的最新应用进行分析和介绍,并提出在应用过程中存在的问题。 展开更多
关键词 粗糙集 管理决策 不确定性数据
下载PDF
基于谱聚类的不确定数据集中快速离群点挖掘算法 被引量:2
19
作者 康耀龙 冯丽露 +1 位作者 张景安 曹素娥 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第4期1181-1186,共6页
针对目前算法对数据进行离群点挖掘时,由于未能在数据挖掘前提取相关数据特征,导致该算法在进行数据挖掘时,存在挖掘时间长、挖掘效果差以及挖掘性能低的问题,提出一种基于谱聚类的不确定数据集中快速离群点挖掘算法。该算法先依据不等... 针对目前算法对数据进行离群点挖掘时,由于未能在数据挖掘前提取相关数据特征,导致该算法在进行数据挖掘时,存在挖掘时间长、挖掘效果差以及挖掘性能低的问题,提出一种基于谱聚类的不确定数据集中快速离群点挖掘算法。该算法先依据不等长序列计算数据的相似程度,并使用偏最小二乘法完成不确定数据集的特征提取;再基于谱聚类算法对数据特征进行计算,获取数据的离群指数;最后通过离群指数完成不确定数据集的离群点挖掘。实验结果表明,使用该算法挖掘数据离群点时,挖掘时间较短、挖掘效果较好、挖掘性能较高。 展开更多
关键词 谱聚类算法 不确定数据集 数据离群点 快速挖掘 偏最小二乘法
原文传递
基于双论域犹豫三角模糊多粒度粗糙集的疾病诊断 被引量:3
20
作者 张超 李德玉 闫燕 《模糊系统与数学》 CSCD 北大核心 2016年第6期141-148,共8页
在临床决策领域,疾病诊断已成为较为复杂的决策问题之一。医疗专家在疾病诊断过程中不仅需要处理大量的不确定性信息,而且需要综合不同医疗专家的意见来给出最终的诊断结果。为了解决以上疾病诊断中普遍存在的不确定性数据分析以及群决... 在临床决策领域,疾病诊断已成为较为复杂的决策问题之一。医疗专家在疾病诊断过程中不仅需要处理大量的不确定性信息,而且需要综合不同医疗专家的意见来给出最终的诊断结果。为了解决以上疾病诊断中普遍存在的不确定性数据分析以及群决策的问题,通过结合犹豫三角模糊集和多粒度粗糙集,提出双论域犹豫三角模糊多粒度粗糙集的概念。在此基础上,提出以疾病诊断为背景的决策模型并用算例阐述所提出模型的有效性。 展开更多
关键词 疾病诊断 不确定性数据分析 群决策 犹豫三角模糊集 多粒度粗糙集
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部