期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于灰关联分析的连续值属性约减算法 被引量:5
1
作者 张健 王晋东 余定坤 《计算机应用》 CSCD 北大核心 2014年第2期401-405,共5页
针对目前大多数属性约减算法只能用于离散值决策表的情况,将条件属性与决策属性的关联度作为属性约减的重要性测度,同时基于条件属性间的关联度和重要度定义了条件属性的重叠性测度,据此对条件属性进行去重叠化处理,提出了一种基于灰关... 针对目前大多数属性约减算法只能用于离散值决策表的情况,将条件属性与决策属性的关联度作为属性约减的重要性测度,同时基于条件属性间的关联度和重要度定义了条件属性的重叠性测度,据此对条件属性进行去重叠化处理,提出了一种基于灰关联分析的连续值属性约减算法CARAG,实现了对连续值属性集的约减,并在仿真实验中对算法的可行性和有效性进行了对比验证。 展开更多
关键词 属性约减 灰关联分析 重叠度 连续值属性
下载PDF
连续值属性的概念层次自动提取算法 被引量:2
2
作者 杨学兵 蔡庆生 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第12期13-15,共3页
针对数值型属性的特点 ,通过不同数值分段的分布特性 ,给出了一种能自动从大型数据库中提取数值型属性的概念层次的有效算法 ,算法的时间复杂度为O(n) ,并通过具体实验对算法进行测试 .结果表明 ,该算法能正确有效地生成概念层次树 ,为... 针对数值型属性的特点 ,通过不同数值分段的分布特性 ,给出了一种能自动从大型数据库中提取数值型属性的概念层次的有效算法 ,算法的时间复杂度为O(n) ,并通过具体实验对算法进行测试 .结果表明 ,该算法能正确有效地生成概念层次树 ,为高质量地进行数据挖掘提供了一种行之有效的数据预处理方法 . 展开更多
关键词 数据库 知识发现 数据挖掘 概念层次 自动提取算法 连续值属性
下载PDF
一种新的用于连续值属性离散化的约简算法 被引量:4
3
作者 刘震宇 郭宝龙 杨林耀 《控制与决策》 EI CSCD 北大核心 2002年第5期545-549,共5页
针对在 Nguyen和 Skowron的离散化算法中进行启发式约简时会出现某些属性不能进行离散化问题 ,以及在无核数据集中启发式约简算法计算量比较大等问题 ,在粗糙集理论和属性频率函数的基础上给出一个新概念——候选核 ,并提出一种新的用... 针对在 Nguyen和 Skowron的离散化算法中进行启发式约简时会出现某些属性不能进行离散化问题 ,以及在无核数据集中启发式约简算法计算量比较大等问题 ,在粗糙集理论和属性频率函数的基础上给出一个新概念——候选核 ,并提出一种新的用于连续值属性离散化的约简算法——基于候选核的启发式约简算法 (简称 BCC)。该算法可以寻找到能对所有属性进行离散化的约简。实验表明 ,所提出的 BCC算法能提高大数据集的离散化效果。 展开更多
关键词 连续值属性离散化 约简算法 数据挖掘 粗糙集理论 人工智能
下载PDF
基于聚类的连续值属性最佳离散化算法 被引量:6
4
作者 席静 欧阳为民 《小型微型计算机系统》 EI CSCD 北大核心 2000年第10期1025-1027,共3页
在机器学习和 KDD研究中 ,大多数算法都是以离散值为处理对象的 .然而 ,在现实世界数据库中 ,存在着大量的连续值属性 .因此 ,常常需要对连续值属性进行离散化 .本文提出了一种基于聚类的连续值属性最佳离散化算法 .
关键词 机器学习 知识发现 连续值属性 聚类 离散化算法
下载PDF
一种实现分类问题中连续值属性离散化的方法 被引量:1
5
作者 刘东荣 王熙照 《计算机工程与应用》 CSCD 北大核心 2002年第23期108-109,247,共3页
在处理分类问题时,通常首先要对连续值属性值进行离散化,用传统的方法难以找到较好的区间划分,该文采用基于变长染色体的遗传算法,并引入淘汰机制,较好地解决了这一问题。
关键词 分类问题 连续值属性离散化 遗传算法 规则映射 适应度函数
下载PDF
基于连续值属性的加权灵活贝叶斯分类器
6
作者 于万国 陈日升 《山西财经大学学报》 CSSCI 北大核心 2014年第S1期243-245,共3页
文章提出了一种新的贝叶斯分类算法——加权灵活贝叶斯分类器用以处理连续值属性的分类问题。通过度量条件属性与决策属性的相关度,类条件概率中对应的边缘概率密度被赋予了相应的权重,其中,条件属性与决策属性之间的相关性通过基于互... 文章提出了一种新的贝叶斯分类算法——加权灵活贝叶斯分类器用以处理连续值属性的分类问题。通过度量条件属性与决策属性的相关度,类条件概率中对应的边缘概率密度被赋予了相应的权重,其中,条件属性与决策属性之间的相关性通过基于互信息的相关度量标准来计算。在10个UCI数据集合上面,我们比较了WFNB与加权朴素贝叶斯和灵活贝叶斯分类器的分类精度,试验结果表明,我们提出的WFNB有效地改进了传统贝叶斯分类器的分类精度。 展开更多
关键词 贝叶斯分类器 连续值属性 相关性 互信息
原文传递
概念学习中连续值型属性的离散化 被引量:2
7
作者 刘娟 李凯扬 《武汉大学学报(自然科学版)》 CSCD 1997年第5期611-616,共6页
在概念学习中,属性不仅可以为离散值型,还可以为连续值型,因此,连续值型属性的离散化问题是概念学习中的一个重要问题,本文给出了基于假设检验的离散化方法的理论依据,并依此提出了一种离散化算法Discrete,实验结果表明... 在概念学习中,属性不仅可以为离散值型,还可以为连续值型,因此,连续值型属性的离散化问题是概念学习中的一个重要问题,本文给出了基于假设检验的离散化方法的理论依据,并依此提出了一种离散化算法Discrete,实验结果表明,这种方法一般能得到较合理的区间划分. 展开更多
关键词 概念学习 连续属性 离散化 假设检验
下载PDF
滑坡数据连续属性值处理的研究 被引量:1
8
作者 亓呈明 崔守梅 《微计算机信息》 北大核心 2006年第08X期10-11,32,共3页
数据预处理是提高挖掘过程精度和性能的关键。文章在分析决策树算法和滑坡数据属性值特点基础上,利用聚类将连续属性值划分区间,提出了一种针对滑坡数据连续属性值离散化的方法,通过实验,新方法构造的决策树比原算法的分类正确率高,规... 数据预处理是提高挖掘过程精度和性能的关键。文章在分析决策树算法和滑坡数据属性值特点基础上,利用聚类将连续属性值划分区间,提出了一种针对滑坡数据连续属性值离散化的方法,通过实验,新方法构造的决策树比原算法的分类正确率高,规则冗余少。 展开更多
关键词 连续属性 聚类 滑坡
下载PDF
基于统计学法则的连续属性值划分方法
9
作者 高洪涛 陆伟 杨余旺 《科学技术与工程》 北大核心 2018年第16期237-240,共4页
目前决策树中很多分类算法例如ID3/C4.5/C5.0等都依赖于离散的属性值,并且希望将它们的值域划分到一个有限区间。利用统计学法则,提出一种新的连续属性值的划分方法;该方法通过统计学法则来发现精准的合并区间。另外在此基础上,为提高... 目前决策树中很多分类算法例如ID3/C4.5/C5.0等都依赖于离散的属性值,并且希望将它们的值域划分到一个有限区间。利用统计学法则,提出一种新的连续属性值的划分方法;该方法通过统计学法则来发现精准的合并区间。另外在此基础上,为提高决策树算法分类学习性能,提出一种启发式的划分算法来获得理想的划分结果.在UCI真实数据集上进行仿真实验.结果表明获得了一个比较高的分类学习精度、与常见的划分算法比较起来有很好的分类学习能力。 展开更多
关键词 连续属性 学习精度 统计学法则 分类算法
下载PDF
一种区间属性值离散化的新方法 被引量:5
10
作者 关欣 衣晓 +1 位作者 何友 周一宇 《宇航学报》 EI CAS CSCD 北大核心 2009年第3期1164-1167,1206,共5页
粗糙集理论作为一种新的处理含糊和不确定性问题的数学工具,已成为国际学术界的一个前沿的研究领域。传统的粗糙集理论只能对数据库中的离散属性进行处理,因此,连续属性值的离散化问题不容忽视。已有的离散化方法主要是针对固定点上的... 粗糙集理论作为一种新的处理含糊和不确定性问题的数学工具,已成为国际学术界的一个前沿的研究领域。传统的粗糙集理论只能对数据库中的离散属性进行处理,因此,连续属性值的离散化问题不容忽视。已有的离散化方法主要是针对固定点上的连续属性值的,实际应用中大量存在着连续区间属性值的情况。文中针对这一问题,提出了一种连续区间属性值离散化的新方法,并利用辐射源信号进行了仿真试验。结果表明,该方法能有效离散区间属性,从而拓展了粗糙集理论的应用范围。 展开更多
关键词 粗糙集 离散化 连续区间属性
下载PDF
基于改进遗传算法的连续属性离散化方法 被引量:1
11
作者 夏战国 夏士雄 +1 位作者 牛强 张磊 《计算机工程与设计》 CSCD 北大核心 2008年第16期4275-4276,4279,共3页
粗糙集中的离散化要求在保持原有决策系统的不可分辩关系情况下,用尽量少的断点进行离散化,而求取连续属性值的最优断点集合是一个NP难题。把连续属性值离散化问题作为一种约束优化问题,采用一种改进的遗传算法来获得最优解,并针对离散... 粗糙集中的离散化要求在保持原有决策系统的不可分辩关系情况下,用尽量少的断点进行离散化,而求取连续属性值的最优断点集合是一个NP难题。把连续属性值离散化问题作为一种约束优化问题,采用一种改进的遗传算法来获得最优解,并针对离散化问题设计了相应的编码方式和交叉方法。实验结果表明,采用改进的遗传算法求解连续属性值最优断点集合是可行的。 展开更多
关键词 离散化 决策表 粗糙集 遗传算法 连续属性
下载PDF
基于模糊化的决策粗糙集属性约简和分类 被引量:14
12
作者 郭敏 贾修一 商琳 《模式识别与人工智能》 EI CSCD 北大核心 2014年第8期701-707,共7页
决策粗糙集是一种基于贝叶斯风险最小化原则的具有一定容忍度的概率粗糙集模型,但当前关于决策粗糙集模型的研究只局限于处理具有离散型数据的信息表.文中将模糊集和决策粗糙集理论相结合,在决策粗糙集模型中计算期望风险损失时,利用模... 决策粗糙集是一种基于贝叶斯风险最小化原则的具有一定容忍度的概率粗糙集模型,但当前关于决策粗糙集模型的研究只局限于处理具有离散型数据的信息表.文中将模糊集和决策粗糙集理论相结合,在决策粗糙集模型中计算期望风险损失时,利用模糊隶属度函数代替传统的后验概率求解方法,这样可推导出新的决策规则,进而可高效处理那些包含连续型属性的信息系统.实验表明该方法是可行的,并且可通过调整隶属度函数,达到更佳分类效果. 展开更多
关键词 决策粗糙集 模糊集 隶属度函数 连续值属性
下载PDF
基于逐级均值聚类的信息熵的离散化算法 被引量:1
13
作者 刘静 罗卫敏 刘井波 《计算机应用研究》 CSCD 北大核心 2010年第9期3368-3371,共4页
目前基于Rough集的离散化算法很难做到高效率和高识别率兼顾,针对粗糙集给出了基于逐级均值聚类的信息熵的离散化算法。首先使用改进的逐级均值聚类算法分别对单个属性的候选断点按其信息熵值进行聚类分析,生成新的规模更小的候选断点集... 目前基于Rough集的离散化算法很难做到高效率和高识别率兼顾,针对粗糙集给出了基于逐级均值聚类的信息熵的离散化算法。首先使用改进的逐级均值聚类算法分别对单个属性的候选断点按其信息熵值进行聚类分析,生成新的规模更小的候选断点集,然后用基于信息熵的离散化算法完成断点的选取并对连续值属性进行离散化。实验结果表明,该方法在识别率相当的情况下比传统的离散化方法的时间代价更低。 展开更多
关键词 粗糙集 离散化 连续值属性 逐级均聚类 信息熵
下载PDF
一种基于灰色绝对关联度的变精度粗糙集模型 被引量:5
14
作者 王磊 王金山 沈浮 《重庆理工大学学报(自然科学)》 CAS 2012年第5期123-126,共4页
应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失,同时经典粗糙集模型也无法处理不精确分类。针对以上问题,建立了基于灰色绝对关联度的变精度粗糙集模型,研究了模型的部分性质和定理,提出了基于... 应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失,同时经典粗糙集模型也无法处理不精确分类。针对以上问题,建立了基于灰色绝对关联度的变精度粗糙集模型,研究了模型的部分性质和定理,提出了基于重要度的约简算法对模型进行属性约简。通过实例说明了模型建立和约简的具体过程。 展开更多
关键词 连续值属性决策表 变精度粗糙集模型 灰色绝对关联度 属性约简 重要度
下载PDF
基于一种改进相似度的扩展粗糙集模型 被引量:1
15
作者 王金山 王磊 《徐州师范大学学报(自然科学版)》 CAS 2012年第1期41-44,共4页
应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失.本文在分析已有相似度不足的基础上提出一种改进的相似度,建立基于改进相似度的扩展粗糙集模型,并提出一种基于重要度的约简算法.
关键词 连续值属性决策表 扩展粗糙集模型 相似度 属性约简 重要度
下载PDF
基于Rough集的集成离散化算法 被引量:1
16
作者 刘静 何贤芳 《重庆三峡学院学报》 2010年第3期59-63,共5页
离散化是Rough集理论研究的一个重要内容,目前基于Rough集的离散化算法很难做到高效率和高识别率兼顾.文中分析了基于断点重要性算法和基于属性重要性算法的特点,确定了离散化思路,提出了一种基于Rough集的集成离散化算法.该算法能够有... 离散化是Rough集理论研究的一个重要内容,目前基于Rough集的离散化算法很难做到高效率和高识别率兼顾.文中分析了基于断点重要性算法和基于属性重要性算法的特点,确定了离散化思路,提出了一种基于Rough集的集成离散化算法.该算法能够有效降低候选断点的数目,快速地实现决策表的离散化.实验结果表明,文中算法保持了与已有算法可比的识别率,且运行效率更高. 展开更多
关键词 粗糙集 决策表 连续值属性 集成离散化
下载PDF
天地一体化智能网络流量实时分类 被引量:1
17
作者 杨力 王龙青 +1 位作者 潘成胜 蔡睿妍 《小型微型计算机系统》 CSCD 北大核心 2022年第7期1547-1552,共6页
天地一体化智能网络规模大,环境复杂,网络中流量业务类型繁多且流量具有突发性.本文结合Spark大数据分布式平台,根据流量的特点设计了SFFS-FCBF-C4.5(简称SFC)决策树分类模型,实现了大规模网络下流量的实时分类,以保障网络中资源的合理... 天地一体化智能网络规模大,环境复杂,网络中流量业务类型繁多且流量具有突发性.本文结合Spark大数据分布式平台,根据流量的特点设计了SFFS-FCBF-C4.5(简称SFC)决策树分类模型,实现了大规模网络下流量的实时分类,以保障网络中资源的合理分配和利用.SFC算法是在C4.5决策树算法的基础上结合了改进后的快速相关滤波算法(Fast Correlation-Based Filter Solution,FCBF)和连续型属性值离散化算法,可以在有效去除冗余特征和降低模型复杂度的同时,提高模型分类的速度和准确率.仿真结果表明,SFC决策树分类模型相比传统的流量分类模型具有较好的稳定性和较高的准确率,可以很好的适应复杂多变的网络环境.同时,Spark大数据分布式平台的应用大幅度提高了大规模网络下流量分类的速度,能够对海量流量进行实时分类. 展开更多
关键词 天地一体化智能网络 FCBF 连续属性离散化算法 SPARK 流量实时分类
下载PDF
基于灰色关联度的变精度粗糙集模型 被引量:2
18
作者 王金山 王磊 《重庆师范大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第1期80-83,共4页
为了解决经典粗糙集理论无法处理不精确分类以及连续值属性离散化造成信息损失等问题,本文提出了基本灰色关联度的变经度粗糙集模型(γ-′β(X),γ′β(X))。首先利用灰色关联度定义相似并进一步定义粗糙集并研究了模型的部分性质和定理... 为了解决经典粗糙集理论无法处理不精确分类以及连续值属性离散化造成信息损失等问题,本文提出了基本灰色关联度的变经度粗糙集模型(γ-′β(X),γ′β(X))。首先利用灰色关联度定义相似并进一步定义粗糙集并研究了模型的部分性质和定理(当0<t1≤t2<1时,有γt2(x)γt1(x)、γ-t1β(X)γ-t2β(X)及γt2β(X)γt1β(X)成立),然后提出了一种基于重要度SIGB(c)的约简算法来计算最小约简,最后通过一个实例说明模型是有效和可行的。 展开更多
关键词 连续值属性决策表 变经度粗糙集模型 灰色关联度 属性约简 重要度
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部