期刊导航
期刊开放获取
重庆大学
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
18
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于灰关联分析的连续值属性约减算法
被引量:
5
1
作者
张健
王晋东
余定坤
《计算机应用》
CSCD
北大核心
2014年第2期401-405,共5页
针对目前大多数属性约减算法只能用于离散值决策表的情况,将条件属性与决策属性的关联度作为属性约减的重要性测度,同时基于条件属性间的关联度和重要度定义了条件属性的重叠性测度,据此对条件属性进行去重叠化处理,提出了一种基于灰关...
针对目前大多数属性约减算法只能用于离散值决策表的情况,将条件属性与决策属性的关联度作为属性约减的重要性测度,同时基于条件属性间的关联度和重要度定义了条件属性的重叠性测度,据此对条件属性进行去重叠化处理,提出了一种基于灰关联分析的连续值属性约减算法CARAG,实现了对连续值属性集的约减,并在仿真实验中对算法的可行性和有效性进行了对比验证。
展开更多
关键词
属性
约减
灰关联分析
重叠度
连续值属性
下载PDF
职称材料
连续值属性的概念层次自动提取算法
被引量:
2
2
作者
杨学兵
蔡庆生
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2003年第12期13-15,共3页
针对数值型属性的特点 ,通过不同数值分段的分布特性 ,给出了一种能自动从大型数据库中提取数值型属性的概念层次的有效算法 ,算法的时间复杂度为O(n) ,并通过具体实验对算法进行测试 .结果表明 ,该算法能正确有效地生成概念层次树 ,为...
针对数值型属性的特点 ,通过不同数值分段的分布特性 ,给出了一种能自动从大型数据库中提取数值型属性的概念层次的有效算法 ,算法的时间复杂度为O(n) ,并通过具体实验对算法进行测试 .结果表明 ,该算法能正确有效地生成概念层次树 ,为高质量地进行数据挖掘提供了一种行之有效的数据预处理方法 .
展开更多
关键词
数据库
知识发现
数据挖掘
概念层次
自动提取算法
连续值属性
下载PDF
职称材料
一种新的用于连续值属性离散化的约简算法
被引量:
4
3
作者
刘震宇
郭宝龙
杨林耀
《控制与决策》
EI
CSCD
北大核心
2002年第5期545-549,共5页
针对在 Nguyen和 Skowron的离散化算法中进行启发式约简时会出现某些属性不能进行离散化问题 ,以及在无核数据集中启发式约简算法计算量比较大等问题 ,在粗糙集理论和属性频率函数的基础上给出一个新概念——候选核 ,并提出一种新的用...
针对在 Nguyen和 Skowron的离散化算法中进行启发式约简时会出现某些属性不能进行离散化问题 ,以及在无核数据集中启发式约简算法计算量比较大等问题 ,在粗糙集理论和属性频率函数的基础上给出一个新概念——候选核 ,并提出一种新的用于连续值属性离散化的约简算法——基于候选核的启发式约简算法 (简称 BCC)。该算法可以寻找到能对所有属性进行离散化的约简。实验表明 ,所提出的 BCC算法能提高大数据集的离散化效果。
展开更多
关键词
连续值属性
离散化
约简算法
数据挖掘
粗糙集理论
人工智能
下载PDF
职称材料
基于聚类的连续值属性最佳离散化算法
被引量:
6
4
作者
席静
欧阳为民
《小型微型计算机系统》
EI
CSCD
北大核心
2000年第10期1025-1027,共3页
在机器学习和 KDD研究中 ,大多数算法都是以离散值为处理对象的 .然而 ,在现实世界数据库中 ,存在着大量的连续值属性 .因此 ,常常需要对连续值属性进行离散化 .本文提出了一种基于聚类的连续值属性最佳离散化算法 .
关键词
机器学习
知识发现
连续值属性
聚类
离散化算法
下载PDF
职称材料
一种实现分类问题中连续值属性离散化的方法
被引量:
1
5
作者
刘东荣
王熙照
《计算机工程与应用》
CSCD
北大核心
2002年第23期108-109,247,共3页
在处理分类问题时,通常首先要对连续值属性值进行离散化,用传统的方法难以找到较好的区间划分,该文采用基于变长染色体的遗传算法,并引入淘汰机制,较好地解决了这一问题。
关键词
分类问题
连续值属性
离散化
遗传算法
规则映射
适应度函数
下载PDF
职称材料
基于连续值属性的加权灵活贝叶斯分类器
6
作者
于万国
陈日升
《山西财经大学学报》
CSSCI
北大核心
2014年第S1期243-245,共3页
文章提出了一种新的贝叶斯分类算法——加权灵活贝叶斯分类器用以处理连续值属性的分类问题。通过度量条件属性与决策属性的相关度,类条件概率中对应的边缘概率密度被赋予了相应的权重,其中,条件属性与决策属性之间的相关性通过基于互...
文章提出了一种新的贝叶斯分类算法——加权灵活贝叶斯分类器用以处理连续值属性的分类问题。通过度量条件属性与决策属性的相关度,类条件概率中对应的边缘概率密度被赋予了相应的权重,其中,条件属性与决策属性之间的相关性通过基于互信息的相关度量标准来计算。在10个UCI数据集合上面,我们比较了WFNB与加权朴素贝叶斯和灵活贝叶斯分类器的分类精度,试验结果表明,我们提出的WFNB有效地改进了传统贝叶斯分类器的分类精度。
展开更多
关键词
贝叶斯分类器
连续值属性
相关性
互信息
原文传递
概念学习中连续值型属性的离散化
被引量:
2
7
作者
刘娟
李凯扬
《武汉大学学报(自然科学版)》
CSCD
1997年第5期611-616,共6页
在概念学习中,属性不仅可以为离散值型,还可以为连续值型,因此,连续值型属性的离散化问题是概念学习中的一个重要问题,本文给出了基于假设检验的离散化方法的理论依据,并依此提出了一种离散化算法Discrete,实验结果表明...
在概念学习中,属性不仅可以为离散值型,还可以为连续值型,因此,连续值型属性的离散化问题是概念学习中的一个重要问题,本文给出了基于假设检验的离散化方法的理论依据,并依此提出了一种离散化算法Discrete,实验结果表明,这种方法一般能得到较合理的区间划分.
展开更多
关键词
概念学习
连续
值
型
属性
离散化
假设检验
下载PDF
职称材料
滑坡数据连续属性值处理的研究
被引量:
1
8
作者
亓呈明
崔守梅
《微计算机信息》
北大核心
2006年第08X期10-11,32,共3页
数据预处理是提高挖掘过程精度和性能的关键。文章在分析决策树算法和滑坡数据属性值特点基础上,利用聚类将连续属性值划分区间,提出了一种针对滑坡数据连续属性值离散化的方法,通过实验,新方法构造的决策树比原算法的分类正确率高,规...
数据预处理是提高挖掘过程精度和性能的关键。文章在分析决策树算法和滑坡数据属性值特点基础上,利用聚类将连续属性值划分区间,提出了一种针对滑坡数据连续属性值离散化的方法,通过实验,新方法构造的决策树比原算法的分类正确率高,规则冗余少。
展开更多
关键词
连续
属性
值
聚类
滑坡
下载PDF
职称材料
基于统计学法则的连续属性值划分方法
9
作者
高洪涛
陆伟
杨余旺
《科学技术与工程》
北大核心
2018年第16期237-240,共4页
目前决策树中很多分类算法例如ID3/C4.5/C5.0等都依赖于离散的属性值,并且希望将它们的值域划分到一个有限区间。利用统计学法则,提出一种新的连续属性值的划分方法;该方法通过统计学法则来发现精准的合并区间。另外在此基础上,为提高...
目前决策树中很多分类算法例如ID3/C4.5/C5.0等都依赖于离散的属性值,并且希望将它们的值域划分到一个有限区间。利用统计学法则,提出一种新的连续属性值的划分方法;该方法通过统计学法则来发现精准的合并区间。另外在此基础上,为提高决策树算法分类学习性能,提出一种启发式的划分算法来获得理想的划分结果.在UCI真实数据集上进行仿真实验.结果表明获得了一个比较高的分类学习精度、与常见的划分算法比较起来有很好的分类学习能力。
展开更多
关键词
连续
属性
值
学习精度
统计学法则
分类算法
下载PDF
职称材料
一种区间属性值离散化的新方法
被引量:
5
10
作者
关欣
衣晓
+1 位作者
何友
周一宇
《宇航学报》
EI
CAS
CSCD
北大核心
2009年第3期1164-1167,1206,共5页
粗糙集理论作为一种新的处理含糊和不确定性问题的数学工具,已成为国际学术界的一个前沿的研究领域。传统的粗糙集理论只能对数据库中的离散属性进行处理,因此,连续属性值的离散化问题不容忽视。已有的离散化方法主要是针对固定点上的...
粗糙集理论作为一种新的处理含糊和不确定性问题的数学工具,已成为国际学术界的一个前沿的研究领域。传统的粗糙集理论只能对数据库中的离散属性进行处理,因此,连续属性值的离散化问题不容忽视。已有的离散化方法主要是针对固定点上的连续属性值的,实际应用中大量存在着连续区间属性值的情况。文中针对这一问题,提出了一种连续区间属性值离散化的新方法,并利用辐射源信号进行了仿真试验。结果表明,该方法能有效离散区间属性,从而拓展了粗糙集理论的应用范围。
展开更多
关键词
粗糙集
离散化
连续
区间
值
属性
下载PDF
职称材料
基于改进遗传算法的连续属性离散化方法
被引量:
1
11
作者
夏战国
夏士雄
+1 位作者
牛强
张磊
《计算机工程与设计》
CSCD
北大核心
2008年第16期4275-4276,4279,共3页
粗糙集中的离散化要求在保持原有决策系统的不可分辩关系情况下,用尽量少的断点进行离散化,而求取连续属性值的最优断点集合是一个NP难题。把连续属性值离散化问题作为一种约束优化问题,采用一种改进的遗传算法来获得最优解,并针对离散...
粗糙集中的离散化要求在保持原有决策系统的不可分辩关系情况下,用尽量少的断点进行离散化,而求取连续属性值的最优断点集合是一个NP难题。把连续属性值离散化问题作为一种约束优化问题,采用一种改进的遗传算法来获得最优解,并针对离散化问题设计了相应的编码方式和交叉方法。实验结果表明,采用改进的遗传算法求解连续属性值最优断点集合是可行的。
展开更多
关键词
离散化
决策表
粗糙集
遗传算法
连续
属性
值
下载PDF
职称材料
基于模糊化的决策粗糙集属性约简和分类
被引量:
14
12
作者
郭敏
贾修一
商琳
《模式识别与人工智能》
EI
CSCD
北大核心
2014年第8期701-707,共7页
决策粗糙集是一种基于贝叶斯风险最小化原则的具有一定容忍度的概率粗糙集模型,但当前关于决策粗糙集模型的研究只局限于处理具有离散型数据的信息表.文中将模糊集和决策粗糙集理论相结合,在决策粗糙集模型中计算期望风险损失时,利用模...
决策粗糙集是一种基于贝叶斯风险最小化原则的具有一定容忍度的概率粗糙集模型,但当前关于决策粗糙集模型的研究只局限于处理具有离散型数据的信息表.文中将模糊集和决策粗糙集理论相结合,在决策粗糙集模型中计算期望风险损失时,利用模糊隶属度函数代替传统的后验概率求解方法,这样可推导出新的决策规则,进而可高效处理那些包含连续型属性的信息系统.实验表明该方法是可行的,并且可通过调整隶属度函数,达到更佳分类效果.
展开更多
关键词
决策粗糙集
模糊集
隶属度函数
连续值属性
下载PDF
职称材料
基于逐级均值聚类的信息熵的离散化算法
被引量:
1
13
作者
刘静
罗卫敏
刘井波
《计算机应用研究》
CSCD
北大核心
2010年第9期3368-3371,共4页
目前基于Rough集的离散化算法很难做到高效率和高识别率兼顾,针对粗糙集给出了基于逐级均值聚类的信息熵的离散化算法。首先使用改进的逐级均值聚类算法分别对单个属性的候选断点按其信息熵值进行聚类分析,生成新的规模更小的候选断点集...
目前基于Rough集的离散化算法很难做到高效率和高识别率兼顾,针对粗糙集给出了基于逐级均值聚类的信息熵的离散化算法。首先使用改进的逐级均值聚类算法分别对单个属性的候选断点按其信息熵值进行聚类分析,生成新的规模更小的候选断点集,然后用基于信息熵的离散化算法完成断点的选取并对连续值属性进行离散化。实验结果表明,该方法在识别率相当的情况下比传统的离散化方法的时间代价更低。
展开更多
关键词
粗糙集
离散化
连续值属性
逐级均
值
聚类
信息熵
下载PDF
职称材料
一种基于灰色绝对关联度的变精度粗糙集模型
被引量:
5
14
作者
王磊
王金山
沈浮
《重庆理工大学学报(自然科学)》
CAS
2012年第5期123-126,共4页
应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失,同时经典粗糙集模型也无法处理不精确分类。针对以上问题,建立了基于灰色绝对关联度的变精度粗糙集模型,研究了模型的部分性质和定理,提出了基于...
应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失,同时经典粗糙集模型也无法处理不精确分类。针对以上问题,建立了基于灰色绝对关联度的变精度粗糙集模型,研究了模型的部分性质和定理,提出了基于重要度的约简算法对模型进行属性约简。通过实例说明了模型建立和约简的具体过程。
展开更多
关键词
连续值属性
决策表
变精度粗糙集模型
灰色绝对关联度
属性
约简
重要度
下载PDF
职称材料
基于一种改进相似度的扩展粗糙集模型
被引量:
1
15
作者
王金山
王磊
《徐州师范大学学报(自然科学版)》
CAS
2012年第1期41-44,共4页
应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失.本文在分析已有相似度不足的基础上提出一种改进的相似度,建立基于改进相似度的扩展粗糙集模型,并提出一种基于重要度的约简算法.
关键词
连续值属性
决策表
扩展粗糙集模型
相似度
属性
约简
重要度
下载PDF
职称材料
基于Rough集的集成离散化算法
被引量:
1
16
作者
刘静
何贤芳
《重庆三峡学院学报》
2010年第3期59-63,共5页
离散化是Rough集理论研究的一个重要内容,目前基于Rough集的离散化算法很难做到高效率和高识别率兼顾.文中分析了基于断点重要性算法和基于属性重要性算法的特点,确定了离散化思路,提出了一种基于Rough集的集成离散化算法.该算法能够有...
离散化是Rough集理论研究的一个重要内容,目前基于Rough集的离散化算法很难做到高效率和高识别率兼顾.文中分析了基于断点重要性算法和基于属性重要性算法的特点,确定了离散化思路,提出了一种基于Rough集的集成离散化算法.该算法能够有效降低候选断点的数目,快速地实现决策表的离散化.实验结果表明,文中算法保持了与已有算法可比的识别率,且运行效率更高.
展开更多
关键词
粗糙集
决策表
连续值属性
集成离散化
下载PDF
职称材料
天地一体化智能网络流量实时分类
被引量:
1
17
作者
杨力
王龙青
+1 位作者
潘成胜
蔡睿妍
《小型微型计算机系统》
CSCD
北大核心
2022年第7期1547-1552,共6页
天地一体化智能网络规模大,环境复杂,网络中流量业务类型繁多且流量具有突发性.本文结合Spark大数据分布式平台,根据流量的特点设计了SFFS-FCBF-C4.5(简称SFC)决策树分类模型,实现了大规模网络下流量的实时分类,以保障网络中资源的合理...
天地一体化智能网络规模大,环境复杂,网络中流量业务类型繁多且流量具有突发性.本文结合Spark大数据分布式平台,根据流量的特点设计了SFFS-FCBF-C4.5(简称SFC)决策树分类模型,实现了大规模网络下流量的实时分类,以保障网络中资源的合理分配和利用.SFC算法是在C4.5决策树算法的基础上结合了改进后的快速相关滤波算法(Fast Correlation-Based Filter Solution,FCBF)和连续型属性值离散化算法,可以在有效去除冗余特征和降低模型复杂度的同时,提高模型分类的速度和准确率.仿真结果表明,SFC决策树分类模型相比传统的流量分类模型具有较好的稳定性和较高的准确率,可以很好的适应复杂多变的网络环境.同时,Spark大数据分布式平台的应用大幅度提高了大规模网络下流量分类的速度,能够对海量流量进行实时分类.
展开更多
关键词
天地一体化智能网络
FCBF
连续
型
属性
值
离散化算法
SPARK
流量实时分类
下载PDF
职称材料
基于灰色关联度的变精度粗糙集模型
被引量:
2
18
作者
王金山
王磊
《重庆师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2014年第1期80-83,共4页
为了解决经典粗糙集理论无法处理不精确分类以及连续值属性离散化造成信息损失等问题,本文提出了基本灰色关联度的变经度粗糙集模型(γ-′β(X),γ′β(X))。首先利用灰色关联度定义相似并进一步定义粗糙集并研究了模型的部分性质和定理...
为了解决经典粗糙集理论无法处理不精确分类以及连续值属性离散化造成信息损失等问题,本文提出了基本灰色关联度的变经度粗糙集模型(γ-′β(X),γ′β(X))。首先利用灰色关联度定义相似并进一步定义粗糙集并研究了模型的部分性质和定理(当0<t1≤t2<1时,有γt2(x)γt1(x)、γ-t1β(X)γ-t2β(X)及γt2β(X)γt1β(X)成立),然后提出了一种基于重要度SIGB(c)的约简算法来计算最小约简,最后通过一个实例说明模型是有效和可行的。
展开更多
关键词
连续值属性
决策表
变经度粗糙集模型
灰色关联度
属性
约简
重要度
原文传递
题名
基于灰关联分析的连续值属性约减算法
被引量:
5
1
作者
张健
王晋东
余定坤
机构
信息工程大学
出处
《计算机应用》
CSCD
北大核心
2014年第2期401-405,共5页
基金
国防预研项目
文摘
针对目前大多数属性约减算法只能用于离散值决策表的情况,将条件属性与决策属性的关联度作为属性约减的重要性测度,同时基于条件属性间的关联度和重要度定义了条件属性的重叠性测度,据此对条件属性进行去重叠化处理,提出了一种基于灰关联分析的连续值属性约减算法CARAG,实现了对连续值属性集的约减,并在仿真实验中对算法的可行性和有效性进行了对比验证。
关键词
属性
约减
灰关联分析
重叠度
连续值属性
Keywords
attribute reduction
grey correlation analysis
overlap degree
continuous-valued attribute
分类号
TP301.4 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
连续值属性的概念层次自动提取算法
被引量:
2
2
作者
杨学兵
蔡庆生
机构
安徽工业大学计算机科学系
中国科技大学计算机科学系
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2003年第12期13-15,共3页
基金
国家自然科学基金资助项目 ( 60 0 75 0 1 5 )
安徽省教育厅科研经费资助项目 ( 2 0 0 2KJ0 46)
文摘
针对数值型属性的特点 ,通过不同数值分段的分布特性 ,给出了一种能自动从大型数据库中提取数值型属性的概念层次的有效算法 ,算法的时间复杂度为O(n) ,并通过具体实验对算法进行测试 .结果表明 ,该算法能正确有效地生成概念层次树 ,为高质量地进行数据挖掘提供了一种行之有效的数据预处理方法 .
关键词
数据库
知识发现
数据挖掘
概念层次
自动提取算法
连续值属性
Keywords
database knowledge discovery
data mining
concept hierarchy
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
一种新的用于连续值属性离散化的约简算法
被引量:
4
3
作者
刘震宇
郭宝龙
杨林耀
机构
西安电子科技大学测控工程系
出处
《控制与决策》
EI
CSCD
北大核心
2002年第5期545-549,共5页
基金
国家自然科学基金项目 (6 9975 0 15 )
文摘
针对在 Nguyen和 Skowron的离散化算法中进行启发式约简时会出现某些属性不能进行离散化问题 ,以及在无核数据集中启发式约简算法计算量比较大等问题 ,在粗糙集理论和属性频率函数的基础上给出一个新概念——候选核 ,并提出一种新的用于连续值属性离散化的约简算法——基于候选核的启发式约简算法 (简称 BCC)。该算法可以寻找到能对所有属性进行离散化的约简。实验表明 ,所提出的 BCC算法能提高大数据集的离散化效果。
关键词
连续值属性
离散化
约简算法
数据挖掘
粗糙集理论
人工智能
Keywords
data mining
rough set theory
discretization
reduction algorithm
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于聚类的连续值属性最佳离散化算法
被引量:
6
4
作者
席静
欧阳为民
机构
中国科学院计算技术研究所
安徽大学计算中心
出处
《小型微型计算机系统》
EI
CSCD
北大核心
2000年第10期1025-1027,共3页
基金
国家自然科学基金项目资助
文摘
在机器学习和 KDD研究中 ,大多数算法都是以离散值为处理对象的 .然而 ,在现实世界数据库中 ,存在着大量的连续值属性 .因此 ,常常需要对连续值属性进行离散化 .本文提出了一种基于聚类的连续值属性最佳离散化算法 .
关键词
机器学习
知识发现
连续值属性
聚类
离散化算法
Keywords
Machine learning
Knowledge discovery
Continuous valued attributes
Discretization
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
一种实现分类问题中连续值属性离散化的方法
被引量:
1
5
作者
刘东荣
王熙照
机构
河北大学数学与计算机学院
河北师范大学数学与信息科学学院
出处
《计算机工程与应用》
CSCD
北大核心
2002年第23期108-109,247,共3页
文摘
在处理分类问题时,通常首先要对连续值属性值进行离散化,用传统的方法难以找到较好的区间划分,该文采用基于变长染色体的遗传算法,并引入淘汰机制,较好地解决了这一问题。
关键词
分类问题
连续值属性
离散化
遗传算法
规则映射
适应度函数
Keywords
Classification,Discretization,Genetic Algorithm(GA)
分类号
O242.23 [理学—计算数学]
TP30 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于连续值属性的加权灵活贝叶斯分类器
6
作者
于万国
陈日升
机构
河北民族师范学院数学与计算机系
出处
《山西财经大学学报》
CSSCI
北大核心
2014年第S1期243-245,共3页
文摘
文章提出了一种新的贝叶斯分类算法——加权灵活贝叶斯分类器用以处理连续值属性的分类问题。通过度量条件属性与决策属性的相关度,类条件概率中对应的边缘概率密度被赋予了相应的权重,其中,条件属性与决策属性之间的相关性通过基于互信息的相关度量标准来计算。在10个UCI数据集合上面,我们比较了WFNB与加权朴素贝叶斯和灵活贝叶斯分类器的分类精度,试验结果表明,我们提出的WFNB有效地改进了传统贝叶斯分类器的分类精度。
关键词
贝叶斯分类器
连续值属性
相关性
互信息
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
原文传递
题名
概念学习中连续值型属性的离散化
被引量:
2
7
作者
刘娟
李凯扬
机构
武汉大学计算机科学与技术学院
武汉大学分析测试中心
出处
《武汉大学学报(自然科学版)》
CSCD
1997年第5期611-616,共6页
基金
国家863高科技项目
文摘
在概念学习中,属性不仅可以为离散值型,还可以为连续值型,因此,连续值型属性的离散化问题是概念学习中的一个重要问题,本文给出了基于假设检验的离散化方法的理论依据,并依此提出了一种离散化算法Discrete,实验结果表明,这种方法一般能得到较合理的区间划分.
关键词
概念学习
连续
值
型
属性
离散化
假设检验
Keywords
concept learning, continous valued attribute, discretizing
分类号
TP301.2 [自动化与计算机技术—计算机系统结构]
O212.1 [理学—概率论与数理统计]
下载PDF
职称材料
题名
滑坡数据连续属性值处理的研究
被引量:
1
8
作者
亓呈明
崔守梅
机构
北京联合大学自动化学院
山东省淄博师范高等专科学校
出处
《微计算机信息》
北大核心
2006年第08X期10-11,32,共3页
文摘
数据预处理是提高挖掘过程精度和性能的关键。文章在分析决策树算法和滑坡数据属性值特点基础上,利用聚类将连续属性值划分区间,提出了一种针对滑坡数据连续属性值离散化的方法,通过实验,新方法构造的决策树比原算法的分类正确率高,规则冗余少。
关键词
连续
属性
值
聚类
滑坡
Keywords
continuous property, cluster, Landslide
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于统计学法则的连续属性值划分方法
9
作者
高洪涛
陆伟
杨余旺
机构
中国刑事警察学院网络犯罪侦查系
南京理工大学计算机科学与工程学院
出处
《科学技术与工程》
北大核心
2018年第16期237-240,共4页
基金
国家自然科学基金(61640020)资助
文摘
目前决策树中很多分类算法例如ID3/C4.5/C5.0等都依赖于离散的属性值,并且希望将它们的值域划分到一个有限区间。利用统计学法则,提出一种新的连续属性值的划分方法;该方法通过统计学法则来发现精准的合并区间。另外在此基础上,为提高决策树算法分类学习性能,提出一种启发式的划分算法来获得理想的划分结果.在UCI真实数据集上进行仿真实验.结果表明获得了一个比较高的分类学习精度、与常见的划分算法比较起来有很好的分类学习能力。
关键词
连续
属性
值
学习精度
统计学法则
分类算法
Keywords
continuous attributes
learning accuracy
statistical criterion classification algorithms
分类号
TP393.03 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种区间属性值离散化的新方法
被引量:
5
10
作者
关欣
衣晓
何友
周一宇
机构
海军航空工程学院信息融合技术研究所
国防科学技术大学电子科学与工程学院
出处
《宇航学报》
EI
CAS
CSCD
北大核心
2009年第3期1164-1167,1206,共5页
基金
国家自然科学基金(60672140)
全国优秀博士论文作者专项资金(200443)
文摘
粗糙集理论作为一种新的处理含糊和不确定性问题的数学工具,已成为国际学术界的一个前沿的研究领域。传统的粗糙集理论只能对数据库中的离散属性进行处理,因此,连续属性值的离散化问题不容忽视。已有的离散化方法主要是针对固定点上的连续属性值的,实际应用中大量存在着连续区间属性值的情况。文中针对这一问题,提出了一种连续区间属性值离散化的新方法,并利用辐射源信号进行了仿真试验。结果表明,该方法能有效离散区间属性,从而拓展了粗糙集理论的应用范围。
关键词
粗糙集
离散化
连续
区间
值
属性
Keywords
Rough set
Discretization
Continuous interval-valued attributes
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于改进遗传算法的连续属性离散化方法
被引量:
1
11
作者
夏战国
夏士雄
牛强
张磊
机构
中国矿业大学计算机科学与技术学院
出处
《计算机工程与设计》
CSCD
北大核心
2008年第16期4275-4276,4279,共3页
基金
国家自然科学基金项目(50674086)
江苏省社会发展科技计划基金项目(B52006002)
+1 种基金
高等学校博士学科点专项科研基金项目(20060290508)
中国矿业大学青年科研基金项目(2005A044)
文摘
粗糙集中的离散化要求在保持原有决策系统的不可分辩关系情况下,用尽量少的断点进行离散化,而求取连续属性值的最优断点集合是一个NP难题。把连续属性值离散化问题作为一种约束优化问题,采用一种改进的遗传算法来获得最优解,并针对离散化问题设计了相应的编码方式和交叉方法。实验结果表明,采用改进的遗传算法求解连续属性值最优断点集合是可行的。
关键词
离散化
决策表
粗糙集
遗传算法
连续
属性
值
Keywords
discretization
decision table
rough set, genetic algorithm
continuous attributes value
分类号
TP398.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于模糊化的决策粗糙集属性约简和分类
被引量:
14
12
作者
郭敏
贾修一
商琳
机构
南京大学计算机软件新技术国家重点实验室
南京理工大学计算机科学与工程学院
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2014年第8期701-707,共7页
基金
国家自然科学基金面上重点项目(No.60105003)
国家自然科学基金面上项目(No.61170180)资助
文摘
决策粗糙集是一种基于贝叶斯风险最小化原则的具有一定容忍度的概率粗糙集模型,但当前关于决策粗糙集模型的研究只局限于处理具有离散型数据的信息表.文中将模糊集和决策粗糙集理论相结合,在决策粗糙集模型中计算期望风险损失时,利用模糊隶属度函数代替传统的后验概率求解方法,这样可推导出新的决策规则,进而可高效处理那些包含连续型属性的信息系统.实验表明该方法是可行的,并且可通过调整隶属度函数,达到更佳分类效果.
关键词
决策粗糙集
模糊集
隶属度函数
连续值属性
Keywords
Decision-Theoretic Rough Set Fuzzy Set Membership Function Continuous Attribute
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于逐级均值聚类的信息熵的离散化算法
被引量:
1
13
作者
刘静
罗卫敏
刘井波
机构
重庆三峡学院实验中心
重庆三峡学院数学与计算机科学学院
出处
《计算机应用研究》
CSCD
北大核心
2010年第9期3368-3371,共4页
文摘
目前基于Rough集的离散化算法很难做到高效率和高识别率兼顾,针对粗糙集给出了基于逐级均值聚类的信息熵的离散化算法。首先使用改进的逐级均值聚类算法分别对单个属性的候选断点按其信息熵值进行聚类分析,生成新的规模更小的候选断点集,然后用基于信息熵的离散化算法完成断点的选取并对连续值属性进行离散化。实验结果表明,该方法在识别率相当的情况下比传统的离散化方法的时间代价更低。
关键词
粗糙集
离散化
连续值属性
逐级均
值
聚类
信息熵
Keywords
rough set
discretization
continuous attribute values
ranking means clustering
information entropy
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一种基于灰色绝对关联度的变精度粗糙集模型
被引量:
5
14
作者
王磊
王金山
沈浮
机构
解放军陆军军官学院数学教研室
出处
《重庆理工大学学报(自然科学)》
CAS
2012年第5期123-126,共4页
文摘
应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失,同时经典粗糙集模型也无法处理不精确分类。针对以上问题,建立了基于灰色绝对关联度的变精度粗糙集模型,研究了模型的部分性质和定理,提出了基于重要度的约简算法对模型进行属性约简。通过实例说明了模型建立和约简的具体过程。
关键词
连续值属性
决策表
变精度粗糙集模型
灰色绝对关联度
属性
约简
重要度
Keywords
continuous valued attribute decision table
variable precision rough set model
grey ab-solute correlation degree
indicator reduction
significant degree
分类号
O29 [理学—应用数学]
下载PDF
职称材料
题名
基于一种改进相似度的扩展粗糙集模型
被引量:
1
15
作者
王金山
王磊
机构
解放军陆军军官学院数学教研室
出处
《徐州师范大学学报(自然科学版)》
CAS
2012年第1期41-44,共4页
基金
总装陆装科订部科研基金资助项目(011027)
文摘
应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失.本文在分析已有相似度不足的基础上提出一种改进的相似度,建立基于改进相似度的扩展粗糙集模型,并提出一种基于重要度的约简算法.
关键词
连续值属性
决策表
扩展粗糙集模型
相似度
属性
约简
重要度
Keywords
continuous valued attribute decision table
extended rough set model
similarity
indicator reduction
significant degree
分类号
O29 [理学—应用数学]
下载PDF
职称材料
题名
基于Rough集的集成离散化算法
被引量:
1
16
作者
刘静
何贤芳
机构
重庆三峡学院实验中心
重庆信息学院
出处
《重庆三峡学院学报》
2010年第3期59-63,共5页
文摘
离散化是Rough集理论研究的一个重要内容,目前基于Rough集的离散化算法很难做到高效率和高识别率兼顾.文中分析了基于断点重要性算法和基于属性重要性算法的特点,确定了离散化思路,提出了一种基于Rough集的集成离散化算法.该算法能够有效降低候选断点的数目,快速地实现决策表的离散化.实验结果表明,文中算法保持了与已有算法可比的识别率,且运行效率更高.
关键词
粗糙集
决策表
连续值属性
集成离散化
Keywords
Rough sets
decision table
continuously valued attributes
integrated discretization
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
天地一体化智能网络流量实时分类
被引量:
1
17
作者
杨力
王龙青
潘成胜
蔡睿妍
机构
大连大学通信与网络重点实验室
大连大学信息工程学院
南京信息工程大学电子与信息工程学院
出处
《小型微型计算机系统》
CSCD
北大核心
2022年第7期1547-1552,共6页
基金
国家自然科学基金项目(61931004)资助.
文摘
天地一体化智能网络规模大,环境复杂,网络中流量业务类型繁多且流量具有突发性.本文结合Spark大数据分布式平台,根据流量的特点设计了SFFS-FCBF-C4.5(简称SFC)决策树分类模型,实现了大规模网络下流量的实时分类,以保障网络中资源的合理分配和利用.SFC算法是在C4.5决策树算法的基础上结合了改进后的快速相关滤波算法(Fast Correlation-Based Filter Solution,FCBF)和连续型属性值离散化算法,可以在有效去除冗余特征和降低模型复杂度的同时,提高模型分类的速度和准确率.仿真结果表明,SFC决策树分类模型相比传统的流量分类模型具有较好的稳定性和较高的准确率,可以很好的适应复杂多变的网络环境.同时,Spark大数据分布式平台的应用大幅度提高了大规模网络下流量分类的速度,能够对海量流量进行实时分类.
关键词
天地一体化智能网络
FCBF
连续
型
属性
值
离散化算法
SPARK
流量实时分类
Keywords
space-earth integrated intelligent network
FCBF
continuous attribute value discretization algorithm
Spark
real-time classification
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于灰色关联度的变精度粗糙集模型
被引量:
2
18
作者
王金山
王磊
机构
解放军陆军军官学院数学教研室
出处
《重庆师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2014年第1期80-83,共4页
基金
军队科研基金项目(No.011027)
文摘
为了解决经典粗糙集理论无法处理不精确分类以及连续值属性离散化造成信息损失等问题,本文提出了基本灰色关联度的变经度粗糙集模型(γ-′β(X),γ′β(X))。首先利用灰色关联度定义相似并进一步定义粗糙集并研究了模型的部分性质和定理(当0<t1≤t2<1时,有γt2(x)γt1(x)、γ-t1β(X)γ-t2β(X)及γt2β(X)γt1β(X)成立),然后提出了一种基于重要度SIGB(c)的约简算法来计算最小约简,最后通过一个实例说明模型是有效和可行的。
关键词
连续值属性
决策表
变经度粗糙集模型
灰色关联度
属性
约简
重要度
Keywords
continuous valued attribute decision table
variable precision rough set model
grey correlation degree
indicator reduc-tion
significant degree
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于灰关联分析的连续值属性约减算法
张健
王晋东
余定坤
《计算机应用》
CSCD
北大核心
2014
5
下载PDF
职称材料
2
连续值属性的概念层次自动提取算法
杨学兵
蔡庆生
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2003
2
下载PDF
职称材料
3
一种新的用于连续值属性离散化的约简算法
刘震宇
郭宝龙
杨林耀
《控制与决策》
EI
CSCD
北大核心
2002
4
下载PDF
职称材料
4
基于聚类的连续值属性最佳离散化算法
席静
欧阳为民
《小型微型计算机系统》
EI
CSCD
北大核心
2000
6
下载PDF
职称材料
5
一种实现分类问题中连续值属性离散化的方法
刘东荣
王熙照
《计算机工程与应用》
CSCD
北大核心
2002
1
下载PDF
职称材料
6
基于连续值属性的加权灵活贝叶斯分类器
于万国
陈日升
《山西财经大学学报》
CSSCI
北大核心
2014
0
原文传递
7
概念学习中连续值型属性的离散化
刘娟
李凯扬
《武汉大学学报(自然科学版)》
CSCD
1997
2
下载PDF
职称材料
8
滑坡数据连续属性值处理的研究
亓呈明
崔守梅
《微计算机信息》
北大核心
2006
1
下载PDF
职称材料
9
基于统计学法则的连续属性值划分方法
高洪涛
陆伟
杨余旺
《科学技术与工程》
北大核心
2018
0
下载PDF
职称材料
10
一种区间属性值离散化的新方法
关欣
衣晓
何友
周一宇
《宇航学报》
EI
CAS
CSCD
北大核心
2009
5
下载PDF
职称材料
11
基于改进遗传算法的连续属性离散化方法
夏战国
夏士雄
牛强
张磊
《计算机工程与设计》
CSCD
北大核心
2008
1
下载PDF
职称材料
12
基于模糊化的决策粗糙集属性约简和分类
郭敏
贾修一
商琳
《模式识别与人工智能》
EI
CSCD
北大核心
2014
14
下载PDF
职称材料
13
基于逐级均值聚类的信息熵的离散化算法
刘静
罗卫敏
刘井波
《计算机应用研究》
CSCD
北大核心
2010
1
下载PDF
职称材料
14
一种基于灰色绝对关联度的变精度粗糙集模型
王磊
王金山
沈浮
《重庆理工大学学报(自然科学)》
CAS
2012
5
下载PDF
职称材料
15
基于一种改进相似度的扩展粗糙集模型
王金山
王磊
《徐州师范大学学报(自然科学版)》
CAS
2012
1
下载PDF
职称材料
16
基于Rough集的集成离散化算法
刘静
何贤芳
《重庆三峡学院学报》
2010
1
下载PDF
职称材料
17
天地一体化智能网络流量实时分类
杨力
王龙青
潘成胜
蔡睿妍
《小型微型计算机系统》
CSCD
北大核心
2022
1
下载PDF
职称材料
18
基于灰色关联度的变精度粗糙集模型
王金山
王磊
《重庆师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2014
2
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部