期刊文献+
共找到68篇文章
< 1 2 4 >
每页显示 20 50 100
基于改进C5.0决策树算法的电力营销异常数据挖掘研究
1
作者 肖杰 《消费电子》 2024年第8期63-65,共3页
由于电力营销数据规模较大且数据组成复杂,传统挖掘方法容易出现异常数据识别不准确的问题,本文研究基于改进C5.0决策树算法的电力营销异常数据挖掘。通过收集与预处理等步骤做好电力营销数据的准备工作,引入信息熵改进C5.0决策树算法... 由于电力营销数据规模较大且数据组成复杂,传统挖掘方法容易出现异常数据识别不准确的问题,本文研究基于改进C5.0决策树算法的电力营销异常数据挖掘。通过收集与预处理等步骤做好电力营销数据的准备工作,引入信息熵改进C5.0决策树算法的属性选择方式,并利用改进后算法挖掘电力营销异常数据。实验结果表明,设计方法下电力营销异常数据挖掘结果的正确率高达97.5%,挖掘性能较强。 展开更多
关键词 改进c5.0决策树算法 电力营销 营销数据 异常数据 数据挖掘
下载PDF
基于Boosting算法的C5.0决策树不平衡数据分类算法 被引量:2
2
作者 王植 张珏 《河南科学》 2023年第1期7-12,共6页
为了改进不平衡数据的分类性能,提出一种可自动确定迭代参数trail值的集成C5.0决策树算法.首先,算法引入boosting集成框架到C5.0决策树算法中,从而生成新的集成分类器;其次,算法使用网格搜索法在一定范围内自动确定trail参数的值.实验... 为了改进不平衡数据的分类性能,提出一种可自动确定迭代参数trail值的集成C5.0决策树算法.首先,算法引入boosting集成框架到C5.0决策树算法中,从而生成新的集成分类器;其次,算法使用网格搜索法在一定范围内自动确定trail参数的值.实验结果表明,该算法在不平衡数据上的分类性能指标G-mean和MCC上具有优势. 展开更多
关键词 类不平衡问题 集成算法 c5.0决策树算法 网格搜索算法
下载PDF
基于C5.0决策树分类算法的ETM+影像信息提取 被引量:32
3
作者 温兴平 胡光道 杨晓峰 《地理与地理信息科学》 CSCD 北大核心 2007年第6期26-29,共4页
利用C5.0决策树算法对ETM+影像进行信息提取,通过与其他分类方法提取结果的对比,得出C5.0决策树分类算法精度较高。大气校正与数据融合可明显提高分类精度,利用经过NDVI、NDBI、缨帽变换处理后的影像组合数据进行信息提取可进一步提高... 利用C5.0决策树算法对ETM+影像进行信息提取,通过与其他分类方法提取结果的对比,得出C5.0决策树分类算法精度较高。大气校正与数据融合可明显提高分类精度,利用经过NDVI、NDBI、缨帽变换处理后的影像组合数据进行信息提取可进一步提高分类精度。研究发现,C5.0决策树算法用未处理的资料生成决策树的效果较差,而经大气校正和数据融合后计算出NDVI、NDBI及缨帽变换的前3个分量的组合数据生成的决策树深度最小,并且分类精度最高。 展开更多
关键词 c5.0决策树算法 ETM+遥感影像 信息提取
下载PDF
数据挖掘:C5.0决策树算法在警察院校学生体质分析中的应用 被引量:4
4
作者 宋兆铭 叶菁 董如军 《四川体育科学》 2020年第1期52-55,74,共5页
C5.0决策树算法适用于大数据集处理,特别是它的Boosting集成机器学习算法可以有效地将精度较低的"弱学习算法"提升为精度较高的"强学习算法",从而达到模型修剪与优化的目的。研究结果表明:C5.0决策树算法生成的模... C5.0决策树算法适用于大数据集处理,特别是它的Boosting集成机器学习算法可以有效地将精度较低的"弱学习算法"提升为精度较高的"强学习算法",从而达到模型修剪与优化的目的。研究结果表明:C5.0决策树算法生成的模型可以精确地评价学生的体质健康状况(97.8%)且模型预测的泛化能力较强(98.1%)。因此,C5.0决策树算法可以用来判断影响警察院校学生体质测试成绩的关键因素,为深层挖掘相关警务数据内涵与监测提供了实证依据。 展开更多
关键词 c5.0决策树 警察院校 学生体质
下载PDF
基于C5.0决策树的税务稽查研究 被引量:1
5
作者 陈仕鸿 刘晓庆 《连云港职业技术学院学报》 2011年第3期21-23,共3页
简要分析了C5.0决策树原理,并将它应用于税务稽查中,通过C5.0决策树模型,对80个商业企业的财务报表和纳税申报表的分析,再与二分类Logistic回归法进行比较,结论表明该模型方法能够辅助稽查选案,提高稽查选案工作的效率和效果。
关键词 税务稽查 c5.0决策树 稽查选案
下载PDF
基于C5.0决策树-快速聚类模型的万州区库岸段乡镇滑坡易发性区划 被引量:27
6
作者 杨永刚 殷坤龙 +3 位作者 赵海燕 黄晨忱 陈丽霞 张俞 《地质科技情报》 CAS CSCD 北大核心 2019年第6期189-197,共9页
以乡镇为评价单元开展区域滑坡易发性评价对用地规划、防灾减灾等方面具有重要意义。以万州区临江段的23个乡镇单元作为研究对象,首先选取地表高程、坡度、坡向、岩性、构造、土地利用类型、地形湿度指数、水系、道路9个指标因子,通过C... 以乡镇为评价单元开展区域滑坡易发性评价对用地规划、防灾减灾等方面具有重要意义。以万州区临江段的23个乡镇单元作为研究对象,首先选取地表高程、坡度、坡向、岩性、构造、土地利用类型、地形湿度指数、水系、道路9个指标因子,通过C5.0决策树算法计算该区域发生滑坡的概率,再利用快速聚类算法进行易发性结果分级;基于ArcGIS平台得到各乡镇单元的滑坡易发性分区,结果表明:C5.0决策树-快速聚类模型的易发性评价精度最高,AUC值达到0.950,优于人工神经网络-快速聚类模型的0.826和贝叶斯-快速聚类模型的0.772。利用C5.0决策树-快速聚类模型的计算结果,综合考虑极高(高)易发区面积大小及其占乡镇面积比大小,完成各乡镇单元的滑坡易发性区划。在所有23个乡镇中,滑坡易发性等级高的包括大周镇、万州城区、溪口乡、新田镇等乡镇。通过对比各乡镇滑坡面积占研究区滑坡总面积的比重,发现两者结论基本一致,预测结果可为全区滑坡防灾减灾提供科学依据。 展开更多
关键词 滑坡 易发性评价 乡镇单元 c5.0决策树-快速聚类模型
下载PDF
C5.0决策树Hyperion影像森林类型精细分类方法 被引量:10
7
作者 王怀警 谭炳香 +2 位作者 房秀凤 李世明 李太兴 《浙江农林大学学报》 CAS CSCD 北大核心 2018年第4期724-734,共11页
以吉林省白河林业局为中心研究区,利用星载高光谱Hyperion数据并结合其他辅助数据,综合利用影像光谱特征、纹理特征、地形特征、典型地类和主要森林类型外业调查样本数据,探究针对C5.0决策树算法的高光谱影像土地覆盖类型多层次信息提... 以吉林省白河林业局为中心研究区,利用星载高光谱Hyperion数据并结合其他辅助数据,综合利用影像光谱特征、纹理特征、地形特征、典型地类和主要森林类型外业调查样本数据,探究针对C5.0决策树算法的高光谱影像土地覆盖类型多层次信息提取与森林类型识别的有效方法。在分析典型地物光谱特征的基础上,优选8种纹理特征,引入主成分分量及与主要森林类型空间分布相关的敏感地形因子,采用分层分类的策略,根据光谱特征将地类划分层次,在层次间建立基于C5.0决策树算法的决策树模型,对研究区的地类进行细分。为便于对比,以相同的策略采用支持向量机(SVM)分类器进行分类。最后,结合野外采集样本并参考高分辨率影像,采用分层随机抽样的独立检验样本对森林类型精细识别结果进行精度验证。结果表明:C5.0决策树算法可综合利用高光谱影像的光谱、纹理及其他辅助数据,自动寻找出区分各类别的最佳特征变量及分割阈值,运算速度快,占用内存较小且无需人为参与,其分类精度达到优势树种级别,总体分类精度达81.9%,Kappa系数0.709 8。 展开更多
关键词 森林经理学 HYPERION c5.0决策树 分层分类 森林类型分类 高光谱
下载PDF
基于C5.0决策树算法的落叶松人工林提取研究
8
作者 马婷 刘思涵 郭瑞霞 《甘肃科技纵横》 2020年第4期7-12,共6页
如何有效提取落叶松人工林信息是落叶松人工林资源调查的关键。本论述以黑龙江省佳木斯市桦南县孟家岗林场为研究试验区域,利用"高分一号"卫星影像(以下简称GF-1)并结合其他辅助数据,在分析落叶松人工林光谱信息的基础上,基... 如何有效提取落叶松人工林信息是落叶松人工林资源调查的关键。本论述以黑龙江省佳木斯市桦南县孟家岗林场为研究试验区域,利用"高分一号"卫星影像(以下简称GF-1)并结合其他辅助数据,在分析落叶松人工林光谱信息的基础上,基于灰度共生矩阵方法提取了8种纹理信息,并根据落叶松人工林季相特征,提取研究区内植被的NDVI、DVI、RVI和EVI时间序列特征,建立基于C5.0决策树算法的落叶松人工林决策树模型,通过10次分类试验,筛选出最优的决策规则,用于落叶松人工林提取研究。结果表明,C5.0决策树算法能综合纹理信息、植被指数和光谱特征信息,自动寻找区分落叶松人工林的最佳特征组合及分割阈值,分类总体精度达到92.25%,Kappa系数为0.87,面积精度为92.79%,能有效地提取落叶松人工林信息。本研究可为森林资源调查提供理论基础与技术支持。 展开更多
关键词 落叶松人工林 高分一号 c5.0决策树算法 植被指数时间序列信息 纹理特征
下载PDF
C5.0决策树算法在基于混沌特征的情绪识别中的应用 被引量:1
9
作者 贺方 聂春燕 《长春大学学报》 2014年第10期1320-1325,共6页
生理信号的某些特征参数在不同情绪下会有不同的变化规律,在此基础上,对4种不同情绪(喜、怒、哀、乐)下的多生理信号(心电信号、肌电信号、呼吸信号、皮电信号)的混沌特征参量进行情绪识别。文中采用C5.0决策树分类器算法,以样本的属性... 生理信号的某些特征参数在不同情绪下会有不同的变化规律,在此基础上,对4种不同情绪(喜、怒、哀、乐)下的多生理信号(心电信号、肌电信号、呼吸信号、皮电信号)的混沌特征参量进行情绪识别。文中采用C5.0决策树分类器算法,以样本的属性作为节点,以属性的取值作为分支的树结构,解决了大样本情况下的机器学习问题。研究结果表明,C5.0决策树这种算法在基于混沌特征参量进行情绪识别方面具有较高的识别率。 展开更多
关键词 多生理信号 c5.0决策树 情绪识别
下载PDF
利用C5.0决策树算法解释碳酸盐岩储层渗透率 被引量:6
10
作者 王兴龙 王龙 +4 位作者 王亚青 李竞 宋来明 杨烁 郭丽娜 《测井技术》 CAS 2020年第3期300-304,共5页
以某油田孔隙型碳酸盐岩为例,提出利用C5.0决策树算法解释储层渗透率。在常规物性分析和测井资料基础上,根据孔隙结构表征参数建立储层分类标准并回归渗透率计算公式。通过多个测井曲线资料组合构建及决策树建模分析,优选出储层分类表... 以某油田孔隙型碳酸盐岩为例,提出利用C5.0决策树算法解释储层渗透率。在常规物性分析和测井资料基础上,根据孔隙结构表征参数建立储层分类标准并回归渗透率计算公式。通过多个测井曲线资料组合构建及决策树建模分析,优选出储层分类表现最佳的资料组合和模型,使用该模型将取心段储层分类标准和渗透率计算公式推广到非取心段,完成测井解释。通过与岩心渗透率相比较,该方法得到的渗透率误差整体较小,并且非含水采油井射孔段渗透率与米采油指数呈正相关关系,说明该方法的有效性。所使用的常规物性分析和测井资料是最常见的油气田静态资料,该方法具有一定的普适性。 展开更多
关键词 测井解释 c5.0决策树算法 机器学习 储层分类 碳酸盐岩 渗透率
下载PDF
基于C5.0决策树的NAT设备检测方法 被引量:2
11
作者 石志凯 朱国胜 +4 位作者 雷龙飞 陈胜 镇佳 吴善超 吴梦宇 《计算机科学》 CSCD 北大核心 2018年第B06期323-327,共5页
网络地址转换NAT对外网隐藏了内网的结构,这一方面给非法终端隐匿接入提供了便利,对网络造成潜在威胁;另一方面,用户也可通过NAT私自共享网络,直接损害网络运营者的利益。有效检测NAT设备,对网络安全管控、运营管理具有重要作用。文中... 网络地址转换NAT对外网隐藏了内网的结构,这一方面给非法终端隐匿接入提供了便利,对网络造成潜在威胁;另一方面,用户也可通过NAT私自共享网络,直接损害网络运营者的利益。有效检测NAT设备,对网络安全管控、运营管理具有重要作用。文中对现有NAT检测技术进行了分析与比较,阐述了各自的优缺点和适用条件;提出了一种利用上层应用的特征和训练数据构建C5.0决策树的NAT设备检测方法。真实网络环境下的实验表明,所提方法能有效识别NAT设备。 展开更多
关键词 NAT NAT检测 c5.0决策树
下载PDF
基于C5.0决策树算法的电力营销数据挖掘 被引量:5
12
作者 卜晓阳 蔡岩 +1 位作者 王宗伟 赵郭燚 《微型电脑应用》 2022年第1期23-26,共4页
为了对电力企业中不同部门的运行数据进行有效的挖掘,提出利用C5.0决策树算法对数据进行深层次分析,为管理人员提供有价值的决策支持。首先,对数据挖掘中先进的C5.0决策树算法原理进行分析,并通过引入信息熵对原有的属性选择方式进行改... 为了对电力企业中不同部门的运行数据进行有效的挖掘,提出利用C5.0决策树算法对数据进行深层次分析,为管理人员提供有价值的决策支持。首先,对数据挖掘中先进的C5.0决策树算法原理进行分析,并通过引入信息熵对原有的属性选择方式进行改进,提高了信息增益比率计算的速度。然后根据设计的售电量关系模型进行对电厂管理信息系统中的数据进行挖掘。在UCI机器学习数据集和电力营销数据集上的实验结果表明,提出的改进C5.0决策树算法具有良好的分类性能,能够对售电市场进行快速、准确的用户分类,准确率达到86.5%。 展开更多
关键词 数据挖掘 c5.0决策树 电力营销 信息熵 分类预测
下载PDF
决策树C5.0与Logistic回归模型对产后腹直肌分离预测性能的比较研究 被引量:3
13
作者 陈小慧 焦子珊 +1 位作者 王娜娜 沙凯辉 《实用临床医药杂志》 2023年第16期115-120,126,共7页
目的比较决策树C5.0与Logistic回归模型对产后腹直肌分离的预测效果。方法选取产后复查的产妇476例作为研究对象。采用问卷调查法获取产妇的一般资料;采用电刺激治疗仪评估盆底肌电值;采用腹部触诊法判断腹直肌分离程度。将所有数据按照... 目的比较决策树C5.0与Logistic回归模型对产后腹直肌分离的预测效果。方法选取产后复查的产妇476例作为研究对象。采用问卷调查法获取产妇的一般资料;采用电刺激治疗仪评估盆底肌电值;采用腹部触诊法判断腹直肌分离程度。将所有数据按照3∶2的比例建立训练集与测试集,运用决策树C5.0及Logistic回归建立产后腹直肌分离的风险预测模型;采用准确度、灵敏度、特异度、约登指数、阴性预测值、阳性预测值和受试者工作特征(ROC)曲线的曲线下面积(AUC)对模型的预测性能进行比较。结果在训练集中,决策树C5.0和Logistic回归模型的准确度分别为96.94%、72.45%,灵敏度分别为98.92%、86.02%,特异度分别为93.52%、49.07%,阳性预测值分别为96.34%、74.42%,阴性预测值分别为98.06%、67.09%,约登指数分别为92.44%、35.10%,AUC分别为0.962、0.675;训练集中,决策树C5.0和Logistic回归模型的AUC比较,差异有统计学意义(P<0.05)。在测试集中,决策树C5.0与Logistic回归模型的准确率分别为81.50%、62.43%,灵敏度分别为88.35%、82.52%,特异度分别为71.43%、32.86%,阳性预测值分别为81.98%、64.39%,阴性预测值分别为80.65%、56.10%,约登指数分别为59.78%、15.38%,AUC分别为0.799、0.577;测试集中,决策树C5.0和Logistic回归模型的AUC比较,差异有统计学意义(P<0.05)。结论决策树C5.0对产后腹直肌分离的预测效能优于Logistic回归模型。 展开更多
关键词 决策树c5.0 LOGISTIc回归模型 产后腹直肌分离 预测模型 曲线下面积
下载PDF
基于C5.0决策树算法的元胞自动机土地利用变化模拟模型 被引量:30
14
作者 柯新利 边馥苓 《长江流域资源与环境》 CAS CSSCI CSCD 北大核心 2010年第4期403-408,共6页
C5.0决策树算法可以揭示数据中的结构化信息,建立直观、易于理解的树形结构,可以用于元胞自动机转换规则的获取。提出了基于C5.0决策树算法的元胞自动机模型,分析了模型构建的理论和原理以及实现方法。在此基础上,以杭州市城市用地演变... C5.0决策树算法可以揭示数据中的结构化信息,建立直观、易于理解的树形结构,可以用于元胞自动机转换规则的获取。提出了基于C5.0决策树算法的元胞自动机模型,分析了模型构建的理论和原理以及实现方法。在此基础上,以杭州市城市用地演变为例,利用C5.0决策树算法从已有的城市用地及其影响因子数据中挖掘出城市用地的演变规则,并将获得的转换规则应用到元胞自动机模型中进行城市用地演变的动态模拟与预测。结果表明:(1)利用C5.0决策树算法获取转换规则可以在较低采样率的前提下保证具有较高的精度;(2)与其它获取元胞自动机转换规则的方法相比,C5.0决策树算法生成的规则清晰明确,很适合用来获取元胞转换规则;(3)基于C5.0决策树算法的元胞自动机模型在模拟城市用地演变方面具有较高的模拟精度,模拟结果可靠。 展开更多
关键词 c5.0决策树 元胞自动机 土地利用变化
原文传递
基于C5.0决策树和时序HJ-1A/B CCD数据的神农架林区植被分类 被引量:13
15
作者 李梦莹 胡勇 王征禹 《长江流域资源与环境》 CAS CSSCI CSCD 北大核心 2016年第7期1070-1077,共8页
我国神农架林区海拔高、气候复杂,森林类型多样,结构破碎,森林遥感分类难度较大。将2013年时间序列HJ-1A/B CCD遥感影像作为数据源,计算出植被指数(NDVI、DVI、RVI)和主成分第一分量(PC1),使用DEM数据生成地形因子(高程、坡度、坡... 我国神农架林区海拔高、气候复杂,森林类型多样,结构破碎,森林遥感分类难度较大。将2013年时间序列HJ-1A/B CCD遥感影像作为数据源,计算出植被指数(NDVI、DVI、RVI)和主成分第一分量(PC1),使用DEM数据生成地形因子(高程、坡度、坡向),构建植被分类时序因子集。运用C5.0决策树分类法将神农架林区植被细分为七类:针叶林;针阔混交林;落叶阔叶林;常绿和落叶阔叶混交林;常绿阔叶林;灌丛和草甸。结果表明:该方法的总体精度为72.7%,Kappa系数为0.67;在6~8月,针叶林、草甸和灌丛的植被指数明显低于常绿阔叶林、常绿和落叶阔叶混交林、落叶阔叶林和针阔混交林,对分类的贡献较大,称为植被分类的"窗口期"。PC1、NDVI和高程因子对神农架林地的区分度较高,而坡度、坡向和RVI因子对分类帮助不大。作为一种智能分类方法,C5.0决策树分类方法应用于30m分辨率的时间序列HJ-1A/B CCD数据,能够将地貌复杂的神农架林区植被分为七类,提高了类别精度,具有更高的应用价值。 展开更多
关键词 c5.0决策树 HJ-1A/B ccD数据 神农架林区 时间序列 森林次级分类
原文传递
基于EM-FR-C5.0DT耦合模型的输气管道地质灾害风险预测模型
16
作者 艾昕宇 何鹏 +6 位作者 孟祥振 王新刚 李玉星 刘鹏 韩建红 梁裕如 由洋 《油气与新能源》 2024年第4期84-96,107,共14页
延安气田地处陕北山区,输气管道沿线发生地质灾害的风险较高,管道生产运行存在一定安全隐患,通过加强风险预测研究,可快速准确甄别沿线高后果区,对管道防灾减灾具有重要意义。为此,选取延安气田内部临镇-子长输气干线作为研究对象。首先... 延安气田地处陕北山区,输气管道沿线发生地质灾害的风险较高,管道生产运行存在一定安全隐患,通过加强风险预测研究,可快速准确甄别沿线高后果区,对管道防灾减灾具有重要意义。为此,选取延安气田内部临镇-子长输气干线作为研究对象。首先,通过相关性分析筛选出高程等11个影响因子,依次开展灾点空间分布规律研究;其次,采用加权频率比法将灾点属性值转换为可体现灾害风险贡献率的EM-FR(加权频率值),划分出低、极低风险区,在此范围内选取非灾点,以此构建EM-FR-C5.0DT(加权频率比-C5.0决策树)、EM-FR-BP(加权频率比-BP神经网络)等2种耦合模型,并预测研究区域的风险性;最后,在研究区域内随机选取非灾点,构建单一C5.0DT、BP模型,并与上述2种耦合模型开展精度对比分析。结果显示:耦合模型预测性能优于单一模型,其中EM-FR-C5.0DT模型效果最优。研究成果表明,在低、极低风险区内,选取非灾点构建数据集得到的耦合模型,可明显提升模型预测精度,更适合小样本地质灾害风险性建模,可为延安气田输气管道风险性研究提供一定借鉴。 展开更多
关键词 输气管道 熵值法 c5.0决策树 BP神经网络 风险性预测
下载PDF
探究基于改进决策树的电力营销数据挖掘方法 被引量:2
17
作者 李慧翔 刘博 《电气技术与经济》 2024年第3期209-211,共3页
电力营销数据量庞大、数据组成复杂,为了更好地服务于电力营销活动,需对电力企业各部门运行数据展开深度挖掘和深层次分析。本文提出改进C5.0决策树,可为用户提供更深层的数据信息,为其进行电力营销决策提供数据支持。结合改进C5.0决策... 电力营销数据量庞大、数据组成复杂,为了更好地服务于电力营销活动,需对电力企业各部门运行数据展开深度挖掘和深层次分析。本文提出改进C5.0决策树,可为用户提供更深层的数据信息,为其进行电力营销决策提供数据支持。结合改进C5.0决策树,对原有引入信息熵的原有属性进行深度挖掘。通过不同决策树对比分析分类性能,包括分类准确率、分类时间,最终测试结果为改进C5.0决策树算法的分类准确率为87.0%、分类时间为1.85s,相比传统的BP神经网络、ID3.0决策树,改进C5.0决策树在分类准确率和分类时间上有较为明显的优势。 展开更多
关键词 电力营销 数据挖掘 改进c5.0决策树 信息熵
下载PDF
基于决策树的水稻病虫害发生程度预测模型——以芜湖市为例
18
作者 付伟 祝玉青 +1 位作者 司红君 邹莹瑾 《气象研究与应用》 2024年第1期102-107,共6页
利用芜湖市1988—2022年7种水稻病虫害发生及种植面积数据,国家气候中心逐月大气环流和海温指数,基于C5.0决策树算法,构建一种以大气环流和海温指数作为预报因子的水稻病虫害发生程度的长期预测模型。结果表明,该模型可较好地预测未来... 利用芜湖市1988—2022年7种水稻病虫害发生及种植面积数据,国家气候中心逐月大气环流和海温指数,基于C5.0决策树算法,构建一种以大气环流和海温指数作为预报因子的水稻病虫害发生程度的长期预测模型。结果表明,该模型可较好地预测未来一年芜湖市各种水稻病虫害发生程度,2022年7种病虫害发生程度预测准确率平均为85.7%,为水稻病虫害发生程度的预测提供一种有效的实用方法。 展开更多
关键词 c5.0决策树算法 水稻病虫害发生程度 预测模型 大气环流和海温指数
下载PDF
C5.0决策树与RBF神经网络模型用于急性缺血性脑卒中出血性转化的风险预测性能比较 被引量:19
19
作者 王海东 张璐 +6 位作者 王洁 李晶 周莹 王国立 汪可可 彭延波 武建辉 《中华疾病控制杂志》 CAS CSCD 北大核心 2019年第2期228-233,共6页
目的比较C5. 0决策树与径向基函数(radial basis function,RBF)神经网络用于急性缺血性脑卒中(acute jschemic stroke,AIS)出血性转化(hemorrhagic transformation,HT)风险预测性能。方法将AIS住院患者作为研究对象,收集相关资料。根据... 目的比较C5. 0决策树与径向基函数(radial basis function,RBF)神经网络用于急性缺血性脑卒中(acute jschemic stroke,AIS)出血性转化(hemorrhagic transformation,HT)风险预测性能。方法将AIS住院患者作为研究对象,收集相关资料。根据入院2周内是否发生HT分为HT组与非HT组,建立C5. 0决策树与RBF神经网络模型,比较两者的预测性能。结果共收集460份病历资料,按照训练集与测试集7∶3的比例分为训练集样本和测试集样本。C5. 0决策树模型的训练集与测试集准确率分别为96. 5%和80. 1%,灵敏度为98. 1%和82. 6%,特异度为94. 8%和77. 9%,Kappa指数是0. 93和0. 60,AUC是0. 97和0. 80。RBF神经网络模型的训练集与测试集准确率分别为72. 6%和74. 7%,灵敏度为87. 6%和88. 4%,特异度为56. 9%和62. 3%,Kappa指数为0. 45和0. 50,AUC为0. 72和0. 75;在训练集中,C5. 0决策树模型的预测性能优于RBF神经网络模型的预测性能。在测试集中,两者预测性能的差异无统计学意义。结论 C5. 0决策树模型的预测性能优于RBF神经网络模型的预测性能。 展开更多
关键词 c5.0决策树 RBF神经网络 急性缺血性脑卒中 出血性转化 预测性能
原文传递
基于C5.0决策树建模的读者借阅频度分析 被引量:4
20
作者 彭莹 《图书情报工作》 CSSCI 北大核心 2016年第S1期10-14,共5页
研究影响读者借阅频度的主要因素,通过这些影响因素对读者进行分类,探究每种分类下的读者借阅特征,图书馆藉此可以有针对性地对读者开展服务。采用SPSS Clementine挖掘工具中的C5.0决策树建模方法对电子科技大学的学生借阅数据进行挖掘... 研究影响读者借阅频度的主要因素,通过这些影响因素对读者进行分类,探究每种分类下的读者借阅特征,图书馆藉此可以有针对性地对读者开展服务。采用SPSS Clementine挖掘工具中的C5.0决策树建模方法对电子科技大学的学生借阅数据进行挖掘分析,创建读者借阅频度决策树分类模型。分析结果表明,读者的年级、性别、类型和馆藏类别都会对读者的借阅频度产生影响。图书馆可以藉此获知馆藏利用率、优化流通规则、调整图书馆的采购策略等,不断提升服务质量。 展开更多
关键词 决策树c5.0 借阅频度 馆藏利用率 数据挖掘
原文传递
上一页 1 2 4 下一页 到第
使用帮助 返回顶部