期刊文献+
共找到49篇文章
< 1 2 3 >
每页显示 20 50 100
C5.0算法的改进及应用 被引量:11
1
作者 罗丽娟 段隆振 +1 位作者 段文影 刘萍 《南昌大学学报(工科版)》 CAS 2017年第1期92-97,共6页
C5.0算法是一种直观、效率高的分类方法,但该算法存在信息增益率计算复杂、容易出现过拟合和决策树偏倚的问题。针对这些问题,通过公式的转换简化信息增益率的计算过程,在剪枝过程采用了损失矩阵和置信区间的结合进行剪枝判断,以及对建... C5.0算法是一种直观、效率高的分类方法,但该算法存在信息增益率计算复杂、容易出现过拟合和决策树偏倚的问题。针对这些问题,通过公式的转换简化信息增益率的计算过程,在剪枝过程采用了损失矩阵和置信区间的结合进行剪枝判断,以及对建立的多个模型的权重进行调整,提出了一种新的C5.0改进算法,并将其应用于信贷逾期预测上。使用借款人的历史还款数据进行实验,并与其他算法进行比较,结果表明:C5.0改进算法相比其他算法具有更高的准确率和效率。 展开更多
关键词 c5.0算法 信息增益率 置信区间 权重调整 信贷逾期
下载PDF
基于决策树C5.0算法的4G终端换机模型 被引量:4
2
作者 陈天池 王振 陈开恒 《信息通信》 2016年第10期261-263,共3页
文章针对用户升4G业务中最困难的用户换机问题进行研究,在传统数据资产基础上,丰富了用户互联网行为数据、用户位置数据和渠道触点行为数据,结合4G业务网络速度快、流量资费低等特点,洞察分析用户换机场景,并运营C5.0算法挖掘4G潜在目... 文章针对用户升4G业务中最困难的用户换机问题进行研究,在传统数据资产基础上,丰富了用户互联网行为数据、用户位置数据和渠道触点行为数据,结合4G业务网络速度快、流量资费低等特点,洞察分析用户换机场景,并运营C5.0算法挖掘4G潜在目标用户,从而辅助运营部门开展4G终端销售,有效提升营销运营效率。 展开更多
关键词 c5.0算法 4G终端 精准营销
下载PDF
新常态下ST公司财务困境预警研究——基于C5.0算法的财报面板数据 被引量:5
3
作者 王秋玮 叶枫 《财会通讯(中)》 北大核心 2018年第8期107-111,共5页
ST公司是指已陷入财务困境而被"特别处理"的上市公司,其将来财务状况的发展自然受到众多利益相关者的瞩目。本文构建融合F-Score模型与决策树C5.0算法的财务预警模型,以26家ST公司2012~2015年的财报面板数据作为研究对象,通... ST公司是指已陷入财务困境而被"特别处理"的上市公司,其将来财务状况的发展自然受到众多利益相关者的瞩目。本文构建融合F-Score模型与决策树C5.0算法的财务预警模型,以26家ST公司2012~2015年的财报面板数据作为研究对象,通过实际数据的分析和测试,结果发现:某些关键财务指标的变动对ST公司的财务困境程度起到重要影响,甚至是决定性作用。所构建的财务困境预警体系可以较好地预测ST公司的未来财务状况。基于该预警模型,已陷入财务困境的ST公司可判断自身困境程度,并有针对性地设法减轻乃至摆脱财务困境,最终适应我国经济的"新常态"。 展开更多
关键词 财务困境 F-Score模型 决策树c5.0算法
下载PDF
基于C5.0算法的胃癌生存预测模型研究 被引量:6
4
作者 黄志刚 刘虹 +1 位作者 刘娟 张岐山 《南京信息工程大学学报(自然科学版)》 CAS 2017年第4期406-410,共5页
我国的胃癌发病率高,每年新增胃癌患者占全世界每年新增数量的42%,胃癌成为我国恶性肿瘤防控的重点.本文针对胃癌数据的特征,给出数据预处理和集成方法;采用C5.0分类算法,构建了胃癌生存预测模型,并首次采用美国癌症研究所的SEER数据库... 我国的胃癌发病率高,每年新增胃癌患者占全世界每年新增数量的42%,胃癌成为我国恶性肿瘤防控的重点.本文针对胃癌数据的特征,给出数据预处理和集成方法;采用C5.0分类算法,构建了胃癌生存预测模型,并首次采用美国癌症研究所的SEER数据库进行预测实验.实验结果表明:C5.0预测的精确度、特异性均高于BP-神经网络算法;胃癌患者的出生地点与最终的存活状态之间存在较强的相关性.该研究是数据挖掘技术在医学领域的一个实际应用,对胃癌的临床诊断具有一定的参考价值,可为医生制定合理的治疗和预防方案提供一定参考. 展开更多
关键词 数据挖掘 c5.0分类算法 胃癌 生存预测 SEER数据库
下载PDF
基于C5.0算法的航空客户流失分析 被引量:4
5
作者 崔亚奇 《西安航空学院学报》 2018年第1期72-77,共6页
客户流失问题是长期困扰航空公司的重大问题,并且在航空业方面一直未被重视。利用决策树模型中的C5.0算法建立了航空公司的客户流失预警模型,并用真实的航空公司营业数据进行了实证分析。结果表明,该模型具有较好的准确性和预测性,为航... 客户流失问题是长期困扰航空公司的重大问题,并且在航空业方面一直未被重视。利用决策树模型中的C5.0算法建立了航空公司的客户流失预警模型,并用真实的航空公司营业数据进行了实证分析。结果表明,该模型具有较好的准确性和预测性,为航空公司提供了准确、可靠的决策指导。 展开更多
关键词 客户流失 决策树 c5.0算法 流失预警模型
下载PDF
基于误判代价的C5.0算法的优化分析
6
作者 张开 《太原师范学院学报(自然科学版)》 2014年第3期39-43,共5页
针对决策树C5.0算法在建模中不同代价值的错误分类没有在建模过程中区别对待,使得模型错误分类代价较高的问题.论文使用误判代价值和代价矩阵以降低高代价错误率,从而实现在模型总体错误率变化不大的情况下,实现C5.0算法所建模型的错误... 针对决策树C5.0算法在建模中不同代价值的错误分类没有在建模过程中区别对待,使得模型错误分类代价较高的问题.论文使用误判代价值和代价矩阵以降低高代价错误率,从而实现在模型总体错误率变化不大的情况下,实现C5.0算法所建模型的错误分类代价最小.实验证明优化后的模型在测试数据中高代价错误率从原模型的1.52%降到了0,说明代价矩阵的应用效果非常明显,一般代价错误率也有所下降,低代价错误率基本持平. 展开更多
关键词 误判代价 c5.0算法 代价矩阵 患者分类
下载PDF
基于C5.0决策树算法的电力营销数据异常识别方法
7
作者 郑欣桐 赵琪 《消费电子》 2024年第10期143-145,共3页
为了增强电力营销数据异常识别的精确度,进而能够精准捕捉异常数据模式,本文借助C5.0决策树算法,深入探索了电力营销数据异常识别方法。根据电力营销数据类型,选择相应的传感器采集数据,并对数据进行集成处理。从集成的数据中提取异常特... 为了增强电力营销数据异常识别的精确度,进而能够精准捕捉异常数据模式,本文借助C5.0决策树算法,深入探索了电力营销数据异常识别方法。根据电力营销数据类型,选择相应的传感器采集数据,并对数据进行集成处理。从集成的数据中提取异常特征,根据业务知识,选择对异常识别有重要影响的特征。在此基础上,构建C5.0决策树,根据特征变量的取值,识别数据异常,输出异常标识。实验测试结果表明,该方法应用后,在测试样本数量逐渐增加的情况下,数据异常识别误报率最高不超过1%,具有较高的识别准确性。 展开更多
关键词 c5.0决策树算法 电力营销 识别 异常 数据
下载PDF
基于改进C5.0决策树算法的电力营销异常数据挖掘研究
8
作者 肖杰 《消费电子》 2024年第8期63-65,共3页
由于电力营销数据规模较大且数据组成复杂,传统挖掘方法容易出现异常数据识别不准确的问题,本文研究基于改进C5.0决策树算法的电力营销异常数据挖掘。通过收集与预处理等步骤做好电力营销数据的准备工作,引入信息熵改进C5.0决策树算法... 由于电力营销数据规模较大且数据组成复杂,传统挖掘方法容易出现异常数据识别不准确的问题,本文研究基于改进C5.0决策树算法的电力营销异常数据挖掘。通过收集与预处理等步骤做好电力营销数据的准备工作,引入信息熵改进C5.0决策树算法的属性选择方式,并利用改进后算法挖掘电力营销异常数据。实验结果表明,设计方法下电力营销异常数据挖掘结果的正确率高达97.5%,挖掘性能较强。 展开更多
关键词 改进c5.0决策树算法 电力营销 营销数据 异常数据 数据挖掘
下载PDF
基于Boosting算法的C5.0决策树不平衡数据分类算法 被引量:2
9
作者 王植 张珏 《河南科学》 2023年第1期7-12,共6页
为了改进不平衡数据的分类性能,提出一种可自动确定迭代参数trail值的集成C5.0决策树算法.首先,算法引入boosting集成框架到C5.0决策树算法中,从而生成新的集成分类器;其次,算法使用网格搜索法在一定范围内自动确定trail参数的值.实验... 为了改进不平衡数据的分类性能,提出一种可自动确定迭代参数trail值的集成C5.0决策树算法.首先,算法引入boosting集成框架到C5.0决策树算法中,从而生成新的集成分类器;其次,算法使用网格搜索法在一定范围内自动确定trail参数的值.实验结果表明,该算法在不平衡数据上的分类性能指标G-mean和MCC上具有优势. 展开更多
关键词 类不平衡问题 集成算法 c5.0决策树算法 网格搜索算法
下载PDF
基于C5.0与Apriori算法的森林生物量等级评价与因子关联分析 被引量:2
10
作者 王霓虹 高萌 +1 位作者 李丹 刘立臣 《中南林业科技大学学报》 CAS CSCD 北大核心 2015年第3期1-6,共6页
针对生物量影响因子量化研究较少、方法单一及区域生物量评价不足且基于单个树种生物量模型进行评价时工作量过大的问题,以孟家岗林场的三类小班清查数据为基础,选取与生物量水平相关的11个因子,利用C5.0算法进行生物量决策树建模,并进... 针对生物量影响因子量化研究较少、方法单一及区域生物量评价不足且基于单个树种生物量模型进行评价时工作量过大的问题,以孟家岗林场的三类小班清查数据为基础,选取与生物量水平相关的11个因子,利用C5.0算法进行生物量决策树建模,并进一步利用Apriror算法进行生物量强影响因子的关联规则挖掘。结果表明:生物量决策树模型的分类预测精度为88.78%,生物量影响因子的量化结果分别为树高(0.348)、胸径(0.225)、林分类型(0.196)、龄级(0.162)、郁闭度(0.134)、坡度(0.096)、海拔(0.074)、坡向(0.065)、立地类型(0.052)和坡位(0.037);得到707条置信度在80%以上、支持度在10%以上的因子关联规则,揭示了生物量影响因子间的隐含关联关系。建立的生物量决策树模型能为快速的区域生物量预测和评价提供模型参考,建立的关联规则评估模型能够为以碳汇为目标的森林生产与经营提供客观评价指标。 展开更多
关键词 森林生物量评价 生物量影响因子 c5.0算法 APRIORI算法 关联分析
下载PDF
基于C5.0决策树分类算法的ETM+影像信息提取 被引量:32
11
作者 温兴平 胡光道 杨晓峰 《地理与地理信息科学》 CSCD 北大核心 2007年第6期26-29,共4页
利用C5.0决策树算法对ETM+影像进行信息提取,通过与其他分类方法提取结果的对比,得出C5.0决策树分类算法精度较高。大气校正与数据融合可明显提高分类精度,利用经过NDVI、NDBI、缨帽变换处理后的影像组合数据进行信息提取可进一步提高... 利用C5.0决策树算法对ETM+影像进行信息提取,通过与其他分类方法提取结果的对比,得出C5.0决策树分类算法精度较高。大气校正与数据融合可明显提高分类精度,利用经过NDVI、NDBI、缨帽变换处理后的影像组合数据进行信息提取可进一步提高分类精度。研究发现,C5.0决策树算法用未处理的资料生成决策树的效果较差,而经大气校正和数据融合后计算出NDVI、NDBI及缨帽变换的前3个分量的组合数据生成的决策树深度最小,并且分类精度最高。 展开更多
关键词 c5.0决策树算法 ETM+遥感影像 信息提取
下载PDF
基于C5.0算法的小额网贷平台的风险监控研究 被引量:5
12
作者 王茂光 葛蕾蕾 赵江平 《中国管理科学》 CSSCI 北大核心 2016年第S1期345-352,共8页
近年来,互联网金融在国内发展迅速,各种类型的小额网贷平台更是层出不穷,但是随着平台跑路,欺诈等各种问题的涌现,暴露出对小额网贷平台监管的不足。本文以C5.0决策树算法为核心建立起风险监控模型,首先利用大数据技术抓取平台数据、公... 近年来,互联网金融在国内发展迅速,各种类型的小额网贷平台更是层出不穷,但是随着平台跑路,欺诈等各种问题的涌现,暴露出对小额网贷平台监管的不足。本文以C5.0决策树算法为核心建立起风险监控模型,首先利用大数据技术抓取平台数据、公开信息数据和征信机构数据,然后对数据分析,筛选关键指标体系,建立了一种风控模型,最后评估和验证模型及算法的有效性,并通过对模型的参数进行调整,提出以保证整体错误率的前提下,尽可能的降低α错误率的评价标准。通过实验发现,该风控模型对问题平台有着很好的预测能力。 展开更多
关键词 小额网贷 风险监控 c5.0决策树算法 α错误率
原文传递
基于C5.0决策树算法的开放数据的效用预测研究 被引量:2
13
作者 杨巳煜 《统计与管理》 2019年第10期17-22,共6页
随着开放政府数据的实践在全球范围内积极开展,数据开放后的用户效用更应该得到关注和重视。文章通过分析数据关注度和使用率指标对数据开放后的效用进行分类,采用C5.0决策树算法构建了开放数据用户效用的预测模型,并以贵阳市政府数据... 随着开放政府数据的实践在全球范围内积极开展,数据开放后的用户效用更应该得到关注和重视。文章通过分析数据关注度和使用率指标对数据开放后的效用进行分类,采用C5.0决策树算法构建了开放数据用户效用的预测模型,并以贵阳市政府数据开放平台为对象进行了实验研究,为政府部门预测已开放数据的未来效用和未开放数据开放后的效用提供了参考方法,且提出了提高数据效用的针对性建议。研究发现,用户效用较好的A类数据比例最低;数据条目的所属领域、提供方、上线月数、更新频率、下载格式等属性对于预测数据开放后的效用均有参考价值。 展开更多
关键词 政府数据 c5.0算法 开放数据 数据效用
下载PDF
基于C5.0算法的贫困大学生行为和心理关系的建立
14
作者 张利芝 《学园》 2022年第3期75-77,共3页
高校贫困生作为大学生中的特殊群体,有着独特的心理活动和行为特征。通过调研高校贫困生的行为活动和心理活动,把调研数据整理输进Excel表格,将表格数据导入SPSS Modeler统计软件,把行为活动作为输入变量,心理活动作为输出变量,运用C5.... 高校贫困生作为大学生中的特殊群体,有着独特的心理活动和行为特征。通过调研高校贫困生的行为活动和心理活动,把调研数据整理输进Excel表格,将表格数据导入SPSS Modeler统计软件,把行为活动作为输入变量,心理活动作为输出变量,运用C5.0算法得到贫困生的行为活动和心理活动的规则集,建立高校贫困生行为与心理活动的关联模型,通过模型预测贫困生的心理状况,有助于高校教育工作者精准帮助贫困大学生,为贫困生的高质量培养提供理论依据。 展开更多
关键词 高校贫困生 心理和行为 c5.0算法
原文传递
基于C5.0决策树算法的落叶松人工林提取研究
15
作者 马婷 刘思涵 郭瑞霞 《甘肃科技纵横》 2020年第4期7-12,共6页
如何有效提取落叶松人工林信息是落叶松人工林资源调查的关键。本论述以黑龙江省佳木斯市桦南县孟家岗林场为研究试验区域,利用"高分一号"卫星影像(以下简称GF-1)并结合其他辅助数据,在分析落叶松人工林光谱信息的基础上,基... 如何有效提取落叶松人工林信息是落叶松人工林资源调查的关键。本论述以黑龙江省佳木斯市桦南县孟家岗林场为研究试验区域,利用"高分一号"卫星影像(以下简称GF-1)并结合其他辅助数据,在分析落叶松人工林光谱信息的基础上,基于灰度共生矩阵方法提取了8种纹理信息,并根据落叶松人工林季相特征,提取研究区内植被的NDVI、DVI、RVI和EVI时间序列特征,建立基于C5.0决策树算法的落叶松人工林决策树模型,通过10次分类试验,筛选出最优的决策规则,用于落叶松人工林提取研究。结果表明,C5.0决策树算法能综合纹理信息、植被指数和光谱特征信息,自动寻找区分落叶松人工林的最佳特征组合及分割阈值,分类总体精度达到92.25%,Kappa系数为0.87,面积精度为92.79%,能有效地提取落叶松人工林信息。本研究可为森林资源调查提供理论基础与技术支持。 展开更多
关键词 落叶松人工林 高分一号 c5.0决策树算法 植被指数时间序列信息 纹理特征
下载PDF
利用C5.0决策树算法解释碳酸盐岩储层渗透率 被引量:6
16
作者 王兴龙 王龙 +4 位作者 王亚青 李竞 宋来明 杨烁 郭丽娜 《测井技术》 CAS 2020年第3期300-304,共5页
以某油田孔隙型碳酸盐岩为例,提出利用C5.0决策树算法解释储层渗透率。在常规物性分析和测井资料基础上,根据孔隙结构表征参数建立储层分类标准并回归渗透率计算公式。通过多个测井曲线资料组合构建及决策树建模分析,优选出储层分类表... 以某油田孔隙型碳酸盐岩为例,提出利用C5.0决策树算法解释储层渗透率。在常规物性分析和测井资料基础上,根据孔隙结构表征参数建立储层分类标准并回归渗透率计算公式。通过多个测井曲线资料组合构建及决策树建模分析,优选出储层分类表现最佳的资料组合和模型,使用该模型将取心段储层分类标准和渗透率计算公式推广到非取心段,完成测井解释。通过与岩心渗透率相比较,该方法得到的渗透率误差整体较小,并且非含水采油井射孔段渗透率与米采油指数呈正相关关系,说明该方法的有效性。所使用的常规物性分析和测井资料是最常见的油气田静态资料,该方法具有一定的普适性。 展开更多
关键词 测井解释 c5.0决策树算法 机器学习 储层分类 碳酸盐岩 渗透率
下载PDF
基于C5.0决策树的船舶交通事故致因分析模型及应用 被引量:5
17
作者 黄常海 沈佳 +3 位作者 朱冉超 齐绪存 郑菲 陆浩 《中国安全科学学报》 CAS CSCD 北大核心 2022年第10期90-99,共10页
为减少船舶交通事故的发生,对船舶交通事故的致因展开研究。首先,以事故类型作为输出变量,以船舶交通事故数据为样本,构建基于C5.0算法的船舶交通事故致因路径分析模型;然后,确定事故致因路径分析有效性评价指标;再次,运用“2-4”模型(2... 为减少船舶交通事故的发生,对船舶交通事故的致因展开研究。首先,以事故类型作为输出变量,以船舶交通事故数据为样本,构建基于C5.0算法的船舶交通事故致因路径分析模型;然后,确定事故致因路径分析有效性评价指标;再次,运用“2-4”模型(24Model),对所识别出的不同类型事故致因路径因果关系进一步分析,提出通过切断事故潜在致因路径的船舶交通事故预控措施;最后,将894起船舶交通事故数据样本随机分为80%的训练集和20%的测试集,应用所提出的模型进行分析。结果表明:所提出的模型可以生成不同类型事故的分类规则集,模型分类正确率达到90%以上,且模型具有强的泛化能力。结合分类规则集构建的船舶交通事故致因链为船舶交通事故的防范提供定量化的理论依据。 展开更多
关键词 c5.0算法 决策树 船舶交通事故 致因路径 致因分析 “2-4”模型(24Model)
原文传递
Clementine数据挖掘工具在大学生心理健康预测中的应用
18
作者 薄启欣 高学东 潘莹雪 《现代信息科技》 2023年第7期127-130,共4页
利用C5.0算法构建大学生心理健康预测的决策树模型和分类规则,利用SPSS Clementine数据挖掘工具对大学生心理卫生测评数据进行分析,以此对大学生心理健康状态进行了预测。研究发现:大学生的心理健康普遍存在一定的问题,应针对不同症状... 利用C5.0算法构建大学生心理健康预测的决策树模型和分类规则,利用SPSS Clementine数据挖掘工具对大学生心理卫生测评数据进行分析,以此对大学生心理健康状态进行了预测。研究发现:大学生的心理健康普遍存在一定的问题,应针对不同症状采取不同的干预措施;强迫症状、精神病性、抑郁、焦虑和人际关系敏感五个属性在大学生心理健康问题中占有较大的比重。 展开更多
关键词 数据挖掘 SPSS clementine 决策树 c5.0算法 心理健康预测
下载PDF
决策树算法在大学生心理健康测评系统中的应用 被引量:14
19
作者 亓文娟 晏杰 《计算机系统应用》 2015年第11期230-234,共5页
决策树是非常流行的数据挖掘方法.介绍了决策树的理论,分析了决策树的构造,讨论了C5.0算法的思想及其优缺点,同时为深入了解影响大学生心理健康的主要心理症状及因素,将C5.0算法应用于大学生心理健康测评数据,根据挖掘结果可以更深入的... 决策树是非常流行的数据挖掘方法.介绍了决策树的理论,分析了决策树的构造,讨论了C5.0算法的思想及其优缺点,同时为深入了解影响大学生心理健康的主要心理症状及因素,将C5.0算法应用于大学生心理健康测评数据,根据挖掘结果可以更深入的了解学生心理健康问题,为高校开展好大学生心理健康教育有着现实的意义. 展开更多
关键词 数据挖掘 决策树 c5.0算法 心理健康
下载PDF
Clementine数据挖掘工具在计算机等级考试成绩中的应用 被引量:2
20
作者 程代娣 《齐鲁工业大学学报》 2017年第6期52-56,共5页
影响成绩的因素很多,针对高校计算机等级考试支持偏低的现状,早期采用传统的决策树人工算法效率低,提出可视化数据挖掘工具SPSS Clementine技术,利用该技术中的决策树算法对近三年学生计算机等级成绩进行分析,快速建立了成绩分析决策树... 影响成绩的因素很多,针对高校计算机等级考试支持偏低的现状,早期采用传统的决策树人工算法效率低,提出可视化数据挖掘工具SPSS Clementine技术,利用该技术中的决策树算法对近三年学生计算机等级成绩进行分析,快速建立了成绩分析决策树模型,找出影响成绩的潜在因素,为学生学习和个性化教学提供参考。 展开更多
关键词 数据挖掘 决策树 SPSS cLEMENTINE c5.0算法 计算机等级考试成绩
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部