期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
基于可解释性分析的深度神经网络优化方法 被引量:2
1
作者 吴欢欢 谢瑞麟 +2 位作者 乔塬心 陈翔 崔展齐 《计算机研究与发展》 EI CSCD 北大核心 2024年第1期209-220,共12页
近年来,深度神经网络(deep neural network,DNN)在众多领域取得了广泛应用,甚至在安全关键系统中已经可以代替人类作出决策,如自动驾驶和智慧医疗等,这对DNN的可靠性提出了更高的要求.由于DNN具有复杂的多层非线性网络结构,难以理解其... 近年来,深度神经网络(deep neural network,DNN)在众多领域取得了广泛应用,甚至在安全关键系统中已经可以代替人类作出决策,如自动驾驶和智慧医疗等,这对DNN的可靠性提出了更高的要求.由于DNN具有复杂的多层非线性网络结构,难以理解其内部预测机制,也很难对其进行调试.现有的DNN调试工作主要通过修改DNN的参数和扩增数据集提升DNN性能,以达到优化的目的.然而直接调整参数难以控制修改的幅度,甚至使模型失去对训练数据的拟合能力;而无指导地扩增训练数据则会大幅增加训练成本.针对此问题,提出了一种基于可解释性分析的DNN优化方法(optimizing DNN based on interpretability analysis,OptDIA).对DNN的训练过程及决策行为进行解释分析,根据解释分析结果,将原始数据中对DNN决策行为产生不同程度影响的部分以不同概率进行数据变换以生成新训练数据,并重训练DNN,以提升模型性能达到优化DNN的目的.在使用3个数据集训练的9个DNN模型上的实验结果表明,OptDIA可以将DNN的准确率提升0.39~2.15个百分点,F1-score提升0.11~2.03个百分点. 展开更多
关键词 深度神经网络 DNN优化 DNN缺陷 DNN性能 可解释性分析
下载PDF
基于逐步特征增广梯度提升的暂态功角稳定评估及可解释性分析
2
作者 刘旭 刘颂凯 +3 位作者 杨超 张磊 段雨舟 晏光辉 《现代电力》 北大核心 2024年第5期844-853,共10页
基于数据驱动的电力系统暂态功角稳定评估虽然可以提供较为准确的结果,但其评估结果缺乏可解释性,导致难以应用于工程实际中。针对该问题,提出一种基于逐步特征增广梯度提升(gradient boosting enhanced with step-wise feature augment... 基于数据驱动的电力系统暂态功角稳定评估虽然可以提供较为准确的结果,但其评估结果缺乏可解释性,导致难以应用于工程实际中。针对该问题,提出一种基于逐步特征增广梯度提升(gradient boosting enhanced with step-wise feature augmentation,AugBoost)的暂态功角稳定评估及可解释性分析方法。首先,通过训练AugBoost评估模型,建立电力系统输入特征与暂态功角稳定指标之间的映射关系;其次,将相量测量单元的实时量测数据传输到训练好的AugBoost评估模型中,提供实时评估结果;并根据沙普利值加性解释(Shapley additive explanations,SHAP)模型对评估结果和输入特征之间的关系进行解释,提高结果的可信度。最后,设计模型更新过程来提升评估模型面对电力系统运行工况变化的鲁棒性。在电力系统仿真软件PSS/E提供的23节点系统和1648节点系统上的仿真结果验证了所提方法的有效性。 展开更多
关键词 暂态功角稳定评估 逐步特征增广梯度提升 沙普利值加性解释 可解释性分析 模型更新
原文传递
融合注意力机制和卷积神经网络的电网暂态电压稳定评估及可解释性分析
3
作者 张哲 秦博宇 +2 位作者 高鑫 丁涛 张逸兴 《电网技术》 EI CSCD 北大核心 2024年第11期4648-4657,I0057,I0056,共12页
提升复杂多变运行场景下电网稳定评估的时效性和准确性,提出一种融合注意力机制和卷积神经网络(convolutional neural network,CNN)的暂态电压稳定评估及可解释性分析方法。首先,采用卷积块注意力模块(convolutional block attention mo... 提升复杂多变运行场景下电网稳定评估的时效性和准确性,提出一种融合注意力机制和卷积神经网络(convolutional neural network,CNN)的暂态电压稳定评估及可解释性分析方法。首先,采用卷积块注意力模块(convolutional block attention module,CB AM)提升传统CNN的特征捕获能力,考虑模型特性和网络结构设计CBAMCNN组合模块。其次,建立基于CBAM-CNN的电网暂态电压稳定评估模型,揭示运行工况多变场景下系统关键电气量和稳定状态之间的映射关系。最后,基于沙普利值加性解释(Shapley additive explanations,SHAP)理论提出数据驱动模型评估结果的可解释性分析框架,提炼影响样本稳定状态的主导特征,评估各输入特征量对模型输出结果的贡献程度。在典型受端电网仿真系统中验证了所提稳定评估方法的准确性和可解释性分析方法的有效性。 展开更多
关键词 卷积块注意力模块-卷积神经网络 暂态电压稳定评估 沙普利值加性解释理论 可解释性分析
原文传递
25CrMo4合金疲劳寿命预测局部可解释性分析
4
作者 蔡国栋 《冶金与材料》 2024年第7期43-45,共3页
在使用机器学习的方法对25CrMo4合金进行疲劳寿命预测时,特征变量对疲劳寿命的决策行为一直是关注的重点。基于此,以89组25CrMo4合金高周循环对称疲劳试验样本作为研究对象,使用XGBoost算法预测其疲劳寿命,再使用LIME(Local Interpretab... 在使用机器学习的方法对25CrMo4合金进行疲劳寿命预测时,特征变量对疲劳寿命的决策行为一直是关注的重点。基于此,以89组25CrMo4合金高周循环对称疲劳试验样本作为研究对象,使用XGBoost算法预测其疲劳寿命,再使用LIME(Local Interpretable Model-agnostic Explanations)及其改进方法(ElasticNet-LIME)分析各特征变量在不同数值范围内对疲劳寿命的正负增益。结果表明,经过微喷丸强化后25CrMo4合金表面残余应力减小,表面粗糙度增大,疲劳寿命增大,ElasticNet-LIME对此判断比LIME更为合理。研究结果可为25CrMo4合金疲劳性能优化提供依据。 展开更多
关键词 25CrMo4 LIME 机器学习可解释性分析
下载PDF
基于机器学习算法的企业财务舞弊预测及可解释性分析
5
作者 童洁 蒋红艳 《中国市场》 2023年第11期139-142,共4页
财务舞弊不仅打击了投资者信心,也对资本市场产生了极大影响。为预测企业的财务舞弊行为,文章选取2016—2020年未发生舞弊行为与首次发生舞弊行为的企业作为研究对象,依据Python机器学习算法建立决策树、支持向量机、神经网络及逻辑回... 财务舞弊不仅打击了投资者信心,也对资本市场产生了极大影响。为预测企业的财务舞弊行为,文章选取2016—2020年未发生舞弊行为与首次发生舞弊行为的企业作为研究对象,依据Python机器学习算法建立决策树、支持向量机、神经网络及逻辑回归模型,基于舞弊三因素理论选取44个指标预测企业财务舞弊行为,并通过SHAP可解释性工具重点关注单个指标变化对财务舞弊预测的重要性程度,同时分析财务指标以及非财务指标对预测财务舞弊的相互作用、预测错误的样本查看的影响。研究结果表明,支持向量机对于预测舞弊效果最优,逻辑回归在模型的精确度表现最佳。 展开更多
关键词 财务舞弊 机器学习 预测 可解释性分析
下载PDF
基于局部集聚特征尺度判定的兴趣点离群分布探测及其可解释性分析
6
作者 吴鹏 哈斯巴根 秦福莹 《地球信息科学学报》 EI CSCD 北大核心 2024年第7期1594-1610,共17页
兴趣点(POI)对于深化理解地理空间中人类活动和环境特征的作用日益凸显,从大规模空间数据中探测与周围环境显著不同的离群点是增强人地系统认知的重要研究方向。现有离群点挖掘方法应用于POI时存在局部空间分布特征表达及量化不足的缺点... 兴趣点(POI)对于深化理解地理空间中人类活动和环境特征的作用日益凸显,从大规模空间数据中探测与周围环境显著不同的离群点是增强人地系统认知的重要研究方向。现有离群点挖掘方法应用于POI时存在局部空间分布特征表达及量化不足的缺点,并且其有效性亟待进一步讨论。鉴于此,本文提出了基于局部集聚尺度判定的兴趣点离群分布探测方法。首先,借助Delaunay三角网构建POI的空间邻接关系,并基于交叉K近邻距离和多尺度特征参数判别点群的局部集聚特征尺度;然后,提取满足尺度约束条件的点及其邻接边集;最后,通过边长约束指标剔除不满足条件的局部长边并整合离群簇,完成POI离群探测。根据实际数据的对比实验结果可以得出所提方法泛化能力良好,且可在不破坏POI固有分布特征的前提下有效、稳健地探测离群点。本文进一步开展离群点探测结果的可解释性分析,讨论得出兴趣点离群分布成因与类型占比、空间布局、占地面积及公众认知水平等因素密切相关。本研究为全面把握城市发展动向、资源配置优化、提高城市可持续性及人居生活质量等方面提供新的方法与研究视角。 展开更多
关键词 兴趣点 空间离群点 DELAUNAY三角网 交叉K邻近距离 集聚特征尺度 边长约束指标 可解释性分析 公众认知度
原文传递
基于深度特征融合的鸟鸣识别方法及其可解释性分析 被引量:1
7
作者 蔡建民 何培宇 +3 位作者 杨智鹏 李露莹 赵启军 潘帆 《生物多样性》 CAS CSCD 北大核心 2023年第7期138-147,共10页
鸟鸣识别是生态监测的重要手段,为进一步提升鸟鸣识别的准确性和鲁棒性,本文提出了1种新的基于深度特征融合的鸟鸣识别方法。该方法首先利用深度特征提取网络对鸟鸣的对数梅尔谱图和补充特征集的深度特征进行提取,再将两种深度特征进行... 鸟鸣识别是生态监测的重要手段,为进一步提升鸟鸣识别的准确性和鲁棒性,本文提出了1种新的基于深度特征融合的鸟鸣识别方法。该方法首先利用深度特征提取网络对鸟鸣的对数梅尔谱图和补充特征集的深度特征进行提取,再将两种深度特征进行融合,最后使用轻量级梯度提升机(light gradient boosting machine,light GBM)分类器进行分类。本文充分利用深度神经网络的特征提取能力以及light GBM的分类性能,将特征提取和特征分类过程进行分离,从而实现了高准确率的鸟鸣识别。实验结果显示,本文提出的方法在北京百鸟数据集中取得了目前已知的最佳结果,模型的平均准确率达到了98.70%,平均F1分数达到了98.84%。相比传统方法,深度融合特征在鸟鸣识别任务上准确率提升了5.62%以上。同时,引入的light GBM分类器使分类准确率提升了3.02%。此外,在CLO-43SD和Bird CLEF2022比赛的数据集中,本文方法也展现出卓越的性能,分别取得了98.32%和91.12%的平均准确率。本文还引入了类激活图对不同类型鸟鸣的识别结果进行可解释性分析,揭示了神经网络对不同类型鸟鸣的注意力区域差异,为后续的特征选择和模型优化提供了理论依据。研究结果表明,本文方法有效提高了鸟鸣识别的准确率,在3个数据集的测试中均展现出较好的性能,能够为基于鸟鸣识别的生态监测提供有力的技术支撑。 展开更多
关键词 鸟鸣识别 特征融合 可解释性分析 深度学习 lightGBM
原文传递
基于可解释性机器学习的建筑物物化阶段碳排放量预测研究 被引量:1
8
作者 王志强 任金哥 +1 位作者 韩硕 李文超 《安全与环境学报》 CAS CSCD 北大核心 2024年第6期2454-2466,共13页
现有碳排放计算方法存在数据量大、计算繁琐和仅适用于事中、事后控制等问题,不利于设计人员在设计阶段进行碳减排工作。为此,研究将机器学习引入建筑物碳排放量计算领域,帮助设计人员在早期设计阶段获得建筑物物化阶段的碳排放信息,提... 现有碳排放计算方法存在数据量大、计算繁琐和仅适用于事中、事后控制等问题,不利于设计人员在设计阶段进行碳减排工作。为此,研究将机器学习引入建筑物碳排放量计算领域,帮助设计人员在早期设计阶段获得建筑物物化阶段的碳排放信息,提供碳减排参考。首先,收集并建立建筑物物化阶段碳排放数据库;其次,基于5个建筑物特征,建立4种不同类型的机器学习模型,并根据评价指标对模型性能进行评价;最后,利用沙普利加和解释(Shapley Additive exPlanations, SHAP)和部分依赖图(Partial Dependence Plot, PDP)验证最优模型应用的合理性,并深入挖掘各特征与碳排放之间的复杂关系,为建筑物碳减排提供新的信息。结果显示:各机器学习模型可以很好地预测建筑物物化阶段碳排放过程,其中建立的极度随机树(Extremely Randomized Trees, ET)模型对碳排放的预测表现最优;机器学习模型各特征对预测结果的影响与现有研究相似,表明了机器学习模型预测结果的可靠性与合理性;机器学习模型可以深入挖掘各特征与碳排放之间的复杂关系,为建筑物碳减排提供新的指导。 展开更多
关键词 环境工程学 建筑物物化阶段 碳排放 机器学习 可解释性分析
原文传递
供应链合作伙伴信息在供应链金融信用风险预测中的作用——基于多机器学习模型的比较分析 被引量:1
9
作者 张道海 杨晨 《物流工程与管理》 2024年第4期56-60,共5页
供应链金融是中小企业缓解融资困难的有效途径。为缓解供应链金融信用风险预测面临的信息不对称和样本选择偏差等问题,文中将供应链合作伙伴信息引入风险指标体系,基于2010-2021年A股上市企业披露数据,通过随机森林、XGBoost、逻辑回归... 供应链金融是中小企业缓解融资困难的有效途径。为缓解供应链金融信用风险预测面临的信息不对称和样本选择偏差等问题,文中将供应链合作伙伴信息引入风险指标体系,基于2010-2021年A股上市企业披露数据,通过随机森林、XGBoost、逻辑回归和MLP四种机器学习模型进行比较分析。结果显示,合作伙伴信息的使用提高了供应链金融信用风险预测的准确性与稳定性。最后通过Lime可解释性分析,发现合作伙伴的速动比率、销售利润率、资产负债率等6个指标是供应链合作伙伴信息中影响信用风险预测的主要因素。 展开更多
关键词 供应链金融 供应链合作伙伴 信用风险 机器学习 可解释性分析
下载PDF
基于暂态时-频特征差异的配电网高阻接地故障识别方法 被引量:1
10
作者 史鸿飞 邓丰 +4 位作者 钟航 钟逸涵 蒋素霞 李鑫瑜 陈依林 《中国电机工程学报》 EI CSCD 北大核心 2024年第16期6455-6469,I0014,共16页
高阻接地故障发生时,故障特征微弱,传统故障识别方法存在特征提取困难、阈值选取灵活性较差的技术瓶颈,导致极端故障场景下出现漏判。为此,提出基于暂态时-频特征差异的配电网高阻接地故障识别方法。首先,结合小波包香农熵量化分析高阻... 高阻接地故障发生时,故障特征微弱,传统故障识别方法存在特征提取困难、阈值选取灵活性较差的技术瓶颈,导致极端故障场景下出现漏判。为此,提出基于暂态时-频特征差异的配电网高阻接地故障识别方法。首先,结合小波包香农熵量化分析高阻接地故障与正常扰动工况暂态信号的时频分布,发现二者存在显著差异:频域上,扰动工况信号的能量集中于低频,而高阻故障信号能量分布相对均匀;时域上,扰动工况信号能量集中于时间窗的前半段,高阻故障信号能量在整个时间窗内均匀分布。在此基础上,以暂态信号时-频域波形作为输入样本,将传统卷积神经网络(convolutional neural networks,CNN)模型中的softmax分类器改进为支持向量机(support vector machine,SVM)分类器,构建适应配电网高阻接地故障识别小样本场景下的CNN-SVM复合分类模型,以卷积层作为特征提取器,以SVM作为分类器,实现高阻接地故障识别。最后,为论证所提方法具有强适应性的内在原因,利用LIME可解释性分析算法可视化展现模型训练过程中的高关注度区域,从模型分类原理层面证明所提方法不受各种故障条件的影响,克服了传统故障识别方法在极端故障场景下出现漏判的缺陷,能准确识别配电线路末端10 kΩ高阻接地故障。 展开更多
关键词 配电网 高阻接地故障 时-频特征 传统卷积神经网络-支持向量机 LIME可解释性分析
原文传递
基于深度强化学习的航天器功率信号复合网络优化算法
11
作者 张庭瑜 曾颖 +1 位作者 李楠 黄洪钟 《系统工程与电子技术》 EI CSCD 北大核心 2024年第9期3060-3069,共10页
为了实现航天器电源系统的灵活高效并网,最大化有限能量的利用,提出一种基于深度强化学习(deep reinforcement learning,DRL)的功率传输与信号传输复合网络拓扑优化模型,并使用知识蒸馏原理的多种可解释组件模型对优化过程进行剖析。首... 为了实现航天器电源系统的灵活高效并网,最大化有限能量的利用,提出一种基于深度强化学习(deep reinforcement learning,DRL)的功率传输与信号传输复合网络拓扑优化模型,并使用知识蒸馏原理的多种可解释组件模型对优化过程进行剖析。首先,分析在轨运行阶段航天器母线电压调节控制域变换规律,并结合节点传播性参数,建立功率传输与信号通信的复合网络拓扑模型。然后,利用A3C(asynchronous advantage actor-critic)算法,对信号传输网络路由分布、拓扑结构等方面潜在的运行可靠性风险进行自适应性优化。最后,结合多种可解释组件对已训练的DRL模型进行知识蒸馏,形成一种可解释的量化分析方法。所提方法可以指导空间电源在随机阴影影响下选择最佳并网方案,并为更高任务要求和复杂环境下空间电源控制器设计提供理论支持。 展开更多
关键词 空间电源系统 复杂网络 深度强化学习 可靠性优化 可解释性分析
下载PDF
基于对比约束的可解释小样本学习 被引量:7
12
作者 张玲玲 陈一苇 +4 位作者 吴文俊 魏笔凡 罗炫 常晓军 刘均 《计算机研究与发展》 EI CSCD 北大核心 2021年第12期2573-2584,共12页
不同于基于大规模监督的深度学习方法,小样本学习旨在从极少的几个样本中学习这类样本的特性,其更符合人脑的视觉认知机制.近年来,小样本学习受到很多学者关注,他们联合元学习训练模式与度量学习理论,挖掘查询集(无标记样本)和支持集(... 不同于基于大规模监督的深度学习方法,小样本学习旨在从极少的几个样本中学习这类样本的特性,其更符合人脑的视觉认知机制.近年来,小样本学习受到很多学者关注,他们联合元学习训练模式与度量学习理论,挖掘查询集(无标记样本)和支持集(少量标记样本)在特征空间的语义相似距离,取得不错的小样本分类性能.然而,这些方法的可解释性偏弱,不能为用户提供一种便于直观理解的小样本推理过程.为此,提出一种基于区域注意力机制的小样本分类网络INT-FSL,旨在揭示小样本分类中的2个关键问题:1)图像哪些关键位置的视觉特征在决策中发挥了重要作用;2)这些关键位置的视觉特征能体现哪些类别的特性.除此之外,尝试在每个小样本元任务中设计全局和局部2种对比学习机制,利用数据内部信息来缓解小样本场景中的监督信息匮乏问题.在3个真实图像数据集上进行了详细的实验分析,结果表明:所提方法INT-FSL不仅能有效提升当前小样本学习方法的分类性能,还具备良好的过程可解释性. 展开更多
关键词 小样本学习 可解释性分析 对比学习 局部描述子 图像识别
下载PDF
基于改进单阶段目标检测算法的换流站电气设备目标检测
13
作者 辛忠良 叶梁劲 +2 位作者 刘善露 付晓勇 廖晓辉 《电力科学与工程》 2024年第2期42-49,共8页
针对换流站多种电气设备检测时背景复杂干扰性强而又需要快速准确检测出故障的实际情况,提出基于改进YOLOv5(You Only Look Once)的检测方法。首先,为提高算法的准确性和收敛速度,通过K-means聚类算法对YOLOv5模型中的锚框预设进行改进... 针对换流站多种电气设备检测时背景复杂干扰性强而又需要快速准确检测出故障的实际情况,提出基于改进YOLOv5(You Only Look Once)的检测方法。首先,为提高算法的准确性和收敛速度,通过K-means聚类算法对YOLOv5模型中的锚框预设进行改进,在数据集预处理阶段得到更适用于换流站电气设备的锚框,使其更加契合换流站电力设备数据集;然后,为提高算法检测过程的识别速度,在特征提取网络添加注意力机制模块,筛选出重要的特征信息。将改进后的算法网络识别效果与YOLOv5中的原始算法网络检测结果进行对比分析。结果表明,检测平均识别精度均值由71.16%提高至92.51%,检测速度由21帧/s提升至31帧/s;同时与R-CNN(Regions with convolutional neural networks)等算法相比,检测精度与速度都有较大提升。添加可解释性分析,将识别结果通过热力图的形式显示,可以更好地应对算法的潜在风险。 展开更多
关键词 特高压输电 换流站 电气设备检测 YOLOv5 聚类算法 注意力机制 可解释性分析
下载PDF
基于Grasshopper插件二次开发的数字化首饰设计方法研究
14
作者 谢飞扬 梁嘉仪 《鞋类工艺与设计》 2024年第15期172-174,共3页
本课题总结了基于Grasshopper插件二次开发方法,依据可视化节点编程的特点进行数字化首饰设计。创新性地结合AI图像识别和Grasshopper插件辅助设计过程,可解释性分析珠宝首饰图像的风格参数,从而影响Grasshopper首饰造型设计结果,探索... 本课题总结了基于Grasshopper插件二次开发方法,依据可视化节点编程的特点进行数字化首饰设计。创新性地结合AI图像识别和Grasshopper插件辅助设计过程,可解释性分析珠宝首饰图像的风格参数,从而影响Grasshopper首饰造型设计结果,探索一种新型的数字化首饰设计方法。 展开更多
关键词 参数化设计 图像识别 可解释性分析 数字化首饰设计
下载PDF
Hybrid-Gird:遥感图像细粒度分类可解释方法
15
作者 朱凯雯 尤亚楠 +3 位作者 曹婧宜 孟钢 乔媛媛 杨洁 《遥感学报》 EI CSCD 北大核心 2024年第7期1722-1734,共13页
基于遥感图像的目标细粒度分类深度神经网络已技术日益成熟,网络决策的可解释性研究是当前细粒度分类深度学习算法进一步提高决策可信度的关键问题。为精确表征对模型决策起决定性作用的本质特征,本文基于博弈竞争理论对遥感图像目标细... 基于遥感图像的目标细粒度分类深度神经网络已技术日益成熟,网络决策的可解释性研究是当前细粒度分类深度学习算法进一步提高决策可信度的关键问题。为精确表征对模型决策起决定性作用的本质特征,本文基于博弈竞争理论对遥感图像目标细粒度分类任务进行建模,分析了IG、SmoothGrad、Grad-CAM等可解释性方法在遥感图像目标细粒度分类网络上的适用性,提出了一种尺度自适应的目标细粒度分类本质特征可解释性分析方法Hybrid-Grid,使用像素级与局部特征关系融合算法提高对支撑网络决策的目标本质特征的精确描述能力。结果表明:本文提出的Hybrid-Grid对目标细粒度分类网络的解释效果在ADCC量化评估指标上达到78.87,相较Score-CAM有大幅提升;与SmoothGrad、Grad-CAM的解释结果相对比,本文方法在删除及精度损失实验上表现最好,使EFM-Net的Top-1准确率、Top-5准确率、F1得分分别损失了16.92%、1.61%、17.21%,证明Hybrid-Grid准确解释了对细粒度分类网络决策贡献最大的目标本质特征。本文提出的可解释性分析方法能够更精准地揭示当前目标细粒度分类网络的决策特征依据。 展开更多
关键词 遥感图像 可解释性分析方法 目标细粒度分类网络 解释人工智能 合作博弈理论 本质特征
原文传递
基于机器学习的心脏病预测模型研究 被引量:6
16
作者 辛瑞昊 董哲原 +3 位作者 苗冯博 王甜甜 李英瑞 冯欣 《吉林化工学院学报》 CAS 2022年第9期27-32,共6页
心脏病作为当今社会对人类生活健康威胁最严重的血管疾病之一,不仅严重威胁人类的生命安全,而且高昂的治疗费用还会给家庭和社会带来严重的经济负担.针对目前心脏病预测研究中存在准确性不足及缺乏特征可解释性的问题,通过挖掘影响心脏... 心脏病作为当今社会对人类生活健康威胁最严重的血管疾病之一,不仅严重威胁人类的生命安全,而且高昂的治疗费用还会给家庭和社会带来严重的经济负担.针对目前心脏病预测研究中存在准确性不足及缺乏特征可解释性的问题,通过挖掘影响心脏病的重要特征,实现对心脏病准确预测和影响因素可解释性分析.首先,利用T检验来分析特征之间的显著差异性(P-value),通过P-value值降序排列选出特征进行组合.然后,利用十种机器学习模型和SHAP方法实现对心脏病的预测及其特征可解释性分析.在UCI心脏病数据集上进行验证实验,在7个医学领域广泛使用的评价指标上都到达了1,优于对比论文实验结果.最后,利用SHAP方法对13个特征进行可解释性分析,通过特征重要性排序可视化结果,挖掘单个特征与心脏病之间的关联,能为医生对心脏病的精准医疗提供决策支持. 展开更多
关键词 心脏病预测 T检验 机器学习 SHAP 可解释性分析
下载PDF
广义线性模型在车险索赔频率预测中的应用及模型改进
17
作者 黄子阳 申晴 《信息系统工程》 2021年第12期122-127,共6页
为研究广义线性模型在我国车险定价中的应用,基于我国某公司2016年5个省份交强险保单数据,以样本内外损失函数的最小化为标准,对相关模型进行比较以选择相对较优的模型,并对模型进行可解释性分析。研究结果表明:泊松广义线性模型具有较... 为研究广义线性模型在我国车险定价中的应用,基于我国某公司2016年5个省份交强险保单数据,以样本内外损失函数的最小化为标准,对相关模型进行比较以选择相对较优的模型,并对模型进行可解释性分析。研究结果表明:泊松广义线性模型具有较好的拟合效果,并且运用分层重要性方法、局部累积图进行变量重要性测度,根据变量重要性测度结果对广义线性模型加入了交互项,实现了对模型效果的改进,最后根据研究结论提出相关的对策建议。 展开更多
关键词 广义线性模型 交强险 索赔频率 可解释性分析 模型改进
下载PDF
基于Stacking集成模型融合的钢筋混凝土锈胀开裂预测方法
18
作者 梁梓豪 应宗权 +1 位作者 刘梅梅 杨帅 《中国腐蚀与防护学报》 CAS CSCD 北大核心 2024年第6期1601-1609,共9页
为了解决传统经验公式模型对钢筋混凝土锈胀开裂预测方法存在的公式不统一、精度有限等问题的局限性,本文提出一种基于Stacking集成模型融合的钢筋混凝土锈胀开裂预测方法。首先,通过文献收集的223组钢筋混凝土锈胀开裂试验数据进行数... 为了解决传统经验公式模型对钢筋混凝土锈胀开裂预测方法存在的公式不统一、精度有限等问题的局限性,本文提出一种基于Stacking集成模型融合的钢筋混凝土锈胀开裂预测方法。首先,通过文献收集的223组钢筋混凝土锈胀开裂试验数据进行数据预处理;其次,基于支持向量回归(SVR)、随机森林(RF)和极端梯度提升树(XGBoost)算法分别进行贝叶斯优化超参数、模型训练及评估,采用决定系数R^(2)、平均绝对误差(MAE)和均方根误差(RMSE)对比分析3种机器学习模型的预测性能,并在此基础上搭建基于Stacking融合多种算法的预测模型;最后,对所提出的机器学习模型和传统经验公式模型进行泛化性能验证,并探讨基于XGBoost模型的可解释性分析。结果表明:与其他机器学习模型相比,基于Stacking集成模型的预测精度和泛化性能较好,且可解释性分析结果说明模型预测逻辑与实际工程经验较为吻合。研究结果有助于提高钢筋混凝土锈胀开裂预测精度,可为决策者在实际工程提供科学的理论指导。 展开更多
关键词 钢筋混凝土 锈胀开裂 机器学习 Stacking算法 XGBoost算法 可解释性分析
原文传递
建成环境视角下高密度城市内涝风险预测与影响因素机器学习解析:以深圳市为例
19
作者 周士奇 贾蔚怡 +1 位作者 刘治宇 王墨 《景观设计学(中英文)》 CSCD 2024年第5期48-67,共20页
伴随着大数据和人工智能技术的演进,多种基于数据驱动的机器学习算法已逐渐在城市韧性研究中得到广泛应用,尤其是针对城市内涝这一关键问题。目前,解决城市内涝的重要任务是从建成环境的角度理解内涝影响因素,并指导动态监测和预警服务... 伴随着大数据和人工智能技术的演进,多种基于数据驱动的机器学习算法已逐渐在城市韧性研究中得到广泛应用,尤其是针对城市内涝这一关键问题。目前,解决城市内涝的重要任务是从建成环境的角度理解内涝影响因素,并指导动态监测和预警服务。本研究选取深圳市作为高密度城市的典型代表,构建了涵盖水文、气象、城市形态和内涝事件等多方面数据的多因子联动数据集,并对比了四种主流机器学习模型(Light GBM、RF、SVR和BPDNN)在预测城市内涝风险方面的性能差异。结果显示,Light GBM在精确性和鲁棒性上表现最佳,能够有效预测城市街区的内涝深度及相应的风险等级。研究进一步采用了可解释性算法(SHAP)对Light GBM模型进行解耦分析,结果显示,水文气象因子(降雨总量和降雨延时)及部分建筑配置因子(如建筑密度和建筑拥挤度)为主要的灾害影响因子;另外,水体率对内涝的调节和蓄积起到重要作用,特别是当其超过2.5%时,表现出显著的内涝抑制效果。本研究为城市内涝预测提供了新的技术方法,并从建成环境视角揭示了影响城市内涝的因素以及其内在机制,对高密度城市韧性的提升具有重要的科学意义。 展开更多
关键词 城市内涝 机器学习 模型性能评估 比较研究 可解释性分析 高密度城市
原文传递
利用电子健康记录分析心脏瓣膜疾病合并心房颤动的机器学习模型 被引量:1
20
作者 雷诺扬帆 童琪 +5 位作者 张译文 王政捷 李涛 潘帆 钱永军 赵启军 《中国胸心血管外科临床杂志》 CSCD 北大核心 2022年第8期953-962,共10页
目的建立基于机器学习的框架,从瓣膜性心脏病患者中快速筛选出可能发展为心房颤动(房颤)的高危患者,并将风险预测的相关信息提供给临床医生作为临床指导,以便及时做出治疗决策。方法回顾性收集四川大学华西医院及其分院的1740例瓣膜性... 目的建立基于机器学习的框架,从瓣膜性心脏病患者中快速筛选出可能发展为心房颤动(房颤)的高危患者,并将风险预测的相关信息提供给临床医生作为临床指导,以便及时做出治疗决策。方法回顾性收集四川大学华西医院及其分院的1740例瓣膜性心脏病患者的临床资料,其中男831例(47.76%)、女909例(52.24%),平均年龄54岁。基于以上数据,建立经典的logistic回归、3种标准机器学习模型和3种集成机器学习模型,用于房颤的风险预测和特征分析。将机器学习模型的性能与经典logistic回归进行比较,选择了两种最佳模型,应用SHAP(Sharpley Addictive Explanation)算法,提供群体和单体层面上的可解释性。此外,我们还提供了特征分析结果的可视化。结果Stack模型在所有模型中表现最好(房颤检出率85.6%,F1分数0.753),而XGBoost在标准机器学习模型中表现优异(房颤检出率71.9%,F1分数0.732),且两种模型的表现都明显优于logistic回归模型(房颤检出率65.2%,F1分数0.689)。SHAP算法显示,左心房内径、二尖瓣E峰流速、右心房内径、每搏输出量和心功能分级是影响房颤预测的最重要特征。Stack模型和XGBoost都具有出色的预测能力和可解释性。结论Stack模型具有最高的房颤检测性能和综合表现,加载SHAP算法的Stack模型可用于筛选房颤高风险患者,并揭示相应的风险特征。我们的框架可用于指导房颤的临床干预和监测。 展开更多
关键词 心房颤动 心脏瓣膜性疾病 机器学习 风险预测 可解释性分析
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部