机器学习模型可解释性方法、应用与安全研究综述被引量：150

Survey on Techniques, Applications and Security of Machine Learning Interpretability

下载PDF

导出

摘要尽管机器学习在许多领域取得了巨大的成功,但缺乏可解释性严重限制了其在现实任务尤其是安全敏感任务中的广泛应用.为了克服这一弱点,许多学者对如何提高机器学习模型可解释性进行了深入的研究,并提出了大量的解释方法以帮助用户理解模型内部的工作机制.然而,可解释性研究还处于初级阶段,依然还有大量的科学问题尚待解决.并且,不同的学者解决问题的角度不同,对可解释性赋予的含义也不同,所提出的解释方法也各有侧重.迄今为止,学术界对模型可解释性仍缺乏统一的认识,可解释性研究的体系结构尚不明确.在综述中,回顾了机器学习中的可解释性问题,并对现有的研究工作进行了系统的总结和科学的归类.同时,讨论了可解释性相关技术的潜在应用,分析了可解释性与可解释机器学习的安全性之间的关系,并且探讨了可解释性研究当前面临的挑战和未来潜在的研究方向,以期进一步推动可解释性研究的发展和应用. While machine learning has achieved great success in various domains,the lack of interpretability has limited its widespread applications in real-world tasks,especially security-critical tasks.To overcome this crucial weakness,intensive research on improving the interpretability of machine learning models has emerged,and a plethora of interpretation methods have been proposed to help end users understand its inner working mechanism.However,the research on model interpretation is still in its infancy,and there are a large amount of scientific issues to be resolved.Furthermore,different researchers have different perspectives on solving the interpretation problem and give different definitions for interpretability,and the proposed interpretation methods also have different emphasis.Till now,the research community still lacks a comprehensive understanding of interpretability as well as a scientific guide for the research on model interpretation.In this survey,we review the explanatory problems in machine learning,and make a systematic summary and scientific classification of the existing research works.At the same time,we discuss the potential applications of interpretation related technologies,analyze the relationship between interpretability and the security of interpretable machine learning,and discuss the current research challenges and potential future research directions,aiming at providing necessary help for future researchers to facilitate the research and application of model interpretability.

作者纪守领李进锋杜天宇李博 Ji Shouling;Li Jinfeng;Du Tianyu;and Li Bo(Institute of Cyberspace Research and College of Computer Science and Technology,Zhejiang University,Hangzhou 310027;Department of Computer Science,University of Illinois at Urbana-Champaign,Urbana-Champaign,IL,USA 61822)

机构地区浙江大学计算机科学与技术学院网络空间安全研究中心伊利诺伊大学香槟分校计算机科学学院

出处《计算机研究与发展》 EI CSCD 北大核心 2019年第10期2071-2096,共26页 Journal of Computer Research and Development

基金国家自然科学基金项目(61772466,U1836202) 浙江省自然科学基金杰出青年项目(LR19F020003) 浙江省科技计划项目(2017C01055)~~

关键词机器学习可解释性解释方法可解释机器学习安全性 machine learning interpretability interpretation method interpretable machine learning security

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献1577

1姚佳.数据要素市场化的法律制度配置[J].郑州大学学报（哲学社会科学版）,2022,55(6):43-50. 被引量：32
2张欣,宋雨鑫.算法审计的制度逻辑和本土化构建[J].郑州大学学报（哲学社会科学版）,2022,55(6):33-42. 被引量：36
3姜涛.刑法解释的价值判断[J].中国社会科学,2023(7):138-160. 被引量：13
4李训虎.刑事司法人工智能的包容性规制[J].中国社会科学,2021(2):42-62. 被引量：107
5范海东.基于数字孪生的智能电厂体系架构及系统部署研究[J].智能科学与技术学报,2019,0(3):241-248. 被引量：22
6郑南宁.人工智能新时代[J].智能科学与技术学报,2019,0(1):1-3. 被引量：64
7Wende Tian,Yujia Ren,Yuxi Dong,Shaoguang Wang,Lingzhen Bu.Fault monitoring based on mutual information feature engineering modeling in chemical process[J].Chinese Journal of Chemical Engineering,2019,27(10):2491-2497. 被引量：5
8洪丹娜.算法歧视的宪法价值调适:基于人的尊严[J].政治与法律,2020(8):27-37. 被引量：48
9龙宗智.刑事证明中经验法则运用的若干问题[J].中国刑事法杂志,2021(5):55-70. 被引量：47
10姜顺荣,时坤,周勇.基于区块链的能源交易系统的安全和隐私保护[J].中国矿业大学学报,2022,51(5):1016-1030. 被引量：9

引证文献150

1付佳俊,卢梅丽,曹一凡,郭兆桦,高资成.基于深度学习的t-fMRI脑状态解码[J].天津职业技术师范大学学报,2022,32(4):45-50.
2马舒岑,史建琦,黄滟鸿,秦胜潮,侯哲.基于最小不满足核的随机森林局部解释性分析[J].软件学报,2022,33(7):2447-2463. 被引量：2
3赵岩,罗岱,樊娟娟,封少东.船舶与海上设施数字孪生系统评价体系[J].船舶工程,2022,44(S01):548-553.
4李艳红,姚元庆,姚兵,黄威权,杨梦庚.原癌基因c-myc产物在小鼠早期胚胎中的表达[J].第四军医大学学报,2000,21(2):253-254. 被引量：1
5肖丽利.基于探索性和聚类的《高等数学》成绩分析[J].四川文理学院学报,2020,30(2):42-46. 被引量：1
6郭炜炜,张增辉,郁文贤,孙效华.SAR图像目标识别的可解释性问题探讨[J].雷达学报（中英文）,2020,9(3):462-476. 被引量：23
7周俊,方国英,吴楠.联邦学习安全与隐私保护研究综述[J].西华大学学报（自然科学版）,2020,39(4):9-17. 被引量：22
8陈珂锐,孟小峰.机器学习的可解释性[J].计算机研究与发展,2020,57(9):1971-1986. 被引量：45
9范铭,刘烃,刘均,罗夏朴,于乐,管晓宏.安卓恶意软件检测方法综述[J].中国科学：信息科学,2020,50(8):1148-1177. 被引量：19
10郭炜炜,王琦.人-无人车交互中的可解释性交互研究[J].包装工程,2020,41(18):22-28. 被引量：1

二级引证文献1152

1宋保振.数字技术差异赋权风险的法律规控[J].郑州大学学报（哲学社会科学版）,2022,55(4):26-32. 被引量：9
2韩希霖.自动化行政:风险、规范与救济[J].郑州师范教育,2023,12(6):34-40. 被引量：1
3刘艳红.自动驾驶的风险类型与法律规制[J].国家检察官学院学报,2024,32(1):114-130. 被引量：6
4龚善要.人工智能司法应用的实践审思与完善[J].国家检察官学院学报,2023,31(5):95-108. 被引量：6
5田力男.远程侦查讯问程序问题研究[J].中国刑事法杂志,2021(5):140-157. 被引量：15
6姜婷婷,傅诗婷.人本视角下的数字记忆:“人—记忆—技术”三位一体理论框架构建与启示[J].中国图书馆学报,2022,48(5):103-115. 被引量：12
7侯东德.人工智能法的基本问题及制度架构[J].政法论丛,2023(6):61-72. 被引量：14
8王燃,孙艺桐.人身危险性评估的算法治理——从算法透明与商业秘密冲突展开[J].上海政法学院学报（法治论丛）,2023,38(3):94-115. 被引量：1
9刘革平,冉文妍,杨瑜颖,胡翰林.VR环境下认知追踪关键技术综述[J].人工智能科学与工程,2024(2):1-17.
10刘雷.平等视角下算法治理歧视及其反歧视措施均衡[J].湘江青年法学,2021(1):58-74. 被引量：2

1田翔.试论新时代党的建设的历史性继承、现实性要求和前瞻性塑造[J].中共四川省委党校学报,2019,0(3):27-31. 被引量：1
2陈祁章.借鉴经验发展我国城市公共交通[J].中国道路运输,2019,0(8):61-63.
3李卫.新时期物联网移动通信线路发展趋势分析[J].中国新通信,2019,21(15):26-27. 被引量：2
4梁平平.磁性油水分离材料的研究进展[J].石油石化物资采购,2019,0(10):84-84.
5刘魁,刘婷,魏杰,郑新前.数字孪生在航空发动机可靠性领域的应用探索[J].航空动力,2019,0(4):61-64. 被引量：16
6梁玲玲.铀酰配合物的应用研究进展[J].化工科技,2019,27(5):75-78. 被引量：5
7刘汝涵,徐丹.视频放大和深度学习在微表情识别任务上的应用[J].计算机辅助设计与图形学学报,2019,31(9):1535-1541. 被引量：12
8王敦建,李肃成,季文杰,熊伟,张磊,商院芳,罗杰.金属-电介质复合材料中非局域效应诱导的偏振分光器（英文）[J].红外与毫米波学报,2019,38(4):445-450.

计算机研究与发展

2019年第10期

浏览历史

内容加载中请稍等...

机器学习模型可解释性方法、应用与安全研究综述被引量：150

同被引文献1577

引证文献150

二级引证文献1152

相关作者

相关机构

相关主题

浏览历史

机器学习模型可解释性方法、应用与安全研究综述 被引量：150

同被引文献1577

引证文献150

二级引证文献1152

相关作者

相关机构

相关主题

浏览历史

机器学习模型可解释性方法、应用与安全研究综述被引量：150