深度学习模型可解释性研究综述被引量：30

Survey of Interpretability Research on Deep Learning Models

下载PDF

导出

摘要深度学习技术以数据驱动学习的特点,在自然语言处理、图像处理、语音识别等领域取得了巨大成就。但由于深度学习模型网络过深、参数多、复杂度高等特性,该模型做出的决策及中间过程让人类难以理解,因此探究深度学习的可解释性成为当前人工智能领域研究的新课题。以深度学习模型可解释性为研究对象,对其研究进展进行总结阐述。从自解释模型、特定模型解释、不可知模型解释、因果可解释性四个方面对主要可解释性方法进行总结分析。列举出可解释性相关技术的应用,讨论当前可解释性研究存在的问题并进行展望,以推动深度学习可解释性研究框架的进一步发展。 With the characteristics of data-driven learning,deep learning technology has made great achievements in the fields of natural language processing,image processing,and speech recognition.However,due to the deep learning model featured by deep networks,many parameters,high complexity and other characteristics,the decisions and intermediate processes made by the model are difficult for humans to understand.Therefore,exploring the interpretability of deep learning has become a new topic in the current artificial intelligence field.This review takes the interpretability of deep learning models as the research object and summarizes its progress.Firstly,the main interpretability methods are summarized and analyzed from four aspects:self-explanatory model,model-specific explanation,model-agnostic explanation,and causal interpretability.At the same time,it enumerates the application of interpretability related technologies,and finally discusses the existing problems of current interpretability research to promote the further development of the deep learning interpretability research framework.

作者曾春艳严康王志锋余琰纪纯妹 ZENG Chunyan;YAN Kang;WANG Zhifeng;YU Yan;JI Chunmei(Hubei Key Laboratory for High-efficiency Utilization of Solar Energy and Operation Control of Energy Storage System,Hubei University of Technology,Wuhan 430068,China;Department of Digital Media Technology,Central China Normal University,Wuhan 430079,China;Shantou Branch,China Mobile Group Guangdong Co.,Ltd.,Shantou,Guangdong 515041,China)

机构地区湖北工业大学太阳能高效利用及储能运行控制湖北省重点实验室华中师范大学数字媒体技术系中国移动通信集团广东有限公司汕头分公司

出处《计算机工程与应用》 CSCD 北大核心 2021年第8期1-9,共9页 Computer Engineering and Applications

基金国家自然科学基金(61901165,61501199) 湖北省自然科学基金(2017CFB683) 华中师范大学中央高校基本科研业务费项目(CCNU20ZT010)。

关键词深度学习可解释性人工智能因果可解释自解释 deep learning interpretability artificial intelligence causal interpretability self-explanatory

分类号 TN912 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献4

1苏炯铭,刘鸿福,项凤涛,吴建宅,袁兴生.深度神经网络解释方法综述[J].计算机工程,2020,46(9):1-15. 被引量：26
2化盈盈,张岱墀,葛仕明.深度学习模型可解释性的研究进展[J].信息安全学报,2020,5(3):1-12. 被引量：43
3纪守领,李进锋,杜天宇,李博.机器学习模型可解释性方法、应用与安全研究综述[J].计算机研究与发展,2019,56(10):2071-2096. 被引量：150
4王健宗,孔令炜,黄章成,陈霖捷,刘懿,何安珣,肖京.联邦学习算法综述[J].大数据,2020,6(6):64-82. 被引量：48

二级参考文献7

1高莹莹,朱维彬.深层神经网络中间层可见化建模[J].自动化学报,2015,41(9):1627-1637. 被引量：16
2方滨兴,贾焰,李爱平,江荣.大数据隐私保护技术综述[J].大数据,2016,2(1):1-18. 被引量：72
3熊红凯,高星,李劭辉,徐宇辉,王涌壮,余豪阳,刘昕,张云飞.可解释化、结构化、多模态化的深度神经网络[J].模式识别与人工智能,2018,31(1):1-11. 被引量：8
4Quan-shi ZHANG,Song-chun ZHU.Visual interpretability for deep learning：a survey[J].Frontiers of Information Technology & Electronic Engineering,2018,19(1):27-39. 被引量：49
5吴飞,廖彬兵,韩亚洪.深度学习的可解释性[J].航空兵器,2019,26(1):39-46. 被引量：37
6何华灿.重新找回人工智能的可解释性[J].智能系统学报,2019,14(3):393-412. 被引量：34
7M.Ablikim,M.N.Achasov,P.Adlarson,S.Ahmed,M.Albrecht,M.Alekseev,A.Amoroso,F.F.An,Q.An,Y.Bai,O.Bakina,R.Baldini Ferroli,Y.Ban,K.Begzsuren,J.V.Bennett,N.Berger,M.Bertani,D.Bettoni,F.Bianchi,J Biernat,J.Bloms,I.Boyko,R.A.Briere,L.Calibbi,H.Cai,X.Cai,A.Calcaterra,G.F.Cao,N.Cao,S.A.Cetin,J.Chai,J.F.Chang,W.L.Chang,J.Charles,G.Chelkov,Chen,G.Chen,H.S.Chen,J.C.Chen,M.L.Chen,S.J.Chen,Y.B.Chen,H.Y.Cheng,W.Cheng,G.Cibinetto,F.Cossio,X.F.Cui,H.L.Dai,J.P.Dai,X.C.Dai,A.Dbeyssi,D.Dedovich,Z.Y.Deng,A.Denig,Denysenko,M.Destefanis,S.Descotes-Genon,F.De Mori,Y.Ding,C.Dong,J.Dong,L.Y.Dong,M.Y.Dong,Z.L.Dou,S.X.Du,S.I.Eidelman,J.Z.Fan,J.Fang,S.S.Fang,Y.Fang,R.Farinelli,L.Fava,F.Feldbauer,G.Felici,C.Q.Feng,M.Fritsch,C.D.Fu,Y.Fu,Q.Gao,X.L.Gao,Y.Gao,Y.Gao,Y.G.Gao,Z.Gao,B.Garillon,I.Garzia,E.M.Gersabeck,A.Gilman,K.Goetzen,L.Gong,W.X.Gong,W.Gradl,M.Greco,L.M.Gu,M.H.Gu,Y.T.Gu,A.Q.Guo,F.K.Guo,L.B.Guo,R.P.Guo,Y.P.Guo,A.Guskov,S.Han,X.Q.Hao,F.A.Harris,K.L.He,F.H.Heinsius,T.Held,Y.K.Heng,Y.R.Hou,Z.L.Hou,H.M.Hu,J.F.Hu,T.Hu,Y.Hu,G.S.Huang,J.S.Huang,X.T.Huang,X.Z.Huang,Z.L.Huang,N.Huesken,T.Hussain,W.Ikegami Andersson,W.Imoehl,M.Irshad,Q.Ji,Q.P.Ji,X.B.Ji,X.L.Ji,H.L.Jiang,X.S.Jiang,X.Y.Jiang,J.B.Jiao,Z.Jiao,D.P.Jin,S.Jin,Y.Jin,T.Johansson,N.Kalantar-Nayestanaki,X.S.Kang,R.Kappert,M.Kavatsyuk,B.C.Ke,I.K.Keshk,T.Khan,A.Khoukaz,P.Kiese,R.Kiuchi,R.Kliemt,L.Koch,O.B.Kolcu,B.Kopf,M.Kuemmel,M.Kuessner,A.Kupsc,M.Kurth,M.G.Kurth,W.Kuhn,J.S.Lange,P.Larin,L.Lavezzi,H.Leithoff,T.Lenz,C.Li,Cheng Li,D.M.Li,F.Li,F.Y.Li,G.Li,H.B.Li,H.J.Li,J.C.Li,J.W.Li,Ke Li,L.K.Li,Lei Li,P.L.Li,P.R.Li,Q.Y.Li,W.D.Li,W.G.Li,X.H.Li,X.L.Li,X.N.Li,X.Q.Li,Z.B.Li,H.Liang,H.Liang,Y.F.Liang,Y.T.Liang,G.R.Liao,L.Z.Liao,J.Libby,C.X.Lin,D.X.Lin,Y.J.Lin,B.Liu,B.J.Liu,C.X.Liu,D.Liu,D.Y.Liu,F.H.Liu,Fang Liu,Feng Liu,H.B.Liu,H.M.Liu,Huanhuan Liu,Huihui Liu,J.B.Liu,J.Y.Liu,K.Y.Liu,Ke Liu,Q.Liu,S.B.Liu,T.Liu,X.Liu,X.Y.Liu,Y.B.Liu,Z.A.Liu,Zhiqing Liu,Y.F.Long,X.C.Lou,H.J.Lu,J.D.Lu,J.G.Lu,Y.Lu,Y.P.Lu,C.L.Luo,M.X.Luo,P.W.Luo,T.Luo,X.L.Luo,S.Lusso,X.R.Lyu,F.C.Ma,H.L.Ma,L.L.Ma,M.M.Ma,Q.M.Ma,X.N.Ma,X.X.Ma,X.Y.Ma,Y.M.Ma,F.E.Maas,M.Maggiora,S.Maldaner,S.Malde,Q.A.Malik,A.Mangoni,Y.J.Mao,Z.P.Mao,S.Marcello,Z.X.Meng,J.G.Messchendorp,G.Mezzadri,J.Min,T.J.Min,R.E.Mitchell,X.H.Mo,Y.J.Mo,C.Morales Morales,N.Yu.Muchnoi,H.Muramatsu,A.Mustafa,S.Nakhoul,Y.Nefedov,F.Nerling,I.B.Nikolaev,Z.Ning,S.Nisar,S.L.Niu,S.L.Olsen,Q.Ouyang,S.Pacetti,Y.Pan,M.Papenbrock,P.Patteri,M.Pelizaeus,H.P.Peng,K.Peters,A.A.Petrov,J.Pettersson,J.L.Ping,R.G.Ping,A.Pitka,R.Poling,V.Prasad,M.Qi,T.Y.Qi,S.Qian,C.F.Qiao,N.Qin,X.P.Qin,X.S.Qin,Z.H.Qin,J.F.Qiu,S.Q.Qu,K.H.Rashid,C.F.Redmer,M.Richter,M.Ripka,A.Rivetti,V.Rodin,M.Rolo,G.Rong,J.L.Rosner,Ch.Rosner,M.Rump,A.Sarantsev,M.Savrie,K.Schoenning,W.Shan,X.Y.Shan,M.Shao,C.P.Shen,P.X.Shen,X.Y.Shen,H.Y.Sheng,X.Shi,X.D Shi,J.J.Song,Q.Q.Song,X.Y.Song,S.Sosio,C.Sowa,S.Spataro,F.F.Sui,G.X.Sun,J.F.Sun,L.Sun,S.S.Sun,X.H.Sun,Y.J.Sun,Y.K Sun,Y.Z.Sun,Z.J.Sun,Z.T.Sun,Y.T Tan,C.J.Tang,G.Y.Tang,X.Tang,V.Thoren,B.Tsednee,I.Uman,B.Wang,B.L.Wang,C.W.Wang,D.Y.Wang,H.H.Wang,K.Wang,L.L.Wang,L.S.Wang,M.Wang,M.Z.Wang,Wang Meng,P.L.Wang,R.M.Wang,W.P.Wang,X.Wang,X.F.Wang,X.L.Wang,Y.Wang,Y.F.Wang,Z.Wang,Z.G.Wang,Z.Y.Wang,Zongyuan Wang,T.Weber,D.H.Wei,P.Weidenkaff,H.W.Wen,S.P.Wen,U.Wiedner,G.Wilkinson,M.Wolke,L.H.Wu,L.J.Wu,Z.Wu,L.Xia,Y.Xia,S.Y.Xiao,Y.J.Xiao,Z.J.Xiao,Y.G.Xie,Y.H.Xie,T.Y.Xing,X.A.Xiong,Q.L.Xiu,G.F.Xu,L.Xu,Q.J.Xu,W.Xu,X.P.Xu,F.Yan,L.Yan,W.B.Yan,W.C.Yan,Y.H.Yan,H.J.Yang,H.X.Yang,L.Yang,R.X.Yang,S.L.Yang,Y.H.Yang,Y.X.Yang,Yifan Yang,Z.Q.Yang,M.Ye,M.H.Ye,J.H.Yin,Z.Y.You,B.X.Yu,C.X.Yu,J.S.Yu,C.Z.Yuan,X.Q.Yuan,Y.Yuan,A.Yuncu,A.A.Zafar,Y.Zeng,B.X.Zhang,B.Y.Zhang,C.C.Zhang,D.H.Zhang,H.H.Zhang,H.Y.Zhang,J.Zhang,J.L.Zhang,J.Q.Zhang,J.W.Zhang,J.Y.Zhang,J.Z.Zhang,K.Zhang,L.Zhang,S.F.Zhang,T.J.Zhang,X.Y.Zhang,Y.Zhang,Y.H.Zhang,Y.T.Zhang,Yang Zhang,Yao Zhang,Yi Zhang,Yu Zhang,Z.H.Zhang,Z.P.Zhang,Z.Q.Zhang,Z.Y.Zhang,G.Zhao,J.W.Zhao,J.Y.Zhao,J.Z.Zhao,Lei Zhao,Ling Zhao,M.G.Zhao,Q.Zhao,S.J.Zhao,T.C.Zhao,Y.B.Zhao,Z.G.Zhao,A.Zhemchugov,B.Zheng,J.P.Zheng,Y.Zheng,Y.H.Zheng,B.Zhong,L.Zhou,L.P.Zhou,Q.Zhou,X.Zhou,X.K.Zhou,Xingyu Zhou,Xiaoyu Zhou,Xu Zhou,A.N.Zhu,J.Zhu,J.Zhu,K.Zhu,K.J.Zhu,S.H.Zhu,W.J.Zhu,X.L.Zhu,Y.C.Zhu,Y.S.Zhu,Z.A.Zhu,J.Zhuang,B.S.Zou,J.H.Zou,无.Future Physics Programme of BESⅢ[J].Chinese Physics C,2020,44(4). 被引量：540

共引文献257

1张方青,杨列浩,丛宪玲.新辅助检查技术在甲真菌病临床诊断中的应用进展[J].中国实验诊断学,2023,27(7):876-879.
2龚善要.人工智能司法应用的实践审思与完善[J].国家检察官学院学报,2023,31(5):95-108. 被引量：6
3陈财森,纪伯公,黄辰,向阳霞.基于联邦学习的作战数据共享与隐私保护[J].装甲兵学报,2022(1):98-103. 被引量：4
4付佳俊,卢梅丽,曹一凡,郭兆桦,高资成.基于深度学习的t-fMRI脑状态解码[J].天津职业技术师范大学学报,2022,32(4):45-50.
5马舒岑,史建琦,黄滟鸿,秦胜潮,侯哲.基于最小不满足核的随机森林局部解释性分析[J].软件学报,2022,33(7):2447-2463. 被引量：2
6朱文鹏,郭峰,平作为,梁英杰,兰儒恺,张永.基于隐私保护的无监督电机磁瓦表面缺陷检测研究[J].控制工程,2023,30(7):1219-1225.
7赵岩,罗岱,樊娟娟,封少东.船舶与海上设施数字孪生系统评价体系[J].船舶工程,2022,44(S01):548-553.
8李艳红,姚元庆,姚兵,黄威权,杨梦庚.原癌基因c-myc产物在小鼠早期胚胎中的表达[J].第四军医大学学报,2000,21(2):253-254. 被引量：1
9肖丽利.基于探索性和聚类的《高等数学》成绩分析[J].四川文理学院学报,2020,30(2):42-46. 被引量：1
10郭炜炜,张增辉,郁文贤,孙效华.SAR图像目标识别的可解释性问题探讨[J].雷达学报（中英文）,2020,9(3):462-476. 被引量：23

同被引文献295

1张钹.人工智能进入后深度学习时代[J].智能科学与技术学报,2019,0(1):4-6. 被引量：43
2贾宇为,王汉军.改进混合高斯模型的电网检修人员行为检测[J].计算机系统应用,2020,29(10):242-247. 被引量：1
3李妮,关焕梅,杨飘,董文永.基于BERT-IDCNN-CRF的中文命名实体识别方法[J].山东大学学报（理学版）,2020,55(1):102-109. 被引量：54
4彭红星,何慧君,高宗梅,田兴国,邓倩婷,咸春龙.基于改进ShuffleNetV2模型的荔枝病虫害识别方法[J].农业机械学报,2022,53(12):290-300. 被引量：22
5于明,李若曦,阎刚,王岩,王建春,李扬.基于颜色掩膜网络和自注意力机制的叶片病害识别方法[J].农业机械学报,2022,53(8):337-344. 被引量：9
6傅隆生,宋珍珍,Zhang Xin,李瑞,王东,崔永杰.深度学习方法在农业信息中的研究进展与应用现状[J].中国农业大学学报,2020,25(2):105-120. 被引量：53
7马鹏,樊艳芳.基于深度迁移学习的小样本智能变电站电力设备部件检测[J].电网技术,2020,44(3):1148-1159. 被引量：86
8蒲天骄,乔骥,韩笑,张国宾,王新迎.人工智能技术在电力设备运维检修中的研究及应用[J].高电压技术,2020,46(2):369-383. 被引量：216
9庹国柱,段家喜.保险欺诈的博弈分析[J].首都经济贸易大学学报,1999,1(3):51-54. 被引量：4
10宋怀波,何东健.面向精细农业的高维数据本征维数估计方法研究进展[J].中国科学：信息科学,2010,40(S1):104-110. 被引量：5

引证文献30

1任泽裕,王振超,柯尊旺,李哲,吾守尔·斯拉木.多模态数据融合综述[J].计算机工程与应用,2021,57(18):49-64. 被引量：55
2李舵,董超群,司品超,何曼,刘钱超.神经网络验证和测试技术研究综述[J].计算机工程与应用,2021,57(22):53-67. 被引量：16
3卢冰洁,李炜卓,那崇宁,牛作尧,陈奎.机器学习模型在车险欺诈检测的研究进展[J].计算机工程与应用,2022,58(5):34-49. 被引量：11
4葛家驿,杨乃森,唐宏,徐朋磊,纪超.端到端的梯度提升网络分类过程可视化[J].信号处理,2022,38(2):355-366.
5李芳,郜书锴.自媒体突发舆情情绪识别的可解释性深度学习方法[J].新闻知识,2021(11):20-27. 被引量：1
6李凌敏,侯梦然,陈琨,刘军民.深度学习的可解释性研究综述[J].计算机应用,2022,42(12):3639-3650. 被引量：10
7李运硕,段祥骏,李佳,林奕夫,任敬飞,杨婷.基于深度检测网络的配网工程动态缺陷检测进展[J].电力信息与通信技术,2023,21(2):40-52. 被引量：1
8孙弋,梁兵涛.基于BERT和多头注意力的中文命名实体识别方法[J].重庆邮电大学学报（自然科学版）,2023,35(1):110-118. 被引量：11
9曾春艳,余琰,王志锋,夏诗言.面向可解释压缩感知的算法展开综述[J].华中科技大学学报（自然科学版）,2022,50(11):35-43. 被引量：1
10路晓辰,杨立明,杨兴悦,王祖东,王维欢,高永国,尹欣欣.深度学习方法在地震事件分类中的应用及可解释性研究[J].地震工程学报,2023,45(2):474-482. 被引量：2

二级引证文献171

1张才俊,江帆,张波.基于改进型B+树的电力多模态数据索引系统研究[J].系统仿真技术,2023,19(4):302-307.
2何其愚,李斌,昂俊.基于深度学习的水电站地下厂房智能通风调控研究[J].暖通空调,2023,53(S01):254-257.
3刘轶,董敏.区块链赋能下保险欺诈规制的路径优化[J].江淮论坛,2022(4):69-74. 被引量：5
4徐成伟.基于贝叶斯优化Xgboost的车险欺诈识别研究[J].新一代信息技术,2022,5(5):49-52.
5李一凡,袁龙健,王瑞.基于OpenPose改进的轻量化人体动作识别模型[J].电子测量技术,2022,45(1):89-95. 被引量：17
6罗思言,王心舟,饶向荣.人工智能在中医诊断中的应用进展[J].中国医学物理学杂志,2022,39(5):647-654. 被引量：12
7祝文军,王思宁,高晓欣,郑倩.基于知识流和迁移学习的负荷预测[J].电信科学,2022,38(5):114-123. 被引量：3
8黄乾峰,董琴.基于卷积神经网络的农作物病害图像分类研究[J].信息与电脑,2022,34(5):138-142. 被引量：1
9郭婷,张天序,郭诗嘉.一种红外图像和宽光谱融合的人脸识别算法[J].武汉工程大学学报,2022,44(3):320-324. 被引量：2
10黄靖,牛彦敏,柳致远.在线学习课程评论区交互有效性分析[J].开封文化艺术职业学院学报,2022,42(4):82-84.

1宋茜.优秀的区块链钱包具备哪些职责[J].计算机与网络,2021,47(3):48-49.
2段力,李元松,高学文.斜拉法施工张拉模拟技术研究[J].中外公路,2021,41(1):137-142.
3刘宗明,牟金震,张硕,杜宣,曹姝清,张宇.空间失效慢旋卫星视觉特征跟踪与位姿测量[J].航空学报,2021,42(1):277-288. 被引量：4

计算机工程与应用

2021年第8期

浏览历史

内容加载中请稍等...

深度学习模型可解释性研究综述被引量：30

参考文献4

二级参考文献7

共引文献257

同被引文献295

引证文献30

二级引证文献171

相关作者

相关机构

相关主题

浏览历史

深度学习模型可解释性研究综述 被引量：30

参考文献4

二级参考文献7

共引文献257

同被引文献295

引证文献30

二级引证文献171

相关作者

相关机构

相关主题

浏览历史

深度学习模型可解释性研究综述被引量：30