基于机器学习的软件漏洞挖掘方法综述被引量：45

Survey of Software Vulnerability Mining Methods Based on Machine Learning

下载PDF

导出

摘要软件复杂性的增加,给软件安全性带来极大的挑战.随着软件规模的不断增大以及漏洞形态多样化,传统漏洞挖掘方法由于存在高误报率和高漏报率的问题,已无法满足复杂软件的安全性分析需求.近年来,随着人工智能产业的兴起,大量机器学习方法被尝试用于解决软件漏洞挖掘问题.首先,通过梳理基于机器学习的软件漏洞挖掘的现有研究工作,归纳了其技术特征与工作流程;接着,从其中核心的原始数据特征提取切入,以代码表征形式作为分类依据,对现有研究工作进行分类阐述,并系统地进行了对比分析;最后,依据对现有研究工作的整理总结,探讨了基于机器学习的软件漏洞挖掘领域面临的挑战,并展望了该领域的发展趋势. The increasing complexity of software application brings great challenges to software security.Due to the increase of software scale and diversity of vulnerability forms,the high false positives and false negatives of traditional vulnerability mining methods cannot meet the requirements of software security analysis.In recent years,with the rise of artificial intelligence industry,a large number of machine learning methods have been tried to solve the problem of software vulnerability mining.Firstly,the latest research results of applying machine learning method to the research of vulnerability mining are summarized in recent years,and the technical characteristics and workflow are proposed.Then,starting from the core original data features extraction,the existing research is classified according to the code representation form,and the existing research is systematically compared.Finally,based on the summary of the existing research,the challenges in the field of software vulnerability mining based on machine learning are discussed,and the development trends of this field are proposed.

作者李韵黄辰林王中锋袁露王晓川 LI Yun;HUANG Chen-Lin;WANG Zhong-Feng;YUAN Lu;WANG Xiao-Chuan(College of Computer Science and Technology,National University of Defense Technology,Changsha 410073,China;PLA 61302 Troops,Beijing 100016,China)

机构地区国防科技大学计算机学院中国人民解放军

出处《软件学报》 EI CSCD 北大核心 2020年第7期2040-2061,共22页 Journal of Software

基金国家重点研发计划(2018YFB0803501)。

关键词机器学习漏洞挖掘代码表征软件质量深度学习 machine learning vulnerability mining code representation software quality deep learning

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献14

1陈翔,顾庆,刘望舒,刘树龙,倪超.静态软件缺陷预测方法研究[J].软件学报,2016,27(1):1-25. 被引量：123
2叶志斌,严波.符号执行研究综述[J].计算机科学,2018,45(B06):28-35. 被引量：19
3孙鸿宇,何远,王基策,董颖,朱立鹏,王鹤,张玉清.人工智能技术在安全漏洞领域的应用[J].通信学报,2018,39(8):1-17. 被引量：29
4邹权臣,张涛,吴润浦,马金鑫,李美聪,陈晨,侯长玉.从自动化到智能化:软件漏洞挖掘技术进展[J].清华大学学报（自然科学版）,2018,58(12):1079-1094. 被引量：39
5张雄,李舟军.模糊测试技术研究综述[J].计算机科学,2016,43(5):1-8. 被引量：32
6陈翔,王莉萍,顾庆,王赞,倪超,刘望舒,王秋萍.跨项目软件缺陷预测方法研究综述[J].计算机学报,2018,41(1):254-274. 被引量：44
7许嘉,张千桢,赵翔,吕品,李陶深.动态图模式匹配技术综述[J].软件学报,2018,29(3):663-688. 被引量：14
8吴世忠,郭涛,董国伟,王嘉捷.软件漏洞分析技术进展[J].清华大学学报（自然科学版）,2012,52(10):1309-1319. 被引量：29
9刘云龙.基于Token的结构化匹配同源性代码检测技术研究[J].计算机应用研究,2014,31(6):1841-1845. 被引量：6
10吴世忠.信息安全漏洞分析回顾与展望[J].清华大学学报（自然科学版）,2009(S2):2065-2072. 被引量：22

二级参考文献298

1吴世忠.信息安全漏洞分析回顾与展望[J].清华大学学报（自然科学版）,2009(S2):2065-2072. 被引量：22
2陈石坤,李舟军,黄永刚,邢建英.一种基于SAT的C程序缓冲区溢出漏洞检测技术[J].清华大学学报（自然科学版）,2009(S2):2169-2175. 被引量：2
3易锦,郭涛,黄永刚,张普含.基于语言等价关系化简Büchi自动机的算法[J].清华大学学报（自然科学版）,2009(S2):2181-2185. 被引量：1
4Glossary of Information Security Terms. ISO/IEC SC27 SD6 . 2009
5Abbott R,Chin J,Donnelley J,et al.Security Analysis andEnhancements of Computer Operating Systems. TechnicalReport NB SIR 76-1041 Lawrence LivermoreLaboratory TR NBSIR-76-1041 . 1976
6Aslam T,Krsul I V,Spafford E H.Use of a taxonomy ofsecurity faults. Proceedings of the 19th NationalInformation System Security Conference . 1996
7Bishop M,Bailey D.A Critical Analysis of VulnerabilityTaxonomies. Technical Report CSE-96-11 . 1996
8Denning D.Cryptography and Data Security. . 1982
9Longley D,Shain M,Caell W.Information Security:Dictionary of Concepts,Standards and Terms. . 1992
10Bishop M,Bailey D.A Critical Analysis of VulnerabilityTaxonomies. Technical Report CSE-96-11 . 1996

共引文献333

1郭肇强,周慧聪,刘释然,李言辉,陈林,周毓明,徐宝文.基于信息检索的缺陷定位:问题、进展与挑战[J].软件学报,2020(9):2826-2854. 被引量：14
2陈曙,叶俊民,刘童.一种基于领域适配的跨项目软件缺陷预测方法[J].软件学报,2020,31(2):266-281. 被引量：15
3贾燕华,李英梅.基于自适应聚类过采样的软件缺陷预测研究[J].哈尔滨师范大学自然科学学报,2023,39(2):45-50. 被引量：1
4刘文倩,杨文川.基于深度学习的高效模糊测试技术研究[J].中国科技论文在线精品论文,2021(2):160-167.
5王巧玲.基于组织层面的信息安全漏洞分析[J].中国管理信息化,2011,14(23):56-58.
6刘从虎,王志国,费志敏,唐娟,程幼明.基于ASP网络化汽车废旧零部件绿色回收模式研究[J].中国科技论坛,2012(1):49-54. 被引量：6
7朱团钦.我国风险资本市场发育的制约因素与对策分析[J].金融理论与实践,2000(3):22-24.
8李馥娟.从频发的信息泄露事件分析Web服务安全[J].信息网络安全,2012(7):83-86. 被引量：2
9李鑫,李京春,郑雪峰,张友春,王少杰.一种基于层次分析法的信息系统漏洞量化评估方法[J].计算机科学,2012,39(7):58-63. 被引量：26
10郑继栋.训练扎实指导有序──第十册《基础训练6》第五六七题教学设计[J].小学语文教学,2000(6):57-57.

同被引文献254

1林亮成,国涛,封保占.基于执行路径的模糊测试漏洞挖掘方法[J].中国新通信,2020,0(1):43-44. 被引量：3
2陈曙,叶俊民,刘童.一种基于领域适配的跨项目软件缺陷预测方法[J].软件学报,2020,31(2):266-281. 被引量：15
3梅锋,蔡子仪,陆璐.面向软件缺陷预测的树状结构编码方式[J].计算机应用研究,2020,37(S02):205-209. 被引量：2
4西格弗里德·齐林斯基,唐宏峰(采访),杨旖旎(翻译).媒介考古学:概念与方法——西格弗里德·齐林斯基访谈[J].电影艺术,2020(1):125-132. 被引量：26
5吴世忠.信息安全漏洞分析回顾与展望[J].清华大学学报（自然科学版）,2009(S2):2065-2072. 被引量：22
6石进,陆音,谢立.基于博弈理论的动态入侵响应[J].计算机研究与发展,2008,45(5):747-757. 被引量：13
7余贻鑫.电力系统安全域方法研究述评[J].天津大学学报,2008,41(6):635-646. 被引量：91
8姜伟,方滨兴,田志宏,张宏莉.基于攻防随机博弈模型的防御策略选取研究[J].计算机研究与发展,2010,47(10):1714-1723. 被引量：74
9唐和平,黄曙光,张亮.污染传播分析的漏洞利用检测算法[J].小型微型计算机系统,2010,31(11):2227-2230. 被引量：2
10王旭,陈涛,缪刚.漏洞扫描技术在电网信息安全中的作用与实践[J].电力信息化,2011,9(2):157-160. 被引量：12

引证文献45

1朱会娟,陈锦富,李致远,殷尚男.基于多特征自适应融合的区块链异常交易检测方法[J].通信学报,2021,42(5):41-50. 被引量：10
2梁俊毅,陈静.基于双向LSTM的软件漏洞自动识别方法研究[J].信息与电脑,2021,33(8):174-176. 被引量：2
3肖添明,管剑波,蹇松雷,任怡,张建锋,李宝.基于代码属性图和Bi-GRU的软件脆弱性检测方法[J].计算机研究与发展,2021,58(8):1668-1685. 被引量：6
4顾绵雪,孙鸿宇,韩丹,杨粟,曹婉莹,郭祯,曹春杰,王文杰,张玉清.基于深度学习的软件安全漏洞挖掘[J].计算机研究与发展,2021,58(10):2140-2162. 被引量：26
5邹德清,李响,黄敏桓,宋翔,李浩,李伟明.基于图结构源代码切片的智能化漏洞检测系统[J].网络与信息安全学报,2021,7(5):113-122. 被引量：4
6彭碧涛,王常吉,罗海蛟.软件漏洞分析实验教学探究[J].湖北开放职业学院学报,2021,34(20):160-162.
7张炳,文峥,赵宇轩,王苧,任家东.双粒度轻量级漏洞代码切片方法评估模型[J].通信学报,2021,42(11):233-241.
8丁俊.基于大数据技术的软件安全漏洞自动挖掘方法研究[J].太原师范学院学报（自然科学版）,2022,21(1):45-50. 被引量：5
9苏盛,汪干,刘亮,陈清清,王坤.电力物联网终端安全防护研究综述[J].高电压技术,2022,48(2):513-525. 被引量：36
10杜巧玲,罗永.铁路信号联锁故障诊断模型构建及仿真[J].自动化与仪器仪表,2022(4):38-43.

二级引证文献141

1柳谦,金海娜.“连结的翻译史”与中国电影史研究的“碎片化”[J].都市文化研究,2024(1):373-384.
2李玮瑶.基于大数据技术的网络异常检测方法[J].信息与电脑,2021,33(19):220-222. 被引量：1
3王娟娟,刘雄飞,晏榕璟.基于Ngram+Bi-GRU的多家族恶意域名检测[J].中国电子科学研究院学报,2021,16(12):1270-1275. 被引量：5
4李暖暖,陈岑,张铮,蔡军飞,常昊.电力无线终端通信接入网的安全风险分析[J].通信电源技术,2021,38(18):127-130.
5桂冠,宁金辉,王禹.半监督学习在恶意软件流量检测中的应用[J].移动通信,2022,46(4):28-32. 被引量：3
6王杨,杜君,夏攀.面向电力生产调度系统的可信计算主动免疫安全防护平台[J].工业信息安全,2022(2):68-74. 被引量：2
7冯景瑜,时翌飞.协同缓解PIoT未披露漏洞的黑板积分激励方案[J].西安邮电大学学报,2022,27(1):15-22.
8宋钊,孙骞.人工智能背景下全球关键信息基础设施安全挑战与对策[J].信息安全与通信保密,2022(6):94-101. 被引量：6
9解超.物联网设备漏洞挖掘技术探究[J].数字通信世界,2022(7):30-32.
10杨挺,蔡绍堂,闫鹏,李大帅.面向电力物联网异构信息安全的多任务调度算法[J].电力系统自动化,2022,46(15):162-170. 被引量：5

1毛子晏.对计算机软件测试技术的几点探讨[J].电脑知识与技术,2020,16(18):77-79. 被引量：7
2倪远东,张超,殷婷婷.智能合约安全漏洞研究综述[J].信息安全学报,2020,5(3):78-99. 被引量：32
3张媛.做好敏捷开发转型配置的“五个管理”[J].金融电子化,2020(3):78-80.
4赖晨智,靳小雷.上穹隆联合筋膜鞘悬吊术的研究进展[J].中华医学美学美容杂志,2020,26(3):171-174. 被引量：6
5席珍珍,宋志成,郭永刚,吴翔.光伏组件资源回收进展与前景展望[J].现代化工,2020,40(7):65-68. 被引量：3
6张尚韬.蓝牙OBEX协议分析[J].电脑知识与技术,2020,16(16):45-47.
7韦喜忠,金建海,王墨伟,赵峰.面向船舶总体性能预报APP研制的GJB 5000A应用方案[J].船舶标准化工程师,2020,53(4):5-10. 被引量：4
8李腾飞,张静,王少飞,刘一龙.即插即用机制的软件无线电系统嵌入式中间件技术研究[J].电子世界,2020(6):133-136. 被引量：1
9张习文.GEMS项目管理系统在大型软件开发管理中的应用[J].软件,2020,41(6):127-131. 被引量：1
10梁涛,程立钦,姜文,王剑峰.基于改进Murphy规则的锅炉智能融合故障诊断方法[J].中国测试,2020,46(7):133-140. 被引量：4

软件学报

2020年第7期

浏览历史

内容加载中请稍等...

基于机器学习的软件漏洞挖掘方法综述被引量：45

参考文献14

二级参考文献298

共引文献333

同被引文献254

引证文献45

二级引证文献141

相关作者

相关机构

相关主题

浏览历史

基于机器学习的软件漏洞挖掘方法综述 被引量：45

参考文献14

二级参考文献298

共引文献333

同被引文献254

引证文献45

二级引证文献141

相关作者

相关机构

相关主题

浏览历史

基于机器学习的软件漏洞挖掘方法综述被引量：45