源代码漏洞静态分析技术被引量：4

Vulnerability Detection In Source Code Using Statice Analysis

下载PDF

导出

摘要漏洞这一名词伴随着计算机软件领域的发展已经走过了数十载。自世界上第一个软件漏洞被公开以来,软件安全研究者和工程师们就一直在探索漏洞的挖掘与分析方法。源代码漏洞静态分析是一种能够贯穿整个软件开发生命周期的、帮助软件开发人员及早发现漏洞的技术,在业界有着广泛的使用。然而,随着软件的体量越来越大,软件的功能越来越复杂,如何表示和建模软件源代码是当前面临的一个难题;此外,近年来的研究倾向于将源代码漏洞静态分析和机器学习相结合,试图通过引入机器学习模型提升漏洞挖掘的精度,但如何选择和构建合适的机器学习模型是该研究方向的一个核心问题。本文将目光聚焦于源代码漏洞静态分析技术(以下简称:静态分析技术),通过对该领域相关工作的回顾,将静态分析技术的研究分为两个方向:传统静态分析和基于学习的静态分析。传统静态分析主要是利用数据流分析、污点分析等一系列软件分析技术对软件的源代码进行建模分析;基于学习的静态分析则是将源代码以数值的形式表示并提交给学习模型,利用学习模型挖掘源代码的深层次表征特征和关联性。本文首先阐述了软件漏洞分析技术的基本概念,对比了静态分析技术和动态分析技术的优劣;然后对源代码的表示方法进行了说明。接着,本文对传统静态分析和基于学习的静态分析的一般步骤进行了总结,同时对这两个研究方向典型的研究成果进行了系统地梳理,归纳了它们的技术特点和工作流程,提出了当前静态分析技术中存在的问题,并对该方向上未来的研究工作进行了展望。 The term vulnerability has gone through several decades with the development of the computer software field.Since the first software vulnerability in the world was made public,software security researchers and engineers have been exploring the methods of vulnerability mining and analysis.The static analysis of source code vulnerability is a technology that can run through the whole software development life cycle and help software developers find software vulnerabilities early.It is widely used in the industry.However,with the increasing volume and complexity of software,how to represent and model the software source code is a difficult problem at present.In addition,in recent years,researchers tend to com-bine static analysis of source code vulnerabilities with machine learning,trying to improve the accuracy of vulnerability mining by introducing machine learning model.Nonetheless,how to select and build a suitable machine learning model is a core issue in this research direction.This paper focuses on the static analysis technology of source code vulnerability(hereinafter referred to as static analysis technology),and reviews the related work in this field.The research of static analysis technology is divided into two directions:traditional static analysis and learning-based static analysis.Traditional static analysis mainly uses a series of software analysis technologies such as data flow analysis and taint analysis to model and analyze the source code of the software;learning-based static analysis represents the source code in numerical form and submits it to the learning model,then using the learning model to mine the deep representation features and relevance of the source code.This paper first expounds the basic concepts of software vulnerability analysis technology,and com-pares the advantages and disadvantages of static analysis technology and dynamic analysis technology.Next,the representation method of the source code is explained.After that,this paper summarizes the general steps of traditional static analysis and learning-based static analysis,and systematically combs the typical research results of these two research directions,summarizes their technical characteristics and workflow,puts forward the existing problems in the current static analysis technology,and looks forward to the future research work in these directions.

作者刘嘉勇韩家璇黄诚 LIU Jiayong;HAN Jiaxuan;HUANG Cheng(School of Cyber Science and Engineering,Sichuan University,Chengdu 610207,China)

机构地区四川大学网络空间安全学院

出处《信息安全学报》 CSCD 2022年第4期100-113,共14页 Journal of Cyber Security

基金国家自然科学基金资助项目(No.61902265) 四川省科技厅重点研发资助项目(No.2020YFG0047,No.2020YFG0076)资助.

关键词源代码漏洞静态分析数据流分析污点分析机器学习 source code vulnerability static analysis dataflow analysis taint analysis machine learning

分类号 TP312 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1邹权臣,张涛,吴润浦,马金鑫,李美聪,陈晨,侯长玉.从自动化到智能化:软件漏洞挖掘技术进展[J].清华大学学报（自然科学版）,2018,58(12):1079-1094. 被引量：39
2叶志斌,严波.符号执行研究综述[J].计算机科学,2018,45(B06):28-35. 被引量：19
3陈肇炫,邹德清,李珍,金海.基于抽象语法树的智能化漏洞检测系统[J].信息安全学报,2020,5(4):1-13. 被引量：10
4胡英杰,张琳琳,赵楷,方文波,于媛尔.基于静态污点分析的Android隐私泄露检测方法研究[J].信息安全学报,2020,5(5):144-151. 被引量：6
5王蕾,李丰,李炼,冯晓兵.污点分析技术的原理和实践应用[J].软件学报,2017,28(4):860-882. 被引量：48
6李韵,黄辰林,王中锋,袁露,王晓川.基于机器学习的软件漏洞挖掘方法综述[J].软件学报,2020,31(7):2040-2061. 被引量：45

二级参考文献26

1吴世忠.信息安全漏洞分析回顾与展望[J].清华大学学报（自然科学版）,2009(S2):2065-2072. 被引量：22
2陈聪明,霍玮,于洪涛,冯晓兵.基于包含的指针分析优化技术综述[J].计算机学报,2011,34(7):1224-1238. 被引量：10
3王雷,陈归,金茂忠.基于约束分析与模型检测的代码安全漏洞检测方法研究[J].计算机研究与发展,2011,48(9):1659-1666. 被引量：6
4吴世忠,郭涛,董国伟,王嘉捷.软件漏洞分析技术进展[J].清华大学学报（自然科学版）,2012,52(10):1309-1319. 被引量：29
5刘云龙.基于Token的结构化匹配同源性代码检测技术研究[J].计算机应用研究,2014,31(6):1841-1845. 被引量：6
6张玉清,王凯,杨欢,方喆君,王志强,曹琛.Android安全综述[J].计算机研究与发展,2014,51(7):1385-1396. 被引量：94
7邹权臣,张涛,吴润浦,马金鑫,李美聪,陈晨,侯长玉.从自动化到智能化:软件漏洞挖掘技术进展[J].清华大学学报（自然科学版）,2018,58(12):1079-1094. 被引量：39
8朱波,郑虹,孙琳琳,杨友星.基于AST的程序代码相似性度量研究[J].吉林大学学报（信息科学版）,2015,33(1):99-104. 被引量：6
9李舟军,张俊贤,廖湘科,马金鑫.软件安全漏洞检测技术[J].计算机学报,2015,38(4):717-732. 被引量：76
10陈翔,顾庆,刘望舒,刘树龙,倪超.静态软件缺陷预测方法研究[J].软件学报,2016,27(1):1-25. 被引量：123

共引文献142

1刘文倩,杨文川.基于深度学习的高效模糊测试技术研究[J].中国科技论文在线精品论文,2021(2):160-167.
2周航,方勇,黄诚,刘亮,陈兴刚.针对PHP应用的二阶漏洞检测方法[J].信息安全研究,2018,4(4):380-386. 被引量：1
3王夏菁,胡昌振,马锐,高欣竺.二进制程序漏洞挖掘关键技术研究综述[J].信息网络安全,2017(8):1-13. 被引量：14
4达小文,毛俐旻,吴明杰,郭敏.一种基于补丁比对和静态污点分析的漏洞定位技术研究[J].信息网络安全,2017(9):5-9. 被引量：3
5帅训波.软件安全设计与检测方法概述[J].石油工业计算机应用,2017,25(2):21-25.
6唐枭.基于动态污点分析的反馈式模糊测试改进方法[J].信息安全研究,2019,5(2):145-151. 被引量：3
7李珍,邹德清,王泽丽,金海.面向源代码的软件漏洞静态检测综述[J].网络与信息安全学报,2019,5(1):1-14. 被引量：22
8陈家浩,王轶骏,吕诚.一种基于Python符号执行的自动化网络攻击流量获取方法[J].计算机应用与软件,2019,36(2):294-307. 被引量：3
9刘明聪,王娜,周宁.基于依赖分析的云组合服务信息流控制机制[J].计算机科学,2019,46(4):189-196. 被引量：1
10段斌,李兰,赖俊,詹俊.基于动态污点分析的工控设备硬件漏洞挖掘方法研究[J].信息网络安全,2019(4):47-54. 被引量：2

同被引文献16

1吴海燕,苗春雨,刘启新,孙方成.Web应用系统安全评测研究[J].计算机安全,2008(4):44-46. 被引量：13
2田立军.渗透性测试技术及方法研究[J].铁路计算机应用,2015,24(2):8-12. 被引量：4
3黄显果,王鹏,刘静静,张超永.基于工具检测的源代码静态测试技术研究[J].电脑编程技巧与维护,2019(5):17-20. 被引量：3
4肖芫莹,游耀东,向黎希.代码审计系统的误报率成因和优化[J].电信科学,2020,36(12):155-162. 被引量：4
5李凡长,刘洋,吴鹏翔,董方,蔡奇,王哲.元学习研究综述[J].计算机学报,2021,44(2):422-446. 被引量：68
6赵凯琳,靳小龙,王元卓.小样本学习研究综述[J].软件学报,2021,32(2):349-369. 被引量：146
7张协力,祝跃飞,顾纯祥,陈熹.C2P:基于Pi演算的协议C代码形式化抽象方法和工具[J].软件学报,2021,32(6):1581-1596. 被引量：3
8李炯彬.源代码安全和质量缺陷静态检测技术研究[J].质量与认证,2021(8):66-68. 被引量：4
9冯光升,张熠哲,孙嘉钰,吕宏武.计算机系统漏洞自动化利用研究关键技术及进展[J].信息网络安全,2022(3):39-52. 被引量：6
10王建东.Web应用开源软件安全漏洞风险应急研究[J].电子技术与软件工程,2022(12):66-69. 被引量：3

引证文献4

1葛艺,黄文超,熊焰.基于安全协议代码的形式化辅助建模研究[J].计算机应用研究,2023,40(4):1189-1193. 被引量：2
2刘鹏,代昌盛.计算机软件安全漏洞检测技术与应用路径[J].软件,2024,45(2):167-170. 被引量：1
3陈洪森,方勇,郝城凌,杨运涛,张棋.基于小样本学习的源码漏洞检测[J].信息安全研究,2024,10(5):440-445.
4郑军.铁路应用系统源代码安全检测方案研究[J].铁路计算机应用,2024,33(10):73-77.

二级引证文献3

1缪祥华,黄明巍,张世奇,张世杰,王欣源.安全协议形式化分析方法研究综述[J].化工自动化及仪表,2024,51(3):367-378.
2邓昆朋,沙乐天,潘家晔.Apple系统漏洞分析技术研究[J].软件,2024,45(4):15-19.
3马连志,李凯勇.基于物联网的电镀铬镍混合废水浓度监控系统[J].电镀与精饰,2024,46(7):76-82. 被引量：1

1周炫余,李璇,陈圆圆,刘林,卢笑.联合知识图谱和时间特性的数学知识自动推荐方法[J].武汉大学学报（理学版）,2021,67(6):539-546. 被引量：3
2孙仁杰,贾晓丽.基于思维过程的英语文学阅读思维型课堂教学建构[J].环球首映,2020(3):65-65.
3张红梅,李浩然,张向利.基于重要性池化的层级图表示学习方法[J].桂林电子科技大学学报,2020,40(4):300-304. 被引量：2
4耿浩天.一种基于设备状态变化规避Android动态分析的方法[J].现代计算机,2022,28(8):9-15.
5严超,周悦,张孟.基于SSDLC的安全需求分析研究[J].网信军民融合,2022(2):26-30. 被引量：1
6郭军军,王乐,王正源,姚大春,王长元.软件安全漏洞知识图谱构建方法[J].计算机工程与设计,2022,43(8):2137-2145. 被引量：6
7王雪,王娟,胡仁青.基于数据挖掘的机器英语翻译模型研究[J].电子设计工程,2022,30(15):167-171. 被引量：2

信息安全学报

2022年第4期

浏览历史

内容加载中请稍等...

源代码漏洞静态分析技术被引量：4

参考文献6

二级参考文献26

共引文献142

同被引文献16

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

源代码漏洞静态分析技术 被引量：4

参考文献6

二级参考文献26

共引文献142

同被引文献16

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

源代码漏洞静态分析技术被引量：4