基于植入特征的网页恶意代码检测被引量：5

Web page malicious code detection based on embedded fingerprints

导出

摘要 Web网站已成为黑客的主要攻击目标。基于代码特征签名对网页恶意代码进行检测的方法特征库的维护工作量较大,而基于Honeypot的方法效率较差。黑客在植入网页恶意代码时往往使代码在显示效果上不易被浏览者发现。该文针对这一特征设计了一种检测方法,在对各种恶意代码植入方法分析的基础上,归纳出了6种植入特征,并实现了一个原型系统。原型系统实现了一个包含脚本解释执行功能的Web爬虫来获取目标页面,通过HTML解析获得可供检测的标签,将其与植入特征进行匹配以发现恶意代码。与传统检测方法相比,该方法所依赖的特征数量少,检测效率高。对60个真实站点的检测结果表明,原型系统仅有2.63%的漏报率和1.99%的误报率。 Web sites have become the main targets of many attackers.Signature-based detection needs to maintain a large signature database and Honeypot based methods are not efficient.Since attackers always make the malicious codes in Web pages difficult to detect by the browser users,their methods can be classified into various fingerprints.Various malicious codes were analyzed to identify 6 types of fingerprints.The system utilizes a spider integrated with script interpretation to fetch target Web pages and extract specific tags for detection by HTML parsing for matching with the fingerprints to detect malicious codes.This method needs fewer fingerprints than traditional detection methods and is more efficient.Results for 60 websites show that the system has a false negative rate of 2.63% and a false positive rate of 1.99%.

作者黄建军梁彬

机构地区中国人民大学信息学院数据工程与知识工程教育部重点实验室

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2009年第S2期2208-2214,共7页 Journal of Tsinghua University(Science and Technology)

基金国家自然科学基金资助项目(60873213) 北京市自然科学基金资助项目(4082018) 国家"八六三"高技术项目(2007AA01Z414)

关键词网页恶意代码检测植入特征 Web pages malicious codes detection embedding fingerprints

分类号 TP393.08 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献12

1吴润浦,方勇,吴少华.基于统计与代码特征分析的网页木马检测模型[J].信息与电子工程,2009,7(1):71-75. 被引量：15
2Honeypot.. http://en.wikipedia.org/wiki/Honeypot_ (computing) . 2009
3Capture-HPC.. https://projects.honeynet.org/capture-hpc/ . 2009
4Wang Y,Beck D,Jiang X,et al.Automated web patrol withstrider Honey Monkeys:Finding web sites that exploitbrowser vulnerabilities. Proc the 13th Network andDistributed System Security Symposium (NDSS 2006) . 2006
5Provos N,McNamee D,Mavrommatis P,et al.The ghost inthe browser:analysis of web-based mal ware. Proc FirstWorkshop on Hot Topics in Understanding Botnets . 2007
6Moshchuk A,Bragin T,Gribble S D,et al.Acrawler-basedstudy of spyware on the web. Proc the 13th Networkand Distributed Systems Security Symposium (NDSS 2006) . 2006
7Seifert C,Welch I,Komisarczuk P.HoneyC—Thelow-interaction client Honeypot. Proc the 5th NewZealand Computer Science Research Student Conference (NZCSRSC 07) . 2007
8Roesch,M.Snort—lightweight intrusion detection fornetworks. Proc the 13th Large Systems AdministrationConference . 1999
9Trends in badware 2007.. http://www.stopbadware.org/home/trends2007 . 2009
10HTML Parser. http://ht mlparser.sourceforge.net/ . 2009

二级参考文献6

1王海峰,段友祥,刘仁宁.基于行为分析的病毒检测引擎的改良研究[J].计算机应用,2004,24(B12):109-110. 被引量：12
2何申,张四海,王煦法,马建辉,曹先彬.网络脚本病毒的统计分析方法[J].计算机学报,2006,29(6):969-975. 被引量：11
3Rabek J C,Roger I.Detection of injected,dynamically generated and obfuscated malicious code[C]// Proceedings of the 2003 ACM Workshop on Rapid Malcode.2003:76-82.
4张昊,陶然,李志勇,等.网页恶意脚本检测方法研究[C]// 全国网络与信息安全技术研讨会.2007:84-90.
5Hofmeyr S,Forrest S.Immunity by design:An artificial im2mune system[C]// Proceedings of the Genetic and Evolutionary Computation Conference.2003:1-10.
6许一震,王永成,沈洲.一种快速的多模式字符串匹配算法[J].上海交通大学学报,2002,36(4):516-520. 被引量：29

共引文献14

1王西芳,高宏.网页挂马技术初探及预防对策[J].实验室研究与探索,2010,29(3):73-75. 被引量：4
2方刚.对网站被挂马的分析与防范[J].实验室研究与探索,2010,29(7):71-74. 被引量：2
3胡明,刘嘉勇,刘亮.一种基于代码特征的网页木马改良模型研究[J].通信技术,2010,43(8):155-157. 被引量：3
4杨继武.浅谈如何来加固服务器防网络被挂马[J].中国科技纵横,2011(20):134-134.
5刘忆宁,杨阳,周永华.远程端挂马检测系统的设计与开发[J].信息网络安全,2012(9):15-17. 被引量：1
6孙飞帆,施勇,薛质.基于权重分析的网页木马检测模型[J].信息安全与通信保密,2012,10(12):109-111. 被引量：1
7马立军.基于行为检测的窃密型木马检测研究[J].广西民族大学学报（自然科学版）,2014,20(2):70-74. 被引量：4
8夏爱民,张宏志,杨伟锋.基于综合行为特征的木马检测技术研究[J].信息安全与通信保密,2014,12(6):109-113. 被引量：4
9赵莉,凌翔.网页恶意代码检测系统研究[J].电子设计工程,2015,23(5):25-27.
10郑生军,郭龙华,李建华,王红凯,刘昀.基于云平台的网站安全多维监测系统[J].计算机与现代化,2016(1):39-45. 被引量：5

同被引文献27

1http ://user. qzone, qq. com/95007917/blog/1274004740.
2M. Johns. On javascript malware and related threats[C]. Computer Virology, Jan 2008.
3Egele. M, E. Kirda, and C. Kruegel. Defending browsers against drive-by downloads: Mitigating heap-spra- ying code injection attacks. Detection of Intrusions and Malware, Jan 2009.
4Hallaraker. O and G. Vigna. Detecting malicious javascript code in mozilla. Engineering of Complex Com- puter Systems, Jan 2005.
5Reis C,Dunagany J,Wang H J, et al. BrowserShield: Vulnerability-driven filtering of dynamic HTML[J]. ACM Transactions on the Web,2007,3(1) :11.
6Seifert, I. Welch, and P. Komisarczuk. Identification of malicious web pages with static heuristics[C]. In Australasian Telecommunication Networks and Applications Conference, Jan 2008.
7Craioveanu. Server-side polymorphism: Techniques of analysis and defense. [C] In 3rd International Confer- ence on Malicious and Unwanted Software,2008.
8http: //www. alexa, com/topsites.
9Google, Inc. Google safe browsing API. http://code, google, com/apis/ safebrowsing /.
10Peter Likarish, Eunjin (EJ) Jung, and Insoon Jo. In The 4th International Malicious and Unwanted Soft- ware (Malware 2009) ,October 2009.

引证文献5

1李洋,刘飚,封化民.基于机器学习的网页恶意代码检测方法[J].北京电子科技学院学报,2012,20(4):36-40. 被引量：5
2赵莉,凌翔.网页恶意代码检测系统研究[J].电子设计工程,2015,23(5):25-27.
3朴杨鹤然,任俊玲.基于Stacking的恶意网页集成检测方法[J].计算机应用,2019,39(4):1081-1088. 被引量：7
4黄子依,秦玉海.基于多特征识别的恶意挖矿网页检测及其取证研究[J].信息网络安全,2021(7):87-94. 被引量：5
5刘武,李风华,段海新,孙东红,王继龙,吴海燕,刘沐,张龙.校园网挖矿行为自动识别处置系统[J].福州大学学报（自然科学版）,2023,51(5):657-661.

二级引证文献17

1陈庄,刘龙飞.融合域名注册信息的恶意网站检测方法研究[J].计算机光盘软件与应用,2015,18(1):121-122.
2张瀚珑,沈备军,王永剑.基于模板检测的违法网站识别方法[J].南京理工大学学报,2015,39(3):266-271. 被引量：5
3杨洪娇.基于机器学习的校园网恶意网页检测方法[J].信息与电脑,2016,28(11):175-176. 被引量：2
4凡友荣,杨涛,王永剑,姜国庆.基于URL特征检测的违法网站识别方法[J].计算机工程,2018,44(3):171-177. 被引量：8
5骆子铭,许书彬,刘晓东.基于机器学习的TLS恶意加密流量检测方案[J].网络与信息安全学报,2020,6(1):77-83. 被引量：16
6陈本刚,宋礼鹏.网页内容链接层次语义树的恶意网页检测方法[J].计算机工程与应用,2020,56(11):90-97. 被引量：2
7刘天一,张汝娴,袁艺,邢韦川,林清然,周延森.基于机器学习的网站识别方案[J].网络安全技术与应用,2020(7):62-63. 被引量：1
8刘媛媛,赵希庆.基于Stacking的钢板表面颜色预测[J].计算机时代,2020(8):65-68.
9徐国天,沈耀童.基于XGBoost与Stacking融合模型的恶意程序多分类检测方法[J].信息网络安全,2021(6):52-62. 被引量：8
10张露,刘家鹏,田冬梅.基于Stacking-Bagging-Vote多源信息融合模型的财务预警应用[J].计算机应用,2022,42(1):280-286. 被引量：2

1文凯,何小东.一种基于网络爬虫的跨站脚本漏洞检测方法[J].电脑编程技巧与维护,2012(24):121-123. 被引量：3
2警惕Android扣费门[J].微电脑世界,2011(2):116-116.
3钟春琳,司方豪.一种基于网络爬虫解析HTML的网络热词获取方法[J].电脑编程技巧与维护,2014(12):96-97. 被引量：1
4夏飞,丁胜,孟振南,汤叶舟,谢景文.基于云计算平台的HTML解析系统的设计与实现[J].现代计算机,2015,21(1):42-44. 被引量：1
5肖毅,张林,聂笑一.基于WEB挖掘的网络爬虫设计与实现[J].计算机系统应用,2013,22(9):60-63. 被引量：9
6朱远毅,董道国,金城.一种基于多特征签名的图像检索系统[J].计算机应用与软件,2011,28(7):82-85. 被引量：6
7刘美芹,方敏.基于代码植入的协议测试研究[J].电子科技,2007,20(2):46-50.
8王进科,张爽,王莹.基于Web的工作流物资管理系统研究与实现[J].信息技术与信息化,2015(7):172-173. 被引量：1
9赵海,马殿富,怀进鹏,李巍,张晗立.一种基于Web的工作流系统的设计与实现[J].北京航空航天大学学报,2001,27(4):456-460. 被引量：25
10林雪明.基于Delphi语言的多媒体CAI系统设计[J].宁波大学学报（理工版）,2000,13(2):61-65. 被引量：1

清华大学学报（自然科学版）

2009年第S2期

浏览历史

内容加载中请稍等...

基于植入特征的网页恶意代码检测被引量：5

参考文献12

二级参考文献6

共引文献14

同被引文献27

引证文献5

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于植入特征的网页恶意代码检测 被引量：5

参考文献12

二级参考文献6

共引文献14

同被引文献27

引证文献5

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于植入特征的网页恶意代码检测被引量：5