期刊文献+

融合注意力机制和Child-Sum Tree-LSTM的二进制代码相似性检测

Binary code similarity detection via attention mechanism and Child-Sum Tree-LSTM
下载PDF
导出
摘要 抽象语法树是一种代码的树型表示,它保留了代码中定义良好的语句组件、语句的显式顺序和执行逻辑。包含丰富语义信息的抽象语法树可以在二进制分析时通过反编译生成,并且已经作为代码特征应用于二进制代码相似度检测。抽象语法树中不同类别的节点承载着不同的语义信息,对整棵树的语义具有不同的贡献程度。然而现有的二进制代码相似度检测方法所用神经网络无法对抽象语法树节点进行重要性区分,影响了模型的训练效果。针对该问题,提出了一种融合注意力机制和Child-Sum Tree-LSTM神经网络的跨指令集、跨代码混淆二进制代码相似性检测方法。首先使用二进制分析工具IDA Pro对二进制代码反编译提取架构无关的抽象语法树特征,并利用随机采样构造训练样本对。然后使用抽象语法树训练样本对训练融合注意力机制和Child-Sum Tree-LSTM的神经网络模型。在公开数据集BINKIT上的实验表明,所提方法的AUC和Accuracy指标分别为94.1%、66.2%,优于Child-Sum Tree-LSTM算法。 syntax tree features.Evaluation results on the public dataset BINKIT show that the method achieves an AUC(Area Under the Curve)of 94.1%and an accuracy of 66.2%,outperforming the Child-Sum Tree-LSTM algorithm.
作者 李涛 王金双 Li Tao;Wang Jinshuang(Command&Control Engineering College,Army Engineering University of PLA,Nanjing 210007,China)
出处 《网络安全与数据治理》 2023年第11期8-14,34,共8页 CYBER SECURITY AND DATA GOVERNANCE
关键词 二进制代码 相似性检测 注意力机制 Child-Sum Tree-LSTM binary code similarity detection attention mechanism Child-Sum Tree-LSTM
  • 相关文献

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部