看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于代码嵌入的二进制代码相似性分析方法 收藏
基于代码嵌入的二进制代码相似性分析方法

基于代码嵌入的二进制代码相似性分析方法

作     者:熊敏 薛吟兴 徐云 Xiong Min;Xue Yinxing;Xu Yun

作者机构:中国科学技术大学计算机科学与技术学院安徽合肥230026 安徽省高性能计算重点实验室安徽合肥230026 

基  金:国家自然科学基金项目(61672480,61972373) 教育部和外专局高等学校学科创新引智计划项目(B0703308) 

出 版 物:《网络安全与数据治理》 (CYBER SECURITY AND DATA GOVERNANCE)

年 卷 期:2023年第42卷第3期

页      码:58-67页

摘      要:代码嵌入利用神经网络模型将二进制函数的代码表示转化为向量,在漏洞搜索等应用中展现了优势。现有的方法将函数表示为汇编指令序列、控制流图的拓扑结构或若干路径,都没有克服不同编译环境导致控制流图结构变化的干扰。为此,设计了基于基本块树(Basic Block Tree, BBT)的代码表示以及构建了对应的代码嵌入模型BBTree。首先,二进制函数被表示为一系列BBT,每个BBT被处理为指令序列;其次,BBTree利用LSTM和Bi-GRU将基于BBT的代码表示转化为向量;最后,通过计算向量间的距离去高效衡量对应函数的相似性。在代码搜索中,BBTree的平均准确率比主流工具提升了24.8%;在漏洞搜索中,BBTree的平均召回率比主流工具提升了26.1%。

主 题 词:代码表示 代码嵌入模型 代码搜索 漏洞搜索 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

D O I:10.19358/j.issn.2097-1788.2023.03.010

馆 藏 号:203121090...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分