看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度学习的Linux内核引用计数字段识别方法 收藏
基于深度学习的Linux内核引用计数字段识别方法

基于深度学习的Linux内核引用计数字段识别方法

作     者:谈心 杨悉瑜 曹家俊 张源 TAN Xin;YANG Xi-Yu;CAO Jia-Jun;ZHANG Yuan

作者机构:复旦大学计算机科学技术学院上海201203 

基  金:国家自然科学基金(U1836210,U1836213,U1736208,61972099,62172105) 上海自然科学基金(19ZR1404800) 上海市青年科技启明星计划(21QA1400700) 

出 版 物:《软件学报》 (Journal of Software)

年 卷 期:2022年第33卷第6期

页      码:2030-2046页

摘      要:引用计数机制是现代软件中一种常见的内存管理技术.引用计数错误往往会导致内存泄露、释放后使用(useafterfree)等严重的安全问题.现有致力于提高引用计数安全性的工作都依赖于对引用计数的字段进行识别.然而,由于类似于Linux等软件系统的代码十分复杂,在代码中识别出引用计数字段是一项十分困难的工作.传统的基于代码模式匹配的引用计数字段识别方法一方面存在需要专家经验总结规则,人工开销大的问题;另一方面存在总结的模式无法覆盖所有情况,召回率较低等局限.针对这些问题,发现与字段有关的代码行为以及字段的名称可以用来表征这个字段的特征,帮助识别引用计数字段.基于这两个层面的特征,设计了一种基于多模态深度学习的引用计数字段识别方法,并面向Linux内核实现原型系统.测试数据表明:该原型系统的精确率、召回率分别为96.98%和93.54%,而传统的基于代码模式匹配的方法没有识别出任何引用计数字段.此外,在Linux内核上发现61个引用计数字段使用不安全的数据类型,并对其中21个向Linux内核社区提交数据类型转换补丁以提高引用计数字段的安全性,其中6个已经被合并到Linux内核代码主分支.

主 题 词:引用计数识别 静态程序分析 多模态深度学习 

学科分类:0710[理学-生物科学类] 08[工学] 0835[0835] 0812[工学-测绘类] 081202[081202] 

核心收录:

D O I:10.13328/j.cnki.jos.006567

馆 藏 号:203112007...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分