看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向深度神经网络加速芯片的高效硬件优化策略 收藏
面向深度神经网络加速芯片的高效硬件优化策略

面向深度神经网络加速芯片的高效硬件优化策略

作     者:张萌 张经纬 李国庆 吴瑞霞 曾晓洋 ZHANG Meng;ZHANG Jingwei;LI Guoqing;WU Ruixia;ZENG Xiaoyang

作者机构:东南大学电子学院国家专用集成电路系统工程技术研究中心南京210096 复旦大学专用集成电路与系统国家重点实验室上海200433 

基  金:国家重点研发计划(2018YFB2202703) 江苏省自然科学基金(BK20201145) 

出 版 物:《电子与信息学报》 (Journal of Electronics & Information Technology)

年 卷 期:2021年第43卷第6期

页      码:1510-1517页

摘      要:轻量级神经网络部署在低功耗平台上的解决方案可有效用于无人机(UAV)检测、自动驾驶等人工智能(AI)、物联网(IOT)领域,但在资源有限情况下,同时兼顾高精度和低延时来构建深度神经网络(DNN)加速器是非常有挑战性的。该文针对此问题提出一系列高效的硬件优化策略,包括构建可堆叠共享计算引擎(PE)以平衡不同卷积中数据重用和内存访问模式的不一致;提出了可调的循环次数和通道增强方法,有效扩展加速器与外部存储器之间的访问带宽,提高DNN浅层网络计算效率;优化了预加载工作流,从整体上提高了异构系统的并行度。经Xilinx Ultra96 V2板卡验证,该文的硬件优化策略有效地改进了iSmart3-SkyNet和SkrSkr-SkyNet类的DNN加速芯片设计。结果显示,优化后的加速器每秒处理78.576帧图像,每幅图像的功耗为0.068 J。

主 题 词:深度神经网络 目标检测 神经网络加速器 低功耗 硬件优化 

学科分类:0808[工学-自动化类] 0809[工学-计算机类] 080902[080902] 08[工学] 

核心收录:

D O I:10.11999/JEIT210002

馆 藏 号:203103589...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分