看过本文的还看了

相关文献

该作者的其他文献

文献详情 >深度卷积的软硬件协同优化设计与实现 收藏
深度卷积的软硬件协同优化设计与实现

深度卷积的软硬件协同优化设计与实现

作     者:齐豪 刘少礼 李威 QI Hao;LIU Shaoli;LI Wei

作者机构:中国科学技术大学计算机科学与技术学院合肥230026 上海寒武纪信息科技有限公司上海201306 中国科学院计算技术研究所处理器芯片国家重点实验室北京100190 

基  金:国家重点研发计划(2020AAA0103802) 国家自然科学基金(61732002,61925208,61732007,61906179,U20A20227) 中国科学院战略性先导科技专项(XDBS01050200) 北京智源人工智能研究院和中国科学院青年创新促进会和科学探索奖资助项目 

出 版 物:《高技术通讯》 (Chinese High Technology Letters)

年 卷 期:2022年第32卷第7期

页      码:696-707页

摘      要:近年来,深度学习技术被广泛应用。由于移动设备同时受到算力和功耗的限制,很多轻量级的网络被提出,比如Xception、MobileNet系列等。在这些轻量级网络中,深度卷积的层数占网络中所有卷积层数的31%~50%,故如何优化深度卷积的运算是一个值得研究的问题。通用中央处理器(CPU)、固定运算器长度的单指令多数据流(SIMD)处理器均无法高效处理神经网络中的各种规模的深度卷积,性能较低。针对这一问题,本文提出了一种软硬件结合的方法优化深度卷积的计算,通过一个多种权值传输模式的硬件架构设计,结合软件模式选择、数据拆分等优化方式,在提高运算效率的同时减少了访存量。实验结果表明,使用该方法实现的深度卷积加速器,相比通用CPU最大可达9.3倍的性能加速,相比运算器长度为64的单核SIMD处理器最大可达29.3倍的性能加速。

主 题 词:神经网络 深度卷积 加速器 软硬件协同优化 计算效率 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.3772/j.issn.1002-0470.2022.07.004

馆 藏 号:203114478...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分