文献详情 >深度卷积的软硬件协同优化设计与实现收藏

深度卷积的软硬件协同优化设计与实现

作者：齐豪刘少礼李威 QI Hao;LIU Shaoli;LI Wei

作者机构：中国科学技术大学计算机科学与技术学院合肥230026 上海寒武纪信息科技有限公司上海201306 中国科学院计算技术研究所处理器芯片国家重点实验室北京100190

基　　金：国家重点研发计划(2020AAA0103802) 国家自然科学基金(61732002,61925208,61732007,61906179,U20A20227) 中国科学院战略性先导科技专项(XDBS01050200) 北京智源人工智能研究院和中国科学院青年创新促进会和科学探索奖资助项目

出版物：《高技术通讯》 (Chinese High Technology Letters)

年卷期：2022年第32卷第7期

页码：696-707页

摘要：近年来,深度学习技术被广泛应用。由于移动设备同时受到算力和功耗的限制,很多轻量级的网络被提出,比如Xception、MobileNet系列等。在这些轻量级网络中,深度卷积的层数占网络中所有卷积层数的31%~50%,故如何优化深度卷积的运算是一个值得研究的问题。通用中央处理器(CPU)、固定运算器长度的单指令多数据流(SIMD)处理器均无法高效处理神经网络中的各种规模的深度卷积,性能较低。针对这一问题,本文提出了一种软硬件结合的方法优化深度卷积的计算,通过一个多种权值传输模式的硬件架构设计,结合软件模式选择、数据拆分等优化方式,在提高运算效率的同时减少了访存量。实验结果表明,使用该方法实现的深度卷积加速器,相比通用CPU最大可达9.3倍的性能加速,相比运算器长度为64的单核SIMD处理器最大可达29.3倍的性能加速。

主题词：神经网络深度卷积加速器软硬件协同优化计算效率

学科分类：12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类]

D　O　I：10.3772/j.issn.1002-0470.2022.07.004

馆藏号：203114478...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

深度卷积的软硬件协同优化设计与实现

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

深度卷积的软硬件协同优化设计与实现

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：