看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于专用卷积神经网络加速器的编译器设计与实现 收藏
基于专用卷积神经网络加速器的编译器设计与实现

基于专用卷积神经网络加速器的编译器设计与实现

作     者:焦禹铭 吴凯 郭风祥 王昭 宋庆增 JIAO Yuming;WU Kai;GUO Fengxiang;WANG Zhao;SONG Qingzeng

作者机构:天津工业大学计算机科学与技术学院天津300387 天津工业大学电气工程学院天津300387 中国电子科技集团公司信息科学研究院北京100086 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2022年第42卷第S1期

页      码:208-214页

摘      要:不同框架深度学习模型部署是人工智能落地的核心,然而模型计算量和参数量过大、编程模型未统一导致了各种新型的专用卷积神经网络(CNN)加速器层出不穷,增加了模型的部署难度。对模型压缩和编译工具链这两个方面进行了改进:在模型压缩方面,提出新的通道剪枝标准,结合了通道的相关性和影响性以及输出通道对应的激活值,在保证精度的同时可以极大地削减卷积神经网络的计算量和参数量;在编译工具链方面,设计了一套自动的端到端优化堆栈,提出了针对基于现场可编程门阵列(FPGA)的深度学习编译器设计方法,并在中间表示中添加了所提出的排序标准的剪枝算法。实验结果表明,所设计的编译器于舰船目标检测的任务中,在通用设备上,保证精度损失不超过1%的情况下取得了1.3倍的加速效果;在专用的CNN加速器上取得了1.6倍的加速效果,在部署中能够有效地针对卷积网络进行加速。

主 题 词:现场可编程门阵列 模型压缩 深度学习编译器 中间表示 目标检测 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

D O I:10.11772/j.issn.1001-9081.2021081407

馆 藏 号:203113532...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分