文献详情 >基于专用卷积神经网络加速器的编译器设计与实现收藏

基于专用卷积神经网络加速器的编译器设计与实现

作者：焦禹铭吴凯郭风祥王昭宋庆增 JIAO Yuming;WU Kai;GUO Fengxiang;WANG Zhao;SONG Qingzeng

作者机构：天津工业大学计算机科学与技术学院天津300387 天津工业大学电气工程学院天津300387 中国电子科技集团公司信息科学研究院北京100086

出版物：《计算机应用》 (journal of Computer Applications)

年卷期：2022年第42卷第S01期

页码：208-214页

摘要：不同框架深度学习模型部署是人工智能落地的核心,然而模型计算量和参数量过大、编程模型未统一导致了各种新型的专用卷积神经网络(CNN)加速器层出不穷,增加了模型的部署难度。对模型压缩和编译工具链这两个方面进行了改进:在模型压缩方面,提出新的通道剪枝标准,结合了通道的相关性和影响性以及输出通道对应的激活值,在保证精度的同时可以极大地削减卷积神经网络的计算量和参数量;在编译工具链方面,设计了一套自动的端到端优化堆栈,提出了针对基于现场可编程门阵列(FPGA)的深度学习编译器设计方法,并在中间表示中添加了所提出的排序标准的剪枝算法。实验结果表明,所设计的编译器于舰船目标检测的任务中,在通用设备上,保证精度损失不超过1%的情况下取得了1.3倍的加速效果;在专用的CNN加速器上取得了1.6倍的加速效果,在部署中能够有效地针对卷积网络进行加速。

主题词：现场可编程门阵列模型压缩深度学习编译器中间表示目标检测

学科分类：08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类]

D　O　I：10.11772/j.issn.1001-9081.2021081407

馆藏号：203113532...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于专用卷积神经网络加速器的编译器设计与实现

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于专用卷积神经网络加速器的编译器设计与实现

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：