看过本文的还看了

相关文献

该作者的其他文献

文献详情 >卷积神经网络DPU加速系统设计与实现 收藏
卷积神经网络DPU加速系统设计与实现

卷积神经网络DPU加速系统设计与实现

作     者:徐畅 陈明 谌辰睿 张清河 XU Chang;CHEN Ming;SHEN Chen-rui;ZHANG Qing-he

作者机构:三峡大学计算与信息学院宜昌443002 湖北省水电工程智能视觉监测重点实验室宜昌443002 

基  金:国家自然科学基金(61771008) 湖北省水电工程智能视觉监测重点实验室开放基金(2020SDSJ04) 

出 版 物:《武汉理工大学学报》 (Journal of Wuhan University of Technology)

年 卷 期:2020年第42卷第12期

页      码:62-69页

摘      要:针对嵌入式AI系统中卷积神经网络推理阶段实时性问题,利用软硬件协同设计的思想,在ZYNQ UltraScale+芯片上搭建了基于Deep Learning Processing Unit(DPU)的加速系统,同时为解决DPU调度效率较低的问题,基于优先队列的思想提出了一种适用于DPU的多任务多线程调度策略。在ResNet50,MobileNetV2和DenseBox+MobileNetV2模型上的实验结果表明,加速系统性能与PC机CPU相比提升了141倍,与GPU相比提升了15倍,功耗仅为CPU的6%,GPU的2%。提出的调度策略使DPU调度效率提升了28%,并有效的保证了多任务推理流程的完整性和有序性。

主 题 词:DPU 卷积神经网络推理加速 任务调度 软硬件协同设计 加速系统 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.3963/j.issn.1671-4431.2020.12.010

馆 藏 号:203105309...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分