看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于4 × 4卷积核的异步卷积加速算法研究 收藏
基于4 × 4卷积核的异步卷积加速算法研究

基于4 × 4卷积核的异步卷积加速算法研究

作     者:程海波 余旅莹 李鹏飞 张海涛 何安平 杨裔 

作者机构:兰州大学信息科学与工程学院甘肃 兰州 

基  金:国家自然科学基金(61602224,61402121) 中央高校基础研究基金(lzujbky-2017-194,lzujbky-2018-130,GrantNo.lzujbky-2016-br03) 广西科技计划项目(桂科AB17129012)佛山市科技创新项目(GrantNo.2015IT100095) 中国教育科研网创新项目(GrantNo.NGIL20150606) 广东省科技创新项目(GrantNo.2016B010108002) 广西混杂计算与集成电路设计分析重点实验室开放基金课题资助(HCIC201714) 

出 版 物:《软件工程与应用》 (Software Engineering and Applications)

年 卷 期:2018年第7卷第3期

页      码:160-167页

摘      要:由于基于软件端卷积神经网络的卷积运算难以满足现在的卷积神经网络对运算性能与功耗的要求,为了克服困难,本文设计了一种基于4 × 4卷积核的异步卷积加速算法来对卷积神经网络进行加速。采用AddTree的形式来实现kernel矩阵和pic矩阵的乘加运算,1个Add Tree计算单元是1个4 × 4的卷积核与相同大小的图片矩阵的数据做乘加运算得到一个特征值,采用多个Add Tree的并行计算方式可以大幅度提升卷积计算速率。实验结果表明,该加速算法还有不受时钟频率限制的优点,可以工作在任何时钟频率下,且单个计算单元的计算速度也十分的快,计算一个特征值的时间大约在500 ns左右,相对于软件端的计算速率提升了10倍左右。

主 题 词:卷积神经网络 并行 4 × 4卷积核 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.12677/SEA.2018.73019

馆 藏 号:203384533...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分