看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于3D忆阻器阵列的神经网络内存计算架构 收藏
基于3D忆阻器阵列的神经网络内存计算架构

基于3D忆阻器阵列的神经网络内存计算架构

作     者:毛海宇 舒继武 Mao Haiyu;Shu Jiwu

作者机构:清华大学计算机科学与技术系 

基  金:国家重点研发计划项目(2018YFB1003301) 国家自然科学基金项目(61832011) 

出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)

年 卷 期:2019年第56卷第6期

页      码:1149-1160页

摘      要:现如今,由于人工智能的飞速发展,基于忆阻器的神经网络内存计算(processing in memory,PIM)架构吸引了很多研究者的兴趣,因为其性能远优于传统的冯·诺依曼计算机体系结构的性能.配备了支持功能单元的外围电路,忆阻器阵列可以以高并行度以及相比于CPU和GPU更少的数据移动来处理一个前向传播.然而,基于忆阻器的内存计算硬件存在忆阻器的外围电路面积过大以及不容忽视的功能单元利用率过低的问题.提出了一种基于3D忆阻器阵列的神经网络内存计算架构FMC(function-pool based memristor cube),通过把实现功能单元的外围电路聚集到一起,形成一个功能单元池来供多个堆叠在其上的忆阻器阵列共享.还提出了一种针对基于3D忆阻器阵列的内存计算的数据映射策略,进一步提高功能单元的利用率并减少忆阻器立方体之间的数据传输.这种针对基于3D忆阻器阵列的内存计算的软硬件协同设计不仅充分利用了功能单元,并且缩短了互联电路、提供了高性能且低能耗的数据传输.实验结果表明:在只训练单个神经网络时,提出的FMC能使功能单元的利用率提升43.33倍;在多个神经网络训练任务的情况下,能提升高达58.51倍.同时,和有相同数目的Compute Array及Storage Array的2D-PIM比较,FMC所占空间仅为2D-PIM的42.89%.此外,FMC相比于2D-PIM有平均1.5倍的性能提升,并且有平均1.7倍的能耗节约.

主 题 词:3D忆阻器阵列 内存计算 神经网络 外围电路 互联线路 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.7544/issn1000-1239.2019.20190099

馆 藏 号:203691269...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分