看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向高性能计算的众核处理器轻量级错误恢复技术研究 收藏
面向高性能计算的众核处理器轻量级错误恢复技术研究

面向高性能计算的众核处理器轻量级错误恢复技术研究

作     者:郑方 沈莉 李宏亮 谢向辉 Zheng Fang;Shen Li;Li Hongliang;Xie Xianghui

作者机构:数学工程与先进计算国家重点实验室江苏无锡214125 

基  金:国家"八六三"高技术研究发展计划基金项目(2014AA01A301) "核高基"国家科技重大专项基金项目(2013ZX0102-8001-001-001) 

出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)

年 卷 期:2015年第52卷第6期

页      码:1316-1328页

摘      要:随着半导体技术进步,单个芯片上集成大量核心的众核处理器已经广泛应用于高性能计算领域.相比多核处理器,众核处理器能提供更好的计算密度和能效比,但同时也面临越来越严重的可靠性挑战.需要设计高效的处理器容错机制,有效保证课题运行效率的同时不带来较大的芯片功耗和面积开销.在一款自主众核处理器DFMC(deeply fused and heterogeneous many-core)原型基础上,根据核心上运行的应用程序是否具有关联性特征,提出并实现了面向众核处理器的独立和协同2种轻量级错误恢复技术.其中,协同恢复技术由集中部件进行管理,通过协同恢复总线互连,出错时将与错误相关联的多个核心快速回卷到正确状态.2种错误恢复技术中,保留和恢复过程均通过定制的指令实现,恢复所需要的信息保留在运算核心内部,以保证对课题性能的影响最小化.实验表明,通过上述技术只增加了1.257%的芯片面积,可解决自主众核处理器约80%的瞬时错误,且对课题性能、芯片时序和功耗影响很小,可有效地提高众核处理器的容错能力.

主 题 词:众核处理器 错误恢复 容错 瞬态错误 高性能计算 

学科分类:0810[工学-土木类] 0808[工学-自动化类] 0839[0839] 08[工学] 0835[0835] 0811[工学-水利类] 081201[081201] 0812[工学-测绘类] 

核心收录:

D O I:10.7544/issn1000-1239.2015.20150119

馆 藏 号:203925591...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分