限定检索结果

检索条件"作者=卢兴敬"
2 条 记 录,以下是1-10 订阅
视图:
排序:
POM:一个MPI程序的进程优化映射工具
收藏 引用
《计算机工程与科学》2009年 第A1期31卷 201-205页
作者:卢兴敬 商磊 陈莉中国科学院计算技术研究所系统结构重点实验室北京100190 澳大利亚新南威尔士大学 
现代超级计算机具有越来越多的计算结点,同时结点内具有多个处理器核。由于互联带宽的差异,结点间与结点内构成两个通信性能不同的通信层次,后者的通信性能好于前者。但是,目前MPI程序的默认进程映射未考虑该通信层次差异,无法利用结点...
来源:详细信息评论
基于ARMv8架构的面向机器翻译的单精度浮点通用矩阵乘法优化
收藏 引用
《计算机应用》2019年 第6期39卷 1557-1562页
作者:龚鸣清 叶煌 张鉴 卢兴敬 陈伟中国科学院计算机网络信息中心北京100190 中国科学院大学北京100049 北京搜狗科技发展有限公司北京100084 
针对使用ARM处理器的移动智能设备执行神经网络推理计算效率不高的问题,提出了一套基于ARMv8架构的单精度浮点通用矩阵乘法(SGEMM)算法优化方案。首先,确定ARMv8架构的处理器执行SGEMM算法的计算效率受限于向量化计算单元使用方案、指...
来源:详细信息评论
聚类工具 回到顶部