限定检索结果

检索条件"机构=国防科技大学并行与分布计算全国重点实验室"
5 条 记 录,以下是1-10 订阅
视图:
排序:
高性能异构加速器MiniGo算子优化方法
收藏 引用
国防科技大学学报》2024年 第1期46卷 131-140页
作者:乔鹏 贺周雨 李荣春 姜晶菲国防科技大学计算机学院湖南长沙410073 国防科技大学并行与分布计算全国重点实验室湖南长沙410073 
根据高性能异构加速器的特性和MiniGo的训练模式提出了一种高效的并行计算方法。对片上计算资源进行合理规划,实现异构设备之间的流水并行优化;根据异构设备间存在共享存储段设计了共享内存编码模式,减少数据传输开销;根据数字信号处理...
来源:详细信息评论
多核数字信号处理卷积算法并行优化
收藏 引用
国防科技大学学报》2024年 第1期46卷 103-112页
作者:许金伟 王庆林 李娅琳 姜晶菲 高蕾 李荣春 李东升国防科技大学计算机学院湖南长沙410073 国防科技大学并行与分布计算全国重点实验室湖南长沙410073 
针对国防科技大学自主研发的异构多核数字信号处理(digital signal processing, DSP)芯片的特征以及卷积算法自身特点,提出了一种面向多核DSP架构的高性能多核并行卷积实现方案。针对1×1卷积提出了特征图级多核并行方案;针对卷积...
来源:详细信息评论
NM-SpMM:面向国产异构向量处理器的半结构化稀疏矩阵乘算法
收藏 引用
计算机工程与科学》2024年 第7期46卷 1141-1150页
作者:姜晶菲 何源宏 许金伟 许诗瑶 钱希福国防科技大学计算机学院并行与分布计算全国重点实验室湖南长沙410073 
深度神经网络在自然语言处理、计算机视觉等领域取得了优异的成果,由于智能应用处理数据规模的增长和大模型的快速发展,对深度神经网络的推理性能要求越来越高,N∶M半结构化稀疏化技术成为平衡算力需求和应用效果的热点技术之一。国产...
来源:详细信息评论
面向多核CPU/众核GPU架构的非结构CFD共享内存并行计算技术
收藏 引用
《航空学报》2024年 第7期45卷 108-121页
作者:张健 李瑞田 邓亮 代喆 刘杰 徐传福国防科技大学并行与分布计算全国重点实验室长沙410073 中国空气动力研究与发展中心计算空气动力研究所绵阳621000 
针对现代高性能计算机架构开展非结构CFD节点内共享内存并行,是提升浮点计算效率、实现更大规模流体仿真应用能力的关键。然而由于非结构网格CFD计算存在拓扑关系复杂、数据局部性差、数据写冲突等问题,传统算法如何共享内存并行化以高...
来源:详细信息评论
天河超算系统并行算法库
收藏 引用
计算物理》2024年 第1期41卷 9-21页
作者:刘杰 石永振 杨博 张翔 陈新海 张华健 郭晓威 李胜国 李润华 彭晋韬 肖调杰 陈旭光 张庆阳 李彪 冷灿 李翊谁 王庆林高端装备数字化软件湖南省重点实验室湖南长沙410073 国防科技大学并行与分布计算全国重点实验室湖南长沙410073 
国防科技大学研制的天河超算系统7次荣登世界超算TOP500排行榜第一名。面对高效能发挥超算系统性能的实际需求,天河团队抽取大型科学与工程计算中的共性核心计算方法,根据天河超算系统的特点设计与实现了可扩展并行算法,研制了天河超算...
来源:详细信息评论
聚类工具 回到顶部