限定检索结果

检索条件"机构=国防科技大学计算机学院并行与分布计算全国重点实验室"
3 条 记 录,以下是1-10 订阅
视图:
排序:
多核数字信号处理卷积算法并行优化
收藏 引用
国防科技大学学报》2024年 第1期46卷 103-112页
作者:许金伟 王庆林 李娅琳 姜晶菲 高蕾 李荣春 李东升国防科技大学计算机学院湖南长沙410073 国防科技大学并行与分布计算全国重点实验室湖南长沙410073 
针对国防科技大学自主研发的异构多核数字信号处理(digital signal processing, DSP)芯片的特征以及卷积算法自身特点,提出了一种面向多核DSP架构的高性能多核并行卷积实现方案。针对1×1卷积提出了特征图级多核并行方案;针对卷积...
来源:详细信息评论
NM-SpMM:面向国产异构向量处理器的半结构化稀疏矩阵乘算法
收藏 引用
计算机工程与科学》2024年 第7期46卷 1141-1150页
作者:姜晶菲 何源宏 许金伟 许诗瑶 钱希福国防科技大学计算机学院并行与分布计算全国重点实验室湖南长沙410073 
深度神经网络在自然语言处理、计算机视觉等领域取得了优异的成果,由于智能应用处理数据规模的增长和大模型的快速发展,对深度神经网络的推理性能要求越来越高,N∶M半结构化稀疏化技术成为平衡算力需求和应用效果的热点技术之一。国产...
来源:详细信息评论
高性能异构加速器MiniGo算子优化方法
收藏 引用
国防科技大学学报》2024年 第1期46卷 131-140页
作者:乔鹏 贺周雨 李荣春 姜晶菲国防科技大学计算机学院湖南长沙410073 国防科技大学并行与分布计算全国重点实验室湖南长沙410073 
根据高性能异构加速器的特性和MiniGo的训练模式提出了一种高效的并行计算方法。对片上计算资源进行合理规划,实现异构设备之间的流水并行优化;根据异构设备间存在共享存储段设计了共享内存编码模式,减少数据传输开销;根据数字信号处理...
来源:详细信息评论
聚类工具 回到顶部