文献详情 >一种基于GPU集群的深度优先并行算法设计与实现收藏

一种基于GPU集群的深度优先并行算法设计与实现

作者：余莹李肯立郑光勇 YU Ying;LI Ken-li;ZHENG Guang-yong

作者机构：衡阳师范学院计算机科学系衡阳421002 湖南大学信息科学与工程学院长沙410082

基　　金：国家自然科学基金项目(61370095 61370098 61070057 90715029) 湖南省教育厅科学研究一般项目(13C074) 衡阳市科技局科技发展计划项目(2011KJ22)资助

出版物：《计算机科学》 (Computer Science)

年卷期：2015年第42卷第1期

页码：82-85页

摘要：深度优先搜索算法在GPU集群中大型图上的简单执行,会导致线程间的负载不平衡和无法合并内存访问的情况,这使得算法的性能较低。为了明显提高算法在单个GPU和多个GPU环境下的性能,在处理数据之前通过采取一系列有效的操作来进行重新编排。提出了构造线程和数据之间映射的新技术,通过利用前缀求和及二分查找操作来达到完美的负载平衡。为了降低通信开销,对DFS各分支中需要进行交换的边集执行修剪操作。实验结果表明,算法在单个GPU上可以尽可能地实现最佳的并行性,在多GPU环境下可以最小化通信开销。在一个GPU集群中,它可以对含有数十亿节点的图有效地执行分布式DFS。

主题词：GPU 深度优先搜索(DFS) 分布式算法 CUDA MPI

学科分类：08[工学] 080203[080203] 0802[工学-机械学]

D　O　I：10.11896/j.issn.1002-137X.2015.1.019

馆藏号：203105873...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

一种基于GPU集群的深度优先并行算法设计与实现

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

一种基于GPU集群的深度优先并行算法设计与实现

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：