限定检索结果

检索条件"主题词=LLM分布式推理范式"
1 条 记 录,以下是1-10 订阅
视图:
排序:
低资源集群中的大语言模型分布式推理技术
收藏 引用
《中兴通讯技术》2024年 第2期30卷 43-49页
作者:冯文佼 李宗航 虞红芳电子科技大学成都611731 
探索了一种并行能力更强、具有更好兼容性的大语言模型(llm)分布式推理范式。该范式专为弱算力、小显存环境设计。同时面向主机内外差异带宽,设计了基于通信树的高效All-Reduce组通信技术;针对小显存集群,设计了细粒度的显存管理与调度...
来源:详细信息评论
聚类工具 回到顶部