限定检索结果

检索条件"作者=章隆兵"
34 条 记 录,以下是1-10 订阅
视图:
排序:
基于无裁剪图形流水线的三维图形处理器
收藏 引用
《高技术通讯》2024年 第7期34卷 681-691页
作者:赵皓宇 王重熙 宋鹏皓 章隆兵处理器芯片全国重点实验室(中国科学院计算技术研究所)北京100190 中国科学院大学北京100049 
传统的三维图形处理器通过裁剪操作获取三角形的可见区域。然而,裁剪操作的延迟长且硬件开销高,大量的裁剪操作会降低图形处理器的性能。本文设计了一款基于OpenGL ES 2.0标准的三维图形处理器芯片,采用了统一渲染架构。该图形处理器采...
来源:详细信息评论
一种基于图形处理器压缩结构的预取结构设计
收藏 引用
《高技术通讯》2022年 第4期32卷 351-357页
作者:赵士彭 张立志 章隆兵计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190 中国科学院计算技术研究所北京100190 中国科学院大学北京100049 
图形处理器(GPU)访存利用率已经成为影响其性能的关键瓶颈之一。在处理器设计中,访存的预取结构设计成为了提高访存利用率的主要方法之一。结合图形处理器的访存密集的特点,在提高预取性能的前提下,减小影响图形流水线正常效率成为热门...
来源:详细信息评论
基于社区结构的图数据预取器设计
收藏 引用
《高技术通讯》2022年 第12期32卷 1251-1261页
作者:李策 章隆兵计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190 中国科学院大学计算机学院北京100190 
由于图数据规模庞大且结构不规则,图应用运行时会产生大量高延迟内存访问,大幅度降低了通用处理器的运行效率。本文采用软硬件结合的方式设计了图计算专用预取器,利用图数据访存特点以及社区结构的存储规律,通过对图数据进行混合预取,...
来源:详细信息评论
面向训练的卷积神经网络加速器设计
收藏 引用
《高技术通讯》2023年 第6期33卷 568-580页
作者:杨灿 王重熙 章隆兵计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190 中国科学院计算技术研究所北京100190 中国科学院大学北京100049 
随着深度神经网络的广泛应用,对神经网络模型的训练速度需求也不断增长,各类面向训练的加速器应运而生。然而,在训练过程的各阶段,同一个层展现出了巨大的计算差异,计算差异性使得单一数据流结构的加速器在某些阶段的处理上达不到最高...
来源:详细信息评论
一种面向嵌入式图形处理器的访存子系统结构设计
收藏 引用
《高技术通讯》2022年 第2期32卷 152-160页
作者:赵士彭 张立志 章隆兵计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190 中国科学院计算技术研究所北京100190 中国科学院大学北京100049 
嵌入式图形处理器(GPU)随着访存数据量越来越大,访存子系统在性能、面积及功耗等方面的瓶颈已经日益凸显。针对图形处理器的数据特点及访存需求,考虑到嵌入式图形处理器面积及功耗的约束,结合Godson GPU架构平台,提出了一种面向嵌入式...
来源:详细信息评论
基于软硬协同的程序运行时安全保护机制
收藏 引用
《计算机学报》2023年 第1期46卷 180-201页
作者:李亚伟 章隆兵 张福新 王剑计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190 中国科学院计算技术研究所北京100190 中国科学院大学北京100049 
内存篡改(Memory Corruption)是现代各类攻击的主要原因,通过修改内存中的数据,达到劫持控制流的目的.使用不安全语言暴露内存细节给开发者,导致很多的敏感数据可以任意被修改.现有的解决方案针对安全攻击主要包括两个方面,软件检查和...
来源:详细信息评论
片上实时功耗监控与估测的分析设计
收藏 引用
《计算机辅助设计与图形学学报》2010年 第11期22卷 2053-2060页
作者:段玮 章隆兵中国科学院计算机系统结构重点实验室北京100190 中国科学院计算技术研究所北京100190 中国科学院研究生院北京100049 北京龙芯中科技术服务中心有限公司北京100190 
为了给操作系统提供实时的芯片热点和功耗统计信息,以便进行快速、准确的实时功耗管理,基于龙芯2号处理器核,提出一个基于门控时钟统计的实时功耗监控系统.通过记录处理器门控时钟的翻转信息来获得芯片热点分布状态,并使用在芯片设计流...
来源:详细信息评论
基于层间融合的神经网络访存密集型层加速
收藏 引用
《高技术通讯》2023年 第8期33卷 823-835页
作者:杨灿 王重熙 章隆兵处理器芯片国家重点实验室(中国科学院计算技术研究所)北京100190 中国科学院计算技术研究所北京100190 中国科学院大学北京100049 
近年来,随着深度神经网络在各领域的广泛应用,针对不同的应用场景,都需要对神经网络模型进行训练以获得更优的参数,于是对训练速度的需求不断提升。然而,现有的研究通常只关注了计算密集型层的加速,忽略了访存密集型层的加速。访存密集...
来源:详细信息评论
一种快速的滑动标记缩并垃圾收集算法
收藏 引用
《电子学报》2008年 第10期36卷 1955-1960页
作者:邹琼 章隆兵中国科学技术大学计算机科学与技术系安徽合肥230027 中国科学院计算技术研究所计算机系统结构重点实验室北京100190 
Java语言完全面向对象,因此对象局部性是衡量Java虚拟机性能的重要指标.在Java虚拟机中,由垃圾收集算法负责检测并且回收不再使用的对象,它直接影响着Java程序的性能.保持对象分配序能够提供最佳的局部性.滑动标记缩并算法正是基于这一...
来源:详细信息评论
高性能CPU电源Droop检测优化设计实现
收藏 引用
《高技术通讯》2022年 第9期32卷 894-902页
作者:杨丽琼 章隆兵 肖俊华 王剑计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190 中国科学院计算技术研究所北京100190 中国科学院大学北京100049 
高性能中央处理器(CPU)进入到纳米工艺设计时代,集成度和性能大幅度提高的同时,功耗和时钟之间的平衡优化已经成为当前面临的主要问题。物理供电寄生阻抗增加明显,功耗急速增加过程导致电源网络动态压降明显,抑制了主频进一步提高。本...
来源:详细信息评论
聚类工具 回到顶部