限定检索结果

检索条件"机构=中国科学院计算技术研究所系统结构重点实验室"
95 条 记 录,以下是1-10 订阅
视图:
排序:
一种基于容量复用的异构CMP Cache
收藏 引用
计算研究与发展》2008年 第5期45卷 877-885页
作者:高翔 章隆兵 胡伟武中国科学院计算技术研究所系统结构重点实验室 
多核环境下的Cache设计技术受到线延时和应用等多方面因素影响,私有和共享方案都存在各自的不足.提出了一种异构的CMP Cache结构,采用两类具有不同Cache层次的结点组成多核芯片,设计了基于间接索引的Cache容量复用等技术,提供了容量有...
来源:详细信息评论
基于SimpleScalar的龙芯CPU模拟器Sim-Godson
收藏 引用
计算机学报》2007年 第1期30卷 68-73页
作者:张福新 章隆兵 胡伟武中国科学院计算技术研究所系统结构重点实验室北京100080 
现代高性能通用处理器的设计越来越复杂,模拟器在处理器设计中起的作用越来越大.龙芯2号是中国科学院计算技术研究所研制的高性能通用处理器.最早开发的龙芯2号的模拟器ICT-Godson是信号级模拟器,它模拟了处理器的有细节,十分准确,...
来源:详细信息评论
基于软硬件的协同支持在众核上对1-DFFT算法的优化研究
收藏 引用
计算机学报》2008年 第11期31卷 2005-2014页
作者:周永彬 张军超 张帅 张浩中国科学院计算技术研究所系统结构重点实验室北京100190 
随着高性能计算需求的日益增加,片上众核(many-core)处理器成为未来处理器架构的发展方向.快速傅立叶变换(FFT)作为高性能计算中的重要应用,对计算能力和通信带宽都有较高的要求.因此基于众核处理器平台,实现高效、可扩展的FFT算法是算...
来源:详细信息评论
龙芯2号微处理器的功能验证
收藏 引用
计算研究与发展》2006年 第6期43卷 974-979页
作者:张珩 沈海华中国科学院计算技术研究所计算机系统结构重点实验室 
开发龙芯2号这样的高性能通用处理器是一项极其复杂的艰巨任务·龙芯2号处理器的设计规模和复杂度比龙芯1号增加了许多倍,如何保证设计的正确性是一个重大挑战·简单的系统级测试已经不能满足设计的需要,这就要求采用多种有效...
来源:详细信息评论
数据流Java并行程序设计模型的设计、实现及运行时优化
收藏 引用
《软件学报》2008年 第9期19卷 2181-2190页
作者:刘弢 范彬 吴承勇 张兆庆中国科学院计算技术研究所计算机系统结构重点实验室 
提出了一种具有数据流特征的Java并行程序设计模型,并针对该模型提出了一种基于运行时信息反馈的自适应优化算法,使得运行时系统可以利用数据流程序暴露出的数据并行性,加速程序的运行.此外,在该模型中加入了数据流多态的概念,扩展了...
来源:详细信息评论
一种新型计算机体系结构模拟器的研究与实现
收藏 引用
系统仿真学报》2007年 第7期19卷 1471-1475,1522页
作者:包云岗 许建卫 陈明宇 樊建平中国科学院计算技术研究所计算机系统结构重点实验室 
模拟器是研究新型高性能计算机体系结构的一种快速、有效的手段。并行计算机体系结构模拟器SandFox是为了开展对网格化动态自组织体系结构(DSAG)研究而研制的新模拟器,在设计中采用模块化和层次化设计思想,通过四个层次的逐级模拟实现了...
来源:详细信息评论
基于物理反标的处理器功耗建模与评估方法
收藏 引用
计算机辅助设计与图形学学报》2007年 第11期19卷 1471-1475页
作者:黄琨 张戈 王君 曾洪博中国科学院计算技术研究所计算机系统结构重点实验室 
将基于综合的处理器作为主要研究对象,通过参数化RTL和物理反标的方法对处理器中的基本单元块提取出功耗值并组成功耗模型库;将处理器各模块映射为基本单元块的组合,利用性能模拟器统计出的模块翻转信息,从而对处理器的功耗做出快速准...
来源:详细信息评论
龙芯2号处理器设计和性能分析
收藏 引用
计算研究与发展》2006年 第6期43卷 959-966页
作者:胡伟武 张福新 李祖松中国科学院计算技术研究所计算机系统结构重点实验室北京100080 
介绍龙芯2号处理器设计及其性能测试结果.龙芯2号采用四发射超标量超流水结构。片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.为了充分发挥流水线的效率,龙芯2号实现了先进的转移猜测、寄存器重命名、动态调度等...
来源:详细信息评论
龙芯1号处理器结构级功耗评估有效性分析
收藏 引用
计算机辅助设计与图形学学报》2007年 第9期19卷 1190-1195页
作者:冯子军 肖俊华 胡伟武中国科学院计算技术研究所计算机系统结构重点实验室 中国科学院研究生院北京100049 
结合龙芯1号处理器实际设计过程,介绍了处理器功耗评估的方法和功耗模型,分别对结构级、电路级功耗评估和实际芯片3种情况进行测试程序仿真.经过量化分析和比较表明:结构级功耗评估具有仿真速度快、评估结果误差和测试程序相关,并且同...
来源:详细信息评论
片上多处理器中延迟和容量权衡的cache结构
收藏 引用
计算研究与发展》2009年 第1期46卷 167-175页
作者:肖俊华 冯子军 章隆兵中国科学院计算技术研究所系统结构重点实验室北京100190 中国科学院研究生院北京100049 
片上多处理器中二级cache的设计面临着延迟和容量不能同时满足的矛盾,私有结构有较小的命中延迟但是减少了cache的有效容量,共享结构能增加cache的有效容量但是有较长的命中延迟.提出了一种适用于CMP的cache结构——延迟和容量权衡的ca...
来源:详细信息评论
聚类工具 回到顶部