期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
基于超标量处理器的高效FFT映射方法 被引量:2
1
作者 高立宁 朱亮 +1 位作者 刘腾飞 刘峰 《北京理工大学学报》 EI CAS CSCD 北大核心 2016年第9期940-946,共7页
针对超标量处理器的结构特点,研究新的映射方法,实现高效FFT运算.对现代超标量结构处理器进行建模,分析FFT算法在其上执行情况,得出内存访问是FFT算法执行的关键点.并进一步对FFT的内访问过程进行建模分析,最终实现了一种基于cache优化... 针对超标量处理器的结构特点,研究新的映射方法,实现高效FFT运算.对现代超标量结构处理器进行建模,分析FFT算法在其上执行情况,得出内存访问是FFT算法执行的关键点.并进一步对FFT的内访问过程进行建模分析,最终实现了一种基于cache优化的高效FFT映射方法,该方法将FFT进行拆分实现,充分发挥了cache的作用,进而提高了处理性能.最后在ADI公司的TS201数字信号处理器上,以该映射方法为指导实现了基2FFT算法,实验结果显示在处理点数超出cache容量时,本映射方法可以大幅度提高处理性能. 展开更多
关键词 快速傅里叶变化(FFT) 高速缓存(cache) 超标量处理
下载PDF
超级流水线超标量处理机的性能评价 被引量:1
2
作者 刘静 陈基禄 +1 位作者 李继荣 王振旗 《华北电力大学学报(自然科学版)》 CAS 北大核心 2003年第4期66-69,共4页
流水线作业是实现并行处理的重要方法。在介绍了流水线处理机的工作原理后,首次采用基于排队理论的数学模型解析了超级流水线超标量处理机的性能,并进行了不同类型处理机的性能比较。最后对Alpha 21164处理机从不同角度进行了性能评价。
关键词 超级流水线 超标量处理 性能评价 排队理论 处理
下载PDF
超标量处理器中引入SMT技术的性能分析研究 被引量:1
3
作者 史莉雯 樊晓桠 黄小平 《计算机工程与应用》 CSCD 北大核心 2009年第5期13-15,共3页
同时多线程(SMT)是一种允许多个独立的线程每周期发射多条指令的技术,这种技术充分利用了可能存在的指令级并行和线程级并行,提高了有限资源的利用率。文章以西北工业大学航空微电子中心自主研发的32位超标量处理器"龙腾R2"... 同时多线程(SMT)是一种允许多个独立的线程每周期发射多条指令的技术,这种技术充分利用了可能存在的指令级并行和线程级并行,提高了有限资源的利用率。文章以西北工业大学航空微电子中心自主研发的32位超标量处理器"龙腾R2"为基础,引入SMT技术,在基本不改变内部结构大小、不增加执行功能部件、仅做一些必要修改的前提条件下进行研究。通过仿真不同的线程数和各种线程组合,进行性能分析。尽管存在制约性能提升的一些因素,引入SMT技术后依然获得了最高约50%的性能增加。 展开更多
关键词 超标量处理 同时多线程 每周期完成的指令数(IPC)
下载PDF
超标量处理器的转移预测方案研究 被引量:1
4
作者 陈智勇 《微电子学与计算机》 CSCD 北大核心 2006年第11期118-120,125,共4页
随着高性能超标量处理器的流水线深度和发射度的增加,为挖掘宽发射、深度流水线处理器的潜在性能,设计一个杰出的转移预测器已变得越来越重要。常规的两级转移预测器是根据局部转移历史信息或全局转移历史信息来预测转移的结果,文章给... 随着高性能超标量处理器的流水线深度和发射度的增加,为挖掘宽发射、深度流水线处理器的潜在性能,设计一个杰出的转移预测器已变得越来越重要。常规的两级转移预测器是根据局部转移历史信息或全局转移历史信息来预测转移的结果,文章给出了一种新的转移预测方案,称为LGshare,它同时使用全局和局部转移历史信息来改进超标量微处理器的转移预测准确度。当模式历史表(PHT)的大小固定时,与常规的两级预测器相比,LGshare能获得更高的转移预测准确度。 展开更多
关键词 超标量处理 转移预测 转移历史寄存器 模式历史表
下载PDF
一种面向超标量处理器的高能效指令缓存路选择技术 被引量:1
5
作者 谢子超 陆俊林 +2 位作者 佟冬 王箫音 程旭 《电子学报》 EI CAS CSCD 北大核心 2011年第11期2473-2479,共7页
路选择技术可以有效降低指令缓存能耗开销,但已有方法通常会由于预测错误或更新机制复杂而引入额外的取指延迟,导致整体能效性降低.本文面向典型超标量处理器的指令缓存结构,提出了一种高能效的路选择融合技术(Combining Way Selective ... 路选择技术可以有效降低指令缓存能耗开销,但已有方法通常会由于预测错误或更新机制复杂而引入额外的取指延迟,导致整体能效性降低.本文面向典型超标量处理器的指令缓存结构,提出了一种高能效的路选择融合技术(Combining Way Selective Cache,CWS-Cache).基于对路预测和路历史技术适用条件的分析,CWS-Cache在不同的取指场景中选择使用最佳路选择策略,有效降低了指令缓存的取指能耗,并通过缩短非对齐取指组的访问延迟提升处理器性能.实验表明,CWS-Cache将拥有8路组相联指令缓存的基础处理器取指能耗降低了84.98%,性能提升了3.50%.与已有的三种方法相比,CWS-Cache能效性分别提升了15.48%,14.13%和8.76%. 展开更多
关键词 超标量处理 路预测 路历史
下载PDF
超标量处理器乱序提交机制的研究与设计 被引量:2
6
作者 李昭 刘有耀 +1 位作者 焦继业 潘树朋 《计算机工程》 CAS CSCD 北大核心 2021年第4期180-186,共7页
针对超标量处理器中长周期执行指令延迟退休及持续译码导致的重排序缓存(ROB)阻塞问题,提出一种指令乱序提交机制。通过设计容量可配置的多缓存指令提交结构,实现存储器操作指令和ALU类型指令的分类退休,根据超标量处理器架构及性能需... 针对超标量处理器中长周期执行指令延迟退休及持续译码导致的重排序缓存(ROB)阻塞问题,提出一种指令乱序提交机制。通过设计容量可配置的多缓存指令提交结构,实现存储器操作指令和ALU类型指令的分类退休,根据超标量处理器架构及性能需求对目标缓存和存储缓存容量进行参数化配置降低流水线阻塞风险,同时利用指令目的寄存器编码提交模式加快指令提交速率。实验结果表明,该机制提高了单次指令提交数量,基于该机制的超标量处理器相比传统基于ROB顺序提交机制的超标量处理器在减少硬件开销的情况下平均IPC指数提升46%,相比基于值预测、乱序退休和组提交的超标量处理器平均IPC指数增益为19%,综合性能更优。 展开更多
关键词 超标量处理 重排序缓存 指令分类退休 乱序提交 目的寄存器编码
下载PDF
XLP832系列:2GHz内核超标量处理器
7
《世界电子元器件》 2009年第7期28-28,共1页
XLP832系列是一个高度可升级的超级系统级芯片(SuperSoC),集成了高端通信系统的主要性能,包括无线和有线安全、网络、存储、数据中心加速、负载平衡,以及应用在各种市场的加速引擎。XLP系列采用RMI多核XLR处理系列的第三代增强架构。
关键词 超标量处理 2GHz 内核 系统级芯片 通信系统 数据中心 负载平衡 第三代
下载PDF
超标量技术及结构研究与应用 被引量:2
8
作者 赵庆敏 邱岚 +1 位作者 杜宏露 熊镝 《微计算机应用》 2007年第2期208-210,共3页
超标量处理机采用ILP技术,在Scoroboard或Tomasulo算法的基础上,使用动态和静态相结合的调度算法,使多条执行流水线并行执行多条指令。讨论超标量处理机采用的技术以及结构,并举例PowerPC620。
关键词 超标量处理 指令级并行度 Scoroboard算法 Tomasulo算法
下载PDF
未来向量处理机的一个典型结构
9
作者 黄卫华 《绵阳师范学院学报》 2003年第5期31-34,共4页
简要探讨了计算机向量体系结构的历史以及相对于标量体系结构的优势。向量超级计算机由于造价的因素当前处于被淘汰的地位,但是在来来的计算机应用领域里,向量体系结构仍然是很值得关注的,特别是在以图形、图像和多媒体处理为主的下一... 简要探讨了计算机向量体系结构的历史以及相对于标量体系结构的优势。向量超级计算机由于造价的因素当前处于被淘汰的地位,但是在来来的计算机应用领域里,向量体系结构仍然是很值得关注的,特别是在以图形、图像和多媒体处理为主的下一代计算机系统中,有非常好的前景。 展开更多
关键词 超级计算机 超标量处理 指令系统
下载PDF
超标量DSP的片上调试与实时跟踪支持
10
作者 王刚 张盛兵 黄嵩人 《计算机应用研究》 CSCD 北大核心 2012年第1期207-210,共4页
针对嵌入式系统日益严峻的调试挑战,提出并实现了一种基于32 bit超标量DSP内核的片上调试与实时跟踪架构。该架构通过设计专用的跟踪接口与其他硬件资源,并扩展JTAG端口、存储器保护逻辑与流水线控制逻辑,以较低的硬件开销实现对内核的... 针对嵌入式系统日益严峻的调试挑战,提出并实现了一种基于32 bit超标量DSP内核的片上调试与实时跟踪架构。该架构通过设计专用的跟踪接口与其他硬件资源,并扩展JTAG端口、存储器保护逻辑与流水线控制逻辑,以较低的硬件开销实现对内核的实时运行控制、内部寄存器与存储器的非侵入访问、带复杂触发条件的断点与观察点设置、硬件单步以及程序流的实时跟踪等典型特征的支持,可满足绝大部分嵌入式系统的开发与调试需求。 展开更多
关键词 超标数字信号处理 片上调试 实时程序跟踪 运行控制 单步调试
下载PDF
推断与推测技术在现代高性能微处理器设计中的应用研究 被引量:5
11
作者 单睿 洪缨 侯朝焕 《计算机学报》 EI CSCD 北大核心 2003年第11期1575-1580,共6页
在现代高性能微处理器设计中 ,推断和推测成为开发指令级并行性ILP(InstructionLevelPara llelism)的两种重要技术途径 .推断的目的是打破程序间固有的控制流程 ,将控制相关转变为数据相关 ,使指令级并行性识别从一个基本块扩大为一个超... 在现代高性能微处理器设计中 ,推断和推测成为开发指令级并行性ILP(InstructionLevelPara llelism)的两种重要技术途径 .推断的目的是打破程序间固有的控制流程 ,将控制相关转变为数据相关 ,使指令级并行性识别从一个基本块扩大为一个超块 .推测执行是为打破分支或访存引起的相关问题而进行的操作 ,进一步分为控制推测和数据推测 .控制推测的目的是打破分支和其他操作间的相关性 ,进而由编译器在一个超块内识别并行性 ,减小控制相关的高度 .数据推测则是消去访存相关 ,提高指令级并行度 .该文首先对推断和推测本身进行分析 ,然后在此基础上进一步将推断、推测技术相结合 ,并应用于高性能媒体处理器的设计中 .性能评价和比较结果显示 ,两种技术相结合将比任何一种技术都更加行之有效 . 展开更多
关键词 处理 设计 推断技术 推测技术 超标量处理
下载PDF
一种用于容错处理器的指令复制方法
12
作者 李红兵 尚利宏 +1 位作者 周密 金惠华 《计算机科学》 CSCD 北大核心 2010年第5期278-281,共4页
介绍一种在容错处理器中实现指令复制的方法。处理器的容错机制是通过修改超标量体系结构,利用时间冗余技术实现的。指令复制是容错机制的一种重要功能。详细描述了其实现方法,同时论述了结合指令复制方法对程序控制流的正确性进行检测... 介绍一种在容错处理器中实现指令复制的方法。处理器的容错机制是通过修改超标量体系结构,利用时间冗余技术实现的。指令复制是容错机制的一种重要功能。详细描述了其实现方法,同时论述了结合指令复制方法对程序控制流的正确性进行检测的问题。 展开更多
关键词 容错机制 时间冗余技术 超标量处理 控制流故障
下载PDF
负载均衡的处理器运算资源分配方法研究 被引量:1
13
作者 李亚各 张阳 《电脑编程技巧与维护》 2021年第10期42-44,共3页
在超标量处理程序中,兼容了多组计算单元,支持各组计算单元共同运行,确保程序计算能力。运算资源分配法赋予了处理器高效计算能力,具有重要添加意义。尝试从对称、非对称两种语境入手,研究出自动分配机制。经实践应用发现,多语境运算资... 在超标量处理程序中,兼容了多组计算单元,支持各组计算单元共同运行,确保程序计算能力。运算资源分配法赋予了处理器高效计算能力,具有重要添加意义。尝试从对称、非对称两种语境入手,研究出自动分配机制。经实践应用发现,多语境运算资源分配法,能够有效缓解超标量处理程序运行不畅问题,充分发挥片内缓冲资源,促使处理程序容纳更多运算资源,凸显出负载均衡使用价值。 展开更多
关键词 超标量处理程序 运算资源 计算单元
下载PDF
2020年的微处理器 被引量:2
14
作者 Patt.,DA 郭凯声 《科学(中文版)》 1996年第1期3-6,共4页
关键词 处理 存储器 流水线法 超标量处理
全文增补中
向量计算机的功能探微及发展前瞻
15
作者 黄卫华 《福建电脑》 2004年第1期2-4,共3页
本文给出了向量超级计算机的简短历史,并讨论向量体系结构的优点。尽管向量超级计算机由于造价的因素趋于被淘汰的地位,但是在未来的计算机应用领域里,向量体系结构仍然是很值得关注的,特别是在以图形、图像和多媒体处理里为主的下一代... 本文给出了向量超级计算机的简短历史,并讨论向量体系结构的优点。尽管向量超级计算机由于造价的因素趋于被淘汰的地位,但是在未来的计算机应用领域里,向量体系结构仍然是很值得关注的,特别是在以图形、图像和多媒体处理里为主的下一代的计算机系统中的,有非常好的前景。 展开更多
关键词 计算机 超标量处理 处理 处理 体系结构
下载PDF
多路径Trace处理器
16
作者 杜贵然 《计算机工程与科学》 CSCD 2003年第3期109-109,共1页
关键词 超标量处理单元 多路径Trace处理 体系结构 结构设计
下载PDF
高级处理机的结构和在并行信息处理机中的应用
17
作者 杨英 《管理观察》 1997年第3期47-48,共2页
关键词 信息处理 高级处理 超标量处理 同步化 并行系统 处理机结构 分布存储系统 并行计算机 信息处理系统 晶体管计算机
下载PDF
一种检测程序控制流故障的方法
18
作者 李红兵 尚利宏 +1 位作者 周密 金惠华 《微计算机信息》 2010年第16期1-3,共3页
本文介绍一种在容错处理器中实现控制流故障检测的方法。处理器的容错机制是通过修改超标量体系结构,利用时间冗余技术实现的。处理器支持两个指令流并发执行,本文提出的控制流检测算法是通过比较两个时间冗余的指令流的执行结果实现的... 本文介绍一种在容错处理器中实现控制流故障检测的方法。处理器的容错机制是通过修改超标量体系结构,利用时间冗余技术实现的。处理器支持两个指令流并发执行,本文提出的控制流检测算法是通过比较两个时间冗余的指令流的执行结果实现的,与同类实现方案相比,此方法可以进一步节省硬件资源以及额外的处理器执行时间。 展开更多
关键词 容错机制 时间冗余技术 超标量处理 控制流故障
下载PDF
ADSP-TS101S的自动引导方式分析与设计实现 被引量:3
19
作者 申军建 张勐 卓智海 《电子设计应用》 2004年第5期64-66,共3页
本文详细分析了美国ADI公司最新推出的TigerSHARC系列数字信号处理器ADSP-TS101S的引导方式,并在最后给出了已成功实现的、基于该DSP处理器的某雷达信号处理机的自动引导设计方案。
关键词 ADSP-TS101S数字信号处理 静态超标量处理 信号处理 双运算模块 引导方式 软件设计 雷达信号处理
下载PDF
一种静态LoC关键性预测器设计
20
作者 李清波 苟鹏飞 +2 位作者 孙骏 杨兵 王进祥 《计算机工程》 CAS CSCD 2012年第7期253-256,共4页
针对不同分簇超标量处理器结构下SPEC2000程序中指令关键可能性(LoC)的特性,提出一种静态LoC关键性预测器的设计方法。对指令LoC进行研究,根据其结构无关性和动态不变性,设计预测器。仿真结果表明,在对1×8分簇超标量处理器使用该... 针对不同分簇超标量处理器结构下SPEC2000程序中指令关键可能性(LoC)的特性,提出一种静态LoC关键性预测器的设计方法。对指令LoC进行研究,根据其结构无关性和动态不变性,设计预测器。仿真结果表明,在对1×8分簇超标量处理器使用该设计时,程序的每周期指令数平均提升5.3%,性能优于动态LoC预测器。 展开更多
关键词 超标量处理 结构无关性 动态不变性 静态预测 指令调度
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部