期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
融合动态采样剖析的可重构指令集处理器
1
作者 张惠臻 王超 《计算机科学》 CSCD 北大核心 2013年第3期31-35,共5页
可重构指令集处理器能够根据应用程序特点动态扩展其指令集,其硬件架构和软件工具的设计与传统设计有很大不同。在研究可重构指令集处理器软硬件特性的基础上,提出一种集成动态采样剖析硬件的可重构指令集处理器架构。该处理器具有3种... 可重构指令集处理器能够根据应用程序特点动态扩展其指令集,其硬件架构和软件工具的设计与传统设计有很大不同。在研究可重构指令集处理器软硬件特性的基础上,提出一种集成动态采样剖析硬件的可重构指令集处理器架构。该处理器具有3种不同的工作模式,它通过剖析硬件采样获取程序热点,利用配套工具链半自动地完成指令扩展生成、编译器重定向和可编程硬件逻辑配置,从而获得在不同嵌入式应用领域的硬件适应性和软件兼容性。针对性的实验结果表明,该处理器架构的采样剖析机制准确有效,并且在增加有限的硬件开销的情况下,能够很好地适应应用变化。 展开更多
关键词 计算机系统结构 可重构指令集处理器 指令扩展 动态采样剖析
下载PDF
针对子程序结构的线程级推测并行性分析 被引量:6
2
作者 梁博 安虹 +1 位作者 王莉 王耀彬 《小型微型计算机系统》 CSCD 北大核心 2009年第2期230-235,共6页
线程级推测技术为开发更多的线程级并行性,充分利用多核加速传统上难以手工或自动并行化的串行程序提供可行的技术途径.然而,这种技术的性能严重地依赖于线程划分方案.有研究表明,仅推测执行循环所产生的并行性是不够的,但推测执行子程... 线程级推测技术为开发更多的线程级并行性,充分利用多核加速传统上难以手工或自动并行化的串行程序提供可行的技术途径.然而,这种技术的性能严重地依赖于线程划分方案.有研究表明,仅推测执行循环所产生的并行性是不够的,但推测执行子程序结构比循环结构要难.本文提出寻找适于推测并行执行的子程序结构的基本判定依据;通过运行由Simplescalar工具集改造得到的动态剖析工具ProRV、ProFun和SPEC CPU2000基准测试程序,我们对子程序结构线程化推测执行的适合性进行详细分析,给出具有指导意义的实验分析方法和实验数据.我们发现:1无返回值的子程序结构占据程序整体执行时间的大约40%;返回稀疏整型的子程序结构占据了程序整体执行时间的大约10%,对其返回值的预测成功率在70%左右.对于其他返回值类型的子程序结构,由于对其返回值的预测成功率过低,我们认为不适合作为线程划分的对象.2简单的last-value的值预测方案对于返回值的预测是简单而且足够有效的.3访存数据依赖普遍存在于子程序与其后继代码之间,显式同步机制对于针对子程序结构的线程级推测是必要的. 展开更多
关键词 线程级推测 串行程序自动并行化 子程序结构 动态剖析 数据依赖分析
下载PDF
用线程级推测技术在多核体系结构上并行化科学计算应用 被引量:2
3
作者 王耀彬 安虹 +2 位作者 郭锐 闫洁 路璐 《小型微型计算机系统》 CSCD 北大核心 2010年第2期264-270,共7页
线程级推测技术使在多核上加速传统上难以手工或自动并行化的串行程序成为可能,它不仅需要合理地选择线程的划分策略,而且需要合理地选择适合推测执行的应用.已有的大量研究主要集中在如SPEC CPU这样的桌面应用领域,为了全面地认识TLS... 线程级推测技术使在多核上加速传统上难以手工或自动并行化的串行程序成为可能,它不仅需要合理地选择线程的划分策略,而且需要合理地选择适合推测执行的应用.已有的大量研究主要集中在如SPEC CPU这样的桌面应用领域,为了全面地认识TLS技术的应用适用性,本文探讨TLS技术对科学计算应用的性能提升潜力,提出一套TLS适用性的基本判定准则,实验结果表明采用该技术加速SPLASH2中的多数应用可以有效利用16核及以上的计算资源. 展开更多
关键词 多核 线程级推测 线程划分 动态剖析
下载PDF
HPEC中子程序级推测并行性分析
4
作者 王欣夷 王耀彬 +3 位作者 李凌 杨洋 卜得庆 刘志勤 《计算机工程》 CAS CSCD 北大核心 2020年第8期210-215,222,共7页
线程级推测(TLS)技术的有效运用可提高多核芯片的硬件资源利用率,其已在多种串行应用的自动并行化工作中取得了较好效果,但目前缺乏对HPEC应用子程序级线程推测方面的有效分析。针对该问题,设计子程序级推测的剖析机制及核心数据结构,选... 线程级推测(TLS)技术的有效运用可提高多核芯片的硬件资源利用率,其已在多种串行应用的自动并行化工作中取得了较好效果,但目前缺乏对HPEC应用子程序级线程推测方面的有效分析。针对该问题,设计子程序级推测的剖析机制及核心数据结构,选取HPEC中7个具有代表性的程序,挖掘其子程序级的最大潜在并行性,并结合线程粒度、并行覆盖率、子程序调用次数、数据依赖及源码,对程序的加速比进行分析。实验结果表明,fdfir、svd、db和ga程序的加速比在2.23~11.31,tdfir程序的加速效果最好,加速比达到221.78,对于包含多次非重度数据依赖子程序调用的应用,更适合采用子程序级TLS技术测试其并行性。 展开更多
关键词 线程级推测 多核芯片 HPEC基准套件 数据依赖 动态剖析
下载PDF
基于多核平台无关属性的程序并行度分析工具
5
作者 熬冉 谭光明 陈明宇 《高技术通讯》 CAS CSCD 北大核心 2015年第1期31-37,共7页
为了充分利用计算机多核平台的并行能力,研究了针对特定多核平台的程序并行度分析和优化的方法,提出了一个基于平台无关属性提取的并行度分析工具ParaInsight。用此工具可分析程序中不同区域的可并行性,同时能够根据小规模输入集下的信... 为了充分利用计算机多核平台的并行能力,研究了针对特定多核平台的程序并行度分析和优化的方法,提出了一个基于平台无关属性提取的并行度分析工具ParaInsight。用此工具可分析程序中不同区域的可并行性,同时能够根据小规模输入集下的信息预测这些属性在大规模输入集下的值。通过使用支持向量机(SVM)构建的预测模型,对大输入集下的程序属性值进行预测。选取多线程程序测试包Parsec中的两个程序进行了实验,实验结果表明,通过核函数选择、训练参数调优以及输入变量筛选等方法,用ParaInsight可以有效地预测绝大多数并行区域及其不同的属性值。 展开更多
关键词 并行度分析 动态剖析 输入感知 SVM预测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部