期刊导航
期刊开放获取
重庆大学
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
融合动态采样剖析的可重构指令集处理器
1
作者
张惠臻
王超
《计算机科学》
CSCD
北大核心
2013年第3期31-35,共5页
可重构指令集处理器能够根据应用程序特点动态扩展其指令集,其硬件架构和软件工具的设计与传统设计有很大不同。在研究可重构指令集处理器软硬件特性的基础上,提出一种集成动态采样剖析硬件的可重构指令集处理器架构。该处理器具有3种...
可重构指令集处理器能够根据应用程序特点动态扩展其指令集,其硬件架构和软件工具的设计与传统设计有很大不同。在研究可重构指令集处理器软硬件特性的基础上,提出一种集成动态采样剖析硬件的可重构指令集处理器架构。该处理器具有3种不同的工作模式,它通过剖析硬件采样获取程序热点,利用配套工具链半自动地完成指令扩展生成、编译器重定向和可编程硬件逻辑配置,从而获得在不同嵌入式应用领域的硬件适应性和软件兼容性。针对性的实验结果表明,该处理器架构的采样剖析机制准确有效,并且在增加有限的硬件开销的情况下,能够很好地适应应用变化。
展开更多
关键词
计算机系统结构
可重构指令集处理器
指令扩展
动态
采样
剖析
下载PDF
职称材料
针对子程序结构的线程级推测并行性分析
被引量:
6
2
作者
梁博
安虹
+1 位作者
王莉
王耀彬
《小型微型计算机系统》
CSCD
北大核心
2009年第2期230-235,共6页
线程级推测技术为开发更多的线程级并行性,充分利用多核加速传统上难以手工或自动并行化的串行程序提供可行的技术途径.然而,这种技术的性能严重地依赖于线程划分方案.有研究表明,仅推测执行循环所产生的并行性是不够的,但推测执行子程...
线程级推测技术为开发更多的线程级并行性,充分利用多核加速传统上难以手工或自动并行化的串行程序提供可行的技术途径.然而,这种技术的性能严重地依赖于线程划分方案.有研究表明,仅推测执行循环所产生的并行性是不够的,但推测执行子程序结构比循环结构要难.本文提出寻找适于推测并行执行的子程序结构的基本判定依据;通过运行由Simplescalar工具集改造得到的动态剖析工具ProRV、ProFun和SPEC CPU2000基准测试程序,我们对子程序结构线程化推测执行的适合性进行详细分析,给出具有指导意义的实验分析方法和实验数据.我们发现:1无返回值的子程序结构占据程序整体执行时间的大约40%;返回稀疏整型的子程序结构占据了程序整体执行时间的大约10%,对其返回值的预测成功率在70%左右.对于其他返回值类型的子程序结构,由于对其返回值的预测成功率过低,我们认为不适合作为线程划分的对象.2简单的last-value的值预测方案对于返回值的预测是简单而且足够有效的.3访存数据依赖普遍存在于子程序与其后继代码之间,显式同步机制对于针对子程序结构的线程级推测是必要的.
展开更多
关键词
线程级推测
串行程序自动并行化
子程序结构
动态剖析
数据依赖分析
下载PDF
职称材料
用线程级推测技术在多核体系结构上并行化科学计算应用
被引量:
2
3
作者
王耀彬
安虹
+2 位作者
郭锐
闫洁
路璐
《小型微型计算机系统》
CSCD
北大核心
2010年第2期264-270,共7页
线程级推测技术使在多核上加速传统上难以手工或自动并行化的串行程序成为可能,它不仅需要合理地选择线程的划分策略,而且需要合理地选择适合推测执行的应用.已有的大量研究主要集中在如SPEC CPU这样的桌面应用领域,为了全面地认识TLS...
线程级推测技术使在多核上加速传统上难以手工或自动并行化的串行程序成为可能,它不仅需要合理地选择线程的划分策略,而且需要合理地选择适合推测执行的应用.已有的大量研究主要集中在如SPEC CPU这样的桌面应用领域,为了全面地认识TLS技术的应用适用性,本文探讨TLS技术对科学计算应用的性能提升潜力,提出一套TLS适用性的基本判定准则,实验结果表明采用该技术加速SPLASH2中的多数应用可以有效利用16核及以上的计算资源.
展开更多
关键词
多核
线程级推测
线程划分
动态剖析
下载PDF
职称材料
HPEC中子程序级推测并行性分析
4
作者
王欣夷
王耀彬
+3 位作者
李凌
杨洋
卜得庆
刘志勤
《计算机工程》
CAS
CSCD
北大核心
2020年第8期210-215,222,共7页
线程级推测(TLS)技术的有效运用可提高多核芯片的硬件资源利用率,其已在多种串行应用的自动并行化工作中取得了较好效果,但目前缺乏对HPEC应用子程序级线程推测方面的有效分析。针对该问题,设计子程序级推测的剖析机制及核心数据结构,选...
线程级推测(TLS)技术的有效运用可提高多核芯片的硬件资源利用率,其已在多种串行应用的自动并行化工作中取得了较好效果,但目前缺乏对HPEC应用子程序级线程推测方面的有效分析。针对该问题,设计子程序级推测的剖析机制及核心数据结构,选取HPEC中7个具有代表性的程序,挖掘其子程序级的最大潜在并行性,并结合线程粒度、并行覆盖率、子程序调用次数、数据依赖及源码,对程序的加速比进行分析。实验结果表明,fdfir、svd、db和ga程序的加速比在2.23~11.31,tdfir程序的加速效果最好,加速比达到221.78,对于包含多次非重度数据依赖子程序调用的应用,更适合采用子程序级TLS技术测试其并行性。
展开更多
关键词
线程级推测
多核芯片
HPEC基准套件
数据依赖
动态剖析
下载PDF
职称材料
基于多核平台无关属性的程序并行度分析工具
5
作者
熬冉
谭光明
陈明宇
《高技术通讯》
CAS
CSCD
北大核心
2015年第1期31-37,共7页
为了充分利用计算机多核平台的并行能力,研究了针对特定多核平台的程序并行度分析和优化的方法,提出了一个基于平台无关属性提取的并行度分析工具ParaInsight。用此工具可分析程序中不同区域的可并行性,同时能够根据小规模输入集下的信...
为了充分利用计算机多核平台的并行能力,研究了针对特定多核平台的程序并行度分析和优化的方法,提出了一个基于平台无关属性提取的并行度分析工具ParaInsight。用此工具可分析程序中不同区域的可并行性,同时能够根据小规模输入集下的信息预测这些属性在大规模输入集下的值。通过使用支持向量机(SVM)构建的预测模型,对大输入集下的程序属性值进行预测。选取多线程程序测试包Parsec中的两个程序进行了实验,实验结果表明,通过核函数选择、训练参数调优以及输入变量筛选等方法,用ParaInsight可以有效地预测绝大多数并行区域及其不同的属性值。
展开更多
关键词
并行度分析
动态剖析
输入感知
SVM预测
下载PDF
职称材料
题名
融合动态采样剖析的可重构指令集处理器
1
作者
张惠臻
王超
机构
华侨大学计算机科学与技术学院
中国科学技术大学计算机科学与技术学院
出处
《计算机科学》
CSCD
北大核心
2013年第3期31-35,共5页
基金
国家自然科学基金青年基金(61202053)
华侨大学引进人才科研基金(12BS214)资助
文摘
可重构指令集处理器能够根据应用程序特点动态扩展其指令集,其硬件架构和软件工具的设计与传统设计有很大不同。在研究可重构指令集处理器软硬件特性的基础上,提出一种集成动态采样剖析硬件的可重构指令集处理器架构。该处理器具有3种不同的工作模式,它通过剖析硬件采样获取程序热点,利用配套工具链半自动地完成指令扩展生成、编译器重定向和可编程硬件逻辑配置,从而获得在不同嵌入式应用领域的硬件适应性和软件兼容性。针对性的实验结果表明,该处理器架构的采样剖析机制准确有效,并且在增加有限的硬件开销的情况下,能够很好地适应应用变化。
关键词
计算机系统结构
可重构指令集处理器
指令扩展
动态
采样
剖析
Keywords
Computer architecture, Reconfigurable instruction set processor, Instruction extended, Dynamic samplingprofiling
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
针对子程序结构的线程级推测并行性分析
被引量:
6
2
作者
梁博
安虹
王莉
王耀彬
机构
中国科学技术大学计算机科学与技术系
中国科学院计算技术研究所计算机系统结构重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2009年第2期230-235,共6页
基金
教育部-英特尔信息技术专项科研基金项目(MOE-INTEL-08-07)资助
国家自然科学基金重点项目(60633040)资助
+1 种基金
国家“九七三”计划项目(2005CB321601)资助
国家“八六三”计划重大项目(2006AA01A102)资助
文摘
线程级推测技术为开发更多的线程级并行性,充分利用多核加速传统上难以手工或自动并行化的串行程序提供可行的技术途径.然而,这种技术的性能严重地依赖于线程划分方案.有研究表明,仅推测执行循环所产生的并行性是不够的,但推测执行子程序结构比循环结构要难.本文提出寻找适于推测并行执行的子程序结构的基本判定依据;通过运行由Simplescalar工具集改造得到的动态剖析工具ProRV、ProFun和SPEC CPU2000基准测试程序,我们对子程序结构线程化推测执行的适合性进行详细分析,给出具有指导意义的实验分析方法和实验数据.我们发现:1无返回值的子程序结构占据程序整体执行时间的大约40%;返回稀疏整型的子程序结构占据了程序整体执行时间的大约10%,对其返回值的预测成功率在70%左右.对于其他返回值类型的子程序结构,由于对其返回值的预测成功率过低,我们认为不适合作为线程划分的对象.2简单的last-value的值预测方案对于返回值的预测是简单而且足够有效的.3访存数据依赖普遍存在于子程序与其后继代码之间,显式同步机制对于针对子程序结构的线程级推测是必要的.
关键词
线程级推测
串行程序自动并行化
子程序结构
动态剖析
数据依赖分析
Keywords
thread-level speculation
automatically parallel of serial application
subroutine
dynamic profiling
data dependence analysis
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
用线程级推测技术在多核体系结构上并行化科学计算应用
被引量:
2
3
作者
王耀彬
安虹
郭锐
闫洁
路璐
机构
中国科学技术大学计算机科学技术系
中国科学院计算机系统结构重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2010年第2期264-270,共7页
基金
国家自然科学基金重点项目(60633040)资助
国家"九七三"重点基础研究发展规划基金项目(2005CB321601)资助
+1 种基金
国家"八六三"高技术研究发展计划重大项目(2006AA01A102-5-2)资助
教育部-英特尔信息技术专项科研基金项目(MOE-INTEL-08-07)资助
文摘
线程级推测技术使在多核上加速传统上难以手工或自动并行化的串行程序成为可能,它不仅需要合理地选择线程的划分策略,而且需要合理地选择适合推测执行的应用.已有的大量研究主要集中在如SPEC CPU这样的桌面应用领域,为了全面地认识TLS技术的应用适用性,本文探讨TLS技术对科学计算应用的性能提升潜力,提出一套TLS适用性的基本判定准则,实验结果表明采用该技术加速SPLASH2中的多数应用可以有效利用16核及以上的计算资源.
关键词
多核
线程级推测
线程划分
动态剖析
Keywords
multicore
thread-level speculation
thread partition
dynamic profiling
分类号
TP303 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
HPEC中子程序级推测并行性分析
4
作者
王欣夷
王耀彬
李凌
杨洋
卜得庆
刘志勤
机构
西南科技大学计算机科学与技术学院
西南科技大学四川省军民融合研究院
四川省计算机研究院
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第8期210-215,222,共7页
基金
国家自然科学基金(61672438)
国家留学基金委项目(CSC201908510040)
+3 种基金
四川省科技计划项目(2019YJ0326)
四川省教育厅研究项目(18ZB0603)
西南科技大学科研项目(18lzx451,17lzx621)
西南科技大学研究生创新基金(19ycx0051)。
文摘
线程级推测(TLS)技术的有效运用可提高多核芯片的硬件资源利用率,其已在多种串行应用的自动并行化工作中取得了较好效果,但目前缺乏对HPEC应用子程序级线程推测方面的有效分析。针对该问题,设计子程序级推测的剖析机制及核心数据结构,选取HPEC中7个具有代表性的程序,挖掘其子程序级的最大潜在并行性,并结合线程粒度、并行覆盖率、子程序调用次数、数据依赖及源码,对程序的加速比进行分析。实验结果表明,fdfir、svd、db和ga程序的加速比在2.23~11.31,tdfir程序的加速效果最好,加速比达到221.78,对于包含多次非重度数据依赖子程序调用的应用,更适合采用子程序级TLS技术测试其并行性。
关键词
线程级推测
多核芯片
HPEC基准套件
数据依赖
动态剖析
Keywords
Thread-Level Speculation(TLS)
multicore chips
HPEC benchmark suite
data dependency
dynamic profiling
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于多核平台无关属性的程序并行度分析工具
5
作者
熬冉
谭光明
陈明宇
机构
中国科学院计算技术研究所高性能计算机研究中心
中国科学院研究生院
出处
《高技术通讯》
CAS
CSCD
北大核心
2015年第1期31-37,共7页
基金
973计划(2012CB316502
2011CB302502)
+6 种基金
863计划(2009AA01A129)
国家自然科学基金(61272134
31327901
91430218
60921002
60925009
61472395)资助项目
文摘
为了充分利用计算机多核平台的并行能力,研究了针对特定多核平台的程序并行度分析和优化的方法,提出了一个基于平台无关属性提取的并行度分析工具ParaInsight。用此工具可分析程序中不同区域的可并行性,同时能够根据小规模输入集下的信息预测这些属性在大规模输入集下的值。通过使用支持向量机(SVM)构建的预测模型,对大输入集下的程序属性值进行预测。选取多线程程序测试包Parsec中的两个程序进行了实验,实验结果表明,通过核函数选择、训练参数调优以及输入变量筛选等方法,用ParaInsight可以有效地预测绝大多数并行区域及其不同的属性值。
关键词
并行度分析
动态剖析
输入感知
SVM预测
Keywords
parallelism analysis, dynamic profiling, input-aware, SVM-prediction
分类号
TP311.1 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
融合动态采样剖析的可重构指令集处理器
张惠臻
王超
《计算机科学》
CSCD
北大核心
2013
0
下载PDF
职称材料
2
针对子程序结构的线程级推测并行性分析
梁博
安虹
王莉
王耀彬
《小型微型计算机系统》
CSCD
北大核心
2009
6
下载PDF
职称材料
3
用线程级推测技术在多核体系结构上并行化科学计算应用
王耀彬
安虹
郭锐
闫洁
路璐
《小型微型计算机系统》
CSCD
北大核心
2010
2
下载PDF
职称材料
4
HPEC中子程序级推测并行性分析
王欣夷
王耀彬
李凌
杨洋
卜得庆
刘志勤
《计算机工程》
CAS
CSCD
北大核心
2020
0
下载PDF
职称材料
5
基于多核平台无关属性的程序并行度分析工具
熬冉
谭光明
陈明宇
《高技术通讯》
CAS
CSCD
北大核心
2015
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部