期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
多核Cache稀疏目录性能提升方法综述 被引量:2
1
作者 吴健虢 陈海燕 +2 位作者 刘胜 邓让钰 陈俊杰 《计算机工程与科学》 CSCD 北大核心 2019年第3期385-392,共8页
受限于功耗,十多年前通用微处理器就停止追求更高的主频转而向集成更多处理器核的方向发展;同时,随着晶体管密度按摩尔定律不断提高,单片可集成的处理器核数成倍增长,片上多核、众核处理器已成为高性能微处理器发展的主流。未来千核级... 受限于功耗,十多年前通用微处理器就停止追求更高的主频转而向集成更多处理器核的方向发展;同时,随着晶体管密度按摩尔定律不断提高,单片可集成的处理器核数成倍增长,片上多核、众核处理器已成为高性能微处理器发展的主流。未来千核级通用众核处理器支持共享存储编程模型是一种必然趋势,但传统的Cache一致性目录结构面临着查找延迟高、目录项替换频繁以及硬件代价和功耗可扩展性有限等问题。稀疏目录实现了传统目录结构硬件开销与一致性维护效率的折衷,被认为是众核处理器维护Cache一致性的一种高能效、可扩展结构。综述了近年来提高稀疏目录性能的相关研究与方法,并对其在面积、访问延迟、功耗和实现复杂性等方面进行分析,归纳出这些方法各自的优点和存在的不足,对创新设计未来高性能众核处理器共享存储体系结构具有一定的参考价值。 展开更多
关键词 单片多核 CACHE一致性 稀疏目录 相联度 可扩展
下载PDF
GSVM:一种支持Gather/Scatter的向量存储器
2
作者 陈海燕 刘胜 吴健虢 《国防科技大学学报》 EI CAS CSCD 北大核心 2020年第3期1-8,共8页
宽单指令多数据流(Single Instruction Multiple Data,SIMD)架构数字信号处理器一般都能高效支持地址连续或等距跨步等规则应用的向量访存,但对于科学与工程计算中广泛存在的不规则应用的数据访存则带宽利用率往往较低,从而大幅降低了... 宽单指令多数据流(Single Instruction Multiple Data,SIMD)架构数字信号处理器一般都能高效支持地址连续或等距跨步等规则应用的向量访存,但对于科学与工程计算中广泛存在的不规则应用的数据访存则带宽利用率往往较低,从而大幅降低了其整体运算能效。为了提高不规则应用的向量访存性能,基于某SIMD数字信号处理器的体系结构,设计了一种支持Gather/Scatter访存的向量存储器GSVM。通过设计与SIMD宽度相匹配的向量地址计算单元和合适深度的冲突缓冲器阵列,实现了Gather/Scatter指令向量地址计算、仲裁与缓存的全流水访存操作。实验结果表明,相比以前不支持Gather/Scatter访存的存储器,GSVM在增加22%的硬件代价基础上,基于稀疏矩阵向量乘的测试程序集获得了2~8的性能加速比。 展开更多
关键词 单指令多数据流 Gather/Scatter 向量随机访存 访存冲突
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部