-
题名面向大规模计算集群的多轨分割网络
被引量:2
- 1
-
-
作者
邵恩
元国军
郇志轩
曹政
孙凝晖
-
机构
计算机体系结构国家重点实验室(中国科学院计算技术研究所)
中国科学院大学
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2017年第11期2534-2546,共13页
-
基金
国家重点研发计划项目(2016YFB0200300
2016YFGX030148
+7 种基金
2016YFB0200205
2016GZKF0JT006)
国家自然科学基金项目(61572464
61331008
61402444)
国家"八六三"高技术研究发展计划基金项目(2015AA01A301)
华为科研基金项目(YB2015070066)
中国科学院战略性先导科技专项(XDB24060600)~~
-
文摘
在千万亿次规模的系统中,互连网络设计面临新的挑战.高性能节点和大规模是构建千万亿次系统的主要技术趋势,不断提高的节点计算能力要求互连网络提供更高的性能,而不断增大的规模又对互连网络扩展性提出了更高的要求.此外,随着系统规模的增大,集合通信的执行时间也在不断增长,制约了应用的扩展性,集合通信的性能需要得到进一步优化.除性能之外,可靠性问题也随着系统规模的扩大而日益严重.而随着计算节点性能的不断提高,互连网络逐渐成为限制大规模计算机系统性能的瓶颈.互连网络核心部件交换芯片可提供的聚合网络带宽受到工艺和封装技术的限制.从网络结构与交换机结构的协同设计思想出发,提出了一种在交换机聚合带宽限定的条件下多轨分割网络结构和设计方法.通过数学建模和网络模拟仿真,分析了该多轨分割网络的性能边界.评测结果表明:该网络可将短消息(长度小于128B)的平均延迟性能提高10倍以上,为以短消息占多数的数据中心网络的性能优化提供了新思路.
-
关键词
大规模计算集群
多轨网络
带宽分割
数据中心网络
大规模网络模拟
-
Keywords
largescale clusters
multirail network
bandwidth division
data center network
largescale network simulation
-
分类号
TP303
[自动化与计算机技术—计算机系统结构]
-