高性能计算机的体系结构

来自计算思维百科
跳转至: 导航搜索

高性能计算机的体系结构中主要包括对称多处理器 (symmetric multiple processor, SMP)技术、非一致访问分布共享存储(non uniform memory access, NUMA)技术、大规模并行处理机(massively parallel processor, MPP)技术等。近年来,高性能计算机体系结构的一个发展趋势是SMP机群系统,其是由拥有多个处理器的SMP节点和连接各节点间的快速网络构成的多级体系结构。从全球高性能计算机 TOP500排行榜中可以看出,排行榜上的高性能计算机所采用的体系结构主要以集群技术和大规模并行处理技术为主。

基本概念

高性能计算机的体系结构中主要包括对称多处理器 (symmetric multiple processor, SMP)技术、非一致访问分布共享存储(non uniform memory access, NUMA)技术、大规模并行处理机(massively parallel processor, MPP)技术等。近年来,高性能计算机体系结构的一个发展趋势是SMP机群系统,其是由拥有多个处理器的SMP节点和连接各节点间的快速网络构成的多级体系结构。从全球高性能计算机 TOP500排行榜中可以看出,排行榜上的高性能计算机所采用的体系结构主要以集群技术和大规模并行处理技术为主。

对称多处理器技术

对称多处理器技术是相对于非对称多处理器技术而言应用十分广泛的并行技术。在该架构中,多个处理器运行操作系统的单一复本,同时共享内存和计算机的其它资源,如图1所示。SMP系统采用商业化的处理器,这些处理器通过总线或交叉开关连接到共享存储器。所有的处理器都可以平等地访问内存、I/0和外部中断。系统资源被所有的处理器共享,而且工作负载能够均匀地分配到所有可用的处理器上。目前,多数SMP系统的处理器是通过共享系统总线来实现数据的对称多处理。然而,在SMP系统中增加更多处理器的两个主要问题是系统需要消耗更多资源来支持处理器抢占内存,以及内存同步问题。

6.3.1.png

图1对称多处理SMP技术

非一致访问分布共享存储NUMA技术

在非一致访问分布共享存储技术(NUMA)体系结构中,每个处理器与本地存储器和高速缓存相连,多个处理器通过处理器、存储器互联网络相连,处理器还通过处理器和I/O网络访问共享的I/O和外围设备,如图2所示。对于处理器之间的通信,则通过可选的处理器之间的通信网络来实现。NMUA技术在科学与工程计算领域具有不可替代的地位,在联机事务处理 (OLTP)、决策支持服务 (DSS)、Intranet以及Internet中的地位越来越重要。目前,NUMA并行机的处理器数目可达到512个,且带宽可随处理器数目基本上呈线性扩展。如此多的处理器数量,使得单一系统映像的NUMA机足以覆盖绝大多数的高性能应用。首先,由于它具有与SMP相同的编程模式,因此在科学与工程计算领域具有不可替代的地位;其次,由于它具有共享内存和良好的可扩展性优势,可以适应企业数据中心的多种应用。NUMA系统能够运行世界上一些较大的UNIX数据库应用,而且正被广泛接受为电子商务的主流技术,其优势主要体现在处理功能强大、I/O的大规模可扩展性、高可用性、工作负荷和资源管理的广泛灵活性,而且无需改变SMP编程模型等方面。

6.3.2.png

图2 非一致访问分布共享存储NUMA技术

MPP技术

MPP是一种分布式存储器模式,能够将更多的处理器纳入一个系统的存储器。一个MPP具有多个节点,每个节点都有自己的存储器,可以配置为SMP模式,也可以配置为非SMP模式。单个的节点相互连接起来就形成了一个总系统。MPP体系结构中出现的问题比较容易解决,开发成本较低,同时由于没有硬件支持共享内存或高速缓存一致性的问题,较易实现大量处理器间的连接,MPP的这些优势对硬件开发商颇具吸引力。

单一SMP模式与MPP模式的区别主要是:在SMP模式中,数据一致性是由专用硬件管理的,这样做比较容易实现,但成本较高;在MPP模式中,节点之间的一致性是由软件来管理,因此,它的速度相对较慢,但极大地降低了实现成本。