首页 > 科技 > HLRN北德超级计算联盟选用S9200WK服务器集群支持最新科学研究

HLRN北德超级计算联盟选用S9200WK服务器集群支持最新科学研究

概览:

• HLRN(北德超级计算联盟)由德国七个州联合创建于 2001 年。联盟的宗旨是以强大的计算和存储能力为国内的科学研究提供支持。

• 浮点运算能力可达 16 PetaFLOP/s 的全新 HLRN-IV 系统实际上分处祖斯研究所 (Zuse Institute Berlin, ZIB) 与哥廷根大学 (University of Göttingen) 两处,由一条 10GigE 专用冗余光缆连接。

• 系统采用英特尔® 至强® 铂金 9200 处理器为各节点提供出色的计算性能、内存带宽和计算密度。

• 系统采用英特尔® Omni-Path 架构在节点间实现高速稳定的数据传输。

执行概要

目前,HLRN 超级计算机的用户包括 100 多所大学和 120 多个研究机构。他们通过使用超算,不断探索众多科研前沿领域,创造更美好的未来。在选择英特尔® 全新处理器技术为其最新超级计算机提供支持前,HLRN 曾为寻找最佳解决方案进行过周密细致的测试。哥廷根大学的教授 Ramin Yahyapour 博士解释道:“HLRN 采购超级计算机是为了实现算力的巨大飞跃,便于开展新的实验。”

挑战

“普遍来说,现在科学越来越涉及大量计算和海量数据,也就是说,可供使用的系统越大,就越能够方便科学家更好地开展研究。这就是 HLRN 对于科学研究至关重要的原因,”Ramin Yahyapour 教授表示。

由于在之前部署三个超算系统的过程中获得了大量专业知识,HLRN 被称为非常严苛的客户。来自 ZIB 的 Alexander Reinefeld 教授强调指出,“我们希望所有基准测试应用都拥有最高水平的性能表现。我们全套基准测试均经过仔细斟酌、认真挑选,这样就可以依照每项测试标准对 CPU、通信网络及并行 I/O 等系统各特定部分进行测评。我们要的并非理论上的峰值表现,而是系统的真正性能。这就增加了供应商针对我们的应用来优化其基础设施的复杂性。换句话说,甄选合适的处理器及合适的互联能力对我们整个系统的表现来说极其重要。”

和当前大多数研究一样,增加计算机实际容量的需求来自这样的现实:能够进行多种类型的仿真对于研究人员来说非常关键。速度更快的计算机主要用于提升仿真的规模和分辨率,以期获得新的发现。

“我们要的是系统的真正性能……也就是说,甄选合适的处理器及合适的互联能力

对我们整个系统的表现来说极其重要。” — Reinefeld 教授

解决方案

HLRN 采购了一台内核数量不到 25 万的全新超级计算机。来自第二代英特尔® 至强® 可扩展处理器家族的英特尔® 至强® 铂金 9200 处理器将作为 HLRN “合适的处理器”。至于 “合适的互联能力”,HLRN 选择的是英特尔® Omni-Path 架构。系统由 Atos(前Bull Computing)制造,一分为二部署在 ZIB 和哥廷根大学。两家之前使用的就是这种分置式系统模式,并且已经部署了长度超过 170 英里,连接柏林和哥廷根的 10GigE 专用冗余光缆。

ZIB 的研究人员将利用 HLRN-IV 开展流体动力学研究,包括开发针对飞机机翼的湍流模型。

ZIB 的研究人员将利用 HLRN-IV 开展流体动力学研究,包括开发针对飞机机翼的湍流模型。

结果

HLRN 宣布,新系统 HLRN-IV 大约将比此前使用的系统快六倍,浮点运算能力达 16 PetaFLOP/s。注释[1] 这无疑让研究人员兴奋无比,而且目前利用此系统开展的研究数量非常惊人。Reinefeld 教授表达了他的激动之情:“这是个非常棒的系统。我们的用户无需更改代码就可以立即从这个更加强大的系统中受益。第二代英特尔® 至强® 可扩展处理器的同质架构将带来名副其实的性能可移植性。这一点对于我们的研究人员来说非常重要,如此一来,他们就可以迅速获得功能更强大的新系统所带来的益处。”

HLRN 内部重点研究领域包括:

地球系统科学,这门科学包括气候变化研究。研究课题有海洋、雨林、冰川、南极浮游生物(微藻)、矿物性粉尘循环以及平流层的动态研究。

流体动力学,包括针对轮船涡轮机、风轮机以及飞机机翼的湍流模型。这些模型以需要巨大的算力著称。购置 HLRN-IV将能够实现在大型计算机系统上运行细粒度更高的湍流仿真,如风吹过城市或者横穿涡轮机的叶片。通过为整个城市建模,可以研究新建筑物会如何改变风向以及影响城市内部各种微气候的其他因素。这可能会产生提升城市生活的新设计方向。有些研究人员希望通过研究了解如何为未来高扬程商用飞机的问世做好准备。另一些研究人员希望通过研究固体散装货物(如铁矿石或镍矿石)的液化来挽救生命、营救船只。在过去十年中,因未能正确处理这种问题,已经导致全球至少有七艘船舶全船沉没。

哥廷根大学的研究领域包括有关细胞和分子自动机的联合项目。

哥廷根大学的研究领域包括有关细胞和分子自动机的联合项目。

医疗保健,这是一个范围非常广泛的研究领域。HLRN 的研究人员希望从多方面提供帮助,包括改善家庭医疗照护条件。加深对疾病和治疗的了解与我们每个人都息息相关。研究包括药效、药物相互作用以及副作用的仿真。借助系统的巨大算力,处于这些领域的重要研究人员可以着手对这些仿真研究中的 “个性化药物” 方面,而不仅仅是普通人群的平均疗效展开深入研究。

多元化研究中的出色表现

在科学社群方面,HLRN 需要为众多研究人员产生的各种工作负载提供支持。因此,HLRN 系统必须具备通用系统的特点,但同时性能仍然保持最高水平。他们最终的选择中没有加速器。

“虽然我们将包括 GPU 在内的各类加速器纳入到了采购流程,但是通过在系统中使用 GPU 或其他加速器来获得最高性能并无优势可言。”

— Thomas Steinke 博士,ZIB 超算部门主管

HLRN 采用的基准测试是开放的,其中包括可以利用 GPU 的基准测试。HLRN 发现,即使利用加速器会在某些工作负载方面带来性能上的优势,但由于它会导致通用计算能力下降或者会增加成本,那么这些优势并不足为道。事实证明,基于第二代英特尔® 至强® 可扩展处理器的同构系统是满足 HLRN 科学家及研究人员各种需求的最好选择。

击败阿姆达尔定律

时刻铭记阿姆达尔定律 (Amdahl’s Law) 的 Thomas Steinke博士很喜欢强调高速计算机就要使用高速算法。他分享的观点是,“与此前的多核架构相比,由于采用了真正高性能的第二代英特尔® 至强® 可扩展处理器,因此为扩展节点而对标准进行优化所带来的压力有所降低。”第二代英特尔® 至强® 可扩展处理器为高性能计算提供了一个极好的选择,能够帮助程序员应对阿姆达尔定律。

“我们的用户无需更改代码就可以立即从这个更加强大的系统中受益。”

— Reinefeld 教授

高性能计算融合人工智能的未来

人工智能 (AI) 与机器学习的影响深入到了 HLRN 研究的方方面面。目前一个热点领域是将机器学习和人工智能技术与传统的仿真能力融合。尽管有一些前景美好的研究结果见诸报端,但是尚有许多工作要做。算法研究很可能会将研究人员带至很多不同的研究方向。这种对灵活性的需求是 HLRN 选择第二代英特尔®至强® 可扩展处理器为其下一代研究工作提供支持的原因。

避免数据传输

Yahyapour 教授强调指出:“CPU 对人工智能和机器学习来说相当有益。这是我们研究人员需求不断增加的领域。他们历来不大喜欢数据密集型工作,但是我们知道,未来这可能会成为新系统的一种新趋势,这也是尤其让人感兴趣的一点。”

事实证明,英特尔® 高级矢量扩展技术 512(英特尔® AVX-512)是有助于提高 HLRN 计算能力的合理选择,再加上英特尔® 深度学习加速(英特尔® DL Boost)为 AVX-512 助力,使新的前沿高性能计算应用有了非常出色的表现。

无论使用哪种算法,都可以在数据所在地进行计算,因而避免了数据传输。这意味着计算能力大大提升,能量浪费有所减少。堪称双赢!

在探索新算法、新的应用技术时,没有什么比系统的灵活性更重要。第二代英特尔® 至强® 可扩展处理器可带来出色的性能和灵活性,满足未来挑战之需。

注释[1] :

之前使用的系统 HLRN-III 由两套综合设备组成,分别位于柏林的 ZIB 和汉诺威的 Leibniz Universität IT Services (LUIS),由 10GigE 专用光缆连接,供 HLRN 提供所谓的单系统视图。该系统分两阶段交付,计算节点详细信息包括:第一阶段交付两台 Cray XC30 计算机,每台计算机包括 744 个计算节点,共部署 1488 个主内存共计 93 TB 的双路英特尔® 至强® 可扩展处理器 E5-2695 v2,通过使用 Dragonfly 拓扑结构的快速 Cray Aries 网络进行连接。第二阶段增加 2064 个英特尔® 至强® 可扩展处理器 E5-2680 v3 计算节点,计算内核数量达 85248 个,柏林有 1872 个计算节点,汉诺威有 1680 个节点,峰值性能总计达 2.7 PetaFlops/s,主内存扩展达 222 TB。

来源:英特尔官网

本文来自投稿,不代表本人立场,如若转载,请注明出处:http://www.souzhinan.com/kj/216539.html