Root Nation文章技术Frontier 超级计算机的所有秘密

Frontier 超级计算机的所有秘密

-

它是干什么用的? 边疆,世界上最强大、最快的超级计算机在橡树岭国家实验室运行?从反应堆建模到气候预测。

这个问题有更广泛的背景。我经常被问到,如果我们每个人都可以拥有一台计算机,为什么我们还要建造如此强大的机器呢?当然,超级计算机是非常昂贵的机器,消耗大量能源,但我们从它们身上得到的东西更有价值。今天我将尝试用 Frontier 超级计算机的例子来解释它。

也很有趣: OpenAI 的历史:公司的过去和未来

为什么我们需要超级计算机?

简而言之,超级计算机可以处理大量信息。我们的世界正在迅速变化,人类创建了一个巨大的数据库,需要对其进行处理、分析、分组、保存。例如,这将帮助我们获得新的、更便宜和更有效的药物、更耐用的材料、预测数十年的气候变化等。超级计算机使我们能够对我们将要建造的物体(例如聚变反应堆)的行为进行建模。这些只是最快超级计算机应用的一些例子。是的,它们的制造和维护成本非常昂贵,但它们是值得的。

前沿超级计算机

但让我们从基础开始。到底什么是超级计算机?目前还没有明确的定义。然而,当前每台超级计算机的一个特征是非常高的计算能力。网上可以找到一个简化的定义,根据超级计算机是指能够实现至少1 teraflops计算性能的机器, 即 1012 每秒(万亿)次浮点运算。与普通家用电脑相比,这个数量很多。

如果早期计算机的速度是用 IPS(每秒指令数)来衡量的,那么就必须为超级计算机发明一个新的单位——FLOPS,即每秒的浮点运算次数。这个数字越高,计算机的功能就越强大。

当然,基于特定计算阈值的方法很快就会过时,因为作为这些机器核心的处理器的性能在不断发展和增长。随着新处理器的每次发布,现代计算机的生产力也随之提高。然而,建造它们非常困难且经济昂贵。

另请阅读: 人脑计划:模仿人脑的尝试

哪些超级计算机速度最快?

我们有关于这个问题的最新数据。 2023 年 500 月,多年来定期发布地球上最强大计算机性能评级的 Top62.org 网站发布了最新的第 500 版 Top500 排名,其中列出了目前存在的 台最高效的超级计算机。

- 广告 -

前沿超级计算机

Frontier 系统仍然是地球上最高效的超级计算机。这台超级计算机是世界上第一个百亿亿次计算系统,即其速度超过了1亿亿次浮点运算。 Frontier 本身位于美国田纳西州橡树岭的国家实验室。该超级计算机目前处于领先地位,其 HPL 分数(高性能 LINPACK - 一种评估超级计算机原始性能的特殊测试)为 1193 EFlops(10 exaflop 是 万亿次,即 18 每秒浮点计算)。

比较:最强大芯片的速度 Apple M1 Ultra 的运算能力约为 21 teraflops(一万亿次浮点运算)。数量巨大,这是事实。令人惊奇的是,早在2002年就有一台计算机的速度达到了更高的水平——这就是日本科技巨头NEC公司的地球模拟器超级计算机。它的速度约为 36 terflops!

前沿超级计算机

Frontier 使用 AMD EPYC 64C 2 GHz 处理器,基于最新的 HPE Cray EX235a 架构。它由 9408 个 AMD EPYC 处理器和 37632 个 AMD Instinct MI250x 加速器组装而成。该系统总共拥有 8 个处理器和图形核心。此外,Frontier 的能效高达 699 GFlops/瓦,并使用 HPE Slingshot 904 网络进行数据传输。因此,在测试期间,它能够产生高达 52,59 exaflops 的速度。峰值性能达到创纪录的 11 exaflops。该设备的成本估计为 1,1 亿美元。

这是世界上第一台也是迄今为止唯一一台以触发器模式工作的超级计算机。 Frontier 一年前成为领先者,但在 2023 年 2024 月的排名中不允许任何人侵犯其位置。到目前为止,到 年初,美国的超级计算机是世界上生产力最高的。

但科学家们已经暗示,也许一段时间后他将不得不承认另一台美国机器的优越性:极光超级计算机。

极光超级计算机

根据最新排名,运行于美国伊利诺伊州阿贡领先计算设施的采用英特尔 Sapphire Rapids 芯片的新型 Aurora 超级计算机以 585,34 PFlops 的 HPL 性能排名第二。虽然这只是 Frontier 旗舰超级计算机性能的一半,但 Aurora 系统尚未完成,目前仅计划的最终系统的一半可以运行。完成后,Aurora 的预测性能可能会超过 2 EFlops。英特尔创建的 Aurora 超级计算机基于 HPE Cray EX 架构 - 英特尔百兆级计算 Blade,采用英特尔至强 CPU Max 系列处理器和英特尔数据中心 GPU Max 系列加速器。与 Frontier 中一样,HPE Slinghot-11 网络负责数据传输。

Microsoft Azure Eagle 超级计算机

第三高效的超级计算机是一种名为 Eagle 的新型云系统 Microsoft Azure 在美国。这在某种程度上是一种技术好奇心,因为 Eagle 是一款云超级计算机,在 Top500 排名中排名第三,这是云系统有史以来取得的最高排名。 Microsoft Eagle拥有561,2 PFlops的HPL性能,计算核心是Intel Xeon Platinum 8480C处理器和加速器 NVIDIA H100。

这里值得一提的是日本超级计算机Fugaku,其性能比Frontier低三倍以上,也是过去生产力最高的超级计算机之一——LUMI。尽管中国人仍在建设强大的东西,但这一切都在未来。

也很有趣: 2024 年的技术预测:期待什么?

为什么我们需要如此多的计算能力?

你可能会钦佩地球上最快机器的效率,但它们所实现的性能并不是打破记录,而是在最短的时间内得到想要的计算结果。没有超级计算机用户使用该机器来编写电子邮件或准备演示文稿。使用此类机器来执行我们可以在家里的设备上执行的任务将是一种可怕的浪费。毕竟,超级计算机的计算潜力允许您执行普通计算机无法执行的操作。

我们正在谈论哪些任务?首先,那些能够带来实际利益的东西,这些不一定是能够立即转化为金钱的东西。值得回顾的是,Frontier超级计算机的创建仅花费了约600亿美元。当然,它的使用和持续维护成本也很大。该超级计算机占地680平方米,耗电量21兆瓦。

- 广告 -

前沿超级计算机

Frontier 与其他超级计算机一样,可用于气候建模、对人类至关重要的新药物的研究和生产、新材料技术的研究等任务。当然,此类设备执行的任务范围要广泛得多,包括分析各种类型的巨大数据集:金融、医疗、卫星图像、物理现象建模等等。事实上,Frontier 是第一台百亿亿级超级计算机,这使得它能够执行即使在其他超级计算机上也很难完成的任务。

一个例子是热核反应堆整个生命周期的建模。是的,这不是一个错误。世界上还没有一个聚变发电厂,但 Frontier 强大的百亿亿次计算能力使得模拟假想的聚变反应堆的行为并预测此类反应堆中等离子体的行为成为可能。当然,在热核能源商业化之前,很难想象其带来的好处,但世界上没有人怀疑,有助于创造和发展热核能源、使全人类摆脱能源短缺的计算能力是值得的。投资。

另请阅读: 关于一切 Microsoft 副驾驶:未来还是方向不对?

超级计算机和医学

超级计算机的应用之一是与化学品和有机化合物的结构相关的复杂且耗能的计算。由于能够在非常精确的水平上模拟给定化合物的行为,对单个物质的行为进行仔细分析是可能的,这是一种允许开发新的、更有效的药物的工具。

前沿超级计算机

早在2020年,Frontier超级计算机推出之前,橡树岭国家实验室的科学家们就拥有了Summit超级计算机(这台机器是2018年效率最高的超级计算机,至今仍在使用,排名第7,效率为148,8 PFlops)用它来开发一种新型抗癌药物。事实证明,这种新药的治疗效果比以前使用的方法好约 10%,更有效。当然,10% 并不算多,但请告诉那些由于这个“微小”差异而成功挽救生命的患者。人的生命当然是无价的,但任何具有更高功效的药物都可以为医疗保健系统节省大量资源并降低治疗成本。这就是 Frontier 可以派上用场的地方。其能力远高于同级Summit超级计算机。

另请阅读:

前沿与新气候模型

气候建模需要对地球千年历史模型进行分析和论证。当然,这是一项需要大量计算资源的任务。我们越准确地模拟气候变化并预测长期会发生什么,我们就需要越快、越强大的超级计算机。

桑迪亚国家实验室的马克·泰勒(Mark Taylor)是世界上第一个使用升级计算进行长期气候预测的研究人员之一,他曾表示:“Frontier 超级计算机独特的计算架构实现了我们以前无法做到的事情。”也就是说,这台机器的计算能力将过去需要几年的计算减少到几天。同时,它使研究人员能够获得气候变化和极端天气条件长期影响的详细估计。 “这是气候建模的新黄金标准,”泰勒补充道。

前沿超级计算机

有什么好处?它们太大了。预测灾难性天气变化的能力可以挽救数万人甚至数百万人的生命。分析气候变暖对全球和区域水循环可能产生的影响,使我们能够为未来的变化提前做好准备。现代空间模型是存在的,但它们对计算的要求极高。直到最近,要求太高了。是的,它们使我们能够从理论上预测构成我们所说的天气或气候的各种元素之间的复杂相互作用,例如伴随云形成的对流运动,但需要处理大量的信息流并进行极其复杂的计算。

Frontier 超级计算机的出现已经改变了这一点。能源百亿亿次地球系统模型 (E3SM) 项目通过将新的软件方法与巨大的百亿亿次性能相结合,克服了这些障碍。该研究的合著者、E3SM 项目的协调员以及名为 SCREAM 的 E3SM 大气模型的合著者 Sarath Sripathy 解释道:“气候建模界长期以来一直梦想以足够快的速度运行公里级模型以促进长达数十年的预测,现在它已成为现实。”.

换句话说,没有 Frontier 的项目将因缺乏数据处理量而失败。但值得注意的是,不仅基础算力重要,模型本身的优化也很重要。劳伦斯利弗莫尔国家实验室的气候学家彼得考德威尔和他的团队在过去五年里从头开始构建了一个新的云模型。它将在图形处理器 (GPU) 上高效工作,图形处理器如今是现代超级计算机计算能力的一个非常重要的组成部分。同级别中有趣的顶级汽车也可以包含在这里。

想象。调整代码以在 GPU 上运行显着提高了性能。 SCREAM 可以在 8192 个 Frontier 节点上运行,以模拟全球云的形成,而这通常需要在单个 1,25 小时计算会话中花费一年多的时间(准确地说是 24 年)。 Frontier 可以在几周内完成跨越 30-40 年的长期模拟。研究人员指出,以前几乎不可能进行这样的计算。有兴趣了解更多有关这些研究的人可以 熟悉新的科学出版物 马克·泰勒和他的团队。

也很有趣:

前沿与材料技术

一个利用 Frontier 超级计算机的百亿亿次潜力的有趣项目是材料技术领域的工作。这是有史以来最大的合金计算模拟之一,由于其计算效率,使得达到接近量子级的精度成为可能。这项研究由密歇根大学的 Vikram Gavini 进行,其创新之处在于它使用薛定谔方程来模拟不同材料的行为。 Frontier 强大的计算能力使其能够模拟由 75 个原子组成的镁合金系统。

前沿超级计算机

镁合金是一种非常有趣的材料。它非常轻,同时又很坚固。然而,镁合金对某些缺陷敏感,主要是位错(即材料晶体结构中的大量缺陷),这会极大地改变其机械性能。这使得一种有前途的材料变成了一块无法使用的金属,因为它容易破裂、易碎且不稳定。科学家们在 Frontier 计算能力的帮助下成功纠正了镁合金中的一些缺陷。但这只是艰苦工作的开始。

也很有趣: 

超级计算机的未来?

传统计算机无法解决一些科学技术问题给我们带来的挑战。超级计算机具有更强的计算能力,使其能够执行普通计算机不可能或花费太多时间的计算。通过创建超级计算机,科学家们努力扩展我们的知识和能力的边界,并解决可能对我们的未来产生巨大实际影响的问题。

摩尔定律指出,计算机的能力呈指数级增长。每两年,计算速度就会翻一番,工程师和科学家们设法找到以前认为不可能的问题的解决方案。

前沿超级计算机

有一天,超级计算机将变得司空见惯。毕竟,仅仅十年前,虚拟现实、云游戏、元宇宙等概念还只存在于少数技术专家和极客的想象中,而今天这已成为我们的现实。未来的一代甚至不需要接受信息技术教育并在谷歌找到一份工作就可以利用超级计算机:它们将悄悄地、不知不觉地成为日常生活的一部分,就像智能​​手机、笔记本电脑和其他东西一样。

另请阅读: 

Yuri Svitlyk
Yuri Svitlyk
喀尔巴阡山脉之子、不为人知的数学天才、“律师”Microsoft,实用的利他主义者,左右
- 广告 -
注册
通知关于
客人

0 评论
嵌入式评论
查看所有评论