×

IBM Fusion HCI 2.7.x 单个机架的硬件概述

hqy hqy 发表于2025-10-15 17:30:00 浏览4 评论0

抢沙发发表评论

https://www.ibm.com/docs/zh/fusion-hci-systems/2.7.x?topic=prerequisites-hardware-overview-single-rack



单个机架的硬件概述

上次更新时间: 2024-04-19

查看整体系统布局和硬件配置。

  • 确保 IBM Storage Fusion 安装在受限的访问位置,以便只有获得适当授权的熟练人员才能访问该区域。


系统布局

设备机架详细信息如下所示:注: 无法使用位置 29 到 32 中的任何服务器配置机架。

硬件概述


  • 机架 ( R42型)

  • 42U 机架,带有 2 到 6 PDU ,连线和组件。

  • 仅计算服务器 (型号 C00 和 C04)/计算存储服务器 (型号 C01 和 C05)

  • 计算存储服务器是 IBM Storage Fusion HCI System的基本构建块。 每个系统至少有 6 个 C01 型服务器或 6 个 C05 型服务器,或者各有 3 个。 每个 C01 型服务器至少有两个存储驱动器,每个服务器上最多可以增加 10 个存储驱动器。 可以将 IBM Storage Fusion HCI System 扩展至至少 6 个具有 C00, C01, C04和 C05型组合的服务器之外。 最多可以添加 20 个服务器。 (除非选择 GPU 选项,在这种情况下,最多可以有 18 个服务器。) 添加到 IBM Storage Fusion HCI System 的每个服务器也会添加到存储集群,从而增加总存储容量。 这些服务器还将组合到 Red Hat® OpenShift® Container Platform中。 在 IBM Storage Fusion HCI System 上运行的所有应用程序都在 OpenShift 集群中部署和运行。

    • RU29 到 RU32

    • 您可以购买和增大存储器或计算节点的大小。

    • RU8 到 RU17

    • 您可以购买和增大存储器或计算节点的大小。

    • RU2 到 RU7 机架单元

    • 这些是缺省情况下可用的控制和计算节点。 至少三个控制节点和三个计算节点, CPU 为 32 个核心,内存为 256 GB。

      注: 在网络升级安装阶段,位于机架位置 RU7 的服务器将用作供应节点。

计算存储节点 (9155-C01) 的硬件配置如下所示:
  • Lenovo SR645 服务器

  • 2x AMD EPYC 7302 16 个核心 (总计 32 个核心) , 32 个线程 (总计 64 个线程) , 3.0 GHz 或 3.3 GHz CPU

  • 2x960 GB M.2 操作系统驱动器 (RAID 1)

  • 1x NVIDIA ConnectX-6 双端口 100 GbE 网络适配器

  • 1x NVIDIA ConnectX-6 双端口 25 GbE 网络适配器

  • 1x 1 GbE RJ45 4-端口 OpenShift Container Platform 适配器

  • 2-10x Samsung PM1733 7.68 TB NVMe PCIe 4.0 磁盘

  • 将成对添加 NVMe 磁盘

  • 所有计算存储服务器都必须具有相同数量的 NVMe 驱动器

  • 最大计算存储服务器数为 20 ,由安装的 GPU 服务器数减少

  • 1U 高度

计算存储节点 (9155-C05) 的硬件配置如下所示:
  • Lenovo SR645 更高密度

  • 2x AMD EPYC 7543 32C (总计64C ) 256MB L3, 2.8 GHz/ 3.7 GHz , CPU 225W

  • 基本 RAM: 16x 64GB DIMM (共 16 GB/core 1024GB )

  • 升级后的 RAM: 32x 64GB DIMM (共 32 GB/core 2048GB )

  • 2x 480GB M.2 操作系统驱动器 (RAID 1)

  • 1x NVIDIA ConnectX-6 双端口 100GbE 网络适配器

  • 1x NVIDIA ConnectX-4 双端口 25GbE 网络适配器

  • 1x 1GbE RJ45 4-端口 OCP 适配器

  • 2-10x Samsung PM1733 7.68TB NVMe PCIe 4.0 驱动器

  • 1U 高度

仅计算节点 (9155-C00) 的硬件配置如下所示:
  • Lenovo SR645 服务器

  • 2x AMD EPYC 7302 16 个核心 (总计 32 个核心) , 32 个线程 (总计 64 个线程) , 3.0 GHz 或 3.3 GHz CPU

  • 256 GB RAM (16x 16 GB DIMM)

  • 2x 960 GB M.2 操作系统驱动器 (RAID 1)

  • 1x NVIDIA ConnectX-6 双端口 100 GbE 网络适配器

  • 1x NVIDIA ConnectX-4 双端口 25 GbE 网络适配器

  • 1x 1 GbE RJ45 4-端口 OpenShift 适配器

  • 与计算存储服务器的规格相同,但 NVMe 磁盘为零

  • 1U 高度

仅计算节点 (9155-C04) 的硬件配置如下所示:
  • Lenovo SR645 更高密度

  • 2x AMD EPYC 7543 32C (总计64C ) 256MB L3, 2.8 GHz/ 3.7 GHz , CPU 225W

  • 基本 RAM: 16x 64GB DIMM (共 16 GB/core 1024GB )

  • 升级后的 RAM: 32x 64GB DIMM (共 32 GB/core 2048GB )

  • 2x 480GB M.2 操作系统驱动器 (RAID 1)

  • 1x NVIDIA ConnectX-6 双端口 100GbE 网络适配器

  • 1x NVIDIA ConnectX-4 双端口 25GbE 网络适配器

  • 1x 1GbE RJ45 4-端口 OCP 适配器

  • 零 NVMe 驱动器

  • 1U 高度

硬件配置 AFM 节点 (9155-F01):
  • Lenovo SR630 AFM 节点 (9155-F01)

  • 2x Intel 6242 16C (总计32C ) 150W 2.8 GHz/ 3.9 GHz CPU

  • 192GB RAM (12x 16GB DIMM)

  • 2x 960GB SATA 热插拔 SSD 操作系统驱动器 (RAID 1)

  • 2x NVIDIA ConnectX-4 双端口 25GbE 网络适配器

  • 1x 1GbE RJ45 2-端口 LOM

  • 1U 高度

硬件配置 SR675 V3 GPU 节点 (9155-G03):

Lenovo SR675 V3 服务器满足 AI 级别的计算需求。

  • SR675 V3 8DW PCIe GPU Base

  • AMD EPYC 9254 24C 200W 2.9GHz 处理器

    每个服务器中都有两个处理器。

  • (1-8) x NVIDIA L40S 48GB GPU Gen4 PCIe 适配卡

  • 32GB TruDDR5 4800MHz (2Rx8) RDIMM-A

    每个服务器中都有 24 个 DIMM ,总共提供 768GB RAM。

  • Intel I350 1GbE RJ45 4 端口 OCP 以太网适配器

  • ConnectX-6 Dx 双端口 (插槽 15)

    它是一个 100 GbE 网络适配器。

  • ConnectX-6 Lx 双端口 (插槽 20)

    它是一个 25 GbE 网络适配器。

  • 2x M.2 960GB 适用于操作系统和驱动器的 NVMe 驱动器采用 RAID 1 配置

  • ThinkSystem Intel I350 1GbE RJ45 4 端口 OCP 以太网适配器

  • 3U 高度

注: 从 2.7.2 发行版开始,提供了 SR675 V3 GPU 节点 (9155-G03)。


硬件配置 SR650v3 GPU 节点 (9155-G02):

Lenovo SR650v3 表示继 SR665之后的下一代 GPU 服务器。 它配备了最新的英特尔蓝宝石 Rapids 处理器,采用 24 个核心实现卓越的性能。 此服务器具有大量 512GB DDR5 RAM ,与 SR665中使用的 DDR4 RAM 相比,提供了显着的速度优势。 SR650v3 与 NVIDIA A100 80GB GPU 卡兼容,与 SR665支持的 40GB GPU 相比,提供了增强的处理功能。 SR650v3 中的存储解决方案已升级到 SAS 24Gb HS SSD ,与 SR665中使用的 SAS 12Gb HS SSD 相比,提供了更快的数据传输速率。 SR650v3 中的以太网适配器已从 ConnectX-4 LX 双端口升级到更高级的 ConnectX-6 LX 双端口,提供增强的网络性能和功能。
  • Lenovo SR650 V3 2U 2S 服务器

  • 3x NVIDIA A100 80GB GPU PCIe 适配卡

  • 2x Intel Gold 6418H 24C 2.1GHz 185W CPU ("Sapphire Rapids")

  • 512GB RAM (16x 32GB DIMM)

  • 2x 960GB M.2 NVMe 操作系统驱动器 (RAID 1)

  • 1x NVIDIA ConnectX-6 DX 双端口 100GbE PCIe NIC

  • 1x NVIDIA ConnectX-6 LX 双端口 25GbE PCIe NIC

  • 1x Intel I350 1GbE RJ45 4 端口 OCP 以太网适配器

  • 2x 2.5" PM1655 3.2TB 混合使用 (3-5 DWPD) SAS 24Gb HS SSD (RAID 1) (用于本地存储器)

注: 不再支持购买 G01 。


  • 网络

  • IBM Storage Fusion HCI System 在其中定义了两个物理网络: 供存储集群和应用程序使用的高速网络,以及用于控制服务器和监视服务器运行状况的管理网络。

    • RU18 到 RU19

    • 1GbE 管理网络交换机 (型号 S02)

    • 管理网络围绕一对 48 端口 1Gb 以太网交换机构建。 每个 IBM Storage Fusion HCI System Server 的 IMM 端口都使用带有 RJ45 接口的 CAT5e 电缆连接到第一个管理交换机。 针对所有 IBM Storage Fusion HCI System 服务器配置 LOM 或 OCP 适配器上的备用 IMM 端口,并将其连接到第二个管理交换机。 这些连接也是使用带有 RJ45 接口的 CAT5e 电缆进行的。 这一切都是为了实现冗余以支持管理功能,即使其中一个管理交换机发生故障或其中一个电缆断开连接也是如此。 来自高速交换机 (S01s) 的每个管理端口以及每个 6 机架 PDU 都连接到管理网络交换机。

    • RU20 到 RU21

    • 100GbE 高速网络交换机 (型号 S01)

    • 高速网络围绕一对 32 端口 100Gb 以太网交换机构建。 使用 MLAG 一起配置交换机以创建冗余对。 所有计算存储服务器和 GPU 服务器都具有 2 端口 100Gb 以太网适配器。 适配器上的一个端口连接到第一高速交换机,第二端口连接到第二高速交换机。 此 100GbE 连接保留供存储集群使用。 所有计算存储服务器和 GPU 服务器还具有 2 端口 25Gb 以太网适配器。 通过使用分支电缆将交换机上的 100GbE 端口拆分为四个 25GbE 端口,服务器的 25 个 GbE 网络适配器上的一个端口连接到第一个高速交换机,第二个端口连接到第二个高速交换机。 AFM 服务器没有 2 端口 100 GbE 网络适配器。 相反,这些服务器具有两个 2-port 25GbE 网络适配器。 同样,使用分支电缆,每个适配器都有一个端口连接到第一个高速交换机,另一个端口连接到另一个高速交换机。 所连接的 25GbE 网络旨在供 Red Hat OpenShift 集群以及部署在该集群中的应用程序使用。

  • (可选) 控制台套件 (KVM) ( TF5型)

  • 用于初始系统设置的服务控制台。

    • RU22

  • (可选) AFM 服务器 (型号 F01)

  • 通过向充当 AFM 网关节点的 IBM Storage Fusion HCI System 添加一个或两个可选服务器,支持 IBM Spectrum ® Storage Scale Erasure Code Edition (ECE) 的可选活动 File Manager (AFM) 功能部件。 AFM 网关节点可能在自身和主系统之间生成大量网络流量以访存和同步文件。 为了确保最佳性能和集群稳定性,将使用这些单独的节点,以便 AFM 流量具有其自己的物理适配器,独立于 IBM Storage Scale 集群网络以及用于其他应用程序工作负载的服务器。

    • RU23 和 RU24

  • (可选) GPU 服务器 (型号 G02 或 G03)

  • 一个或两个针对 AI 工作负载的可选 GPU 加速节点,可利用 NVIDIA A100 GPU (每个服务器 3)。 可订购一个 GPU 服务器的最小数量,最多可订购两个 GPU 服务器。

    • RU25 到 RU28

硬件配置

您可以从 IBM 购买机架或自行提供机架。

基本配置:
  • 42U 机架

    2x 以太网高速交换机

    2x 以太网管理交换机

    带有 2 NVMe 驱动器或服务器的 6x 计算存储服务器:

    • RU7 中的服务器已连接到服务控制台托盘

    • RU2, RU3和 RU4 中的服务器成为 OpenShift 控制平面服务器

    • 6x 32 个核心服务器,或 6x 64 个核心服务器,或 3x 32 个核心服务器 + 3x 64 个核心服务器

    • 2x 7.68 TB NVMe PCle 驱动器

可用选项:
  • 额外的计算存储服务器,最多 20 个 (减去任何 GPU 服务器)

  • 一个或两个可选 GPU 服务器,每个服务器都具有 3x NVIDIA A100 GPU

  • 通过将驱动器添加到计算存储服务器来增加存储: 7.68 TB NVMe PCle 驱动器或服务器最多 10 个驱动器或服务器

  • 通过添加纯计算服务器来提高计算能力

  • 可以订购一个 AFM (Active File Management) 服务器的最小数量,总共最多可以订购两个

物理配置

有关物理配置,限制和型号,请参阅 Family 9155 + 01 IBM Storage Fusion HCI

IBM Storage Fusion HCI System Appliance 中的配电单元 (PDU) 位置

使用本部分作为 IBM Storage Fusion HCI System 设备中 PDU 位置的指南。 可根据系统的配置添加其他 PDU。 这些额外的 PDU 水平安装在 PDU 6 上方的空间中。

图 1。 IBM Storage Fusion HCI System PDU 位置
IBM Spectrum Fusion PDU 位置
应用以下规则:
  • 所有配置都需要 PDU 1 和 2 才能连接到电源。

  • 如果存在六个以上的计算存储服务器,那么 PDU 3 和 4 必须连接到电源。

  • 如果存在 AFM 服务器,那么必须将 PDU 3 和 4 连接到电源。

  • 如果存在超过 14 个计算存储服务器,那么 PDU 5 和 6 必须连接到电源。

  • 如果存在 GPU 服务器,那么 PDU 5 和 6 必须连接到电源。

注: 对于独立电源或冗余电源,必须在左侧和下方 (奇数编号) PDU 与右侧和上方 (偶数编号) PDU 之间拆分两个电源。PDU 有四种可能的型号,所包含的型号取决于您的电源连接以及 G03 GPU 服务器是否包含在配置中:
  • 对于所有单相电源和 wye-有线三相电源,有两个 PDU 功能部件代码 :ECJN 和 ECJJ。 仅当配置中包含 G03 GPU 服务器时,才会添加 PDU ECJJ。 请参阅 支持的 PDU 电源线 中的 支持的 PDU 电源线是带有 Souriau 入口的 ECJN 表

  • 对于增量有线三相电源 (通常仅在 N America 中使用) ,有两个 PDU 功能部件代码 :ECJQ 和 ECJL。 仅当配置中包含 G03 GPU 服务器时,才会添加 PDU ECJL。 请参阅 支持的 PDU 电源线中的 带Am苯酚入口的 PDU 功能部件代码 ECJQ 的受支持 PDU 电源线 表。

有关电源连接的电源线的更多信息,请参阅 支持的 PDU 电源线。 有关 IBM Storage Fusion的电源先决条件的更多信息,请参阅 常规电源信息

驱动器和可用存储容量

要计算驱动器的可用存储容量,请使用 IBM Storage Modeler (StorM) 工具

杂项机架部件的重量

下表列出了机架配置的重量,其中包括电缆,星座机架等各个组件之外的其他部件:
表 1. 杂项机架部件的重量
组件权重 (lbs)重量 (千克)型号
SN3700C 交换机27.512.5S01
7316-TF5 控制台12.05.5TF5
AS4610 交换机11.85.4S02
SR665 GPU 服务器85.538.9G01
SR630 AFM 服务器41.919.0F01
SR645-0 32 核 256GB 服务器39.117.8C00
SR645-2 32 核 256GB 服务器40.218.3带有 2 个驱动器的 C01
SR645-10 32 核 256GB 服务器44.620.3带有 10 个驱动器的 C01
SR645-0 64 核 1024GB 服务器39.117.8C04
SR645-2 64 核 1024GB 服务器40.218.3带有 2 驱动器的 C05
SR645-10 64 核 1024GB 服务器40.218.3带有 10 个驱动器的 C05
星座机架398.2181.0R42
智能交换 PDU +9.54.3不适用
所有电缆,导轨等。395.5179.8不适用
SR675 V3 GPU 服务器72.1 磅32.8 千克带有 1 个 GPU 的 G03
SR675 V3 GPU 服务器87.5 磅39.8 千克带有 8 个 GPU 的 G03




打赏

本文链接:https://kinber.cn/post/5714.html 转载需授权!

分享到:


推荐本站淘宝优惠价购买喜欢的宝贝:

image.png

 您阅读本篇文章共花了: 

群贤毕至

访客