单个机架的硬件概述
上次更新时间: 2024-04-19
查看整体系统布局和硬件配置。
确保 IBM Storage Fusion 安装在受限的访问位置,以便只有获得适当授权的熟练人员才能访问该区域。
机架 ( R42型) 42U 机架,带有 2 到 6 PDU ,连线和组件。 仅计算服务器 (型号 C00 和 C04)/计算存储服务器 (型号 C01 和 C05) 计算存储服务器是 IBM Storage Fusion HCI System的基本构建块。 每个系统至少有 6 个 C01 型服务器或 6 个 C05 型服务器,或者各有 3 个。 每个 C01 型服务器至少有两个存储驱动器,每个服务器上最多可以增加 10 个存储驱动器。 可以将 IBM Storage Fusion HCI System 扩展至至少 6 个具有 C00, C01, C04和 C05型组合的服务器之外。 最多可以添加 20 个服务器。 (除非选择 GPU 选项,在这种情况下,最多可以有 18 个服务器。) 添加到 IBM Storage Fusion HCI System 的每个服务器也会添加到存储集群,从而增加总存储容量。 这些服务器还将组合到 Red Hat® OpenShift® Container Platform中。 在 IBM Storage Fusion HCI System 上运行的所有应用程序都在 OpenShift 集群中部署和运行。 RU29 到 RU32 您可以购买和增大存储器或计算节点的大小。 RU8 到 RU17 您可以购买和增大存储器或计算节点的大小。 RU2 到 RU7 机架单元 这些是缺省情况下可用的控制和计算节点。 至少三个控制节点和三个计算节点, CPU 为 32 个核心,内存为 256 GB。 注: 在网络升级安装阶段,位于机架位置 RU7 的服务器将用作供应节点。 Lenovo SR645 服务器 2x AMD EPYC 7302 16 个核心 (总计 32 个核心) , 32 个线程 (总计 64 个线程) , 3.0 GHz 或 3.3 GHz CPU 2x960 GB M.2 操作系统驱动器 (RAID 1) 1x NVIDIA ConnectX-6 双端口 100 GbE 网络适配器 1x NVIDIA ConnectX-6 双端口 25 GbE 网络适配器 1x 1 GbE RJ45 4-端口 OpenShift Container Platform 适配器 2-10x Samsung PM1733 7.68 TB NVMe PCIe 4.0 磁盘 将成对添加 NVMe 磁盘 所有计算存储服务器都必须具有相同数量的 NVMe 驱动器 最大计算存储服务器数为 20 ,由安装的 GPU 服务器数减少 1U 高度 Lenovo SR645 更高密度 2x AMD EPYC 7543 32C (总计64C ) 256MB L3, 2.8 GHz/ 3.7 GHz , CPU 225W 基本 RAM: 16x 64GB DIMM (共 16 GB/core 1024GB ) 升级后的 RAM: 32x 64GB DIMM (共 32 GB/core 2048GB ) 2x 480GB M.2 操作系统驱动器 (RAID 1) 1x NVIDIA ConnectX-6 双端口 100GbE 网络适配器 1x NVIDIA ConnectX-4 双端口 25GbE 网络适配器 1x 1GbE RJ45 4-端口 OCP 适配器 2-10x Samsung PM1733 7.68TB NVMe PCIe 4.0 驱动器 1U 高度 Lenovo SR645 服务器 2x AMD EPYC 7302 16 个核心 (总计 32 个核心) , 32 个线程 (总计 64 个线程) , 3.0 GHz 或 3.3 GHz CPU 256 GB RAM (16x 16 GB DIMM) 2x 960 GB M.2 操作系统驱动器 (RAID 1) 1x NVIDIA ConnectX-6 双端口 100 GbE 网络适配器 1x NVIDIA ConnectX-4 双端口 25 GbE 网络适配器 1x 1 GbE RJ45 4-端口 OpenShift 适配器 与计算存储服务器的规格相同,但 NVMe 磁盘为零 1U 高度 Lenovo SR645 更高密度 2x AMD EPYC 7543 32C (总计64C ) 256MB L3, 2.8 GHz/ 3.7 GHz , CPU 225W 基本 RAM: 16x 64GB DIMM (共 16 GB/core 1024GB ) 升级后的 RAM: 32x 64GB DIMM (共 32 GB/core 2048GB ) 2x 480GB M.2 操作系统驱动器 (RAID 1) 1x NVIDIA ConnectX-6 双端口 100GbE 网络适配器 1x NVIDIA ConnectX-4 双端口 25GbE 网络适配器 1x 1GbE RJ45 4-端口 OCP 适配器 零 NVMe 驱动器 1U 高度 Lenovo SR630 AFM 节点 (9155-F01) 2x Intel 6242 16C (总计32C ) 150W 2.8 GHz/ 3.9 GHz CPU 192GB RAM (12x 16GB DIMM) 2x 960GB SATA 热插拔 SSD 操作系统驱动器 (RAID 1) 2x NVIDIA ConnectX-4 双端口 25GbE 网络适配器 1x 1GbE RJ45 2-端口 LOM 1U 高度 硬件配置 SR675 V3 GPU 节点 (9155-G03): Lenovo SR675 V3 服务器满足 AI 级别的计算需求。 SR675 V3 8DW PCIe GPU Base AMD EPYC 9254 24C 200W 2.9GHz 处理器 每个服务器中都有两个处理器。 (1-8) x NVIDIA L40S 48GB GPU Gen4 PCIe 适配卡 32GB TruDDR5 4800MHz (2Rx8) RDIMM-A 每个服务器中都有 24 个 DIMM ,总共提供 768GB RAM。 Intel I350 1GbE RJ45 4 端口 OCP 以太网适配器 ConnectX-6 Dx 双端口 (插槽 15) 它是一个 100 GbE 网络适配器。 ConnectX-6 Lx 双端口 (插槽 20) 它是一个 25 GbE 网络适配器。 2x M.2 960GB 适用于操作系统和驱动器的 NVMe 驱动器采用 RAID 1 配置 ThinkSystem Intel I350 1GbE RJ45 4 端口 OCP 以太网适配器 3U 高度 硬件配置 SR650v3 GPU 节点 (9155-G02): Lenovo SR650 V3 2U 2S 服务器 3x NVIDIA A100 80GB GPU PCIe 适配卡 2x Intel Gold 6418H 24C 2.1GHz 185W CPU ("Sapphire Rapids") 512GB RAM (16x 32GB DIMM) 2x 960GB M.2 NVMe 操作系统驱动器 (RAID 1) 1x NVIDIA ConnectX-6 DX 双端口 100GbE PCIe NIC 1x NVIDIA ConnectX-6 LX 双端口 25GbE PCIe NIC 1x Intel I350 1GbE RJ45 4 端口 OCP 以太网适配器 2x 2.5" PM1655 3.2TB 混合使用 (3-5 DWPD) SAS 24Gb HS SSD (RAID 1) (用于本地存储器) 网络 IBM Storage Fusion HCI System 在其中定义了两个物理网络: 供存储集群和应用程序使用的高速网络,以及用于控制服务器和监视服务器运行状况的管理网络。 RU18 到 RU19 1GbE 管理网络交换机 (型号 S02) 管理网络围绕一对 48 端口 1Gb 以太网交换机构建。 每个 IBM Storage Fusion HCI System Server 的 IMM 端口都使用带有 RJ45 接口的 CAT5e 电缆连接到第一个管理交换机。 针对所有 IBM Storage Fusion HCI System 服务器配置 LOM 或 OCP 适配器上的备用 IMM 端口,并将其连接到第二个管理交换机。 这些连接也是使用带有 RJ45 接口的 CAT5e 电缆进行的。 这一切都是为了实现冗余以支持管理功能,即使其中一个管理交换机发生故障或其中一个电缆断开连接也是如此。 来自高速交换机 (S01s) 的每个管理端口以及每个 6 机架 PDU 都连接到管理网络交换机。 RU20 到 RU21 100GbE 高速网络交换机 (型号 S01) 高速网络围绕一对 32 端口 100Gb 以太网交换机构建。 使用 MLAG 一起配置交换机以创建冗余对。 所有计算存储服务器和 GPU 服务器都具有 2 端口 100Gb 以太网适配器。 适配器上的一个端口连接到第一高速交换机,第二端口连接到第二高速交换机。 此 100GbE 连接保留供存储集群使用。 所有计算存储服务器和 GPU 服务器还具有 2 端口 25Gb 以太网适配器。 通过使用分支电缆将交换机上的 100GbE 端口拆分为四个 25GbE 端口,服务器的 25 个 GbE 网络适配器上的一个端口连接到第一个高速交换机,第二个端口连接到第二个高速交换机。 AFM 服务器没有 2 端口 100 GbE 网络适配器。 相反,这些服务器具有两个 2-port 25GbE 网络适配器。 同样,使用分支电缆,每个适配器都有一个端口连接到第一个高速交换机,另一个端口连接到另一个高速交换机。 所连接的 25GbE 网络旨在供 Red Hat OpenShift 集群以及部署在该集群中的应用程序使用。 (可选) 控制台套件 (KVM) ( TF5型) 用于初始系统设置的服务控制台。 RU22 (可选) AFM 服务器 (型号 F01) 通过向充当 AFM 网关节点的 IBM Storage Fusion HCI System 添加一个或两个可选服务器,支持 IBM Spectrum ® Storage Scale Erasure Code Edition (ECE) 的可选活动 File Manager (AFM) 功能部件。 AFM 网关节点可能在自身和主系统之间生成大量网络流量以访存和同步文件。 为了确保最佳性能和集群稳定性,将使用这些单独的节点,以便 AFM 流量具有其自己的物理适配器,独立于 IBM Storage Scale 集群网络以及用于其他应用程序工作负载的服务器。 RU23 和 RU24 (可选) GPU 服务器 (型号 G02 或 G03) 一个或两个针对 AI 工作负载的可选 GPU 加速节点,可利用 NVIDIA A100 GPU (每个服务器 3)。 可订购一个 GPU 服务器的最小数量,最多可订购两个 GPU 服务器。 RU25 到 RU28 您可以从 IBM 购买机架或自行提供机架。 42U 机架 2x 以太网高速交换机 2x 以太网管理交换机 带有 2 NVMe 驱动器或服务器的 6x 计算存储服务器: RU7 中的服务器已连接到服务控制台托盘 RU2, RU3和 RU4 中的服务器成为 OpenShift 控制平面服务器 6x 32 个核心服务器,或 6x 64 个核心服务器,或 3x 32 个核心服务器 + 3x 64 个核心服务器 2x 7.68 TB NVMe PCle 驱动器 额外的计算存储服务器,最多 20 个 (减去任何 GPU 服务器) 一个或两个可选 GPU 服务器,每个服务器都具有 3x NVIDIA A100 GPU 通过将驱动器添加到计算存储服务器来增加存储: 7.68 TB NVMe PCle 驱动器或服务器最多 10 个驱动器或服务器 通过添加纯计算服务器来提高计算能力 可以订购一个 AFM (Active File Management) 服务器的最小数量,总共最多可以订购两个 有关物理配置,限制和型号,请参阅 Family 9155 + 01 IBM Storage Fusion HCI。 使用本部分作为 IBM Storage Fusion HCI System 设备中 PDU 位置的指南。 可根据系统的配置添加其他 PDU。 这些额外的 PDU 水平安装在 PDU 6 上方的空间中。 所有配置都需要 PDU 1 和 2 才能连接到电源。 如果存在六个以上的计算存储服务器,那么 PDU 3 和 4 必须连接到电源。 如果存在 AFM 服务器,那么必须将 PDU 3 和 4 连接到电源。 如果存在超过 14 个计算存储服务器,那么 PDU 5 和 6 必须连接到电源。 如果存在 GPU 服务器,那么 PDU 5 和 6 必须连接到电源。 对于所有单相电源和 wye-有线三相电源,有两个 PDU 功能部件代码 :ECJN 和 ECJJ。 仅当配置中包含 G03 GPU 服务器时,才会添加 PDU ECJJ。 请参阅 支持的 PDU 电源线 中的 支持的 PDU 电源线是带有 Souriau 入口的 ECJN 表 对于增量有线三相电源 (通常仅在 N America 中使用) ,有两个 PDU 功能部件代码 :ECJQ 和 ECJL。 仅当配置中包含 G03 GPU 服务器时,才会添加 PDU ECJL。 请参阅 支持的 PDU 电源线中的 带Am苯酚入口的 PDU 功能部件代码 ECJQ 的受支持 PDU 电源线 表。 要计算驱动器的可用存储容量,请使用 IBM Storage Modeler (StorM) 工具。系统布局
设备机架详细信息如下所示:注: 无法使用位置 29 到 32 中的任何服务器配置机架。
计算存储节点 (9155-C01) 的硬件配置如下所示:
计算存储节点 (9155-C05) 的硬件配置如下所示:
仅计算节点 (9155-C00) 的硬件配置如下所示:
仅计算节点 (9155-C04) 的硬件配置如下所示:
硬件配置 AFM 节点 (9155-F01):
注: 从 2.7.2 发行版开始,提供了 SR675 V3 GPU 节点 (9155-G03)。
注: 不再支持购买 G01 。硬件配置
可用选项:物理配置
IBM Storage Fusion HCI System Appliance 中的配电单元 (PDU) 位置

注: 对于独立电源或冗余电源,必须在左侧和下方 (奇数编号) PDU 与右侧和上方 (偶数编号) PDU 之间拆分两个电源。PDU 有四种可能的型号,所包含的型号取决于您的电源连接以及 G03 GPU 服务器是否包含在配置中:
有关电源连接的电源线的更多信息,请参阅 支持的 PDU 电源线。 有关 IBM Storage Fusion的电源先决条件的更多信息,请参阅 常规电源信息。驱动器和可用存储容量
杂项机架部件的重量
下表列出了机架配置的重量,其中包括电缆,星座机架等各个组件之外的其他部件:组件 权重 (lbs) 重量 (千克) 型号 SN3700C 交换机 27.5 12.5 S01 7316-TF5 控制台 12.0 5.5 TF5 AS4610 交换机 11.8 5.4 S02 SR665 GPU 服务器 85.5 38.9 G01 SR630 AFM 服务器 41.9 19.0 F01 SR645-0 32 核 256GB 服务器 39.1 17.8 C00 SR645-2 32 核 256GB 服务器 40.2 18.3 带有 2 个驱动器的 C01 SR645-10 32 核 256GB 服务器 44.6 20.3 带有 10 个驱动器的 C01 SR645-0 64 核 1024GB 服务器 39.1 17.8 C04 SR645-2 64 核 1024GB 服务器 40.2 18.3 带有 2 驱动器的 C05 SR645-10 64 核 1024GB 服务器 40.2 18.3 带有 10 个驱动器的 C05 星座机架 398.2 181.0 R42 智能交换 PDU + 9.5 4.3 不适用 所有电缆,导轨等。 395.5 179.8 不适用 SR675 V3 GPU 服务器 72.1 磅 32.8 千克 带有 1 个 GPU 的 G03 SR675 V3 GPU 服务器 87.5 磅 39.8 千克 带有 8 个 GPU 的 G03
本文链接:https://kinber.cn/post/5714.html 转载需授权!
推荐本站淘宝优惠价购买喜欢的宝贝:

支付宝微信扫一扫,打赏作者吧~
