SFF(Small Form Factor)硬盘一般特指服务器或盘柜中使用的2.5英寸硬盘。服务器和盘柜使用它的目的是为了提高单位容积内的存储密度,降低热量和功耗,SFF对应的是LFF,3.5英寸硬盘所使用的就是LFF的设计规范。SFF有很多具体的协议标准,比如本文中所介绍的SFF-8639,当然还有SFF-8637、SFF-8482以及SFF-8223等。这些协议对多种接口及其连接器进行了详细的定义。本文只介绍SFF-8639以及PBlaze4的热插拔技术。
SFF-8639是一个2.5英寸(固态硬盘和机械硬盘)的企业级背板接口,涵盖了PCIe、SATA和SAS。
上图展示了SFF-8639的结构,其中红色标识的为PCIe能够使用的通道,共4个,蓝色标识的为SAS和SATA来连接HBA/RAID控制器或者芯片组的通道,共2个。上图中红色的部分就是在传统SAS连接器基础上增加的PCIe引脚——包括通道0、通道3-1和边带,如此则实现了双端口SAS和PCIe x4共用一个连接器,兼容不同协议的SSD和HDD。
作为一个硬件层面的接口标准,SFF-8639无疑也将是推动闪存发展的一个重要的因素,当下主流的服务器厂商已经在新一代的服务器中加入了配有SFF-8639接口的背板。而且相比PCIe闪存卡,2.5英寸的硬盘外形更受服务器厂商青睐。
接下来讨论的是SFF-8639接口的PBlaze 4的热插拔功能,这个功能中按照设备插入和移除的不同操作和场景分为四种不同的情况,首先是热添加(Hot Add)。通过软件控制的方式(比如RAID)将PCIe SSD添加到一个操作系统正在运行的设备中。这种操作也被称为热插入(Hot Insertion),通常用于系统容量的扩充或者替换故障设备;第二是热移除(HotRemoval)。当一个PCIe SSD不能被系统所识别和管理,那么在不停机的前提下将设备状态标记为可移除(之后就可以将PCIe SSD拔出),这个过程就叫做热移除,也叫做软件管理的热移除(Software Managed Hot Removal)。
第三是意外热移除(SurpriseHot Removal)。由于操作人员失误或者其他的原因造成正在运行的PCIe SSD设备突然被移除。这种情况比较复杂,因为此时被移除的设备可能还在处理IO请求,管理软件可能也没有做好移除设备的充分被准。当下包括PBlaze 4在内的主流PCIe SSD都会有多个设备指示灯用于显示设备的运行状态,这种设计一定程度上降低了意外热移除的概率。最后是热替换(HotSwap)。简单的说这是一个综合了热移除和热添加两个过程的操作,所以这也是热插拔中最为复杂的一个操作。
热插拔功能在PBlaze4上的实现并没有太高的技术壁垒,但是实现这项功能需要接口总线电气特性、主板BIOS、操作系统、上层的RAID软件以及NVMe驱动的支持。一个完整的热插拔系统一般包括热插拔系统的硬件,支持热插拔的软件(如果系统中有RAID软件,那么热插拔需要RAID软件配合)和操作系统,支持热插拔的设备驱动程序和支持热插拔的用户接口。这里以热移除为例:
从上面这个热移除事件的交付过程来看,系统(BIOS),存储系统软件,设备驱动的配合是整个移除能够成功的关键。从SFF-8639的生态来看,上文中提到当下主流的服务器厂商都已经开始支持SFF-8639接口的设备,这为SFF-8639接口的PBlaze4提供了一个良好的平台基础。拥有了热插拔功能,PBlaze 4就可以在不停机的前提下实现插入和移除的操作,系统维护成本和难度也将随之大幅降低。
————————————————
本文链接:https://www.kinber.cn/post/2086.html 转载需授权!
推荐本站淘宝优惠价购买喜欢的宝贝: