×

华为 CE交换机 智能无损网络综述

hqy hqy 发表于2024-12-19 15:11:31 浏览4 评论0

抢沙发发表评论

智能无损网络综述

智能无损网络简介

随着全球企业数字化转型的加速进行,网络的使命正在从聚焦业务快速发放向聚焦数据高效处理转变。为了提升数据处理的效率,分布式存储、AI(Artificial Intelligence,人工智能)、HPC(High-performance Computing,高性能计算)等当今热门应用要求网络具有无丢包、低时延、高吞吐的能力。然而传统的基于TCP/IP协议栈的网络通信由于在数据拷贝等关键环节资源消耗较大并且时延过高,无法满足对网络性能的高要求。RDMA(Remote Direct Memory Access,远程直接内存访问)利用相关的硬件和网络技术,使主机的网卡之间可以直接读内存,最终达到高带宽、低时延和低资源消耗率的效果。但是RDMA专用的InfiniBand网络架构封闭,难以与现网大规模的IP网络兼容,使用和维护的成本较高。

RoCE(RDMA over Converged Ethernet)技术的出现有效解决了这些难题。RoCE即使用以太网承载RDMA的网络协议,有两个版本:RoCEv1是一种链路层协议,不同广播域下无法使用;RoCEv2是一种网络层协议,可以实现路由功能。

当前分布式存储、人工智能、高性能计算等应用均采用RoCEv2协议来降低CPU的处理和时延,提升应用的性能。然而,由于RDMA的提出之初是承载在无损的InfiniBand网络中,RoCEv2协议缺乏完善的丢包保护机制,对于网络丢包异常敏感。同时,这些分布式高性能应用的特征是多对一通信的Incast流量模型,对于以太网的设备,Incast流量易造成设备内部队列缓存的瞬时突发拥塞甚至丢包,带来应用时延的增加和吞吐的下降,从而损害分布式应用的性能。

解决网络拥塞丢包实际上是要防止过多的数据注入到网络中造成拥塞,使设备缓存或链路容量不会过载。在现网中,流量控制和拥塞控制需要配合应用才能真正解决网络拥塞。流量控制和拥塞控制的区别在于:流量控制是端到端的,需要做的是抑制发送端的发送速率,以便接收端来得及接收;拥塞控制是一个全局性的过程,涉及到所有的主机、网络设备,以及与降低网络传输性能有关的所有因素。

智能无损网络提供的iLossless智能无损算法正是一系列技术的合集,相互配合应用从而真正解决传统以太网络拥塞丢包的问题,为RoCEv2流量提供“无丢包、低时延、高吞吐”的网络环境,满足RoCEv2应用的高性能需求。智能无损网络技术可以分为:

  • 流量控制技术

  • 拥塞控制技术

  • NSLB(Network Scale Load Balance)技术

  • 自适应路由技术

流量控制技术

流量控制,也称为链路级流控,流量控制所要做的就是抑制流量发送端发送数据的速率,以便流量接收端来得及接收,防止设备端口在拥塞的情况下出现丢包。

PFC(Priority-based Flow Control,基于优先级的流量控制)是目前应用最广泛的流量控制技术。对于PFC控制的队列,当队列在下游设备发生拥塞时,上游设备会停止发送该队列的流量,从而实现报文的零丢包传输。而对非PFC控制的队列,系统则不进行反压处理,在发生拥塞时将直接丢弃报文。

因此,根据报文在网络中传输时是否需要无丢包传输,可以将业务划分为无损业务和有损业务。

  • 无损业务:需要无丢包传输的业务。需要无丢包传输的队列即为无损队列。

  • 有损业务:允许丢包传输的业务。允许丢包传输的队列即为有损队列。

PFC是一种有效避免丢包的流量控制技术,但由于PFC会暂停一部分流量,这一技术应该作为最后的手段使用,否则频繁触发PFC会出现PFC死锁的问题。PFC死锁,是指当多个网络设备之间因为环路等原因同时出现拥塞,各自端口缓存消耗超过阈值,而又相互等待对方释放资源,从而导致所有设备上的数据流都永久阻塞的一种网络状态。

为了解决PFC死锁的问题,智能无损网络提供了PFC死锁预防功能,可以提前预防PFC死锁的发生。

拥塞控制技术

拥塞控制是一个全局性的过程,目的是让网络能承受现有的网络负荷,往往需要转发设备、流量发送端、流量接收端协同作用,并结合网络中的拥塞反馈机制来调节整网流量才能起到缓解拥塞、解除拥塞的效果。

DCQCN(Data Center Quantized Congestion Notification)目前是RDMA网络应用最广泛的拥塞控制算法,DCQCN只需要网络设备支持ECN(Explicit Congestion Notification)功能,其他功能在主机的网卡上实现。当转发设备上发生拥塞时,会发送携带ECN拥塞标记的报文给流量接收端,流量接收端会发送CNP(Congestion Notification Packets)拥塞通知报文给流量发送端,流量发送端会降低报文的发送速率,从而缓解网络拥塞。

然而DCQCN存在着不容忽视的问题:传统的静态ECN功能需要用户手动设置ECN门限等参数,然而现网中的流量模型非常复杂,手动设置无法应对流量变化。

为了解决DCQCN的问题,智能无损网络提供了AI ECN(Artificial Intelligence Explicit Congestion Notification)功能,并且为了将DCQCN功能应用到VXLAN网络中,丰富DCQCN的应用场景,智能无损网络还提供了ECN Overlay功能。

NSLB技术

NSLB技术将Flow Matrix和Rail Group相结合,充分利用网络资源,从而提升整网吞吐率。

自适应路由技术

建设大型超算中心需要实现大规模计算节点互联,但集群规模的扩大导致网络时延增加、部署成本提高,无法满足算力需求和部署要求。直连拓扑网络兼具接入规模大、网络直径小的优势,自适应路由与其配合使用,根据网络拓扑和流量负载变化,进行动态路由决策,即通过主动感知链路拥塞状态,优选路径短、不拥塞的报文转发路径,充分利用非等价路径,提升带宽利用率,在支持大规模组网的同时,满足高吞吐、低时延、低成本的要求。






华为智能无损网络解决方案相关参考如下链接:

智能无损高性能计算网络解决方案-高性能计算网络-华为企业业务 (huawei.com)


无损网络优势如下:

华为CE交换机实现无损网络的原理主要依赖于其智能无损网络技术,该技术集成了流量控制、拥塞控制、NSLB(Network Scale Load Balance)和自适应路由等关键技术,以确保网络在处理RoCEv2(RDMA over Converged Ethernet)流量时能够实现无丢包、低时延和高吞吐的性能。

流量控制技术
流量控制技术,如PFC(Priority-based Flow Control),用于抑制流量发送端的发送速率,以防止接收端无法及时接收数据而导致的丢包。PFC通过在下游设备发生拥塞时,让上游设备停止发送特定队列的流量,实现零丢包传输。1PFC将业务划分为无损业务和有损业务,无损业务要求零丢包,而有损业务允许一定程度的丢包。1
拥塞控制技术
拥塞控制技术,如DCQCN(Data Center Quantized Congestion Notification),是一种全局性的过程,通过网络设备、流量发送端和接收端之间的协同作用,结合拥塞反馈机制来调节整网流量,以缓解和解除网络拥塞。DCQCN通过ECN(Explicit Congestion Notification)功能在设备发生拥塞时,向接收端发送ECN拥塞标记,接收端再向发送端发送CNP(Congestion Notification Packets),促使发送端降低发送速率,从而缓解网络拥塞。1
NSLB技术

NSLB技术结合Flow Matrix和Rail Group,通过优化网络资源分配,提升整网吞吐率,确保网络资源的高效利用。

自适应路由技术
自适应路由技术与直连拓扑网络配合使用,根据网络拓扑和流量负载变化,动态选择最优路径,避免拥塞,提升带宽利用率,满足大规模组网对高吞吐、低时延和低成本的需求。1
综合应用

在实际部署中,如华为CloudEngine系列交换机,通过配置上述技术,如PFC优先级流量控制、PFC死锁检测、动态ECN门限、快速ECN拥塞标记、快速CNP拥塞通知、大小流区分调度和动态负载分担等功能,构建智能无损网络环境,为RoCEv2流量提供高性能的网络支持。

例如,在配置智能无损网络时,可以:

配置PFC优先级流量控制,将承载RoCEv2流量的队列设置为无损队列。
配置PFC死锁检测功能,预防PFC死锁。
开启智能无损网络基本功能。
配置无损队列的缓存空间优化,提高缓存利用率。2
配置动态ECN门限,根据业务需求调整ECN标记概率。
配置快速ECN拥塞标记和快速CNP拥塞通知,加快拥塞反馈速度。
配置大小流区分调度功能,优化流量调度。
配置动态负载分担功能,均衡网络负载。2

通过这些配置,华为CE交换机能够实现智能无损网络,为数据中心的高性能应用提供稳定、高效的数据传输环境。








华为CE交换机实现无损网络的原理主要依赖于智能无损网络技术,这项技术旨在解决高性能计算、分布式存储和人工智能等应用对网络无丢包、低时延和高吞吐的需求。以下是实现无损网络的关键技术:
1、流量控制技术:
PFC(Priority-based Flow Control):基于优先级的流量控制,当队列在下游设备发生拥塞时,上游设备会停止发送该队列的流量,从而实现报文的零丢包传输。无损业务需要无丢包传输,因此使用PFC控制的队列;有损业务允许丢包传输,使用非PFC控制的队列。
2、拥塞控制技术:
DCQCN(Data Center Quantized Congestion Notification):是RDMA网络应用最广泛的拥塞控制算法,当转发设备上发生拥塞时,会发送携带ECN拥塞标记的报文给流量接收端,流量接收端会发送CNP拥塞通知报文给流量发送端,流量发送端会降低报文的发送速率,从而缓解网络拥塞。
3、NSLB(Network Scale Load Balance)技术:
结合Flow Matrix和Rail Group,充分利用网络资源,提升整网吞吐率。
4、自适应路由技术:
根据网络拓扑和流量负载变化,进行动态路由决策,优选路径短、不拥塞的报文转发路径,提升带宽利用率,满足高吞吐、低时延、低成本的要求。

智能无损网络技术通过上述机制,确保网络能够提供无丢包、低时延和高吞吐的环境,满足高性能应用的需求。同时,华为CE交换机还提供了PFC死锁预防功能,以解决PFC死锁问题,确保网络的稳定运行。此外,智能无损网络还提供了AI ECN功能,以及ECN Overlay功能,以解决DCQCN的问题,并将DCQCN功能应用到VXLAN网络中,丰富DCQCN的应用场景。


打赏

本文链接:https://www.kinber.cn/post/4249.html 转载需授权!

分享到:


推荐本站淘宝优惠价购买喜欢的宝贝:

image.png

 您阅读本篇文章共花了: 

群贤毕至

访客