问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

CFM概述:以太网连接故障管理详解

创作时间:
作者:
@小白创作中心

CFM概述:以太网连接故障管理详解

引用
1
来源
1.
https://info.support.huawei.com/hedex/api/pages/EDOC1100277650/AZM1016J/04/resources/vrp/dc_vrp_cfm_cfg_000002.html

CFM(Connectivity Fault Management)是基于以太网承载网络的连接检测的OAM(Operation, Administration and Maintenance)功能,主要用于大规模组网的端到端场景。它能够提供链路连通性检测、故障监控、远端故障通知等功能,是网络级的OAM协议。

CFM概述

CFM作为以太网的OAM,提供了链路连通性检测功能。以太网技术简单易用、价格低廉、且带宽可不断提高,无论是作为一种业务还是作为一种网络结构在企业网、城域网、广域网范围内都已经得到广泛应用。但是传统以太网可维护、可运营能力比较弱,随着以太网推广的范围逐渐扩大,对以太网OAM功能的需求也越来越强烈。

根据网络的分层/分级架构,需要提供分层/分级的以太OAM功能。如图1所示。

图1以太网OAM示意图

  • 802.3ah(Ethernet in the First Mile,简称EFM)主要用于用户接入部分的以太网物理层规范以及接入部分的以太网OAM,是链路级的OAM。针对两台直连设备之间的链路,提供链路连通性检测功能、链路故障监控功能、远端故障通知功能和远端环回功能。
  • 802.1ag(Connectivity Fault Management,简称CFM)定义了基于以太网承载网络的连接检测的OAM功能,包括CC/LB/LT,适用于大规模组网的端到端场景,是网络级的OAM。
  • Y.1731是由ITU-T标准组织提出的OAM协议,它不仅包含IEEE802.1ag所规定的内容,而且又增加了更多的OAM消息组合,包括AIS(Alarm Indication Signal),RDI(Remote Defect Indication),锁信号LCK(Locked Signal),测试信号,维护通信渠道MCC(Maintenance Communication Channel),试验EXP(Experimental OAM),供应商特定的VSP(Vendor Specific OAM)故障管理以及用于性能监视的丢包管理LM(Loss Measurement)和延迟评估DM(Delay Measurement)等。

基本概念

  • MD(Maintenance Domain)
    维护域MD指明了连通错误检测所覆盖的网络,其边界是由配置在端口上的一系列维护端点所定义的。维护域以“维护域名”来标识。为了准确定位故障点,在维护域中引入了级别(层次)的概念。维护域共分为八级,用整数0~7来表示,数字越大级别越高,维护域的范围也就越大。不同维护域之间可以相邻或嵌套,但不能交叉,且嵌套时只能由高级别维护域向低级别维护域嵌套,即低级别维护域必须包含在高级别维护域内部。

  • 默认MD
    802.1ag 2007标准版本规定,每台设备上可配置一个默认MD。默认MD的级别必须高于本设备配置MEP节点所有MD的级别,和高优先级MD的级别相等,用于高级别CCM报文穿越,创建MIP节点回复LTR报文。

  • MA(Maintenance Association)
    在维护域内根据需要可以配置多个维护联盟(Maintenance Association,MA),每个维护联盟是维护域内一些维护点的集合。维护联盟以“维护域名+维护联盟名”来标识。维护联盟服务于某个特定的业务(如VLAN),维护联盟中的维护点所发送的报文都带有该业务的标签,同时维护联盟中的维护点可以接收由本维护联盟中其它维护点发来的报文。

  • MEP(Maintenance End Point)
    维护端点确定了维护域MD的范围和边界,是维护联盟MA的边缘节点。维护端点所属的维护联盟和维护域确定了该维护端点所发出报文的业务和级别。维护端点的级别决定了其所能处理的报文的级别,维护端点所发出报文的级别就是该维护端点的级别。当维护端点收到高于自己级别的报文时,不会进行处理,而是将其按原有路径转发;而当维护端点收到小于或者等于自己级别的报文时,才会进行处理。维护端点位于设备的接口上,手工创建。维护端点的级别等于它所在的维护域的级别。对于运行以太网CFM的网络中的任意一台设备,该设备上的MEP称为本地MEP,同一MA内其它设备上的MEP对本设备而言称为远端维护联盟边缘节点RMEP(Remote Maintenance association End Point)。

  • MIP(Maintenance Intermediate Point)
    维护中间点位于维护域内部,通过MEP之间部署多个MIP可以提高对网络的可管理性。MIP越多,对网络的可控性、可管理性就越强。对于能够给运营商带来更多利润的大客户关心的重要业务,运营商部署MIPs的数量要远多于运行普通业务的链路上。

基本功能

连通性检测或者CC检测功能用来检测维护端点之间的连通状态,由维护端点MEP周期性的发送CCM(Continuity Check Message)组播报文,相同维护联盟的其他维护端点接收该报文。当维护端点在3.5个超时周期内未收到源端维护端点发送的CCM报文,则认为链路有问题。

CFM故障传递功能

通常在网络中部署链路检测协议,实现与相邻设备之间链路连通性及其故障的检测。但是面对越来越复杂的网络环境,要想依靠单一的检测技术完成网络中所有链路的故障检测几乎无法实现。因此需要在对网络环境和用户需求进行细致分析的基础上,综合运用各种检测技术实现链路的故障检测。

由CFM负责对链路状态、网络性能等进行检测,并通过联动功能将检测结果通知给与其联动的接口或者检测协议;当被联动的接口或者检测协议感知到网络状态变化后,以告警方式通知网络管理员,以便对当前网络进行调整,从而避免通信中断或服务质量的降低,提高网络的可靠性。

CFM与检测模块之间的故障传递

通过MGR可以建立CFM与其他检测模块之间的故障传递,目前支持的检测模块主要有EFM、CFM和BFD,如图2所示。

图2CFM与检测模块之间故障传递示意图

以CE1–UPE1–PE2–PE4–PE6–PE8链路为例,CFM与检测模块之间的故障传递如表1所示。

现有组网
存在问题
解决方案
CE1到UPE1之间部署EFM、PE4到PE8之间部署CFM
当CFM检测到某端到端网络故障时,由于远端CE设备无法感知,导致用户侧过来的流量继续发往故障链路。
部署EFM与CFM故障传递:当EFM检测到链路故障时,将该故障传递到CFM。当CFM检测到链路故障时,将该故障传递到EFM。实现当中间链路故障时,将该故障传递到远端设备并向网管发送告警。网络管理员可以通过观察告警信息动态地了解链路状态,对相应的错误及时进行处理。
UPE1到PE4之间、PE4到PE8之间部署CFM
当PE4到PE8链路的CFM检测到链路故障时,由于远端设备CE1无法感知,会有用户侧流量继续发往PE2设备。当UP1到PE4链路的CFM检测到链路故障时,由于网络侧设备无法感知,会有网络侧回程流量继续发往故障链路。
部署CFM和CFM故障传递,实现当一侧CFM检测到链路故障时,将该故障传递到另一侧CFM并向网管发送告警。网络管理员可以通过观察告警信息动态的了解链路状态,并对相应的错误及时进行处理。
UPE1到PE4之间部署CFMPE4到PE8网络不是以太网,则在该段网络中部署BFD进行链路检测
当CFM检测到链路发生故障时,网络侧设备无法感知,会有网络侧回程流量继续发往故障链路。当BFD检测到链路发生故障时,由于远端CE设备无法感知到,会有用户侧流量继续发往故障链路。
部署CFM与BFD故障传递:当CFM检测到链路故障时,将该故障传递到BFD。当BFD检测到链路故障时,将该故障传递到CFM。实现当中间链路故障时,将该故障传递到远端设备并向网管发送告警。网络管理员可以通过观察告警信息动态地了解链路状态,对相应的错误及时进行处理。

CFM与应用模块之间的故障传递

通过MGR可以建立CFM与应用模块之间的联动,目前支持联动的应用模块主要有VRRP。

CFM与VRRP故障传递应用场景如图3所示。VRRP与CFM故障传递应用场景如图4所示。

图3CFM与VRRP之间的故障传递示意图

图4VRRP与CFM之间的故障传递示意图

CFM与VRRP故障传递、VRRP联动CFM的故障传递如表2所示。

当前组网
存在问题
解决方案
NPE设备互为主备,配置VRRP实现主备监控。PE-AGG到NPE之间采用CFM检测链路的连通性。
NPE1设备为主用设备,当NPE1到PE-AGG1之间链路发生故障时,NPE1和NPE2设备经过3个协商报文的周期,均升为主用设备,出现VRRP备份组的双主现象。从网络侧过来的下行流量会出现双份。
在NPE上部署CFM与VRRP故障传递功能,当PE-AGG2到NPE1之间的CFM检测到链路故障后联动VRRP。作为主用设备的NPE1,将VRRP状态迁移到Initial,作为备用设备的NPE2经过3个协商报文周期后升为主用设备,避免了VRRP备份组的双主现象。
NPE设备互为主备,配置VRRP实现主备监控。PE-AGG到NPE之间采用CFM检测链路的连通性。PE-AGG到UPE之间采用PW Redundancy实现PW链路主备。
当NPE上游的骨干网设备或者网络发生故障时,VRRP会进行主备切换,但是下游UPE到PE-AGG网络中的主备PW无法感知VRRP切换,从而导致从CE侧过来的上行流量丢失。
当VRRP状态发生变化时,VRRP与CFM故障传递,将NPE的主备状态通知给PE-AGG。PE-AGG上,CFM与PW故障传递,从而确定PE-AGG1和PE-AGG2上PW的本地状态。PE-AGG将PW的本地状态发送给UPE。UPE收到PE-AGG发送的信息后,确定PW的主备。当CFM检测到链路故障时,同样可以通知VRRP和PW进行切换。

另外,当CFM接收到故障时,通过配置CFM联动清理MAC/ARP功能,可以保证链路正常切换。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号