目录
一、相关理论介绍
1.1 华三M-LAG介绍
1.2 DRCP协议
1.3 keepalive机制
1.4 MAD机制
1.5 一致性检查功能
二、M-LAG系统建立及工作过程
三、实验组网案例
3.1 组网需求
3.2 组网拓扑
3.3 设备接口及地址规划
四、具体配置命令
4.1 S6850-1的配置
4.2 S6850-2的配置
4.3 S6850-3的配置
4.4 S6850-4的配置
4.5 PC的配置
五、查看各种状态和测试
一、相关理论介绍
1.1 华三M-LAG介绍
LAG(Multichassis link aggregation,跨设备链路聚合)将两台物理设备在聚合层面虚拟成一台设备来实现跨设备链路聚合,从而提供设备级冗余保护和流量负载分担。
M-LAG网络模型
Device A与Device B形成负载分担,共同进行流量转发,当其中一台设备发生故障时,流量可以快速切换到另一台设备,保证业务的正常运行。如下图所示
M-LAG设备在M-LAG系统中互为邻居,其中Device A为主设备,Device B为从设备。M-LAG为每个M-LAG设备定义了以下几个接口角色:
①M-LAG接口:与外部设备相连的二层聚合接口。与外部设备上相同聚合组相连的M-LAG接口属于同一M-LAG组。如上图所示,Device A上的二层聚合接口BAGG1和Device B上的二层聚合接口BAGG2属于同一M-LAG组。M-LAG组中的M-LAG接口由多条链路聚合组成,且具有相同的M-LAG组编号。
②peer-link接口:连接对端M-LAG邻居设备用于内部控制的接口。每台M-LAG设备只有一个peer-link接口。peer-link接口间的链路为peer-link链路,M-LAG设备通过peer-link链路交互协议报文及传输数据流量。一个M-LAG系统只有一条peer-link链路。
1.2 DRCP协议
M-LAG通过在peer-link链路上运行DRCP(Distributed Relay Control Protocol,分布式聚合控制协议)来交互M-LAG的相关信息,以确定两台设备是否可以组成M-LAG系统。
两端M-LAG设备通过peer-link链路定期交互DRCP报文。当本端M-LAG设备收到对端M-LAG设备的DRCP协商报文后,会判断DRCP协商报文中的M-LAG系统配置是否和本端相同。如果两端的M-LAG系统配置相同,则这两台设备可以组成M-LAG系统。DRCP超时时间是指peer-link接口等待接收DRCPDU的超时时间。在DRCP超时时间之前,如果本端peer-link接口未收到来自对端M-LAG设备的DRCPDU,则认为对端M-LAG设备peer-link接口已经失效。DRCP超时时间同时也决定了对端M-LAG设备发送DRCPDU的速率。
DRCP超时有短超时(3秒)和长超时(90秒)两种:
①若本端DRCP超时时间为短超时,则对端M-LAG设备将快速发送DRCPDU(每1秒发送1个DRCPDU);
②若本端DRCP超时时间为长超时,则对端M-LAG设备将慢速发送DRCPDU(每30秒发送1个DRCPDU)。
1.3 keepalive机制
M-LAG设备间通过Keepalive链路检测邻居状态,即通过交互Keepalive报文来进行peer-link链路故障时的双主检测。Keepalive报文为我司私有报文。
如果在指定时间内,本端M-LAG设备收到对端M-LAG设备发送的Keepalive报文:
①如果peer-link链路状态为down,则本端和对端M-LAG设备根据收到的Keepalive报文选举主从设备,保证M-LAG系统中仅一台M-LAG设备转发流量,避免两台M-LAG设备均升级为主设备。
②如果peer-link链路状态为up,则M-LAG系统正常工作。
如果在指定时间内,本端M-LAG设备未收到对端M-LAG设备发送的Keepalive报文时:
①如果peer-link链路状态为down,则认为对端M-LAG设备状态为down:
本端设备为主设备时,如果本端设备上存在处于up状态的M-LAG接口,则本端仍为主设备;否则,本端设备角色变为None角色。
②本端设备为从设备时,则升级为主设备。此后,只要本端设备上存在处于up状态的M-LAG接口,则保持为主设备,否则本端设备角色变为None角色。
③当设备为None角色时,设备不能收发Keepalive报文,Keepalive链路处于down状态。
如果peer-link链路状态为up,则认为Keepalive链路状态为down。此时主从设备正常工作,同时设备打印日志信息,提醒用户检查Keepalive链路。
1.4 MAD机制
peer-link链路故障后,为了防止从设备继续转发流量,M-LAG提供MAD(Multi-Active Detection,多Active检测)机制,即在M-LAG系统分裂时将设备上部分接口置为M-LAG MAD DOWN状态,不允许此类接口转发流量,避免流量错误转发,尽量减少对业务影响。
当peer-link链路故障恢复后,为了防止丢包,从设备尽可能在延迟恢复时间内完成表项(MAC地址表、ARP表等)同步,其后该设备上处于M-LAG MAD DOWN状态的接口将恢复为up状态。
M-LAG MAD DOWN保持功能
当peer-link链路故障,Keepalive链路正常工作时,主设备正常工作,从设备会自动关闭本设备上除M-LAG保留接口外的所有接口,将这些接口置为M-LAG MAD DOWN状态。如果此时Keepalive链路也发生故障,从设备上的接口会解除M-LAG MAD DOWN状态,并升级为主设备,使M-LAG系统中的两台设备都作为主设备转发流量,引起网络故障。为了避免以上情况,需要开启M-LAG MAD DOWN保持功能,使设备上的接口一直处于M-LAG MAD DOWN状态,不参与流量转发。
1.5 一致性检查功能
M-LAG系统建立过程中会进行配置一致性检查,以确保两端M-LAG设备配置一致,不影响M-LAG设备转发报文。M-LAG设备通过交换各自的配置信息,检查配置是否一致。目前M-LAG支持对两种类型的配置一致性检查:
① Type 1类型配置:影响M-LAG系统转发的配置。如果Type 1类型配置不一致,则将从设备上M-LAG接口置为down状态。
②Type 2类型配置:仅影响业务模块的配置。如果Type 2类型配置不一致,从设备上M-LAG接口依然为up状态,不影响M-LAG系统正常工作。由Type 2类型配置对应的业务模块决定是否关闭该业务功能,其他业务模块不受影响。
为了避免设备M-LAG接口震荡,设备会在延迟恢复定时器一半时间之后进行配置一致性检查。
二、M-LAG系统建立及工作过程
如下图所示,Device A和Device B之间M-LAG系统建立及工作过程如下:
①当M-LAG设备完成M-LAG系统参数配置后,两端设备通过peer-link链路定期发送DRCP报文。当本端收到对端的DRCP协商报文后,会判断DRCP协商报文中的M-LAG系统配置是否和本端相同。如果两端的M-LAG系统配置相同,则这两台设备组成M-LAG系统。
②配对成功后,两端设备会确定出主从状态。依次比较两端M-LAG设备的初始角色、M-LAG MAD DOWN状态、设备的健康值、角色优先级、设备桥MAC,比较结果更优的一端为主设备;
③主从协商后,M-LAG设备间会进行配置一致性检查。
④当主从角色确定后,两端设备通过Keepalive链路周期性地发送Keepalive报文检测邻居状态。
⑤M-LAG系统开始工作后,两端设备之间会实时同步对端的信息,例如MAC地址表项、ARP表项等,这样任意一台设备故障都不会影响流量的转发,保证正常的业务不会中断。
三、实验组网案例
3.1 组网需求
由于用户对于业务的可靠性要求很高,如果Device C和接入设备(Device A和Device B)之间配置链路聚合只能保证链路级的可靠性,接入设备发生故障时则会导致业务中断。这时用户可以采用M-LAG技术,正常工作时链路进行负载分担且任何一台设备故障对业务均没有影响,保证业务的高可靠性。
配置6850-1和6850-2的三层以太网接口XGE1/0/49为保留接口,在该三层以太网接口上搭建Keepalive链路,保证Keepalive报文能够正常传输。
VLAN 100内主机的缺省网关为192.168.10.254/24,VLAN 200内主机的缺省网关为172.16.10.254/24。6850-1和6850-2同时属于虚拟IP地址为192.168.10.254/24的备份组100和虚拟IP地址为172.16.10.254/24的备份组200。在备份组100和备份组200中6850-1的优先级高于6850-2。
3.2 组网拓扑
3.3 设备接口及地址规划
XGE1/0/49---------用于keepalive链路
XGE1/0/50、XGE1/0/51-----绑定到聚合口12,用于peer-link链路;
业务vlan------100(左边内网)、200(右边内网)
S6850-1的G1/0/1和S6850-2的G1/0/4接口加入聚合口100
S6850-2的G1/0/4和S6850-2的G1/0/5接口加入聚合口200
S6850-3的G1/0/2和G1/0/4加入聚合口100中
S6850-4的G1/0/4和G1/0/5加入聚合口200中
四、具体配置命令
4.1 S6850-1的配置
4.2 S6850-2的配置
与S6850-1有区别的地方上配置中有所标记
4.3 S6850-3的配置
4.4 S6850-4的配置
4.5 PC的配置
五、查看各种状态和测试
在6850-1上查看M-LAG的信息,可以看到6850-1和6850-2成功组成M-LAG系统。
在Device C和Device D上分别查看二层聚合组100和二层聚合组200的详细信息
在6850-1和6850-2上查看VRRP备份组的信息。可以看到6850-1在备份组1和2中为Master,从而保证区域A和区域B内的主机通过6850-1与外部通信。
查看Device C和Device D上的OSPF邻居信息,可以看到Device C与6850-1和6850-2分别建立OSPF邻居,Device D与6850-1和6850-2分别建立OSPF邻居,从而确保了三层互通。
在ping1上面ping测试pc2