BGP简介
定义
边界网关协议BGP(Border Gateway Protocol)是一种实现自治系统AS(Autonomous System)之间的路由可达,并选择最佳路由的距离矢量路由协议。早期发布的三个版本分别是BGP-1(RFC1105)、BGP-2(RFC1163)和BGP-3(RFC1267),1994年开始使用BGP-4(RFC1771),2006年之后单播IPv4网络使用的版本是BGP-4(RFC4271),其他网络(如IPv6等)使用的版本是MP-BGP(RFC4760)。
MP-BGP是对BGP-4进行了扩展,来达到在不同网络中应用的目的,BGP-4原有的消息机制和路由机制并没有改变。MP-BGP在IPv6单播网络上的应用称为BGP4+,在IPv4组播网络上的应用称为MBGP(Multicast BGP)。
目的
为方便管理规模不断扩大的网络,网络被分成了不同的自治系统。1982年,外部网关协议EGP(Exterior Gateway Protocol)被用于实现在AS之间动态交换路由信息。但是EGP设计得比较简单,只发布网络可达的路由信息,而不对路由信息进行优选,同时也没有考虑环路避免等问题,很快就无法满足网络管理的要求。
BGP是为取代最初的EGP而设计的另一种外部网关协议。不同于最初的EGP,BGP能够进行路由优选、避免路由环路、更高效率的传递路由和维护大量的路由信息。
虽然BGP用于在AS之间传递路由信息,但并不是所有AS之间传递路由信息都需要运行BGP。比如在数据中心上行的连入Internet的出口上,为了避免Internet海量路由对数据中心内部网络的影响,设备采用静态路由代替BGP与外部网络通信。
受益
BGP从多方面保证了网络的安全性、灵活性、稳定性、可靠性和高效性:
-
BGP采用认证和GTSM的方式,保证了网络的安全性。
-
BGP提供了丰富的路由策略,能够灵活的进行路由选路。
-
BGP提供了路由聚合和路由衰减功能用于防止路由振荡,有效提高了网络的稳定性。
-
BGP使用TCP作为其传输层协议(端口号为179),并支持BGP与BFD联动、BGP Tracking和BGP GR,提高了网络的可靠性。
BGP的基本概念
本章节介绍了BGP的基本概念,理解这些基本概念后,您可以更好的理解BGP的其它功能。
自治系统AS(Autonomous System)
AS是指在一个实体管辖下的拥有相同选路策略的IP网络。BGP网络中的每个AS都被分配一个唯一的AS号,用于区分不同的AS。AS号分为2字节AS号和4字节AS号,其中2字节AS号的范围为1至65535,4字节AS号的范围为1至4294967295。支持4字节AS号的设备能够与支持2字节AS号的设备兼容。
BGP分类
如图1所示,BGP按照运行方式分为EBGP(External/Exterior BGP)和IBGP(Internal/Interior BGP)。
-
EBGP:运行于不同AS之间的BGP称为EBGP。为了防止AS间产生环路,当BGP设备接收EBGP对等体发送的路由时,会将带有本地AS号的路由丢弃。
-
IBGP:运行于同一AS内部的BGP称为IBGP。为了防止AS内产生环路,BGP设备不将从IBGP对等体学到的路由通告给其他IBGP对等体,并与所有IBGP对等体建立全连接。为了解决IBGP对等体的连接数量太多的问题,BGP设计了路由反射器和BGP联盟。
说明:如果在AS内一台BGP设备收到EBGP邻居发送的路由后,需要通过另一台BGP设备将该路由传输给其他AS,此时推荐使用IBGP。
BGP报文交互中的角色
BGP报文交互中分为Speaker和Peer两种角色。
-
Speaker:发送BGP报文的设备称为BGP发言者(Speaker),它接收或产生新的报文信息,并发布(Advertise)给其它BGP Speaker。
-
Peer:相互交换报文的Speaker之间互称对等体(Peer)。若干相关的对等体可以构成对等体组(Peer Group)。
BGP的路由器号(Router ID)
BGP的Router ID是一个用于标识BGP设备的32位值,通常是IPv4地址的形式,在BGP会话建立时发送的Open报文中携带。对等体之间建立BGP会话时,每个BGP设备都必须有唯一的Router ID,否则对等体之间不能建立BGP连接。
BGP工作原理
BGP对等体的建立、更新和删除等交互过程主要有5种报文、6种状态机和5个原则。
BGP的报文
BGP对等体间通过以下5种报文进行交互,其中Keepalive报文为周期性发送,其余报文为触发式发送:
-
Open报文:用于建立BGP对等体连接。
-
Update报文:用于在对等体之间交换路由信息。
-
Notification报文:用于中断BGP连接。
-
Keepalive报文:用于保持BGP连接。
-
Route-refresh报文:用于在改变路由策略后请求对等体重新发送路由信息。只有支持路由刷新(Route-refresh)能力的BGP设备会发送和响应此报文。
BGP状态机
如图1所示,BGP对等体的交互过程中存在6种状态机:空闲(Idle)、连接(Connect)、活跃(Active)、Open报文已发送(OpenSent)、Open报文已确认(OpenConfirm)和连接已建立(Established)。在BGP对等体建立的过程中,通常可见的3个状态是:Idle、Active和Established。
- Idle状态是BGP初始状态。在Idle状态下,BGP拒绝邻居发送的连接请求。只有在收到本设备的Start事件后,BGP才开始尝试和其它BGP对等体进行TCP连接,并转至Connect状态。
说明:
- Start事件是由一个操作者配置一个BGP过程,或者重置一个已经存在的过程或者路由器软件重置BGP过程引起的。
- 任何状态中收到Notification报文或TCP拆链通知等Error事件后,BGP都会转至Idle状态。
-
在Connect状态下,BGP启动连接重传定时器(Connect Retry),等待TCP完成连接。
- 如果TCP连接成功,那么BGP向对等体发送Open报文,并转至OpenSent状态。
- 如果TCP连接失败,那么BGP转至Active状态。
- 如果连接重传定时器超时,BGP仍没有收到BGP对等体的响应,那么BGP继续尝试和其它BGP对等体进行TCP连接,停留在Connect状态。
-
在Active状态下,BGP总是在试图建立TCP连接。
- 如果TCP连接成功,那么BGP向对等体发送Open报文,关闭连接重传定时器,并转至OpenSent状态。
- 如果TCP连接失败,那么BGP停留在Active状态。
- 如果连接重传定时器超时,BGP仍没有收到BGP对等体的响应,那么BGP转至Connect状态。
-
在OpenSent状态下,BGP等待对等体的Open报文,并对收到的Open报文中的AS号、版本号、认证码等进行检查。
- 如果收到的Open报文正确,那么BGP发送Keepalive报文,并转至OpenConfirm状态。
- 如果发现收到的Open报文有错误,那么BGP发送Notification报文给对等体,并转至Idle状态。
- 在OpenConfirm状态下,BGP等待Keepalive或Notification报文。如果收到Keepalive报文,则转至Established状态,如果收到Notification报文,则转至Idle状态。
-
在Established状态下,BGP可以和对等体交换Update、Keepalive、Route-refresh报文和Notification报文。
- 如果收到正确的Update或Keepalive报文,那么BGP就认为对端处于正常运行状态,将保持BGP连接。
- 如果收到错误的Update或Keepalive报文,那么BGP发送Notification报文通知对端,并转至Idle状态。
- Route-refresh报文不会改变BGP状态。
- 如果收到Notification报文,那么BGP转至Idle状态。
- 如果收到TCP拆链通知,那么BGP断开连接,转至Idle状态。
BGP对等体之间的交互原则
BGP设备将最优路由加入BGP路由表,形成BGP路由。BGP设备与对等体建立邻居关系后,采取以下交互原则:
-
从IBGP对等体获得的BGP路由,BGP设备只发布给它的EBGP对等体。
-
从EBGP对等体获得的BGP路由,BGP设备发布给它所有EBGP和IBGP对等体。
-
当存在多条到达同一目的地址的有效路由时,BGP设备只将最优路由发布给对等体。
-
路由更新时,BGP设备只发送更新的BGP路由。
-
所有对等体发送的路由,BGP设备都会接收。
实验需求
如图中所示,需要在所有Switch间运行BGP协议,S1、S2之间建立EBGP连接,S2、S3和S4之间建立IBGP全连接。
注:请确保该场景下互联接口的STP处于未使能状态。因为在使能STP的环形网络中,如果用交换机的VLANIF接口构建三层网络,会导致某个端口被阻塞,从而导致三层业务不能正常运行。
配置思路
采用如下的思路配置BGP的基本功能:
- 在S2、S3和S4间配置IBGP连接。
- 在S1和S2之间配置EBGP连接。
操作步骤
- 配置各接口所属的VLAN
# 配置S1。S2、S3和S4的配置与S1类似。
<Huawei>system-view
Enter system view, return user view with Ctrl+Z.
[Huawei]sysname S1[S1]undo info-center enable
Info: Information center is disabled.[S1]vlan batch 10 50
Info: This operation may take a few seconds. Please wait for a moment...done.[S1]interface GigabitEthernet 0/0/1
[S1-GigabitEthernet0/0/1]port link-type trunk
[S1-GigabitEthernet0/0/1]port trunk allow-pass vlan 10[S1-GigabitEthernet0/0/1]interface GigabitEthernet 0/0/2r
[S1-GigabitEthernet0/0/2]port link-type trunk
[S1-GigabitEthernet0/0/2]port trunk allow-pass vlan 50
[S1-GigabitEthernet0/0/2]quit
2. 配置各VLANIF接口的IP地址
# 配置S1。S2、S3和S4的配置与S1类似。
[S1]interface Vlanif 10
[S1-Vlanif10]ip address 192.168.1.2 24
[S1-Vlanif10]quit[S1]interface Vlanif 50
[S1-Vlanif50]ip address 10.1.1.1 16
[S1-Vlanif50]quit
3. 配置IBGP连接
# 配置S2。
[S2]bgp 65009
[S2-bgp]router-id 172.17.2.2
[S2-bgp]peer 172.16.1.2 as-number 65009
[S2-bgp]peer 172.16.3.2 as-number 65009
[S2-bgp]quit
# 配置S3。
[S3]bgp 65009
[S3-bgp]router-id 172.17.3.3
[S3-bgp]peer 172.16.3.1 as-number 65009
[S3-bgp]peer 172.16.2.2 as-number 65009
[S3-bgp]quit
# 配置S4。
[S4]bgp 65009
[S4-bgp]router-id 172.17.4.4
[S4-bgp]peer 172.16.1.1 as-number 65009
[S4-bgp]peer 172.16.2.1 as-number 65009
[S4-bgp]quit
4. 配置EBGP
# 配置S1。
[S1]bgp 65008
[S1-bgp]router-id 172.17.1.1
[S1-bgp]peer 192.168.1.1 as-number 65009
[S1-bgp]quit
# 配置S2。
[S2]bgp 65009
[S2-bgp]peer 192.168.1.2 as-number 65008
[S2-bgp]quit
# 查看BGP对等体的连接状态。
可以看出,S2其它Switch的BGP连接均已建立。
5. 配置S1发布路由10.1.0.0/16
# 配置S1发布路由。
[S1]bgp 65008
[S1-bgp]ipv4-family unicast
[S1-bgp-af-ipv4]network 10.1.0.0 255.255.0.0
[S1-bgp-af-ipv4]quit
[S1-bgp]quit
# 查看S1路由表信息。
# 查看S2的路由表。
# 查看S3的路由表。
从路由表可以看出,S3学到了AS65008中的10.1.0.0的路由,但因为下一跳192.168.1.2不可达,所以也不是有效路由。
6. 配置BGP引入直连路由
# 配置S2。
[S2]bgp 65009
[S2-bgp]ipv4-family unicast
[S2-bgp-af-ipv4]import-route direct
[S2-bgp-af-ipv4]quit
[S2-bgp]quit
# 查看S1的BGP路由表。
# 查看S3的路由表。
可以看出,到10.1.0.0的路由变为有效路由,下一跳为S1的地址。
# 使用Ping进行验证。
S2 配置
<Huawei>system-view
Enter system view, return user view with Ctrl+Z.
[Huawei]sysname S2[S2]undo info-center enable
Info: Information center is disabled.[S2]vlan batch 10 20 30
Info: This operation may take a few seconds. Please wait for a moment...done.[S2]interface GigabitEthernet 0/0/1
[S2-GigabitEthernet0/0/1]port link-type trunk
[S2-GigabitEthernet0/0/1]port trunk allow-pass vlan 10[S2-GigabitEthernet0/0/1]interface GigabitEthernet 0/0/2
[S2-GigabitEthernet0/0/2]port link-type trunk
[S2-GigabitEthernet0/0/2]port trunk allow-pass vlan 20[S2-GigabitEthernet0/0/2]interface GigabitEthernet 0/0/3
[S2-GigabitEthernet0/0/3]port link-type trunk
[S2-GigabitEthernet0/0/3]port trunk allow-pass vlan 30
[S2-GigabitEthernet0/0/3]quit [S2]interface Vlanif 10
[S2-Vlanif10]ip address 192.168.1.1 24[S2-Vlanif10]interface Vlanif 20
[S2-Vlanif20]ip address 172.16.3.1 24[S2-Vlanif20]interface Vlanif 30
[S2-Vlanif30]ip address 172.16.1.1 24
[S2-Vlanif30]quit
S3 配置
<Huawei>system-view
Enter system view, return user view with Ctrl+Z.
[Huawei]sysname S3[S3]undo info-center enable
Info: Information center is disabled.[S3]vlan batch 20 40
Info: This operation may take a few seconds. Please wait for a moment...done.[S3]interface GigabitEthernet 0/0/1
[S3-GigabitEthernet0/0/1]port link-type trunk
[S3-GigabitEthernet0/0/1]port trunk allow-pass vlan 20[S3-GigabitEthernet0/0/1]interface GigabitEthernet 0/0/2
[S3-GigabitEthernet0/0/2]port link-type trunk
[S3-GigabitEthernet0/0/2]port trunk allow-pass vlan 40
[S3-GigabitEthernet0/0/2]quit [S3]interface Vlanif 20
[S3-Vlanif20]ip address 172.16.3.2 24[S3-Vlanif20]interface Vlanif 40
[S3-Vlanif40]ip address 172.16.2.1 24
[S3-Vlanif40]quit
S4 配置
<Huawei>system-view
Enter system view, return user view with Ctrl+Z.
[Huawei]sysname S4[S4]undo info-center enable
Info: Information center is disabled.[S4]vlan batch 30 40
Info: This operation may take a few seconds. Please wait for a moment...done.[S4]interface GigabitEthernet 0/0/1
[S4-GigabitEthernet0/0/1]port link-type trunk
[S4-GigabitEthernet0/0/1]port trunk allow-pass vlan 30[S4-GigabitEthernet0/0/1]interface GigabitEthernet 0/0/2
[S4-GigabitEthernet0/0/2]port link-type trunk
[S4-GigabitEthernet0/0/2]port trunk allow-pass vlan 40
[S4-GigabitEthernet0/0/2]quit [S4]interface Vlanif 30
[S4-Vlanif30]ip address 172.16.1.2 24[S4-Vlanif30]interface Vlanif 40
[S4-Vlanif40]ip address 172.16.2.2 24
[S4-Vlanif40]quit