Wysoka dostępność w sieciach operatorskich. Łukasz Bromirski lbromirski@cisco.com



Podobne dokumenty
Praktyczne aspekty implementacji IGP

Protokół BGP Podstawy i najlepsze praktyki Wersja 1.0

Unified MPLS. Marcin Aronowski Consulting Systems Engineer Cisco Systems

Podstawy MPLS. PLNOG4, 4 Marzec 2010, Warszawa 1

Routing. mgr inż. Krzysztof Szałajko

PBS. Wykład Routing dynamiczny OSPF EIGRP 2. Rozwiązywanie problemów z obsługą routingu.

(secure) ROUTING WITH OSPF AND BGP FOR FUN, FUN & FUN. Łukasz Bromirski. lukasz@bromirski.net

ZiMSK. Routing dynamiczny 1

DR INŻ. ROBERT WÓJCIK DR INŻ. JERZY DOMŻAŁ PODSTAWY RUTINGU IP. WSTĘP DO SIECI INTERNET Kraków, dn. 7 listopada 2016 r.

Jak zbudować profesjonalny styk z internetem?

Routing dynamiczny... 2 Czym jest metryka i odległość administracyjna?... 3 RIPv RIPv Interfejs pasywny... 5 Podzielony horyzont...

IP Anycast. Ochrona i skalowanie usług sieciowych. Łukasz Bromirski lbromirski@cisco.com

router wielu sieci pakietów

Routing - wstęp... 2 Routing statyczny... 3 Konfiguracja routingu statycznego IPv Konfiguracja routingu statycznego IPv6...

Rozległe Sieci Komputerowe

Instrukcja do laboratorium 2. Podstawowa konfiguracja środowiska MPLS (Multi-Protocol Label Switching)

Instrukcja do laboratorium 1. Podstawowa konfiguracja środowiska MPLS (Multi-Protocol Label Switching)

Warstwa sieciowa rutowanie

OSPF... 3 Komunikaty OSPF... 3 Przyległość... 3 Sieć wielodostępowa a punkt-punkt... 3 Router DR i BDR... 4 System autonomiczny OSPF...

Wirtualizacja sieci izolacja ruchu w LAN oraz sieciach MPLS

ZP-92/022/D/07 załącznik nr 1. Wymagania techniczne dla routera 10-GIGABIT ETHERNET

LABORATORIUM SIECI KOMPUTEROWYCH (compnet.et.put.poznan.pl)

Wykład 2: Budowanie sieci lokalnych. A. Kisiel, Budowanie sieci lokalnych

ARP Address Resolution Protocol (RFC 826)

Ćwiczenie Rozwiązywanie problemów związanych z trasami statycznymi IPv4 oraz IPv6 Topologia

1.1 Ustawienie adresów IP oraz masek portów routera za pomocą konsoli

Zarządzanie systemem komendy

Księgarnia PWN: Mark McGregor Akademia sieci cisco. Semestr piąty

Sieci Komputerowe Laboratorium 08 OSPF

Link-State. Z s Link-state Q s Link-state. Y s Routing Table. Y s Link-state

PBS. Wykład Podstawy routingu. 2. Uwierzytelnianie routingu. 3. Routing statyczny. 4. Routing dynamiczny (RIPv2).

Ćwiczenie Konfiguracja statycznych oraz domyślnych tras routingu IPv4

CCNA : zostań administratorem sieci komputerowych Cisco / Adam Józefiok. Gliwice, cop Spis treści

Księgarnia PWN: Mark McGregor Akademia sieci cisco. Semestr szósty

Wykorzystanie połączeń VPN do zarządzania MikroTik RouterOS

Laboratorium - Przeglądanie tablic routingu hosta

MPLS. Bartłomiej Anszperger. Co to jest? Z czym to gryźć? Jak i po co myśleć o mechanizmach MPLS we własnej sieci?

Sieci komputerowe. Routing. dr inż. Andrzej Opaliński. Akademia Górniczo-Hutnicza w Krakowie.

RUTERY. Dr inŝ. Małgorzata Langer

Instrukcja do laboratorium 1

Routing. część 2: tworzenie tablic. Sieci komputerowe. Wykład 3. Marcin Bieńkowski

Spis treúci. Księgarnia PWN: Wayne Lewis - Akademia sieci Cisco. CCNA semestr 3

Sklejanie VPN (różnych typów)

Sieci komputerowe Protokoły routingu

Routing. część 2: tworzenie tablic. Sieci komputerowe. Wykład 3. Marcin Bieńkowski

Wykład 3: Internet i routing globalny. A. Kisiel, Internet i routing globalny

Podstawy Sieci Komputerowych Laboratorium Cisco zbiór poleceń

LABORATORIUM SIECI KOMPUTEROWYCH (compnet.et.put.poznan.pl)

Wdrożenie ipv6 w TKTelekom.pl

BADANIE DOBORU TRAS W WIELODROGOWEJ ARCHITEKTURZE SIECIOWEJ ZE WZGLĘDU NA ZMIENNE WARUNKI SIECIOWE

3. Routing z wykorzystaniem wektora odległości, RIP

Sieci Komputerowe Modele warstwowe sieci

Materiały przygotowawcze do laboratorium

Routing. routing bezklasowy (classless) pozwala na używanie niestandardowych masek np. /27 stąd rozdzielczość trasowania jest większa

Mechanizmy routingu w systemach wolnodostępnych

DWA ZDANIA O TEORII GRAFÓW. przepływ informacji tylko w kierunku

Sieci komputerowe. Router. Router

Routing dynamiczny konfiguracja CISCO

Sieci Komputerowe Laboratorium 10. Redystrybucja_OSPF_EIGRP_RIP

Packet Tracer - Podłączanie routera do sieci LAN

MODEL WARSTWOWY PROTOKOŁY TCP/IP

Ruting. Protokoły rutingu a protokoły rutowalne

Marcin Mazurek P.I.W.O, 22/05/2004, Poznań, Polska:)

Zapytanie ofertowe. zakup routera. Przedmiotem niniejszego zamówienia jest router spełniający następujące wymagania:

LABORATORIUM SIECI KOMPUTEROWYCH (compnet.et.put.poznan.pl)

52. Mechanizm trasowania pakietów w Internecie Informacje ogólne

Sieci komputerowe - Protokoły wspierające IPv4

Laboratorium - Przechwytywanie i badanie datagramów DNS w programie Wireshark

Plan wykładu. 1. Sieć komputerowa 2. Rodzaje sieci 3. Topologie sieci 4. Karta sieciowa 5. Protokoły używane w sieciach LAN 6.

Sterowanie ruchem wyjściowym

SIECI KOMPUTEROWE. Dariusz CHAŁADYNIAK Józef WACNIK

Badanie mechanizmu rozgłaszania i przenumerowywania prefiksów sieci

WPROWADZENIE DO PROTOKOŁU BGP (BORDER GATEWAY PROTOCOL)

Badanie protokołów routingu

Routing i polityka bezpieczeństwa w Śląskiej Akademickiej Sieci Komputerowej

Akademia sieci Cisco CCNA Exploration : semestr 2 : protokoły i koncepcje routingu / Rick Graziani, Allan Johnson. wyd. 1, dodr. 4.

Ćwiczenie Konfiguracja routingu między sieciami VLAN

Spis treúci. Księgarnia PWN: Rick Graziani, Allan Johnson - Akademia sieci Cisco. CCNA Exploration. Semestr 2

Ćwiczenie Konfiguracja statycznych oraz domyślnych tras routingu IPv6

Ćwiczenie Wykrywanie błędów w routingu między sieciami VLAN

* konfiguracja routera Asmax V.1501 lub V.1502T do połączenia z Polpakiem-T lub inną siecią typu Frame Relay

Laboratorium - Konfiguracja zaawansowanych właściwości protokołu OSPFv2

Nowości w protokole BGP Optymalizacja routingu. Łukasz Bromirski lukasz.bromirski@cisco.com CCIE # R&S/SP, CCDE #2012::17

MPLS. Co to jest? Z czym to gryźć? Jak i po co myśleć o mechanizmach MPLS we własnej sieci? Bartłomiej Anszperger

Warsztaty z Sieci komputerowych Lista 3

ZiMSK NAT, PAT, ACL 1

ZST Wykład (lato 2014)

Model warstwowy sieci

Spanning Tree to samo zło, czyli Protekcja Ringu w Ethernecie na podstawie wdrożenia w sieci Leon

ISP od strony technicznej. Fryderyk Raczyk

Laboratorium Projektowanie i implementowanie schematu adresowania z zastosowaniem zmiennych masek podsieci

SIECI KOMPUTEROWE LABORATORIUM 109

ZADANIE.03 Routing dynamiczny i statyczny (OSPF, trasa domyślna) 1,5h

Szczegółowy Opis Przedmiotu Zamówienia (SOPZ)

Formularz Oferty Technicznej

Podstawy multicast - IGMP, CGMP, DVMRP.

lp wykonawca nr w dzienniku (dz) 1. POL GRZYBOWSKI MAZUR zadanie rodzaj tunelowania typ tunelu wybór 1. wyspy IPv6 podłączone w trybie Manual Mode 4

BRINET Sp. z o. o.

BGP. Piotr Marciniak (TPnets.com/KIKE) Ożarów Mazowiecki, 26 marca 2010 r.

Transkrypt:

Wysoka dostępność w sieciach operatorskich Łukasz Bromirski lbromirski@cisco.com

Agenda Wysoka dostępność...szybka konwergencja Mechanizmy L1 Mechanizmy L2 Mechanizmy L3 2

Wysoka dostępność a szybka konwergencja 3

Problemy i sposoby ich rozwiązywania Tym się dzisiaj zajmiemy Kontrola dostępu do łącza Przeciążone łącze Awaria łącza Fast ReRoute Routing Fast Convergence BGP PIC Wykrycie awarii Awaria węzła Kolejkowanie SSO ISSU Przełącznie RP Graceful Restart/HA Non-Stop Routing 4

Odporność usług na przerwę w pracy sieci Sygnalizacja Połączenie VoIP Protokoły routingu Wideo Tunele Sesja TCP Transport L1/L2 50 msec 500 msec 1 sekunda 5 sekund 30 sekund 1 minuta 5

Projektowanie sieci Szybka konwergencja to trochę więcej niż parę poleceń Parę warstw do rozważenia i ich wzajemnego działania Warstwa 1 i 2 wykrywanie awarii i zmian w topologii fizycznej Warstwa 3 zachowanie protokołów, interakcje pomiędzy protokołami Warstwy 4-7 zachowanie aplikacji i usług Wszelkie aspekty związane z budową platform sieciowych czasem z dokładnością do możliwości wykrycia awarii w L1, prędkości budowania (programowania) tablic FIB i MFIB, itp. itd. 6

Działa? Nie poprawiać! Zakres opcji może różnic się zakresem, złożonością i czasem widoczności zmian Koszt i złożoność Potencjalne podejścia do problemu bliższe faktycznej efektywnej użyteczności Potencjalnie przesterowane Można optymalizować Trzeba optymalizować Straty 7

Mechanizmy L1 8

Opcje transportu IP w sieci transportowej IP/MPLS L3 Ethernet/FR/ATM L2 SONET/SDH/OTN L1 L0 DWDM IP -> Layer 2: Ethernet, EoDWDM, Frame Relay, ATM IP -> Layer 1: SONET/SDH (POS), xwdm (Transponder, EoDWDM) IP -> Layer 0: G.709 (IPoDWDM) 9

Wykrywanie awarii w L0 IPoDWDM Integracja optyczna i IP wprowadza możliwość zidentyfikowania łącza gorszej jakości i automatycznego włączenia ochrony (i rekonwergencji protokołów L3) w wielu wypadkach oznacza to że przeniesienie ruchu odbędzie się bez straty ruchu Working path Switchover lost data Protected path Working path Protect path Port optyczny routera BER LOF Port WDM routera BER Near-hitless switch FEC Transponder FEC Corrected bits FEC limit Optical impairments Corrected bits FEC limit Optical impairments Protection trigger WDM Protekcja normalna 10 WDM Protekcja proaktywna

Wykrywanie awarii w L1 SONET/SDH Alarmy Reakcja natychmiastowa, możliwa do kontrolowania poleceniem pos delay-trigger Należy oczywiście wziąć pod uwagę protekcję SONET/SDH przy konfiguracji wyzwolenia położenia logicznego interfejsu Domyślnie polecenie shutdown nie generuje alarmu należy to wprost włączyć poleceniem pos ais-shut na interfejsie fizycznym 11

Wykrywanie awarii w L1 światłowód/ge Autonegocjacja (tak jak opisano to w IEEE 802.3z/802.3ae) może sygnalizować lokalne problemy stronie zdalnej R1 rx X tx R2 tx rx W przypadku połączeń Ethernet ponad SONET/SDH problemem może być przeniesienie sygnalizacji zwykle po prostu to nie działa R1 rx X tx MUX-A SDH Transport MUX-B tx rx R2 tx rx rx tx 12

Mechanizmy L2 carrier-delay IP dampening 13

Wykrywanie awarii w L2 transport Wykorzystanie konstrukcji protokołów L2 i różnego rodzaju odpowiedników pakietów typu Hello pakiety keepalive w PPP i HDLC LMI we Frame-Relay OAM w ATMie OAM w Ethernet Mechanizmy te nie dają możliwości osiągnięcia konwergencji na poziomie poniżej sekundy Obsługa pakietów keepalive w różnych protokołach (do minimalnej sekundy) nie jest zalecana większość producentów nie optymalizuje platform do ich priorytetowej obsługi co może prowadzić do fałszywych alarmów 14

Carrier-Delay 1 i 2 warstwa przekazują sygnał o awarii łącza (LINK i/lub LINEPROTO) Domyślnie większość platform stosuje dodatkowy licznik zanim zareaguje Cisco IOS domyślnie od zera (Catalyst) do 2 sekund interface carrier-delay msec 0 Oczywiście czas należy możliwie zmniejszyć Aby zapobiec niepotrzebnemu klapaniu łącz i wpływowi tego na routing, stosuje się IP dampening interface dampening 15

Carrier-Delay asymetrycznie Zadeklarowanie interfejsu w stan up można opóźnić, aby umożliwić pierwszym zapytaniom ARP zakończyć zbieranie informacji o sąsiedztwach interface carrier-delay up 2000 msec Wsparcie dla Cisco IOS - od 12.0(32)SY2, 12.2SRD, XR3.4.0 Niektóre sterowniki mają wbudowany czas up POS: z reguły 10 sekund 7600 ES20/40 WAN: 4 sekundy 16

Mechanizmy L2 carrier-delay IP dampening 17

IP Event Dampening Zapobiega ciągłym zmianom informacji z protokołów routingu Wspiera wszystkie protokoły routingu, oraz: Routing statyczny, RIP, EIGRP, OSPF, IS-IS, BGP HSRP i routing CLNS Dostępny od 12.0(22)S, 12.2(13)T 18

IP Event Dampening Bez skonfigurowanego HQ/ISP R1 Łącze podstawowe R3 Zdalne biuro R2 Łącze zapasowe Fizyczny stan łącza Up Down Ścieżka do HQ od R3 P B P B P B P B P Czas trwania utraty pakietów 19

IP Event Dampening Po skonfigurowaniu HQ/ISP R1 Łącze podstawowe R3 Zdalne biuro R2 Łącze zapasowe Fizyczny stan łącza Logiczny stan łącza Up Down Up Down Ścieżka do HQ od R3 P B P B P Czas trwania utraty pakietów 20

Mechanizmy L3 Tuning protokołów routingu IGP Tuning protokołu BGP BGP PIC Edge i Core 21

Komponenty konwergencji w L3 1. Wykrycie awarii 2. Propagacja informacji o awarii (flooding, etc.) 3. Przeliczenie topologii 4. Uaktualnienie tablic przechowujących informację o routingu (RIB & FIB) 5. Wydajność warstwy kontrolnej węzła sieciowego 1. 2. 3. 4. t 0 t 1 t t 5. 2 3 t 4 22

Wykrycie problemu w L3 Nie wszystkie problemy da się wykryć za pomocą L2 czasami sygnalizację zdalnej awarii musi zapewnić L3 Segment L2 DWDM/X bez propagacji LoS Tunele (GRE/IPsec) 23

Warstwa routingu Wszystkie protokołu IGP (EIGRP, OSPF i ISIS) używają pakietów HELLO aby utrzymać sąsiedztwa i sprawdzić osiągalność sąsiadów Liczniki hello/hold można odpowiednio dostosować w dół aby osiągnąć czasy wykrycia awarii na poziomie poniżej sekundy, jednak: Nie skaluje się to dobrze dla dużych ilości sesji (wiele setek, tysiące) Duże obciążenie CPU może spowodować niechciane próby rekonwergencji sieci wokół problemu który w ogóle nie wystapił Można jednak to robić w sieciach na małą skalę Lepszym rozwiązaniem jest coś uniwersalnego 24

BFD (Bi-directional Forwarding Detection) Lekki, prosty protokół z niskim narzutem BFD może być przetwarzany w sposób rozproszony (np. na kartach liniowych routerów GSR, CRS czy ASR9k) a zatem daje się go w przewidywalny sposób skalować dla większej ilości sesji Dowolna zainteresowana aplikacja taka jak protokół routingu (OSPF, BGP, EIGRP) czy mechanizm (HSRP) może zarejestrować chęć bycia poinformowaną przez BFD o utracie osiągalności ścieżki 25

Konfiguracja BFD i negocjacja pracy Sąsiedzi mogą stale renegocjować parametry pracy Wolniejszy system będzie dyktował parametry zestawienia sesji Ustalone tempo Chcę otrzymywać co 50 ms Mogę wysylać co 100 ms Zielony wysyła co 100ms Chcę otrzymywać co 60 ms Mogę wysyłać co 40 ms Pomarańczowy wysyla co 50ms interface <name> bfd interval <msec> min_rx <msec> multiplier <n> 26

Propagacja zdarzeń OSPF Pierwsze opóźnienie związane z generowaniem LSA domyślnie ustawione jest na 500ms (dotyczy tylko Router/Network) Kolejny opóźniający timer czas pomiędzy rozgłoszeniem konkretnego LSA domyślnie 5 sekund Odbiór LSA w trakcie odbioru LSA router zakłada domyślnie, że nowe instancje LSA mogą spływać co MinLSArrival domyślnie co 1 sekundę timers throttle lsa all <lsa-start> <lsa-hold> <lsa-max> timers lsa arrival <timer> wszystkie wartości czasu w ms 27

Propagacja zdarzeń OSPF timers throttle lsa all 10 500 5000 Zdarzenia powodujące generowanie LSA poprzednie generowanie LSA w t0 (t1 t0) > 5000 ms 1000 t1 t2 LSA Generowanie Czas [ms] 500 5000 5000 LSA Generowanie algorytm backoff Czas [ms] 500 1000 2000 4000 5000 t1+10 t2+10 Czas [ms] 28

Propagacja zdarzeń OSPF W domyślnej konfiguracji każdy z węzłów sieciowych może dodać do 33ms do momentu wysłania zdarzenia Zmiana: timers pacing flood <timer> timers pacing retransmission <timer> 29

Propagacja zdarzeń OSPF Odłożenie w czasie przeliczenia SPF chroni router przed zbyt dużym obciążeniem, ale będzie miało negatywny wpływ na konwergencję Zmiana timers throttle spf <spf-start> <spf-hold> <spf-max> 30

Priorytetyzacja prefiksów OSPF i IS-IS Sieć posiada zwykle zbiór prefiksów ważniejszych w szczególności adresów interfejsów loopback (używane jako router-id, używane do nawiązania sesji BGP) Przy konwergencji sieci w której znajdują się setki tysięcy prefiksów, czas programowania wpisów może mieć istotne znaczenie dla szybkiej konwergencji 31

Priorytetyzacja prefiksów Konfiguracja Priorytety dla prefiksów Krytyczny, Wysoki, Średni, Niski /32 dla IPv4 i /128 dla IPv6 automatycznie trafiają do Średniego Pozostałe prefiksy domyślnie trafiają do Niskiego priorytetu Dopasowanie poleceniem spf prefix-priority interface Gigabitethernet0/1! do bramki VoIP ip router isis isis tag 17 router isis ip route priority high tag 17 32

Mechanizmy L3 Tuning protokołów routingu IGP Tuning protokołu BGP BGP PIC Edge i Core 33

Co można poprawić w BGP? Skaner BGP ATF/NHT Address Tracking Filter/Next Hop Tracking FSD Fast Session Deactivation MRAI Minimal Route Advertisement Interval TCP PMTUD/SACK 34

Skaner BGP Skaner (domyślnie) co 60 sekund wykonuje pełne przejście tablicy BGP bgp scan-time x Co 15 sekund działa skaner importu importuje prefiksy VPNv4 do VRFów bgp scan-time import X Pełne przejście wykonuje między innymi: sprawdzenie osiągalności routerów next-hop sprawdzenie poprawności wyboru najlepszej trasy zaktualizowanie tablicy po zmianach w redystrybucji i wydaniu poleceń network sprawdzenie rozgłoszeń warunkowych obsługę route dampening wyczyszczenie bazy BGP 35

ATF / NHT BGP rejestruje w ATF prefiksy 10.1.1.3 i 10.1.1.5 BGP Nexthopy BGP 10.1.1.3 10.1.1.5 ATF nie informuje BGP o zmianach dla pozostałych prefiksów np. 10.1.1.11/32, 10.1.1.2/32 i 10.1.1.4/32 ATF ATF informuje BGP o zmianach dla prefiksów zarejestrowanych RIB 10.1.1.1/32 10.1.1.2/32 10.1.1.3/32 10.1.1.4/32 10.1.1.5/32 36

NHT Mechanizm BGP Next Hop Tracking dba automatycznie o rejestrowanie wszystkich adresów next-hop w ATF włączony domyślnie (od 12.0(29)S i 12.3(14)T): [no] bgp nexthop trigger enable lista zarejestrowanych adresów: show ip bgp attr nexthop Informacja z ATF uruchomi lekką wersję BGP skanera: wyliczenie najlepszych tras...pozostałe operacje będą czekać na normalny cykl skanera, skaner nie weryfikuje już jednak osiągalności routerów next-hop oraz najlepszych tras 37

NHT Domyślnie BGP czeka 5 sekund po otrzymaniu informacji z ATF o zmianie dla prefiksu bgp nexthop trigger delay <0-100> Do zmniejszenia wpływu dużej ilości zmian sygnalizowanych przez ATF, używany jest dampening show ip bgp internal wyświetla informacje kiedy ostatnio odbył się proces NHT i kiedy odbędzie się następny 38

Fast Session Deactivation Zarejestrowanie adresu next-hop dla prefiksów przez BGP w ATF pozwala bardzo szybko podjąć decyzję o osiągalności partnerów BGP Po utracie trasy do partnera sesji BGP, natychmiast można zdezaktywować sesję BGP BGP nie czeka na upłynięcie czasu wynikającego z licznika hold Przydatne dla sesji ebgp Bardzo niebezpieczene dla sesji ibgp IGP może nie mieć trasy do sąsiada przez ułamek sekundy... FSD natychmiast rozłączy sesje... Domyślnie wyłączone neighbor x.x.x.x fall-over neighbor x.x.x.x fall-over bfd! FSD z BFD 39

MRAI [...] określa minimalny okres czasu który musi minąć pomiędzy rozgłoszeniem i/lub wycofaniem trasy do konkretnego prefiksu. Mechanizm działa z dokładnością do prefiksu, ale wartość MinRouteAdvertisementIntervalTimer ustalana jest dla sąsiada BGP. RFC 4271 Sekcja 9.2.1.1 Presentation_ID 2007 Cisco Systems, Inc. All rights reserved. Cisco Confidential 40

MRAI - podstawy Liczniki MRAI utrzymywane są per sąsiad ibgp domyślnie 5 sekund ebgp domyślnie 30 sekund neighbor x.x.x.x advertisement-interval <0-600> Zalety Wady pozwala uprościć/usystematyzować wymianę rozgłoszeń może spowolnić konwergencje wartości określone w standardzie są bardzo konserwatywne i nie pozwalają zapewnić szybkiej konwergencji 41

MRAI co można zmienić i jak? Zmiany w osiągalności prefiksów w internecie oznaczają falę zmian Jeden klepiący prefiks może spowolnić znacznie konwergencje dla pozostałych prefiksów (np. nowych lub zmienianych) W internecie mamy do czynienia z 2-3 zmianami na sekundę (zmiana w stosunku do 2006 roku z 1-2 zmian): na podstawie pracy Geoff Hustona: http://www.potaroo.net/presentations/2006-11-03-caida-wide.pdf Dla połączeń ibgp i połączeń ebgp na styku PE<>CE sensowne wydaje się: neighbor x.x.x.x advertisement-interval 0 42

Mechanizmy L3 Tuning protokołów routingu IGP Tuning protokołu BGP BGP PIC Edge i Core 43

BGP PIC Edge awaria linku PE-CE 1. Łącze PE2<>CE2 ulega awarii 2. Router PE2 posiada zaprogramowaną zapasową trasę do CE2 przez PE3 3. Ruch z CE1 jest przesyłany na trasie CE1-PE1-PE2-PE3-CE2 RR1 RR2 BGP PIC Edge RR3 RR4 VPN 1 site A CE1 PE1 RD 1:1 PE2 RD 2:1 PE3 RD 3:1 CE2 VPN 1 site B x.x.x.x/y 44

BGP PIC Edge rekonwergencja 1. Łącze PE2<>CE2 ulega awarii 2. Router PE2 posiada zaprogramowaną zapasową trasę do CE2 przez PE3 3. Ruch z CE1 jest przesyłany na trasie CE1-PE1-PE2-PE3-CE2 4. Fast External Fallover przeszukuje tablicę BGP szukając najlepszej ścieżki RR1 RR2 3. PE2 wycofuje ścieżkę 4. RR2 i RR4 propaguje wycofanie rozgłoszenia 5. RR1 i RR3 propagują wycofanie rozgłoszenia 6. PE1 kasuje ścieżkę przez PE2, trasa prowadzi teraz przez PE3 VPN 1 site A CE1 PE1 RD 1:1 RR3 RR4 PE2 RD 2:1 PE3 RD 3:1 CE2 VPN 1 site B x.x.x.x/y 45

Awaria linku PE<>CE Eliminowane po zastosowaniu BGP PIC Czas konwergencji będzie zależał od D: czas do wykrycia awarii S(p): czas do przeskanowania tablicy BGP przejście per-rd dla VPN4 a potem dla IPv4 B(p): czas do obliczenia najlepszych ścieżek i zaprogramowanie FIB Wtx(p): czas generowania/propagowania wycofywania ścieżek RR(p): czas na odbicie RR Wrx(p): czas na otrzymanie i przetworzenie ścieżek wycofywanych B(p): czas do obliczenia najlepszych ścieżek i zaprogramowanie FIB X(p) oznacza że czas zależy wprost od rozmiaru tablicy 46

BGP PIC Edge awaria węzła PE 1. Łącze do PE2<>CE2 ulega awarii 2. IGP propaguje problem z trasą NH 3. PE1 wycofuje ścieżki 4. Po włączeniu BGP PIC Edge zapasowa trasa prowadzi przez PE1,PE3,CE2 RR1 RR2 RR3 RR4 VPN 1 site A CE1 PE1 RD 1:1 PE2 RD 2:1 PE3 RD 3:1 CE2 VPN 1 site B x.x.x.x/y 47

Awaria węzła PE Czas konwergencji będzie zależał od D: czas do wykrycia awarii IGP: czas na konwergencję IGP Eliminowane po zastosowaniu BGP PIC S(p): przeskanowanie tablicy BGP Przejrzenie tablicy VPNv4 a potem IPv4 B(p): czas do obliczenia najlepszych ścieżek i zaprogramowanie FIB 48

Konfiguracja BGP PIC W konfiguracji procesu BGP address-family {ipv4 unicast vpnv4} bgp additional-paths install Jak to wygląda w tablicy RIB? r# show ip bgp 10.0.0.0 255.255.0.0 BGP routing table entry for 10.0.0.0/16, version 123 Paths: (4 available, best #3, table default) Additional-path Advertised to update-groups: 2 3 Local 10.0.101.2 from 10.0.101.2 (10.1.1.1) Origin IGP,localpref 100,weight 900,valid, internal, best Local 10.0.101.1 from 10.0.101.1 (10.5.5.5) Origin IGP,localpref 100,weight 700,valid, internal, backup/repair 49

Q&A Łukasz Bromirski, lbromirski@cisco.com 50