GDY KRZEM ZJADA PAKIETY - ciekawostki i pułapki architektur routerów

Podobne dokumenty
GDY KRZEM ZJADA PAKIETY - zło czai się w pakietach

ZP-92/022/D/07 załącznik nr 1. Wymagania techniczne dla routera 10-GIGABIT ETHERNET

Zapytanie ofertowe. zakup routera. Przedmiotem niniejszego zamówienia jest router spełniający następujące wymagania:

Mosty przełączniki. zasady pracy pętle mostowe STP. Domeny kolizyjne, a rozgłoszeniowe

PARAMETRY TECHNICZNE PRZEDMIOTU ZAMÓWIENIA

OPIS PRZEDMIOTU ZAMÓWIENIA

RAZEM brutto (poz. 1+2). (kwotę należy przenieść do formularza oferty)

Przełączniki i Routery

Wykorzystanie układów FPGA w implementacji systemów bezpieczeństwa sieciowego typu Firewall

Monitoring ruchu sieciowego w nk.pl w oparciu o protokół netflow oraz rozwiązania opensource

Elastyczna sieć dla rozwiązań Cloud Open vswitch

CZĘŚĆ IV ZAMÓWIENIA OBLIGATORYJNE WYMAGANIA TECHNICZNE

Niniejszy załącznik zawiera opis techniczny oferowanego przedmiotu zamówienia.

Formularz Oferty Technicznej

I. Rozbudowa istniejącej infrastruktury Zamawiającego o przełączniki sieciowe spełniające poniższe minimalne wymagania - szt. 5

WOJEWÓDZTWO PODKARPACKIE

SZCZEGÓŁOWE OKREŚLENIE Przełączniki sieciowe

WYMAGANIA SPRZĘTOWE DLA SIECI LAN W INFRASTRUKTURZE POCZTY POLSKIEJ

Architektura komputerów

Podstawy MPLS. PLNOG4, 4 Marzec 2010, Warszawa 1

SEKCJA I: Zamawiający

Software RAID funkcje dostarcza zaimplementowane oprogramowanie, bez wykorzystania z dedykowanych kontrolerów.

Budowa przełączników modularnych. Piotr Głaska Senior Product Manager Enterprise Networking Solutions

Porty przełącznika: 8 lub więcej portów typu 10/100/1000Base-T 2 lub więcej porty SFP Gigabit Ethernet (obsługujące również moduły SFP Fast Ethernet)

Załącznik nr 1 do SIWZ

Wykład 2: Budowanie sieci lokalnych. A. Kisiel, Budowanie sieci lokalnych

VPLS - Virtual Private LAN Service

GS HP. 24-portowy zarządzalny przełącznik. Opis produktu. Charakterystyka produktu

Szczegółowy Opis Przedmiotu Zamówienia. Dostawa przełączników sieciowych spełniających poniższe minimalne wymagania:

router wielu sieci pakietów

Opis przedmiotu zamówienia - Załącznik nr 1 do SIWZ

PRZEDMIAR ROBÓT ROZBUDORWA SIECI LOGICZNEJ

WYMAGANIA TECHNICZNE. Oferowany model *.. Producent *..

Autorytatywne serwery DNS w technologii Anycast + IPv6 DNS NOVA. Dlaczego DNS jest tak ważny?

Z A P Y T A N I E O F E R T O W E

Bezpieczeństwo usług a zasoby sprzętowe platformy dostępowej. Ryszard Czernecki Kraków, 23 października 2012

Załącznik nr 1b do SIWZ Opis przedmiotu zamówienia dla części II

SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA. CZĘŚĆ NR 2: Dostawa systemów sterowania i kontroli wraz z akcesoriami sieciowymi

Formularz specyfikacji technicznej oferowanych urządzeń sieci komputerowej i oprogramowania dla tych urządzeń

Podstawy sieci komputerowych

Architektura komputerów

Urządzenia sieciowe. host urządzenie końcowe umożliwiające połączenie z siecią może istnieć bez sieci

OPIS PRZEDMIOTU ZAMÓWIENIA

Dlaczego? Mało adresów IPv4. Wprowadzenie ulepszeń względem IPv4 NAT CIDR

DR INŻ. ROBERT WÓJCIK DR INŻ. JERZY DOMŻAŁ PODSTAWY RUTINGU IP. WSTĘP DO SIECI INTERNET Kraków, dn. 7 listopada 2016 r.

OpenContrail jako wtyczka do OpenStacka. Bartosz Górski, Paweł Banaszewski CodiLime

WYMAGANIA SPRZĘTOWE DLA SIECI LAN W INFRASTRUKTURZE POCZTY POLSKIEJ

Sieci komputerowe. Zajęcia 2 Warstwa łącza, sprzęt i topologie sieci Ethernet

SPECYFIKACJA TECHNICZNA ZAŁĄCZNIK NR 1 DO SIWZ

PBS. Wykład Zabezpieczenie przełączników i dostępu do sieci LAN

Podstawy Transmisji Danych. Wykład IV. Protokół IPV4. Sieci WAN to połączenia pomiędzy sieciami LAN

Rys. 1. Wynik działania programu ping: n = 5, adres cyfrowy. Rys. 1a. Wynik działania programu ping: l = 64 Bajty, adres mnemoniczny

Jak zbudować profesjonalny styk z internetem?

Przesyłania danych przez protokół TCP/IP

1. Przełącznik do węzła głównego, 48-portowy, gigabitowy 2 szt.

Architektura komputerów

358,98 PLN brutto 291,85 PLN netto

TEST GPON/1GE. Spis treści:

Jak się buduje przełączniki Ethernet i dlaczego ma to znaczenie?

Purview Widoczność i kontrola w L7, analityka aplikacji bez degradacji wydajności sieci do 100 mln sesji

Nieustanny rozwój. Daniel Fenert

Uniwersalny Konwerter Protokołów

16. Taksonomia Flynn'a.

Wykład 3: Internet i routing globalny. A. Kisiel, Internet i routing globalny

ZMIANA SPECYFIKACJI ISTOTNYCH WARUNKÓW ZAMÓWIENIA pt. Rozbudowa i modernizacja kablowej sieci telekomunikacyjnej drugi etap

OPIS PRZEDMIOTU ZAMÓWIENIA

Wymagania dotyczące łączy: należy zapewnić redundancję łączy w połączeniach pomiędzy routerami Uruchmić protokół routingu RIP v.2

Przetwarzanie równoległesprzęt. Rafał Walkowiak Wybór

SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA

Plan wykładu. 1. Sieć komputerowa 2. Rodzaje sieci 3. Topologie sieci 4. Karta sieciowa 5. Protokoły używane w sieciach LAN 6.

Załącznik nr 2 do SIWZ. strona. z ogólnej liczby stron OPIS PRZEDMIOTU ZAMÓWIENIA/SPECYFIKACJA TECHNICZNA URZĄDZEŃ

Gdzie ComNet świadczy usługi.

KONWERTER DVB ASI -> DVB IP DELTA-1

Warstwa sieciowa. Model OSI Model TCP/IP. Aplikacji. Aplikacji. Prezentacji. Sesji. Transportowa. Transportowa

Metody optymalizacji soft-procesorów NIOS

Warstwa sieciowa rutowanie

ZiMSK. VLAN, trunk, intervlan-routing 1

MODEL OSI A INTERNET

Transmisje grupowe dla IPv4, protokół IGMP, protokoły routowania dla transmisji grupowych IPv4.

Ethernet. Ethernet odnosi się nie do jednej, lecz do wielu technologii sieci lokalnych LAN, z których wyróżnić należy cztery podstawowe kategorie:

CIOR 6/117/09. Właściwość Parametry wymagane Model, typ oraz parametry sprzętu oferowanego przez Wykonawcę Nazwa producenta, model wyceniony

DR INŻ. ROBERT WÓJCIK DR INŻ. JERZY DOMŻAŁ

Szczegółowy Opis Przedmiotu Zamówienia (SOPZ)

FORMULARZ OFEROWANYCH PARAMETRÓW TECHNICZNYCH Część 2 dostawa przełączników sieciowych (stawka Vat 0%)

Paweł Pokrywka. Radar w Ethernecie. Lokalizowanie hostów w sieci LAN

WYMAGANE PARAMETRY TECHNICZNE OFEROWANYCH URZĄDZEŃ ZABEZPIECZAJĄCYCH

CCNA : zostań administratorem sieci komputerowych Cisco / Adam Józefiok. Gliwice, cop Spis treści

Akademickie Centrum Informatyki PS. Wydział Informatyki PS

ZAŁĄCZNIK NR 2.14 do zapytania ofertowego SCENARIUSZE TESTOWE

Pomiary łączy ethernetowych - zajęcia praktyczne. Darek Matyjewicz RATE ART

ZiMSK. Charakterystyka urządzeń sieciowych: Switch, Router, Firewall (v.2012) 1

Podsystem graficzny. W skład podsystemu graficznego wchodzą: karta graficzna monitor

QoS jak o tym myśleć w kontekście L2 i L3. Piotr Wojciechowski (CCIE #25543) Architekt Rozwiązań Sieciowych Kraków, 28 września 2011

Specyfikacja techniczna do przełączników sieciowych i firewall a Załącznik nr 4. 1) Przełącznik sieciowy typu I (np: WS-C TC-L lub równoważny)

Rodzaje, budowa i funkcje urządzeń sieciowych

Praktyczne aspekty implementacji IGP

Sieci komputerowe. Dr inż. Robert Banasiak. Sieci Komputerowe 2010/2011 Studia niestacjonarne

Załącznik nr 1 do SIWZ. Numer sprawy: DO-DZP

Protokoły sieciowe - TCP/IP

Transkrypt:

GDY KRZEM ZJADA PAKIETY - ciekawostki i pułapki architektur routerów (Episode One) Robert Ślaski Chief Network Architect CCIE#10877 PLNOG10 28.02-01.03.2013 Warszawa

O mnie i o prezentacji 2

Zapraszamy na pokład! Trochę historii i nieco podstaw Matryc-o-niuanse Co w kartach piszczy? To TCAM or not to TCAM? Szybko, szybciej, najwolniej http://www.pbase.com/flying_dutchman/ 3

TROCHĘ HISTORII I NIECO PODSTAW 4

Co tak w zasadzie router robi z pakietami? Modyfikowany nagłówek + nieruszane (ew. oglądane) dane Co router może zrobić z szeroko rozumianym nagłówkiem danych? HDR DATA HDR Forwarding DstMAC SrcMAC TTL Checksum Markowanie DstMAC SrcMAC DSCP TTL Checksum NAT DstMAC SrcMAC TTL Checksum SrcIP SrcPort DstPort DstMAC SrcMAC IP GRE IPV4 Tunelowanie DstMAC SrcMAC LABEL1 LABEL2 IPV4 MPLS VPN Ruch z routera IPv4 TCP Dane 5

Warstwy! Routery mają warstwy! Warstwy (płaszczyzny) routera Control Plane Data / Forwarding Plane Management Plane i troszkę tym Urządzenia inne niż routery też mają te same trzy warstwy Zajmiemy się tym 6

Warstwy a funkcje Data plane Control plane Obsługa interfejsów fizycznych Obsługa protokołów routingu dla potrzeb przesyłania ruchu i komunikacji między routerami Synchronizacja własnych tablic Budowanie tablic FIB oraz ich FIB z tablicą Control Plane propagowanie do Data Plane Klasyfikacja, kolejkowanie Dystrybucja innych danych do i obróbka pakietów Data Plane (np. oprogramowania) Realizacja przekazywania Obsługa protokołów L2 (np. ARP) pakietów na podstawie FIB i metody przełączania Obsługa interfejsów fizycznych dla potrzeb zarządzania Zbieranie statystyk ruchowych Kontrola i monitorowanie komponentów routera (np. alarmów) 7

Architektura oparta o szynę Pojedynczy CPU zarządzający wszystkimi funkcjami wszystkich warstw Głupie karty liniowe (tylko funkcje L1 lub L1/L2) Szyna danych łącząca karty liniowe i CPU routera (np. PCI) Zalety: cena, szybkość projektowania i łatwość implementacji funkcji Wady: wszystko pozostałe HDR DATA HDR CPU DATA MEM Karty liniowe Centralny CPU 8

Architektura oparta o szynę Płyta typowego małego routera (wygląda prawie jak pecet) DSP Wewnętrzny switch PCI I/O ASIC DRAM CPU Flash Złącze rozszerzeń Złącza modułów 9

Architektura rozproszona, oparta o szynę Główny CPU zarządzający wszystkimi funkcjami Control Plane Mądre karty liniowe z własnym CPU (Data Plane, L3 forwarding) HDR DATA C P U HDR DATA Szyna danych łącząca to wszystko Zalety: Zdecydowanie większa wydajność przełączania L3 Wady: Ograniczona wydajność (nadal współdzielona szyna) C P U C P U karty liniowe z własnym CPU CPU MEM Centralny CPU 10

Architektura rozproszona, z matrycą przełączającą Architektura jak poprzednio plus matryca przełączająca realizująca transmisję między kartami liniowymi oraz głównym CPU HDR DATA karty liniowe C P U HDR DATA matryca przełączająca HDR karty liniowe C P U DATA HDR DATA C P U C P U Wady: cena, złożoność Zalety: wszystko inne CPU MEM główny procesor 11

Jaka jest idea matrycy przełączającej? HDR HDR HDR HDR Maksymalizacja wykorzystania dostępu DATA DATA DATA DATA 0 1 2 3 4 5 6 7 kart liniowych do siebie przepustowość 0 1 2 3 4 5 6 7 teoretycznie rośnie n-krotnie 12

Multicasty kontra matryca Implementacja połączeń multicast jest intuicyjnie łatwa matryca łączy wyjścia jednej karty do wejść wielu kart...... ale zarządzanie HDR DATA 0 1 2 3 4 5 6 7 HDR HDR DATA DATA kolejkowaniem połączeń 0 1 2 3 4 5 6 7 multicast wcale nie jest proste 13

Co tak naprawdę jest przesyłane w routerze? Dane użytkowe + I (Local Connection Identifier) (port źródłowy / docelowy + numer sekwencyjny + priorytet + dodatkowe informacje) Dodatkowe bajty do przesłania przez matrycę podatek transmisji! HDR DATA I HDR DATA HDR DATA I SFC I wejściowa ingress Scheduler wyjściowa egress 14

Oto uogólniona architektura naszego routera (nad którą będziemy pracować dalej) NP FI FI NP NP FI FI NP RP (aktywny) RP (zapasowy) 15

Pamiętacie warstwy? NP FI FI NP Ruch Data Plane Ruch Control / Management Plane NP FI FI NP Ruch Control / Management Plane RP (aktywny) RP (zapasowy) 16

Magiczne skróty, które trzeba znać (aby pójść dalej) : Line Card RP: Route Processor NP: Network Processor SFC: Switch Fabric Card FI: Fabric Interface : Physical (interface) RIB: Routing Information Base FIB: Forwarding Information Base CAM/TCAM: Content / Ternary Content Addressable Memory Dobre rady spod lady: Znaj architekturę sprzętu na którym pracujesz Jeśli nie znasz, poproś dostawcę rozwiązania o mądre kwity 17

MATRYC-O-NIUANSE 18

Co trzeba wiedzieć o matrycach? Matryca blokująca vs nieblokująca Matryce wielostopniowe: rozwiązują problemy z dużą liczbą łączonych wejść i wyjść (gdzie kończą się możliwości chipsetów) Przykładowo: jednostopniowa 128x128: 16384 połączeń trójstopniowa 128x128: 4*(32x32)+32*(4x4)+4*(32x32)=8704 punktów połączeń Pola komutacyjne Closa i Benesa Stopnie S1, S2, S3 Multiplane a multistage 19

Matryca w praktyce Matryca może wyglądać tak 20

Matryca w praktyce Albo tak makaron stopień S1/S3 stopień S1/S3 stopień S2 21

Transport danych przez matrycę Podatki transportu danych Dane netto + podatek I + kodowanie nadmiarowe (np. 8B/10B) Z np. 40Gbps netto łatwo robi się >55Gbps brutto Producenci (prawie) zawsze uwzględniają ten narzut w dokumentach Jak transportowane są dane Dawniej: matryca komórkowa (celki) Obecnie najczęściej: matryca pakietowa (ramki, super-ramki) 22

Dlaczego stosowano transport danych w postaci komórek? Ze względu na trudności w realizacji arbitra dla zmiennej długości pakietów - aby algorytmy działały poprawnie, dane przesyłane są w równych paczkach Przykład z jednej z konstrukcji (tu akurat super-komórka): I DANE UŻYTKOWE POSIEKANE NA KAWAŁKI CRC 12B 30B 30B 30B 30B 4B 120 B 136 B Szkolenie OST112 Wprowadzenie do OST112 i technologii sieciowych (c)2010 ATM S.A. 23

Jaki jest problem z matrycą komórkową? Problem: dodatkowy narzut danych, zmienny w zależności od długości ramki Przykład dla tyciutkiej ramki (narzut 26 bajtów) DANE I DANE CRC 20B 12B 30B 4B 46 B A tu ramka trochę większa (a narzut już 46 bajtów) DANE I DANE CRC I DANE CRC 46B 12B 30B 4B 12B 30B 4B 92 B Szkolenie OST112 Wprowadzenie do OST112 i technologii sieciowych (c)2010 ATM S.A. 24

WYDAJNOŚĆ Co jeśli matryca nie jest wystarczająco szybka? Producent routerów Tanie ale Dobre Wydajność matrycy nie do końca uwzględnia dodatkowy podatek celkowy Tak wtedy, mniej więcej, wygląda wydajność matrycy przy długości ramki WIELKOŚĆ RAMKI 25

Więcej matryc niezawodność, wydajność Matryce dedykowane, Active-Standby NP FI FAB-A FI NP Matryce dedykowane, Active-Active FAB-B Jakieś zalety? Jakieś wady? NP FI FAB-A FI NP FAB-B 26

Matryce kolokowane z RP Matryce kolokowane, Active-Standby RP ACT NP FI FAB-A FI NP FAB-B RP STB Jakieś zalety? Jakieś wady? Matryce kolokowane, Active-Active RP ACT NP FI FAB-A FI NP FAB-B RP STB 27

I wreszcie Matryce multiplane (2n+1) FAB-1 Jakieś zalety? Jakieś wady? FAB-2 NP FI FAB-3 FI NP FAB-4 FAB-5 28

Wnioski z przeglądu architektur matryc Redundancja: jest albo powinna być Przełączenie: bezstratne, małostratne (pojedyncze* pakiety), destrukcyjne Spadek wydajności: jest / nie ma Multicasty: replikacja / brak replikacji Niepożądane efekty możliwe przy matrycach komórkowych * pojedyncze TYSIĄCE pakietów 8-) Dobre rady spod lady: Architektura matryc w znacznym stopniu decyduje o stracie pakietów przy przełączaniu oraz wydajności 29

CO W KARTACH PISZCZY? 30

Mamy dwie karty i parę rzeczy do zrobienia - w którym miejscu co robimy NP FI FI NP wejściowa wyjściowa MAC lookup IGMP snooping QoS classification NetFlow Unicast L3 FIB lookup ECMP hashing IPv4 urpf check Multicast replication Shaping Marking ACL 31

Są też karty z lokalnym przełączaniem Karta bez lokalnego przełączania (1) Karta z lokalnym przełączaniem (2) Jakieś zalety? Jakieś wady? NP FI FI NP ASIC NP FI FI NP 1 2 Dobre rady spod lady: Lokalne przełączanie niekoniecznie zwiększa wydajność, ale przy tym generuje nieprzewidywalne struktury ruchu 32

Zasoby jakich NP potrzebuje do pracy DATA HDR DATA HDR I NP IN FI L2 TABLE QoS TABLE L3 TABLE FLOW TABLE L2 lookup QoS lookup L3 lookup Netflow QoS TABLE L3 TABLE FLOW TABLE NP OUT FI HDR DATA I HDR DATA 33

Jak można podłączyć porty do NP trzy typowe warianty Jeden port do jednego NP 10G NP1 N-portów do jednego NP nx1g NP2 FI Dwa NP do obsługi jednego portu (każdy obsługuje jeden kierunek) 100G NP3A NP3B 34

Gdzie mamy limity wydajności? Dwa limity wydajności komponentów: Przepustowość szyn danych (half lub full duplex) NP FI Wydajność NP w Mpps (zwykle sumaryczna, full-duplex) k-gbps l-gbps p-mpps m-gbps n-gbps A jak mierzymy, to pamiętajmy o narzucie w Ethernecie (IFG + PR/SFD + DST + SRC + T/L + PDU + CRC) Dla 1Gbps, minimalne PDU (46B) SDU 84B 1,488Mpps Dla 1Gbps, maksymalne PDU (1500B) SDU 1538B 81,2kpps 35

Jak dobrać warunki testowe Optymalnie (dla dostawcy sprzętu) Rozmiar pakietu IPv4 Liczba pakietów Dystrybucja Średni rozmiar pakietu PPS dla 1Gbps 1500 1 100% 1500 81,2kpps Złośliwie (dla dostawcy sprzętu) Rozmiar pakietu IPv4 Liczba pakietów Dystrybucja Średni rozmiar pakietu PPS dla 1Gbps 40 1 100% 40 1,488Mpps Realne warunki testowe (np. IMIX) Rozmiar pakietu IPv4 Liczba pakietów Dystrybucja Średni rozmiar pakietu PPS dla 1Gbps 40 7 58% 576 4 33% 1500 1 8% 340 0,33Mpps Dobre rady spod lady: Do testów stosujmy rzeczywistą dystrybucję ruchu z naszej sieci Każda sieć ma trochę inną dystrybucję ruchu 36

Przykład firmy Routery Dla Ludu - oto możliwości oraz wymagania Nasze NP są zdolne obsłużyć 15Mpps oraz 20Gbps ruchu 2x15 Gbps 30 Gbps Mamy 2 szyny -NP, 15Gbps każda NP FI Szyna NP-FI ma 30Gbps Nasza matryca dostarcza 4 kanałów per slot, 50Gbps każdy 15 Mpps 20 Gbps TCAM 4x50 Gbps Mamy mieć karty obsługujące 1GbE, 10GbE oraz 100GbE Nie może być za drogo, inaczej lud tego nie kupi =8-) 37

Przypadek 1 karta 24x1Gbps Dobre rady spod lady: Szyny dają radę Lekka nadsubskrypcja NP (24>20Gbps) Mieścimy się w IMIX (12*2*0,33=7,9Mpps) NP wytrzyma DDoS na kilku portach (line rate dla małych pakietów) Jeden port na NP może wysycić TCAM i dla pozostałych nic nie zostanie 1G 1G 1G 1G 1G 1G 1G 1G 1G 1G 1G 1G 1G 1G 1G 1G 1G 1G 1G 1G 1G 1G 1G 1G BRIDGE BRIDGE 2x15Gbps NP1 TCAM1 NP2 TCAM2 15Mpps 20Gbps 30Gbps FI 4x 50Gbps 38

Przypadek 2 karta 8x10Gbps Dobre rady spod lady: Mieścimy się w Gbps NP (20=20Gbps) IMIX przejdzie (2*10*2*0,33=13,2Mpps<15Mpps) DDoS na jednym porcie (14,8Mpps~15Mpps) zabije też sąsiada Poza tym design w miarę ok 8-) 10G 10G 10G 10G 10G 10G 10G 10G 2x15Gbps NP1 TCAM1 NP2 TCAM2 NP3 TCAM3 NP4 TCAM4 15Mpps 20Gbps 30Gbps FI 4x 50Gbps 39

Przypadek 3 karta 4x10Gbps Żeby było taniej, damy współdzielone TCAMy 10G 15Gbps NP1 30Gbps Dobre rady spod lady: NP wydajnościowo daje radę, nawet z DDoSem walczy nieźle 10G TCAM12 NP2 Ale współdzielenie TCAM powoduje, że funkcje na jednym porcie mogą go wysycić i dla drugiego nic nie zostanie 10G NP3 TCAM34 FI 4x 50Gbps 10G NP4 15Mpps 20Gbps 40

Przypadek 4 karta 2x100Gbps CEO powiedział: Dajcie mi kartę 100Gbps, konkurencja już ma 2x50Gbps NP1A 100Gbps Dajemy więc nowy NP 100G TCAM1 Dobre rady spod lady: Nie osiągniemy więcej niż 80Gbps Wtedy, dzięki osobnym NP, IMIX da radę (80*0,33=26,4Mpps < 30Mpps) Nie osiągniemy więcej niż 50Gbps per flow 100G NP1B 30Mpps 80Gbps NP2A TCAM2 FI 4x 50Gbps 20Gbps ruchu DDoS kładzie port NP2B Współdzielimy TCAM, zajętość funkcji ingress rzutuje na funkcje egress 41

WYDAJNOŚĆ Procesory L3 kart liniowych Do wyboru są: dedykowane ASIC, procesory sieciowe i specjalizowane CPU Czy szybsze to lepsze? niekoniecznie Szybciej / Taniej / Elastyczniej wybierz dowolne dwa ASIC NP zwykłe CPU ELASTYCZNOŚĆ 42

Procesory L3 kart liniowych Obecnie zawsze architektury wieloprocesorowe Przetwarzanie pakietów Potokowe, zestaw potoków Przez pojedynczy rdzeń Zasoby towarzyszące procesorowi L3 TCAM (dla ACL/NetFlow/QoS) Packet Lookup Unit Table Lookup Unit Pamięć statystyk (SRAM / RLDRAM) 43

Aksjomat: każdy duży router jest sprzętowy* * tak, ale nie dla wszystkich funkcji Kiedy router jest sprzętowy, a kiedy już nie chce przykład z życia Funkcja Hardware Software IPv4 ACL Tak - VLAN ACL Tak - Port ACL Tak - Policy Based Routing Tak (z uwagami) - Unicast RPF with ACL Tak - WCCP with HTTP redirect Tak - WCCP with HTTP SYN/FIN/RST packets - Tak NAT, first packet in flow - Tak NAT, subsequent packets Tak - ACL deny w/ ICMP unreachable enabled - Tak ACL with logging - Tak (z uwagami) Broadcast traffic ACL deny - Tak 44

Kiedy router nie jest już sprzętowy Projektant ma trzy opcje do wyboru Próbujemy obsłużyć ruch przez CPU RP Próbujemy obsłużyć ruch przez CPU na karcie Wywalamy ruch do kosza Dobre rady spod lady: W przypadku małych routerów MOŻESZ zaglądać do dokumentacji W przypadku dużych routerów MUSISZ Features Supported, Restrictions and Limitations, Deployment Notes - wszystko Twoim przyjacielem 45

TO TCAM OR NOT TO TCAM? 46

RAM / CAM / TCAM o co chodzi? Tradycyjna pamięć RAM (DRAM, SRAM, DDRx SDRAM, RLDRAM ) Adres Dane 00 1 0 1 1 0 01 01 10 0 1 1 0 0 0 1 1 1 0 0 1 1 0 0 Adres 11 1 0 0 1 0 Dane 47

RAM / CAM / TCAM o co chodzi? Pamięć CAM (Content Addresable Memory) Adres Dane 00 1 0 1 1 0 0 1 1 1 0 01 10 0 1 1 0 0 0 1 1 1 0 1 0 Dane 11 1 0 0 1 0 Rezultat 48

RAM / CAM / TCAM o co chodzi? Pamięć TCAM (Ternary* Content Addresable Memory) Adres Dane Enkoder priorytetowy 00 1 0 1 X X 0 1 1 0 0 Dane 01 10 11 0 1 1 0 X 0 1 1 X X 1 0 0 1 0 Rezultat 0 1 *Ternary trójwartościowa (0, 1, X) 49

TCAM czarnym koniem roboczym routera Pamięci TCAM wyszukują informację w jednym cyklu Rezultatem jest indeks do pamięci SRAM/RLDRAM wskazujący operację do wykonania (np. interfejs wyjściowy, ACL DROP czy police 10Mbps) Możliwe jest zadanie wielu wyszukiwań w pamięci TCAM w jednym cyklu przetwarzania pakietu) Dzięki temu możliwe jest jednoczesne stosowanie funkcji typu ACL, PBR, QoS itp. Ale też pamięci TCAM: są bardzo złożone (kilka razy więcej bramek niż RAM) - TCAM nie jest z gumy są bardzo energochłonne (każdy cykl pobudza wszystkie komórki pamięci) posiadają niską gęstość upakowania i bardzo dużą cenę 50

Opcja 0 nie stać nas na TCAM Sprawa jest prosta wszystkie operacje wyszukiwania NP realizuje w tablicach szybkiej, ale jednak klasycznej pamięci Wydajność spada znacząco wraz ze wzrostem długości tablic przeszukiwania Wydajność spada znacząco wraz z liczbą tablic przeszukiwania (liczbą aplikowanych funkcji) Po zaaplikowaniu na interfejsie 4 ACL każda po 1000 linii (in/out dla IPv4/IPv6), policera i sampled netflow (i może jeszcze PBR na dokładkę), przy krótkich pakietach możemy skończyć z 30% wydajności Dobre rady spod lady: Unikajcie takich rozwiązań, mają nieprzewidywalną wydajność 51

Opcja 1 Stać nas na TCAM do wszystkiego O, taki właśnie przykład FIB TCAM ACL/QoS/Sec TCAM Netflow TCAM 52

Opcja 1 Stać nas na TCAM do wszystkiego Niezbyt tanie, niestety Wydajność czystego przełączania pakietów jest całkowicie niezależna od wielkości tablicy FIB Aplikowanie funkcji typu ACL czy QoS nie rusza wydajności TCAM do obsługi FIB może mieć swoje ograniczenia (np. szerokości słowa), co może powodować różne ograniczenia (np. przy obsłudze IPv6) Zamiast NP czasem używa się wtedy ASICów (tańsze), co może się przekładać na ograniczenia funkcjonalne i gorszą elastyczność Dobre rady spod lady: Rozwiązania dobre i wydajne, ale mogą mieć ukryte pułapki funkcjonalne 53

Opcja 2 TCAM tam gdzie jest konieczny Przykład takiej architektury DRAM TCAM DRAM SRAM / RLDRAM 54

Opcja 2 TCAM tam gdzie jest konieczny Stosujemy TCAM tam, gdzie możemy popłynąć ze skalowalnością (np. tablice przeszukiwania ACL) Ponieważ FIB się dobrze hierarchizuje (drzewka), więc jest obsługiwany w klasycznej pamięci RAM. Wydajność czystego przełączania pakietów może być w niewielki sposób zależna od wielkości tablicy FIB. Korzystając z pamięci RAM współdzielonej między tablice przeszukiwania (np. L2 i L3), możemy przesuwać zasoby tak, aby dostosować je do zastosowania (patrz dalej). Dobre rady spod lady: Rozwiązania optymalizowane najczęściej pod kątem rzeczywistych wymagań wydajnościowych, cenowo najbardziej opłacalne. 55

Współdzielone tablice przeglądowe - dziel i rządź Wybór między FIB (IPv4/v6, label) a L2 (MAC, ARP) Trudny wybór :-) L2 FIB L2 FIB QoS ACL L2 FIB QoS ACL L2 FIB QoS ACL L2 FIB 56

Jak dokonujemy wyboru W zależności od producenta / sprzętu / wersji oprogramowania / pogody Oficjalna komenda konfiguracyjna Nieoficjalna komenda konfiguracyjna, czyli tzw. hack Udokumentowane proporcje zaszyte na stałe w software Proporcje zależne od skompilowanego per klient oprogramowania!@#!?$ Dobre rady spod lady: Unikaj oprogramowania pisanego Specjalnie dla Ciebie W całych testach używaj zawsze tego samego oprogramowania Inaczej okaże się, że testach urządzenie się skaluje, a w życiu nie. 57

SZYBKO, SZYBIEJ, NAJWOLNIEJ 58

Routing a przełączanie RIB jest tworzony na podstawie protokołów routingu FIB jest tworzony na podstawie RIB FIB jest dalej przesyłany do organów wykonawczych, czyli BGP OSPF Static [ ] RIB RIB w zależności od architektury routera: Routing głównego CPU procesorów kart liniowych FIB FIB innych kawałków krzemu L2 ADJ ADJ Przełączanie HDR DATA HDR DATA 59

RIB i FIB w systemie rozproszonym Protokoły routingu RIB RIB RIB RIB FIB FIB FIB FIB L2 ADJ ADJ ADJ ADJ Aktywny RP CPU CPU Zapasowy RP IPC CPU CPU CPU FIB FIB FIB FIB FIB FIB 60

Czy to już koniec wędrówki? Nie! A tymczasem w nx10g NP1 ASIC FIB FIB DRAM / TCAM nx10g nx10g NP2 DRAM / TCAM NP3 DRAM / TCAM ASIC ASIC FABIC INTERFACE nx10g NP4 ASIC DRAM / TCAM 61

Długa, kręta droga do konwergencji Konwergencja routingu BGP 1 2 3 4 5 Sąsiad wysyła update BGP wybiera trasy do RIB Trasy z RIB lądują w FIB RP RP dystrybuuje FIB do programują FIBem NP Proces BGP 1 Proces BGP 2 3 RIB FIB (RP) 4 4 Sąsiad BGP Aktywny RP Kiedy dokonała się konwergencja? Skąd o tym wiadomo? FIB () NP DRAM TCAM NP DRAM TCAM FIB () 5 5 NP DRAM TCAM NP DRAM TCAM 62

Ile trwa zmiana w FIB? Ile czasu trwa wymiana prefiksów w FIB? Wykonaj test lokalnej przerwy! Przykład: 500k prefiksów IPv4 z BGP, nowoczesny router ponad 50 sekund! Dla update BGP daje to całkowity czas konwergencji ponad 90 sekund! 63

Tak wolno? A co mogę z tym zrobić? Prędkość aktualizacji FIB / NP (kpps, kilo prefiksów per sekundę) Słaba: 1-2 kpps Średnia 5-10 kpps Dobra >10-15 kpps Użyj mechanizmów przyspieszających zbieżność w FIB Prefix Independent Convergence (draft-rtgwg-bgp-pic-00) LFA, np. BGP Add-Paths (draft-ietf-idr-add-paths-08) Dobre rady spod lady: Dowiedz się lub sprawdź sam prędkość operacji na FIB Prędkość jest różna dla różnej klasy sprzętu Użyj mechanizmów szybkiej konwergencji FIB 64

Dla geeków do poczytania Varghese Kloth Serpanos/Wolf 65