Diagnostyka awarii to nie tylko PING Pokaz zintegrowanego systemu monitorowania sieci 2010 IBM Corporation
Dlaczego tak trudno jest monitorować sieć? bo ciągle ktoś w niej coś zmienia bo trudno przekonać sieciowca, Ŝe problem leŝy w sieci nie wiemy gdzie jest Root Cause 1
Rozwiązaniem jest IBM Tivoli Network Manager Widzimy co mamy w sieci Aktywny mechanizm wykrywania usterek Działające Root Cause Analysis 2
RCA (1) Problem w sieci 192.68.23.4 24-DEC-02 12:19:01 Not responding to ping 192.68.32.6 24-DEC-02 12:19:06 Not responding to ping Konsola zarzadzania 192.68.81.7 24-DEC-02 12:19:07 Lista zdarzeń Not responding to ping 192.68.43.8 24-DEC-02 12:19:07 Not responding to ping Alarm 192.68.44.8 24-DEC-02 12:19:54 Not responding to ping 192.68.64.12 24-DEC-02 12:20:02 Not responding to ping 192.68.44.7 24-DEC-02 12:20:06 AlarmNot responding to ping 192.68.64.11 24-DEC-02 12:20:23 AlarmNot responding to ping 192.68.32.2 24-DEC-02 12:21:11 Not responding to ping Alarm 192.68.10.52 24-DEC-02 12:21:13 Not responding to ping 192.68.23.15 24-DEC-02 12:21:13 AlarmNot responding to ping 192.68.58.10 24-DEC-02 12:21:17 Not responding to ping 192.68.43.9 24-DEC-02 12:21:24 AlarmNot responding to ping Alarm 192.68.81.6 24-DEC-02 12:21:25 Not responding to ping Alarm Alarm 3
RCA (2) Konsola zarzadzania Lista zdarzeń Dzięki znajomości powiązań między urządzeniami istnieje moŝliwość zrozumienia powiązań pomiędzy zdarzeniami które napływają od tych urządzeń Alarm Alarm Alarm Alarm Alarm Alarm Alarm Alarm Alarm 4
RCA (3) Konsola zarzadzania Lista zdarzeń Korelacja RCA: Warstwy 2 i 3 Przyczyna Alarm Symptom Alarm Symptom Alarm Symptom Alarm Symptom Alarm Symptom Alarm Symptom Alarm Symptom Alarm Symptom Alarm 5
A gdyby nie ITNM mielibyśmy 7 informacji o awarii 7 razy więcej pracy dzięki RCA mamy tylko jedną nie wiedzielibyśmy, Ŝe łącze jest wysycone dzięki aktywnemu monitorowaniu jesteśmy pewni nie wiedzielibyśmy od czego zacząć dzięki prezentacji topologii wiedzieliśmy a usługa leŝałaby dalej 6
Performance Flow Analyzer 7
Przedstawiamy Tivoli Netcool Performance Flow Analyzer To wypróbowane i przetestowane rozwiązanie pochodzi ze sławnych na świecie laboratoriów IBM w Zurichu. Było uŝytkowane przez lata w sieciach IBM do pomocy w diagnozowaniu krytycznych problemów sieciowych oraz przez naszych klientów, którzy potrzebowali najlepszych narzędzi dostępnych na rynku. 8
Co robi Tivoli Netcool Performance Flow Analyzer? The Tivoli Netcool Performance Flow Analyzer (TNPFA) to system profilowania sieci oparty na przepływach. Jest tak zaprojektowany aby zwiększyć kontrolę nad wykorzystaniem zasobów sieciowych dla elementów sieci, serwerów, usług, aplikacji, protokołów, domen, autonomicznych systemów, klas QOS, interfejsów, i dowolnej kombinacji tych aspektów. System działa pasywnie generując szczegółowe raporty o ruchu na podstawie strumieni informacji o przepływach zawartych w protokołach takich jak: NetFlow protokół sieciowy produkcji firmy Cisco Systems działający na urządzeniach sieciowych z systemem Cisco IOS do zbierania informacji o ruchu IP. IPFIX Uniwersalny standard eksportu informacji o przepływach z ruterów sond, i innych urządzeń J-Flow - Protokół Juniper Networks J-Flow jest narzędziem do zbierania statystyk o ruchu IP na ruterach. Cflowd Systemy operacyjne Juniper Networks próbkuja przepływy na ruterach, agregują je i wysyłają informacje statystyczne do zewnętrznych aplikacji pracujących na serwerach w sieci. NetStream - Netstream jest wersją NetFlow firmy Huawei Raporty o ruchu dostarczają szczegółowej informacji o wykorzystaniu zasobów z poziomem szczegółowości od sekund do lat. System profilowania wspiera zarówno planowanie sieci jak i jej bieŝące operacje, na przykład poprzez identyfikację przyczyny kongestii. MoŜe być równieŝ wykorzystywany do przybliŝania wielkości ruchu przy instalacji serwerów albo wdraŝaniu nowych aplikacji. 9
Zalety TNPFA TNPFA dostarcza narzędzi pozwalających efektywnie: Chronić i optymalizować operacyjność krytycznych dla biznesu infrastruktur sieciowych. Poprawiać wydajność sieci. Redukować czasy przestoju sieci. Wykrywać zaleŝności między serwerami, by skracać czas przekształcania sieci i koszty relokacji. Zmniejszać koszty związane z wdraŝaniem nowych aplikacji. Wspierać projekty związane z konsolidacją serwerów. Wspierać identyfikację wdroŝonych komponentów procesów biznesowych 10
Funkcjonalność TNPFA Wysoka skalowalność Adaptywna agregacja czasowa w bazie danych (oczekująca na patent) Wsparcie dla duŝego strumienia danych (>10K flows/s) śaden inny produkt nie jest w stanie dorównać tej wydajności przy zachowaniu pełnek funkcjonalności. Szybkie generowanie raportów Mały pakiet instalacyjny i łatwa instalacja (400KB SW package) Rozszerzona funkcjonalność Wysoka szczegółowość raportów Wizualizacja zaleŝności ruchu w sieci Elastyczne definowanie domen w instalacjach rozproszonych Pełna zgodność ze standardami NetFlow v5, v7, v9 IETF IPFIX kolekcja i analiza śaden inny produkt nie wspiera IPFIX dzisiaj Przeszedł z sukcesem oficjalne testy współpracy z IPFIX IPv6 wspierane zarówno w warstwie zbierania danych jak i przetwarzania i wyświetlania SCTP wspierane po stronie kolektora 11
Wykorzystanie TNPFA jest wielo-wymiarowe Monitorowanie dostępu WAN Site X Remote Sites... TNPFA Internet Monitorowanie wielu lokalizacji Sites Monitorowanie ruchu lokalnego Core LAN TNPFA TNPFA Nie ma duplikowania informacji o przepływach! 12
Wykrywanie zaleŝności między serwerami Klienci Proxy Legacy traffic to nonexisting machine Serwery Bazy danych System zarządzania siecią Candidate server X NAS/SAN Wykrywanie wszystkich zaleŝności komunikacyjnych serwera X Czasowe zmiany pasma i wyjątki Jaki jeszcze inny sprzęt trzeba migrować razem z serwerem X? Dane do strategii przekształcania sieci (np., wspóldzielona lokalizacja, Klastrowanie) Wykrywanie ścisłych zaleŝności 13
14
Dziękujemy 15
Dodatkowe slajdy Prezentacja live 16
Wykrywanie 17
Wykrywanie 18
Konfiguracja wykrywania 19
Konfiguracja wykrywania 20
Konfiguracja wykrywania 21
Konfiguracja wykrywania 22
Konfiguracja wykrywania 23
Konfiguracja wykrywania 24
Konfiguracja wykrywania 25
Wykrywanie zakończone 26
Wyniki wykrywania 27
Konfiguracja pollera 28
Konfiguracja pollera 29
Konfiguracja pollera 30
Konfiguracja pollera 31
Konfiguracja pollera 32
Po awarii (wysycenie łącza, brak ping do 8 urządzeń) 33
Zdarzenia po awarii 34
Real-time MIB Grapher 35
Sprawdzenie połączeń 36