Klastry wysokiej dostępności - idea, koncepcje,

Podobne dokumenty

Budowanie tanich, wysoko wydajnych i wysoko dostępnych systemów pod Linuksem Mariusz Droździel Październik 2009

Koncepcja wirtualnej pracowni GIS w oparciu o oprogramowanie open source

Microsoft System Center Virtual Machine Manager 2012

OpenContrail jako wtyczka do OpenStacka. Bartosz Górski, Paweł Banaszewski CodiLime

Sposób funkcjonowania

Rozwiązania HPE Storage jak zapewnić pełne bezpieczeństwo Twoich danych?

Dane bezpieczne w chmurze

InfoCloud24 Usługowe Centrum Danych

Zmiana treści Specyfikacji Istotnych Warunków Zamówienia.

Zapewnienie wysokiej dostępności baz danych. Marcin Szeliga MVP SQL Server MCT

Skalowalne aplikacje internetowe wysokiej dostępności

Referat pracy dyplomowej

VMware vsphere 5.5: Install, Configure, Manage

Wirtualizacja desktopów i aplikacji.

Wsparcie migracji obliczeń poprzez wirtualizację zasobów sieciowych

Digitize Your Business

Odpowiedź II wyjaśnienie na zapytania do Specyfikacji Istotnych Warunków Zamówienia.

Wykorzystanie wirtualizacji w kluczowych scenariuszach data-center

Maciej Roszkowski Wirtualny klaster komputerowy jako narzędzie optymalizacji wydajności infrastruktury technicznej społeczeństwa informacyjnego

NOWY OPIS TECHNICZNY PRZEDMIOTU ZAMÓWIENIA

REFERAT O PRACY DYPLOMOWEJ

VMware vsphere: Automation Fast Track

Capgemini IT Wirtualizacja fundamentem chmury technologie wirtualizacji jako podstawy funkcjonowania chmury

Zmiana treści Specyfikacji Istotnych Warunków Zamówienia.

Kompleksowe rozwiązania do ochrony danych. Wybrane przykłady wdroŝeń. Tomasz Tubis. Tivoli Summer Academy 2010

Szczegółowy opis przedmiotu zamówienia

Letnia Akademia SUSE Implementacja nowych rozwiązań open source wszystko, co musisz wiedzieć!

Rozwiązania HA i DR. Etapy projektowania infrastruktury sprzętowej. Robert Kleniewski. IBM Certified Architect

Profesjonalna ochrona danych z arcserve UDP

Produkty Acronis. Dariusz Cudak, Systemy Informatyczne ITXON

1.1. Założenia dla architektury korporacyjnej EPL

Usługi utrzymaniowe infrastruktury SI PSZ

Wykorzystanie wirtualizacji w kluczowych scenariuszach data-center

Implementowanie zaawansowanej infrastruktury serwerowej Windows Server 2012 R2

CZĘŚĆ II SIWZ SPECYFIKACJA PRZEDMIOTU ZAMÓWIENIA

Fujitsu World Tour 2019

ZAŁOŻENIA PROJEKTOWE I SPECYFIKACJA USŁUG

Dokumentacja techniczna SIS2-SAD

platforma zapewniająca usługi wirtualizacji

Projekt "Rozwój kompetencji społecznych i zarządczych wśród kadr IT"

OPIS TECHNICZNY PRZEDMIOTU ZAMÓWIENIA

27/13 ZAŁĄCZNIK NR 4 DO SIWZ. 1 Serwery przetwarzania danych. 1.1 Serwery. dostawa, rozmieszczenie i zainstalowanie 2. serwerów przetwarzania danych.

Wirtualizacja sieci - VMware NSX

Sieć aktywna. Podział infrastruktury sieciowej na różne sieci wewnętrzne w zależności od potrzeb danego klienta.

Jarosław Kuchta. Administrowanie Systemami Komputerowymi. Klastry serwerów

Wdrażanie całościowej strategii w zakresie zapewnienia ciągłości biznesowej i przywracania po awarii opartej na rozwiązaniach VMware

Cleeng Case Study. Klient Cleeng. Branża. Okres realizacji. Zakres usługi: Consulting. Projekt i wdrożenie Chmury AWS. Zarządzanie chmurą

Laboratorium Chmur obliczeniowych. Paweł Świątek, Łukasz Falas, Patryk Schauer, Radosław Adamkiewicz

Tworzenie i obsługa wirtualnego laboratorium komputerowego

ZAŁĄCZNIK NR 3 OPIS PRZEDMIOTU ZAMÓWIENIA DOTYCZĄCY WDROŻENIA PLATFORMY ZAKUPOWEJ

Uslugi chmurowe dla nauki na podstawie BonFIRE

5 nines. - czyli jak osiągnąć większą dostępność dzięki VMware i Metro Storage Cluster

AE/ZP-27-16/14. Oprogramowanie do wykonywania kopii zapasowych oraz zarządzania maszynami wirtualnymi

Wirtualizacja zasobów IPv6 w projekcie IIP

Hadoop i Spark. Mariusz Rafało

WHITE PAPER. Planowanie, przygotowanie i testowanie działań na wypadek wystąpienia awarii

Sposoby klastrowania aplikacji webowych w oparciu o rozwiązania OpenSource. Piotr Klimek. piko@piko.homelinux.net

Licencjonowanie w środowiskach wirtualnych

Joanna Baranowska. Chmura obliczeniowa w samorządach korzyści i wyzwania

WAKACYJNA AKADEMIA TECHNICZNA

Budowa Data Center. Zmagania Inwestora. Konferencja. 30 października 2014

Nowoczesny dział IT w chmurze

Usługi przechowywania danych KMD/PLATON-U4 dla bibliotek cyfrowych. Maciej Brzeźniak, Norbert Meyer, Rafał Mikołajczak, Maciej Stroiński

Niezawodne usługi outsourcingowe na przykładzie usług kampusowych i Krajowego Magazynu Danych w sieci PIONIER

Przetwarzanie i zabezpieczenie danych w zewnętrznym DATA CENTER

HP StoreOnce B6200 Przykład wdrożenia

Zasady licencjonowania produktów bazodanowych ORACLE

Serwer aplikacji OracleAS 10g w architekturach o podwyższonej niezawodności

Backup Exec Disaster Recovery - konfiguracja płyty ratunkowej i przywracanie całego systemu operacyjnego z kopii bezpieczeństwa

Opis Przedmiotu Zamówienia na dostawę sprzętu i oprogramowania do tworzenia kopii zapasowych

Wirtualizacja bez macierzy? Żaden problem.

Windows Serwer 2008 R2. Moduł 8. Mechanizmy kopii zapasowych

Case Study: Migracja 100 serwerów Warsaw Data Center z platformy wirtualizacji OpenSource na platformę Microsoft Hyper-V

CloudFerro. Chmury publiczne, chmury prywatne, serwery dedykowane zalety, wady, problemy, ograniczenia, wyzwania.

Nowe spojrzenie na wirtualizację

Przełączanie i Trasowanie w Sieciach Komputerowych

Zapytanie ofertowe nr 03/05/2014. Zakup licencji na oprogramowanie do wirtualizacji Działanie POIG 8.2

Wirtualizacja infrastruktury według VMware. Michał Małka DNS Polska

Wymagania systemowe Dla przedsiębiorstw i średnich firm

Comarch IT Integration Kompleksowe rozwiązania informatyczne w zakresie integracji i administracji IT

Systemy macierzowe. www. qsantechnology. com

Od czego zacząć przy budowaniu środowisk wysokiej dostępności?

Załącznik nr 1 - Szczegółowy opis przedmiotu zamówieni Specyfikacja techniczna - minimalne obligatoryjne wymagania techniczne, funkcjonalne sprzętu

Case Study: Migracja 100 serwerów Warsaw Data Center z platformy wirtualizacji OpenSource na platformę Microsoft Hyper-V

Nr sprawy: INF-V Załącznik nr 4 do SIWZ /Załącznik nr 2 do umowy część II/ OPIS PRZEDMIOTU ZAMÓWIENIA CZĘŚĆ II

C H M U R A P U B L I C Z N A W P O L S C E

PREMIUM BIZNES zł 110zł za 1 Mb/s Na czas nieokreślony Od 9 14 Mbit/s

Instalowanie i konfigurowanie Windows Server 2012 R2

Technologie wirtualizacyjne na platformie Red Hat. Artur Głogowski

Metody replikacji baz danych Oracle pomiędzy ośrodkami przetwarzania danych

7. zainstalowane oprogramowanie zarządzane stacje robocze

Dyski wirtualne w technologi IBM kolejne poziomy Matrixa

Proponowana architektura ZPT

Sterowany jakością dostęp do usług składowania danych dla e-nauki

System multimedialny Muzeum Górnośląski Park Etnograficzny.

Czy potrzebujesz wszystkich licencji, za które płacisz? Inwentaryzacja i zarządzanie oprogramowaniem w firmie

Cluster Quick Start Guide

1 Implementowanie i konfigurowanie infrastruktury wdraŝania systemu Windows... 1

ZMIANA TREŚCI SPECYFIKACJI ISTOTNYCH WARUNKÓW ZAMÓWIENIA

Opis wdrożenia Platformy Technologicznej epodreczniki.pl na zasobach Poznańskiego Centrum Superkomputerowo-Sieciowego

Transkrypt:

Klastry wysokiej dostępności - idea, koncepcje, przykład realizacji przy użyciu rozwiązań open source Maciej Rostański (Wyższa Szkoła Biznesu w Dąbrowie Górniczej) DataCenter Trends, Warszawa 30.10.2014

Agenda Koncepcja Wysokiej Dostępności (ang. High Availability) Wysoka dostępność a Odporność na Awarie (ang. Fault-Tolerance) Rozwiązania HA Elementy klastra HA Studium przypadku

Prelegent Dr inż. Maciej Rostański Katedra Informatyki Wyższej Szkoły Biznesu w Dąbrowie Górniczej Cisco Certified Academy Instructor Ekspert Narodowego Centrum Badań i Rozwoju Konsultant przy projektach związanych z: Sieciami komputerowymi Bezpieczeństwem informatycznym Wirtualizacją systemów komputerowych mrostanski@wsb.edu.pl

Niezbędna teoria Kiedy system się nie psuje?

Ogólnie o wysokiej dostępności Dostępność Brak działania w ciągu roku Wysoka dostępność: Ogół metod, technik i rozwiązań pozwalających na osiągnięcie ustalonego poziomu dostępności w zakontraktowanym czasie 99% 3,6 dnia A = czas działania usługi całkowity czas pomiaru 99,95% 4 godziny 99,999% 5 minut

Problem z wysoką dostępnością Czy 99,9% to wysoka dostępność? 99,9% to byłaby: Znakomita frekwencja w pracy Cudowna ściągalność długów ;) W pracy codziennej, błąd zdarzałby się nam raz na dwa tygodnie Ale 99,9% to byłoby również: 10 000 pasażerów ze zgubionym bagażem w roku 2013 TYLKO na lotnisku Chopina 200 000 ludzi, którym wydano by zły bilet PKP w roku 2012 3800 pracowników ze złym orzeczeniem lekarskim w roku 2012 w Polsce 500 nieprawidłowych operacji chirurgicznych CO TYDZIEŃ (dane dla USA)

Ogólnie o wysokiej dostępności cd. Jak rozumieć termin wysoka dostępność? Ogólna definicja dostępności: A = czas działania usługi całkowity czas pomiaru Szczegółowa definicja dostępności: A = MTBF MTBF + MTTR MTBF => MTBSO : Mean Time Between Failures / Service Outage MTTR => MTTSR : Mean Time To Repair / Service Repair

Jakość (Quality) Elementy rzadziej ulegające awarii Obniżenie prawdopodobieństwa awarii usługi

Wysoka dostępność (High Availability) Reaktywne techniki, protokoły, mechanizmy Obniżenie czasu potrzebnego na naprawę usługi Nacisk na odzyskanie równowagi po awarii

Ciągła dostępność / Odporność na awarie (Fault-Tolerance) Proaktywne techniki, mechanizmy, struktury Wyeliminowanie czasu potrzebnego na naprawę usługi Nacisk na powrót do stanu wyjściowego po awarii

Rozwiązania wysokiej dostępności Albo dobrze, albo tanio?

Osiąganie HA Unikanie potrzeby ludzkiej interwencji (automatyzacja napraw) Pasywna redundancja elementów systemu Zamienniki Replikacja Failover Aktywna redundancja elementów systemu Współdziałanie elementów Load balancing Klastry HA Klastry aplikacji

Osiąganie HA obecnie Wirtualizacja elementów systemu Maszyny wirtualne można uruchomić na innym hypervisorze (failover) Główni dostawcy (VMWare, Microsoft, Citrix) przygotowane mechanizmy HA dla maszyn wirtualnych (automatyzacja) Dostępne również namiastki FT (replika maszyny gotowa do działania) Wdrożenie klastra elementów systemu Elementy systemu są zainstalowane na wielu węzłach (redundancja) Węzły komunikują się między sobą (współdziałanie) Oprogramowanie nadzorujące uruchamia elementy na różnych węzłach zgodnie z narzuconymi zasadami (nawet, a zwłaszcza więcej niż jednym naraz) Realizacje komercyjne (WebLogic) ale i open source (pacemaker)

Koncepcja Active/Passive Active / Passive jest standardową topologią rozwiązań wysokiej dostępności Usługa Start na drugim węźle Szczególny przypadek: N+1 - wiele rozwiązań Active/Passive z jednym węzłem jako zapasowym dla wszystkich usług Węzeł A Węzeł B IDEA ACTIVE / PASSIVE Średni czas przełączenia - minuty

Koncepcja Active/Active Active / Active jest podstawową topologią rozwiązań Fault-Tolerance Usługa Usługa Nadal świadczę usługę Szczególny przypadek: N+M wiele usług uruchomionych naraz na wielu węzłach, dodatkowe węzły przygotowane na failover Węzeł A IDEA ACTIVE / ACTIVE Węzeł B Średni czas przełączenia - sekundy

Realizacja klastra High Availability Przy użyciu oprogramowania open source

Klaster wysokiej dostępności w open source Fizyczne elementy klastra Węzły Współdzielone zasoby Komunikacja Kworum Fencing Logiczne elementy klastra Menedżer klastra (oprogramowanie) Kontroler klastra (węzeł) Zasoby

Zadania menedżera klastra Infrastruktura klastra ( Administracja ) Zarządzanie przesyłaniem wiadomości Sprawdzanie dostępności węzłów Zarządzanie członkostwem węzłów Komunikacja dla pozostałych elementów logicznych Heartbeat OpenAIS Corosync Corosync + CMAN

Fencing (Odcięcie) Sytuacja: brak komunikacji węzła z klastrem lub awaria wymagająca usunięcia węzła Cel: Ochrona danych przed korupcją Fencing to wyłączenie odpowiedniego węzła z klastra (i jego ewentualne ponowne uruchomienie) Metody fencingu na poziomie węzła: Oparte na urządzeniach rezerwujących (np. SCSI storage, FibreChannel) Oparte na urządzeniach dostarczających prąd (PDU) Wewnętrzne (np. HP ilo, IPMI, IBM Bladecenter, Cisco UCS) Zewnętrzne (np. APC, WTI) Oparte o inne metody (np. vsphere lub SNMP)

Split-brain Sytuacja: brak komunikacji części węzłów z inną częścią. Obydwie grupy nie wiedzą, co dzieje się z drugą grupą Cel: Ochrona zasobów przed równoczesnym użyciem z obu stron (np. zapis do bazy) Aby uchronić się przed podziałem na dwie niezależne grupy, jedna z nich musi być ważniejsza Rozwiązanie: utrzymuje się kworum, np.: Demokratyczna większość Grupa posiadająca istotny zasób niepodzielny Grupa wyznaczona przez arbitra W przypadku sytuacji split-brain, grupa słabsza dokonuje fencingu

Zadania menedżera zasobów Monitoring i decyzyjność klastra ( Kadra kierownicza ): Uruchamianie i zatrzymywanie usług / zasobów Podejmowanie ww. decyzji na podstawie ustalonych zasad Utrzymywanie historii i parametrów (np. licznik awarii) Pacemaker Resource Manager Migracja zasobów na inne węzły Uruchamianie lub zatrzymywanie dodatkowych instancji zasobów

Pacemaker Przykładowe systemy używające pacemaker: RedHat, SLES, OpenStack Obecny kierunek rozwoju: Współpraca z corosync 2.0 Split-site Architektura agentowa (pacemakerd) Zarządzanie zasobami Kworum Członkostwo Komunikacja między węzłami Red Hat Cluster Manager HA w systemach RedHat rgmanager rgmanager CMAN pacemaker lub rgmanager pacemaker CMAN CMAN corosync (opcja: razem z CMAN) OpenAIS corosync 2003 2005 2007 2010 2014

Prosty active / passive przy użyciu pacemaker Na jednym z węzłów: Połącz z magazynem dyskowym Zamontuj system plików Uruchom adres IP Uruchom serwer aplikacji

Ponowne spojrzenie na elementy klastra HA Węzły jednostki (nodes) Aplikacje (applications) Bazy danych (databases) Magazyn danych (storage) Elementy równoważące łącze / rozprowadzające żądania (load balancer) Elementy łączące (urządzenia i połączenia sieciowe)

Problem odwróconej piramidy Najwięcej energii wkłada się w konstrukcję najbardziej zaawansowanej technologii (tutaj: oprogramowanie klastra) Tymczasem w klastrze HA chodzi o najsłabszy punkt oraz ewentualny pojedynczy punkt awarii (POF) Zasoby dyskowe na potrzeby współdzielenia umieszcza się na maszynach NAS/SAN, często wyspecjalizowane urządzenia z wysokim MTBF Tymczasem problem z zasobem dyskowym eliminuje całkowicie operatywność klastra HA Poziom aplikacji (klaster) N węzłów Poziom sieci (urządzenia) 2 zestawy Zasoby dyskowe

Replikacja magazynu danych Rozwiązania własne poszczególnych dostawców Świat open source: Distributed Replicated Block Device (DRBD) mirror sieciowy używane przez wiele rozwiązań Licencja GPLv2 Wiele sposobów konfiguracji Za: dev.mysql.com

Case study Projekt Staż Sukcesem Naukowca - dmt SoftwareHouse (Kraków) Zadanie umożliwienie w każdej chwili przeniesienia działania do drugiego datacenter celem osiągnięcia Disaster Recovery Realizacja ruchomego magazynu danych przy użyciu DRBD oraz Pacemaker Magazyn danych może być użyty przez XenServer w danej lokalizacji Magazyn zawiera metadane oraz dyski maszyn wirtualnych

Poza klastrem: chmura prywatna/hybrydowa Najbardziej zaawansowane rozwiązanie Połączenie zalet zarówno wirtualizacji, jak i klastra wysokiej dostępności Środowisko wielu węzłów, na których zainstalowano hyperwizory - pozwala na wykorzystanie wirtualizacji w sposób opisany poprzednio Całością topologii zarządza oprogramowanie automatyzujące - pozwala na wykorzystanie zasad jak w klastrach HA, opisanych przed chwilą Całość można wykorzystać również do wdrażania Disaster Recovery.

Chmury prywatne open-source?

Podsumowanie High Availability, Disaster Recovery, Fault-Tolerance Open source nie znaczy gorszy Gama mechanizmów do wykorzystania Różne scenariusze realizacji wysokiej dostępności Perspektywy Słabe strony rozwiązań

Dziękuję