Wysoka Dostępność i odzyskiwanie danych po awarii w rozwiązaniach VMware Maciej Kot, Senior System Engineer, VMware 1
Wstęp vsphere HA nowe podejście Vmware Site Recovery Manager 5 vsphere HA - TECHNICAL 2
Poprawa Ciągłości Biznesowej na wszystkich poziomach Lokalizacja Podstawowa Lokalizacja Zapasowa vsphere vsphere vsphere vsphere vsphere Dostępność Usług vsphere High Availability vsphere Fault Tolerance vmotion i Storage vmotion Ochrona Danych vsphere Data Recovery Storage APIs for Data Protection Poprawiono w 2011 Poprawiono w 2011 Disaster Recovery vcenter Site Recovery Manager vsphere Replication Nowość w 2011 Poprawiono w 2011 3
Overview vsphere HA nowe podejście VMware Site Recovery Manager 5 vsphere HA - TECHNICAL 4
vsphere HA nowa architektura Zupełnie nowy produkt Większa stabilność i niezawodność mechanizmu Niezależność od usługi DNS Dodatkowy kanał komunikacji Wykorzystanie Podsystemu Dyskowego do sprawdzenia dostępności hosta Możliwość wykrycia różnych rodzjów awarii hosta Wsparcie dla IPv6 Poprawione raportowanie błędów Jeden plik log per host wszystkie informacje o HA Rozbudowany Interfejs Używkownika 5
vsphere HA Główne komponenty Agent na każdym hoście. Działa w oparciu o FDM lub Fault Domain Manager Jeden agent z klastra pełni rolę Master Podczas normalnej pracy jest tylko jeden Master w klastrze Pozostali pełnią rolę Slave Model - Primary/Secondary - brak ESX 01 ESX 03 ESX 02 ESX 04 vcenter 6
Host typu Master FDM Master monitoruje: Dostępność hostów ESX i wirtualnych maszyn. Wszystkie hosty Salve. Stan Power On/Off wszystkich chronionych VMs. Niedostępność jednej z nich Master restartuje usługę FDM Master zarządza: Listą hostów, które są w klastrze, którę sa dodawane lub usuwane z klastra. Listą chronionych maszyn wirtualnych. Master uaktualnia listę po każdej operacji Power On lub Power Off. ESX 02 7
Host typu Slave Slave monitoruje stan swoich maszyn wirtualnych i raportuje zmiany do Mastera. Slave monitoruje stan Mastera. Jeśli Master ulegnie awarii, bierze udział w ESX 01 ESX 03 wyborze nowego Mastera. Zarządza listą włączonych lokalnie maszyn wirtualnych. ESX 04 8
Proces wyboru nowego Master Master jest wybierany przez proces elekcji. Elekcja zachodzi gdy: vsphere HA jest włączone. Master uległ awarii, jest wyłączony, lub jest w trybie maintenance. ESX 01 ESX 03 Zaistniało Management network partition. Algorytm wyboru nowego Mastera: Masterem zostaje host, który ma dostęp do największej liczby wolumenów dyskowych. Lub host z najwyższym moid. Przykład: moid "host-99 jest większe od moid "host-100" ponieważ "9" jest większe od "1". ESX 02 ESX 04 9
Proces elekcji Master 10
Proces komunikacji Komunikacja pomiędzy agentami odbywa się za pomocą sieci management. Cała komunikacja jest typu Point to Point. Brak broadcasts. Elekcja korzysta z UDP. Komunikacja pomiędzy Master a Slave odbywa się za pomocą SSL. Każdy Slave utrzymuje połączenie TCP z Master em. Podsystem Dyskowy jest używany jako kanał komunikacyjny w momencie niedostępności sieci Management. ESX 01 ESX 03 ESX 02 ESX 04 11
Heartbeat Datastores Wykorzystanie Podsystemu Dyskowego w vsphere HA. Wolumeny dyskowe są tzw. Heartbeat Datastores. Zapewniono redundancję komunikacji dla vsphere HA. Heartbeat Datastores są wykorzystywane w momencie braku sieci LAN. ESX 01 ESX 03 ESX 02 ESX 04 12
Podsystem Dyskowy jako Heartbeat Datastores Heartbeat Datastores umożliwia: Host Master monitoruje dostępność wszystkich hostów Slave i maszyn wirtualnych. Określenie czy host jest izolowany sieciowo czy też nastąpiło Network Partitioning. Domyślnie, vcenter automatycznie wybiera 2 wolumeny dyskowe, które mogą być również wskazane przez administratora. ESX 01 ESX 03 ESX 02 ESX 04 13
Podsystem Dyskowy jako Heartbeat Datastores Dostępność Host ów: Dla wolumenów VMFS, Master czyta VMFS heartbeat obszar. Dla wolumenów NFS, Master monitoruje specjalny plik heartbeat, który jest znaczony przez hosty typu Slave. Dostępność Maszyn Wirtualnych jest raportowana w specjalnym pliku na każdym hoście Slave w plikacj znajduje się lista włączonych maszyn wirtualnych. ESX 01 ESX 03 ESX 02 ESX 04 14
Network isolation a Network partition 15
Stan usługi HA Dodano pole informujące o stanie usługi HA. Host może być: N/A (HA not configured) Election (Master election in progress) Master (Can be more than one) Connected (To Master over network) Network Partitioned Network Isolated Dead Agent Unreachable Initialization Error Unconfig Error 16
vsphere HA - Podsumowanie vsphere HA zapewnia wysoką dostępność dla wszystkich aplikacji również krytycznych. Nowe vsphere HA umożliwia: Solidny, skalowalny fundament na którym można budować usługi w chmurze Łatwość zarządzania Większa stabilność i pewność działania usługi Resource Pool VMware ESXi VMware ESXi VMware ESXi Operating Server Failed Server Operating Server 17
Overview vsphere HA nowe podejście VMware Site Recovery Manager 5 vsphere HA - TECHNICAL 18
vcenter Site Recovery Manager Site Recovery Manager zapewnia najprostszą i najlepszą ochronę usług wirtualnych poprzez możliwość wykorzystania różnych mechanizmów replikacji danych Site A (Podstawowy) VMware vcenter Server VMware vsphere Servers Site Recovery Manager Site B (Zapasowy) VMware vcenter Server VMware vsphere Servers Site Recovery Manager Zapewnia opłacalną replikację aplikacji do Ośrodka Zapasowego Wbudowany mechanizm replikacji Wsparcie dla replikacji mechanizmami macierzy dsykowych Uproszczone zarządzanie procesem Odzyskiwania usług po awarii Zastępuje ręczne procedury scentralizowanymi, automatycznymi procesami Znacznie skraca czas implementacji procedur DRC Automatyzuje czynnosći wymagane przy procedurach DRC 19
SRM 5 Edycje i ceny SRM 5 Standard Enterprise Price per protected virtual machine (license only) $195 $495 Scalability Limits Maximum protected VMs 75 virtual machines (1) Unlimited (2) Features Support for storage-based replication Centralized recovery plans Non-disruptive testing Automated DR failover vsphere Replication Automated failback Planned migration 1. Maximum of 75 VMs per site and per SRM instance 2. Subject to the product s technical scalability limits New in SRM 5.0 20
Co nowego w Vmware Site Recovery Manager 5.0? vsphere Replication Natywna replikacja danych Opłacalna i efektywna replikacja danych pomiędzy Klastrami vsphere Objęcie ochroną Aplikacji typu Tier 2, a także mniejszych Ośrodków Zdalnych Automatyczny failback Dwu-kierunkowe procedury DR Automatyzacja powrotu stanu usług do momentu przed awarią Planowana migracja Nowa opcja związana z planowanym przełączeniem Zapewnia spójność danych Większa łatwość i przejrzystość konfiguracji Inne Kontrola kolejności uruchamiania usług Nowy Interfejs Administratora Wsparcie dla IPv6 21
Planowana Migracja Nowość!!!. Wyłączy chronione maszyny wirtualne i zsynchronizuje je! Proces zostanie przerwany w momencie wystąpienia błędu 22
Failback Opis Jeden Przycisk aby zabezpieczyć wszystkie maszyny Integracja z replikcają podsystmemu dyskowego Zastępuje istniejące Recovery Plans Korzyści Ułatwia procedury DR dla organizacji które muszą okresowo przeprowadzać i testować procedury DR Upraszcza i ułatwia procesy DR po katastrofie Reverse Replication Site A (Podstawowy) Site B (Zapasowy) 23
Opcja Reprotect Zapewnia ponowne zabezpieczenie usług wirtualnych poprzez objęcie maszyn ochroną, sprawdzenie replikacji zawsze przed Failback. 24
Interfejs Administratora Nowy intuicyjny i przejrzysty interfejs! Dostępność obu Lokalizacji bez trybu LinkedMode 25
Pozostałe Wsparcie dla IPv6 Dla wszystkich kart sieciowych. vsphere Replication może działać w adresacji IPv6. Nowy Interfejs cała konfiguracja z jednego miejsca Proces readresacji IP dużo szybszy i sprawniejszy Możliwość uruchamiania skryptów w maszynach wirtualnych Uruchamianie skryptów pomiędzy kolejnymi krokami. Uruchamianie skryptów wewnątrz maszyn wirtualnych 26
Pozostałe skrypty w VM 27
Zależności Większe możliwości konfiguracji kolejności uruchamianych usług wirtualnych. 28
Zależności 29
KOLEJNOŚĆ URUCHAMIANIA USŁUG Group 1 Group 2 Group 3 Group 4 Group 5 Master Database Database App Server Apache Apache Desktop Desktop App Server Desktop Exchange Mail Sync Desktop 30
VMware SRM 5.0 - Typy replikacji vcenter Server Site A (Primary) Site Recovery Manager Site B (Recovery) vcenter Server Site Recovery Manager vsphere vsphere Replication vsphere Array-based replication 31
SRM 5 Architektura z ABR Protected Site vsphere Client Recovery Site vsphere Client
vsphere Replication - (VR) SRM zapewnia natywną replikację danych źródła cel Maszyny wirtualne mogą być replikowane niezależnie od rodzaju i technologii pracujących podsystemów dyskowych Zapewnia replikację pomiędzy niejednorodnymi wolumenami dyskowymi Replikacja jest właściwością maszyny wirtualnej 33
SRM 5 - Architektura z vsphere Replication (VR) Protected Site vsphere Client Recovery Site vsphere Client
vsphere Replication - konfiguracja 35
vsphere Replication - konfiguracja 36
vsphere Replication Szczegóły Replikacja per Maszyna Wirtualna Możliwość replikacji wszystkich lub pojedynczych dysków Dowolność zrobienia kopii inicjalnej Replikacja typu from any storage to any storage. Zarządzanie procesem replikacji Replikacja Administrator wybiera miejsce docelowe dysków Administrator konfiguruje RPO Możliwość dostarczenia kopii inicjalnej oszczędność pasma i czasu Zmiany na dyskach źródłowych są śledzone przez ESX Zmiany sa wysyłane do Ośrodka Zapasowego Nie wykorzystujemy Vmware snapshots 37
vsphere Replication - Ograniczenia Replikowane są dyski włączonych maszyn wirtualnych. ISO, flp nie są replikowane. Wyłączone/Uśpione maszyny wirtualne nie są replikowane. Pliki typu: logs, stats, swap, dumps nie są replikowane. vsphere Replication działa w warstwie wirtualnych urządzeń. Niezależne od formatu dysku. Niezależne od snapshotów. Snapshots działają z VR, snapshoty są replikowane, ale maszyna wirtualna jest bez snapshotu. Brak wsparcia dla RDM. FT, Linked Clones, VM templates nie są wspierane przez VR. Virtual Hardware minimum wersja 7. 38
VR DISK TRANSFER PROTOCOL JAK DZIAŁA Zaczynamy od full-sync Kiedy pierwszy raz włączamy Replikację Czytane są dyski po obu stronach Porównywane są bloki i tworzone jest tzw mapa różnic Przesyłane sa tylko różnice Teraz przesyłamy delty Zapewnione cross-disk consistency 39
VSPHERE REPLICATION - WYMIAROWANIE Maszyna Wirtualna Wzrasta nieznacznie utylizacja CPU/Network/Disk podczas synchronizacji inicjalnej Host Wzrasta nieznacznie utylizacja CPU/Network/Disk podczas synchronizacji inicjalnej WAN Replikacja po określonych portach (QoS ) VR Server Appliance 500 chronionych maszyn wirtualnych za pomocą VR Dokumentacja dostępna http://www.vmware.com/support/pubs/srm_pubs.html 40
Use Case Site-to-Site Protected Recovery Async vsphere Replication 41
Przypadek Site-to-Site Minimalne wymagania 1 x SRM server per lokalizacja 1 x VRMS per lokalizacja 1 x VR per lokaloizacja (min), 1 x vcenter per lokalizacja vcenter + SRM wersje muszą być takie same w obu lokalizacjach. ESXi 5.0 wymagany w obu lokalizacjach VR Agent dostępny tylko w ESXi 5.0 Dla kogo? Rynek SMB Niejdnorodne środowisko SAN Replikacja mechanizmami macierzy jest niedostępna 42
Use Case Alongside Array Replication Protected Recovery Async vsphere Replication Sync / Async VMFS VMFS Storage Array Replication VMFS VMFS Storage 43
Przypadek Alongside Array Replication Wymagania minimalne Identyczne jak w poprzednim przypadku SRA zainstalowany i skonfigurowany per lokalizacja Host Fizyczne Jeśli chcemy zabezpieczać część maszyn wirtualnych pamiętamy że musimy korzystać z wersji 5.0 Maszyny chronione mechanizmami replikacji macierzowej mogą działać na hostach w wersji vsphere 4.x i VI 3.5. Dla kogo? DRC jako usługa Niejednorodne środowisko SAN, z więcej niż jednym dostawcą macierzy W przypadku migracji SAN 44
Pytania? 45
THANK YOU HAVE A GREAT CONFERENCE! 46