Klastry z polotem dla systemów Open Source Jakub Janakowski ESSN Presales Consultant
Agenda Wprowadzenie portfolio rozwiązao HP w zakresie High Availability/Disaster Tolerant, Podstawowe pojęcia związane z budową klastrów HP Serviceguard- paczka, floating IP address... Jak działa klaster HP Serviceguard i co dzieje się podczas przełączania reformowanie klastra, Wprowadzenie do rozwiązao Disaster Tolerant, Kilka słów o rozszerzeniach do HP Serviceguard (ECMT, SGeRAC, SGeEBS, Data Guard toolkit... ) 2
Metryki RPO i RTO Recovery Point Objective (RPO) Maksymalna ilośd danych, która może byd utracona w przypadku awarii Powinna byd bliska zeru Recovery Time Objective (RTO) Maksymalny czas potrzebny do przywrócenia systemu do działania Technologie klastrowe Wks Days Hrs Mins Zero Secs Mins Hrs Days Wks Recovery Point Recovery Time Tape Backup Snapshot Incremental Asynchronous Replication Synchronous Replication Clustering Manual Migration Tape Restore
Serviceguard Portfolio
Serviceguard - terminologia = węzeł/node = paczka = klaster Copyright 2010 Hewlett-Packard Development Company, L.P.
Serviceguard terminologia c.d Heartbeat Hostname:HostA IP: 192.169.2.1 Hostname:HostA IP: 192.169.2.2 Package IP adress/ floating IP IP: 192.169.5.2 App A App A Quorum Device Copyright 2010 Hewlett-Packard Development Company, L.P.
Paczka HP Serviceguard używa koncepcji paczki na której definicję składają się następujące elementy: Serwery Lista jednego lub więcej węzłów na których aplikacja może zostad uruchomiona Sieci Adresy sieciowe, przypisane do paczki, które w przypadku przełączenia zostaną przepisane wraz z aplikacją Dane Grupy wolumenowe (VGs) lub współdzielone zasoby dyskowe takie jak Cluster File Systems (CFS) do ktorych aplikacja wymaga dostępu Aplikacje Skrypty umożliwiające uruchomienie, zatrzymanie i monitorowanie aplikacji Serwisy aplikacji, które są monitorowane Inne zasoby Zasoby wykorzystywane przez aplikację Wyróżniamy następujące typy pakietów: Failover Package Multi-node Packages (MNP) System Multi-node Packages (SMNP) HP Copyright 2010 Hewlett-Packard Development Company, L.P.
Zależności pomiędzy paczkami Mechanizm łączenia paczek do potrzeb takich jak Gwarantowanie kolejności uruchamiania aplikacji Gwarantowanie dostępności zasobu Jeśli zasób staje się niedostępny, zależna paczka zostaje automatycznie przeniesiona na węzeł na którym zasób jest dostępny Typy zależności: W ramach tego samego węzła Paczka A wymaga aby na tym samym węźle uruchomiona była Paczka B Paczka A nie może wystartowad przed Paczką B Paczka B nie może zostad wyłączona zanim nie zostanie wyłączona Paczka A W ramach różnych wezłów Przykład: Paczka serwera aplikacyjnego (App- Server) wymaga do działania paczki bazy danych Oracle Database (Oracle-DB) Konfiguracja paczki App-Server: DEPENDENCY_NAME Oracle-DB DEPENDENCY_CONDITION B = UP DEPENDENCY_LOCATION SAME_NODE Package: App-Server Successor Package: Oracle-DB Depends on Predecessor Copyright 2010 Hewlett-Packard Development Company, L.P.
Live application detach (LAD) Description Możliwość zatrzymania węzła lub klastra bez zatrzymywania paczki Detached Re-attached Paczka jest odłączona bez przerywania jej pracy kiedy klaster był wyłaczony wykorzystując opcję d Odłączona paczka nie jest monitorowana przez HP Serviceguard Paczka, która nie jest w trybie detached może byd znowu monitorowana przez klaster Copyright 2010 Hewlett-Packard Development Company, L.P.
Quorum service Serviceguard używa tie-breaker a lub urządzenia quorum (a.k.a. a cluster lock mechanizm) aby zabezpieczyd dane na wypadek wystąpienia sytuacji tzw. Split-Brain klastra
Cluster-wide device file names Opis Możliwość dostępu do tego samego urządzenia (dysk lub LUN) ze wszystkich węzłów klastra wykorzystując do tego tą samą nazwę zasobu co redukuje ryzyko wystąpienia błędu Polecenie cmsetdsfgroup Definiuje grupę węzłów Tworzy cdsf /dev/ dsk rdsk disk rdisk cdisk rcdisk Legacy DSFs Persistent DSFs Cluster-wide DSFs Copyright 2010 Hewlett-Packard Development Company, L.P.
Modele przełączania Active / Standby Active / Active Rotating Standby Jeden lub więcej węzłów przeznaczonych jest na potrzeby przełączania awaryjnego Brak utraty wydajności w przypadku przełączania Wszystkie węzły pracują na potrzeby różnych aplikacji Wprzypadku przełączenia następuje: Redukcja wydajności Wyłączenie mniej krytycznych aplikacji Wykorzystanie mechanizmów VSE do gwarantowania określonych przydziałów zasobów W przypadku awarii system zapasowy staje się nowym systemem podstawowym natomiast naprawiony system podstawowy staje się węzłem zapasowym Active / Active aplikacje rozproszone takie jak Oracle RAC Wszystkie węzły pracują na potrzeby tej samej aplikacji np, Oracle RAC Nie jest wymagane przełączanie aplikacji W przypadku awarii użytkownicy przełączani są na pozostałe węzły Copyright 2010 Hewlett-Packard Development Company, L.P.
Start Start paczki Hostname:HostA IP: 192.169.2.1 App A Cluster Hostname:HostA IP: 192.169.2.2 Paczka Aplikacja Interfejsy sieciowe Zasoby dyskowe PPAS Virtual IP 192.196.2.5 Punkty Montowania App A
Zarządzanie
Integracja z komponentami Virtual Server Environment
Run Attention Fault Remote SP Present Standby Power Power Run Attention Fault Remote SP Present Standby Power Power Virtualne maszyny jako paczki SG VM Guest Package hp Integrity rx8620 hp Integrity rx8620 cmapp server VM Guest app1 app2 Serviceguard Cluster VM guest package failover hpvmsg_mon cmappmgr app1 cmappmgr app2 VM Host VM Host Primary Node Standby Node Serviceguard monitoring of applications running inside VM Guest is provided via cmappserver communication with each applications and cmappmgr
HP-UX Workload Manager (WLM) WLM zwiększa poziom utylizacji zasobów zapewniając aplikacją utrzymanie wymaganej wydajności Najwyższej klasy menadżer obciążenia dla serwerów opartych na systemie HP-UX Automatycznie dopasowuje konfigurację partycji bazując na dostępnych zasobach i priorytetach Wspiera: - Partycje zasobów - Partycje wirtualne i sprzętowe - Maszyny wirtualne - Technologię icap oraz TiCAP
HP Cappacity Advisor Zbieranie danych (util. providers) Standardy WBEM Zbieranie danych w zdefiniowanych godzinach Import i export Symulacja komponentów VSE Planowanie awaryjnego przełączania w klastrze, Planowanie konsolidacji VM, Planowanie wykorzystania procesorów TiCAP, Utilization Calculator Dodawanie/odejmowanie obciążeń Intuicyjna obsługa
Rozwiązania Disaster Tolerant
HP Serviceguard Solutions in Action Across Availability Spectrum Local Serviceguard Cluster Metrocluster Continentalclusters Redundant networks carrying cluster heartbeats (1 cluster) app 4 app 3 app 2 app 1 Cluster Status Monitoring app 4 app 3 app 2 app 1 Replication/Mirroring Synchronous or Asynchronous Replication Copyright 2010 Hewlett-Packard Development Company, L.P.
Extended Distance Cluster DATA CENTER 1 1 or 2 nodes Data LAN + Heartbeat DATA CENTER 2 1 or 2 nodes Data LAN + Heartbeat Heartbeat Heartbeat Up to 100 km (DWDM) SAN SAN Cluster Lock 1 Each data center must have the same number of nodes Data replication using Mirrordisk/UX or VxVM mirroring Cluster Lock 2 Copyright 2010 Hewlett-Packard Development Company, L.P.
Metrocluster using Quorum Service 3 rd Location (Site 3) Quorum Service protected in a separate cluster Serviceguard Sub-cluster A IP Subnet K Volume Manager: SLVM or CVM Clients Ethernet Network Ethernet Network TCP/IP DWDM Channels Each main data center (sites 1 and 2) must have the same number of nodes Serviceguard Sub-cluster B IP Subnet K or L (different subnets supported) Volume Manager: SLVM or CVM Up to 8- node Subcluster Up to 300 km w/ DWDM Up to 8- node Subcluster DWDM Data Replication DWDM Channels DWDM (Site 1) Bi-directional Data replication using (Site 2) DATA CENTER 1 Continuous Access XP or EVA, DATA CENTER 2 or EMC SRDF Copyright 2010 Hewlett-Packard Development Company, L.P. 22
Continentalclusters NOTE: each cluster may have different cluster configurations (# of nodes, etc.) Cluster 1 Router Router Cluster 2 Router Router Clients IP Network (WAN/LAN) No Distance Limitation Site 1 Up to 16 nodes FC-IP Converter Supported data replication using Continuous Access XP or EVA, or EMC SRDF FC-IP Converter Site 2 Up to 16 nodes Copyright 2010 Hewlett-Packard Development Company, L.P.
HP-UX Disaster RECOVERY Solutions Extended Distance Cluster Metrocluster Continentalclusters # of Clusters One cluster One cluster Multiple clusters # of Nodes Up to 16 Up to 16 Up to 64 nodes total Distance 100KM Software Mirroring 300KM XP, EMC, EVA Unrestricted Volume Manager LVM, SLVM, VxVM, CVM,CFS LVM, SLVM, VxVM, CVM,CFS Data Replication Serviceguard Extension for RAC Support MirrorDisk UX VERITAS Mirroring Continuous Access SRDF Yes Yes Yes LVM, SLVM, VxVM, CVM,CFS Continuous Access, SRDF, Oracle Data Guard Failover Direction Bi-directional Bi-directional Bi-directional Storage All supported Serviceguard Fibre Channel storage XP, EVA, EMC XP, EVA, EMC Servers OS version HP Integrity and HP 9000 HP-UX 11i v2, 11i v3 HP Integrity and HP 9000 HP-UX 11i v2, 11i v3 HP Integrity and HP 9000 HP-UX 11i v2, 11i v3
Serviceguard extensions and toolkits
Servicguard for linux i ECMT toolkit for PPAS ECMT (PPAS toolkit) ECMT toolkit
HP Serviceguard Toolkit for Oracle Data Guard Always-on database manageability with zero custom coding
Integracja aplikacji c.d. Gotowe szablony do uruchomienia popularnych aplikacji w środowisku wysokodostepnym: EnterpriseDB (PPAS) Apache Web Server Oracle RDBMS Tomcat Sybase ASE IBM DB2 MySQL CIFS (aka SAMBA) Wysokodostępny serwer NFS (HA NFS toolkit)
Dziękuję za uwagę