Microsoft SQL Server jak zwiększyć wydajność środowiska oraz jak dobrze je zabezpieczyć? Piotr Karaszewski EMC 1
Microsoft SQL Server - środowisko pracy dla wielu krytycznych aplikacji Skalowanie pod kątem pojemności zamiast wydajności Wyzwania związane z ochroną MS SQL Server i sposoby na radzenie sobie z nimi 2
Jak zapewnić wydajność? Podejście tradycyjne (shortstroking) Manualny tiering Tiering automatyczny np. EMC FAST VP 3
4
EMC FAST VP(Fully Automated Storage Tiering for Virtual Pools) Selekcjonuje obszary wymagające wydajności na poziome pamięci Flash Pozwala w znacznym stopniu zredukować narzut administracyjny związany z: Analizą danych Ręczną relokacją danych Relokacja danych w macierzy VNX: Harmonogram Na żądanie Ciągłe monitorowanie i automatyczna reakcja na zmianę profilu I/O aplikacji 5
Konfiguracja testowa środowiska MS SQL Testowa baza danych: Ilość użytkowników: 75000 Wielkość bazy: 798 GB Oczekiwana wydajność:14000 IOPS Symulowany profil dostępu: TPC-E (Transaction Procesing Performance Council). Konfiguracja początkowa: 90 x FC 15k Konfiguracja z tieringiem: 30 x FC 15k, 4 x SSD 6
Konfiguracja początkowa - Layout dysków 7
Konfiguracja z FAST em - Layout dysków 8
LUN Layout LUN ID Pool/RAID Group Name LUN size (GB) Filename 30 300 LUN 30 TD1 35 tempdb.mdf 31 300 LUN 31 TD2 35 tempdb2.ndf 32 301 LUN 32 TD3 35 tempdb3.ndf 33 301 LUN 33 TD4 35 tempdb4.ndf 34 300 LUN 34 TL1 25 templog.ldf 100 Pool 0 LUN 100 TPCE 50 Market_1.ndf Misc_1.ndf MSSQL_tpce_root.md f 101 Pool 0 LUN 101 TPCE_B1 180 Broker_1.ndf 102 Pool 0 LUN 102 TPCE_B2 180 Broker_2.ndf 103 Pool 0 LUN 103 TPCE_B3 180 Broker_3.ndf 104 Pool 0 LUN 104 TPCE_B4 180 Broker_4.ndf 105 Pool 0 LUN 105 TPCE_C1 100 Customer_1.ndf Customer_2.ndf 106 Pool 0 LUN 105 TPCE_C2 100 Customer_3.ndf Customer_4.ndf 107 302 LUN 107 TPCE_Log 100 MSSQL_tpce_log TPCE DB Total 1070 9
Wyniki po relokacji Pool 0 LUN 100 LUN 101 LUN 102 LUN 103 LUN 104 LUN 105 LUN 106 Flash 3% 79% 57% 77% 85% 12% 14% FC 97% 21% 43% 23% 15% 88% 86% Procentowo dane, które mechanizm FAST uznał za aktywne na każdym z LUN ów. *SPA was the main allocation SP for the pool 10
Porównanie Porównanie wyników dla obu konfiguracji. CX4-960 Before FAST After FAST Configuration All Fibre Channel Tiered Flash/FC Disks 90 FC 4 Flash / 30 FC Transactions /sec 2910.841 2983.441 Disk Transfers /sec 13785.326 14397.418 Avg Disk sec/read & Write All data files < 15 ms Avg Disk sec/read & Write Log files < 5 ms CPU % Processor 41.92% 42.90% SPA*/SPB Utilization 37.23% / 3.83% 38.45% / 3.82% Disk Utilization 60% 91% / 62% *SPA was the main allocation SP for the pool 11
Wykorzystanie przestrzeni dyskowej 12
Inne różnice? Konfiguracja All Fibre Channel Tiered Flash/FC Dyski 90 FC 30 FC / Four Flash TPS Baseline + 2.4% I/OPS Baseline + 4.2% Koszt zakupu Baseline - 38% Zużycie energii Baseline - 45% Wysokość (RU) 24U 15 U(-38 %) 13
Podsumowanie - kluczowe zalety Tiering automatyczny to: Zmniejszone koszty administracyjne Szybka reakcja na zmiany profilu I/O Prostsze środowisko Mniejszy koszt przy zachowaniu (lub polepszeniu): Czasu odpowiedzi Wydajności (I/OPS) *For further information refer to the white paper: EMC Tiered Storage for Microsoft SQL Server 2008 Enabled by EMC Unified Storage and EMC Fully Automated Storage Tiering (FAST) - An Architectural Overview 14
Wyzwania związane z ochroną bazy danych MS SQL Server Częstotliwość tworzenia kopii zapasowych Problematyczne i długotrwałe odtwarzanie Ilość miejsa zajmowanego przez kopie zapasowe Możliwie niskie RPO/RTO Tworzenie środowisk testowych i developerskich 15
Warianty ochrony danych a RPO Backup tradycyjny Replikacja lokalna Continous Data Protection (CDP) (T) TIME Checkpoint Pre-Patch Patch Post-Patch Cache Flush Hot Quarterly Checkpoint Backup Close (Znaczniki czasu i bookmarki użytkownika) 16
EMC Data Domain dla SQL Server Medium z deduplikacją w locie Skalowalność Pozwala zredukować miejsce 10-30 x i pomieścić nawet 28 PB logicznej pojemności w jednym urządzeniu Redukcja wysyłanych danych Wysyła tylko zdeduplikowane dane, dodatkowo je kompresując. Wydajny proces deduplikacji Wydajność do 26 TB na godzinę Wsparcie dla SQL Server dump Łatwa integracja Bezproblemowa integracja z systemami backupowymi wiodących producentów 17
Integracja Avamar i DataDomain NAS Avamar Client DD Boost Avamar Data Store Data Domain System DD Boost Łatwa integracja z SQL Server i innymi aplikacjami Microsoft Szybkie, bezprzerwowe backupy bazy SQL z deduplikacją Częstsze backupy umożliwiające odtwarzanie z jak najmniejszą utratą danych Zarządzanie z pojedyńczego punktu Wbudowana replikacja 18
EMC Replication Manager Szybkie i automatyczne tworzenie kopii zapasowych Bardzo szybkie odtworzenie produkcji Konsystentna kopia, różna granularność, harmonogram tworzenia i usuwania replik Montowanie repliki do zdalnych hostów Backup Data repurposing (Testowanie, datamining, tworzenie raportów). Automatyczne wykrywanie środowiska (OS, bazy, patche, macierze, wirtualizacja itd). 19
Czym jest EMC RecoverPoint? Replikacja lokalna w sieci SAN Zdalna replikacja danych synchroniczna i/lub asynchroniczna Odtworzenie do dowolnego wcześniejszego punktu w czasie (CDP) Wsparcie dla heterogenicznych środowisk (OS, macierze, przełączniki SAN) Automatyzacja procesów przełączania za pomocą integracji z zewnętrznymi systemami np. VMware SRM, MSCS, EMC Replication Manager Zapewnienie spójnej kopii danych dla powiązanych środowisk systemowo/aplikacyjnych np. Windows i Unix, SQL i Oracle, etc. Monitorowanie i zarządzanie za pomocą graficznego interfejsu oraz CLI 20
RecoverPoint Lokalna Replikacja (CDP) 2a. Host splitter 1. Aplikacja wykonuje zapis na Produkcję. Zapis w sposób przezroczysty jest rozdzielany na 1 z 3 sposobów: 2b.Fabric splitter 3. Potwierdzenie zapisu 2c. Array splitter 4. Dane są zapisywane do dziennika zmian (Journal) razem ze znacznikiem czasu oraz opcjonalnym znacznikiem / A / C / B r A r B r C Produkcja Replika Dziennik zmian 5. Dane są dystrybuowane w sposób spójny (write-orderconsistent) na wolumeny repliki 21
RecoverPoint przykłady zastosowania Odtwarzanie do momentu tuż sprzed awarii lub błędu logicznego bez konieczności przechowywania wielu kopii backupowych Replikacja danych po między lokalizacjami, gdzie wąskim gardłem jest łącze WAN Migracja danych pomiędzy różnymi macierzami, np. IBM -> EMC Spójna replikacja danych powiązanych aplikacji znajdujących się nie koniecznie na tej samej macierzy w sieci SAN Testowanie, raportowanie, backup np. szybkie i proste wycofanie wgranej nowej wersji, poprawki aplikacji 22
Podsumowanie Zmniejszenie ilości miejsca zajmowanego przez kopie zapasowe Skrócenie okna backupowego Odtwarzanie jednostopniowe (minimalizacja RTO) Duża granularność kopii bezpieczeństwa (minimalizacja RPO) 23