Tworzenie kopii zapasowych i archiwalnych Warsztaty Usługa powszechnej archiwizacji Sławomir Zdanowski, PCSS Maciej Brzeźniak, PCSS
Plan prezentacji Czym jest kopia zapasowa a czym jest archiwum? Podstawowe pojęcia związane z kopiami zapasowymi i archiwizacją Klient kopii zapasowych i archiwalnych podstawowa funkcjonalnośd klienta funkcje specjalne klienta na przykładzie klienta NDSTC (National Data Storage Tivoli Client)
Kopia zapasowa vs archiwum Kopia zapasowa służy do odtwarzania oryginalnych danych w przypadku ich utraty lub uszkodzenia Tworzenie kopii zapasowych ma charakter krótkoterminowy (w odróżnieniu od archiwizacji) Założenie: dane w kopii zapasowej są zapasowe w stosunku do oryginalnych danych składowanych np. na dysku twardym komputera PC Kopia zapasowa Mechanizm kopii zapasowych jest jednym z podstawowych mechanizmów ochrony danych
Kopie zapasowe (ilustracja) Kopia zapasowa a okno odtwarzania Dzieo 1 Dzieo 2 Dzieo 3 Dzieo 4 Dzieo 5 Dzieo 6 Dzieo X Dzieo X+1 Dzieo X+2... Kopia Kopia Odtworzenie Kopia Kopia REGULARNY BACKUP OKNO ODTWARZANIA JEŻELI UTRATA PLIKU ZOSTANIE WYKRYTA PO UPŁYWIE OKNA ODTWARZANIA PRZYWRÓCENIE PLIKU MOŻE BYD NIEMOŻLIWE
Kopia zapasowa (obserwacje) Kopie zapasowe powinny byd tworzone regularnie, tak aby w razie potrzeby zawsze można było odzyskad potrzebne dane: np. najbardziej aktualne kopie lub np. ostatnią poprawną wersję danych Dostępnośd kopii zapasowych jest ograniczona tzw. oknem odtwarzania; natomiast wielkośd okna odtwarzania jest ograniczona dostępnymi zasobami na przechowywanie danych => Trzeba pogodzid się z istnieniem okna odtwarzania LUB przeznaczyd odpowiednio duże zasoby na kopie zapasowe, by nie trzeba było o tym problemie myśled LUB powierzyd problem komuś innemu...
Czym jest archiwum Archiwum zawiera dane, które powinny byd przechowywane przez pewien okres czasu (w szczególnych przypadkach na zawsze ) W odróżnieniu od kopii zapasowej, dane w archiwum: nie wymagają ciągłego dostępu może nie istnied inna kopia tych danych (np. w komputerze PC użytkownika) po archiwizacji dane mogą byd usunięte z oryginalnego nośnika Archiwizacja danych ma charakter długoterminowy
Archiwizacja (ilustracja) Archiwizacja a okres przechowywania Dzieo 1 Dzieo 2 Tygodnie, Dzieo X+1... Miesiące, Lata,...... (w zależności od dziedziny) Archiwizacja Archiwizacja Pobranie z archiwum ARCHIWUM CZAS PRZECHOWYWANIA W SZCZEGÓLNYCH PRZYPADKACH CZAS PRZECHOWYWANIA = NA ZAWSZE
Archiwizacja (obserwacje) Archiwizacji podlegad może wiele danych, wiele z nich musi byd długo przechowywane: dokumenty księgowe dokumentacja projektów europejskich wyniki badao naukowych zasoby bibliotek i archiwów 5 lat 10 lat na zawsze na zawsze Przez cały okres archiwizacji musi byd zapewniona: Dostępnośd archiwalnych danych z akceptowalnym opóźnieniem Technologiczna możliwośd odtworzenia /odczytania danych nietrywialne... Pojemnośd archiwum jest ograniczona dostępnymi zasobami na przechowywanie danych => Trzeba przeznaczyd odpowiednio duże zasoby na archiwa, by nie trzeba było myśled problemie braku miejsca na dysku LUB powierzyd problem komuś innemu...
Klient kopii zapasowych i archiwalnych Po stronie użytkownika działa aplikacja-klient kopii zapasowych i archiwizacji Dane składowane są w bezpiecznej, odległej lokalizacji: Aplikacja kopii zapasowych / archiwalnych Użytkownik Dane użytkownika Usługa PLATON-U4 Aplikacja typu klient-serwer: Klient usługi kopii zapasowych / archiwizacji Serwer usługi kopii zapasowych / archiwizacji Serwer usługi kopii zapasowych / archiwizacji
Funkcjonalność klienta kopii zapasowych i archiwalnych vs NDSTC Klient kopii zapasowych i archiwalnych: Tworzenie kopii zapasowych i archiwalnych Realizacja polityk: np. kopie pełne, przyrostowe Automatyzacja procesu kopiowania Sprawdzanie stanu replik na serwerze danych Przywracanie danych NDSTC: NDSTC - National Data Storage Tivoli Client aplikacja: opracowana w ramach projektu KMD naśladuje standardowego klienta TSM (interfejs command-line) wzbogacona o dodatkową funkcjonalnośd, m.in: replikacja danych (w locie) szyfrowanie i kontrola integralności danych
Funkcjonalność: Tworzenie kopii zapasowych i archiwalnych Kopie danych tworzone są dla plików wskazanych przez użytkownika Aplikacja kopii zapasowych / archiwalnych Użytkownik Dane użytkownika Kopia danych Serwery PLATON-U4 Klient NDSTC: możliwośd wyboru plików i katalogów podlegających tworzeniu kopii plik konfiguracyjny wsparcie dla znaków * i? oraz przeszukiwania drzewa katalogów wersjonowanie w przypadku kopii zapasowych na serwerze może istnied wiele wersji pliku: najnowsza wersja oznaczona jest jako aktywna (pozostałe jako nieaktywne) można odtworzyd określony punkt w czasie
Funkcjonalność: rodzaje backupów (1) Backup pełny: - Na serwer wysyłane są wszystkie wskazane pliki
Funkcjonalność: rodzaje backupów (2) Backup przyrostowy: - Na serwer wysyłane są pliki: - nowe - takie, których zawartośd uległa zmianie od poprzedniego backupu - Aktualizowane są informacje (meta-dane) o kopiach plików na serwerze w przypadku plików, dla których zmieniły się tylko meta-dane, np. - data modyfikacji pliku, - rozmiar pliku itp. - Zalety: - zmniejszenie kosztów - skrócenie czasu wykonywania kopii
Funkcjonalność: Sprawdzanie stanu replik Pozwala sprawdzid jakie kopie plików znajdują się na serwerze Daje informacje o tym kiedy kopie plików zostały utworzone W przypadku kopii zapasowych udostępnia informacje o wszystkich wersjach i replikach utworzonych dla danego pliku W przypadku kopii archiwalnych udostępnia informacje o tym jak długo replika będzie przechowywana na serwerze Aplikacja kopii zapasowych / archiwalnych Użytkownik Dane użytkownika Kopia danych Serwery PLATON-U4
Funkcjonalność: Przywracanie danych W razie potrzeby umożliwia odtworzenie oryginalnych danych Dane można przywrócid do oryginalnej lub do nowej lokalizacji Aplikacja kopii zapasowych / archiwalnych Użytkownik Dane użytkownika Kopia danych Serwery PLATON-U4 W przypadku kopii zapasowych istnienie kilku wersji plików na serwerze umożliwia cofnięcie się w czasie do określonej daty i określonej wersji pliku
Dodatkowa funkcjonalność klienta NDSTC (1) Dostęp do wielu serwerów danych automatyczna replikacja danych: większe bezpieczeostwo danych odpornośd procesu kopiowania/odtwarzania na awarie serwerów wydajne wykonywanie kopii zapasowych i archiwalnych Aplikacja kopii zapasowych / archiwalnych Serwery PLATON-U4 Użytkownik Dane użytkownika
Dodatkowa funkcjonalność klienta NDSTC (2) Wielosesyjny dostęp do serwera danych: dalsza poprawa wydajności transmisji skrócenie czasu wykonywania kopii zrównoleglenie wysyłania/odbierania danych w wielu wątkach pozwala pokonad ograniczenia pojedynczego strumienia TCP/IP) Aplikacja kopii zapasowych / archiwalnych Serwery PLATON-U4 Użytkownik Dane użytkownika
Dodatkowa funkcjonalność klienta NDSTC (3) Szyfrowanie danych i kontrola integralności po stronie klienta zapewnia poufnośd i możliwośd kontroli integralności danych użytkownika niepotrzebne zaufanie do serwerów Użytkownik Dane użytkownika Aplikacja kopii zapasowych / archiwalnych Kopia danych Serwery PLATON-U4 Szyfrowanie po stronie klienta: do szyfrowania wykorzystywany jest algorytm AES z kluczem o długości 256 bitów dostęp do oryginalnych danych posiada tylko użytkownik, który zna hasło na serwerze dane znajdują się tylko w postaci zaszyfrowanej, administrator serwera nie jest w stanie ich odczytad Kontrola integralności po stronie klienta: może byd przeprowadzana w trakcie przywracania kopii zapasowej lub archiwalnej kontrola za pomocą kryptograficznej funkcji skrótu daje użytkownikowi pewnośd, że dane, które otrzymuje z serwera są tymi samymi, które wcześniej umieścił na serwerze
Podsumowanie Klient kopii zapasowych i archiwalnych: Wspiera tworzenie kopii zapasowych i archiwalnych Automatyzuje proces Realizuje odpowiednie polityki (np. kopie pełne, przyrostowe) Posiada funkcje przywracanie danych: w tym tzw. odtwarzania punktu w czasie (ang. point in time recovery) NDSTC: Realizuje specjalne funkcje : Replikację danych w locie (dostęp do wielu serwerów danych) => Niezawodnośd / wysoka dostępnośd danych => Wydajnośd Zrównoleglenie transmisji klient-serwer: => Wydajnośd Szyfrowanie danych i kontrola integralności (po stronie klienta) => Pełna poufnośd danych => Możliwośd kontroli wiarygodności danych
Podsumowanie Status NDSTC (06.2010) Wersja 1.0 gotowa do testów u użytkowników Oparta o TSM API 5.5.x.x RPMy na Fedorę i CentOS (Linux) Plany: Pełna integracja z pozostałymi usługami PLATON-U4 (wersja Linux) (w tej chwili możliwe wykorzystanie jedynie serwerów Tivoli Storage Manager jako repozytorium danych) Dostępnośd 10.2010 Wersja Windows nieplanowana obecnie
Usługa Powszechnej Archiwizacji Dziękujemy za uwagę Kontakt: slawek@man.poznan.pl kmd.pcss.pl