Przykłady DFS z lotu ptaka :) NFS AFS Coda GoogleFS ZFS



Podobne dokumenty
Rozproszone systemy plików

Rozproszone systemy plików

Systemy rozproszone. na użytkownikach systemu rozproszonego wrażenie pojedynczego i zintegrowanego systemu.

Prezentacja systemu plików NFS

IBM DCE/DFS. Mikołaj Gierulski. 17 stycznia 2003

Systemy rozproszone System rozproszony

współbieżność - zdolność do przetwarzania wielu zadań jednocześnie

Klient-Serwer Komunikacja przy pomocy gniazd

Rozproszone systemy plików AFS i Coda

Prezentacja AFS. Andrzej Kurach. 13 stycznia 2003

ARCHITEKTURY SYSTEMÓW ROZPROSZONYCH. 2. Rozproszone systemy plików

Problemy niezawodnego przetwarzania w systemach zorientowanych na usługi

RPC. Zdalne wywoływanie procedur (ang. Remote Procedure Calls )

76.Struktura oprogramowania rozproszonego.

Architektura i mechanizmy systemu

Replikacja bazy danych polega na kopiowaniu i przesyłaniu danych lub obiektów bazodanowych między serwerami oraz na zsynchronizowaniu tych danych w

System plików warstwa fizyczna

System plików warstwa fizyczna

Zdalne wywołanie procedur. Krzysztof Banaś Systemy rozproszone 1

System plików warstwa fizyczna

System kontroli wersji - wprowadzenie. Rzeszów,2 XII 2010

Dokumentacja wstępna TIN. Rozproszone repozytorium oparte o WebDAV

ZiMSK dr inż. Łukasz Sturgulewski, DHCP

Rozproszone systemy plików wprowadzenie. Autor: Łukasz Polak

Wykaz zmian w programie WinAdmin Replikator

System plików. Warstwowy model systemu plików

NFS jest protokołem zdalnego wywoływania procedur (RPC)

Wprowadzenie. Dariusz Wawrzyniak 1

16MB - 2GB 2MB - 128MB

Rozproszone systemy plików Bartosz Grabiec Jerzy Brzeziński Cezary Sobaniec

NOWY OPIS TECHNICZNY PRZEDMIOTU ZAMÓWIENIA

Akademia Techniczno-Humanistyczna w Bielsku-Białej

Dfs - Distributed File System SMB - Server Message Block. 18 grudnia 2002

RPC Remote Procedural Call. Materiały do prezentacji można znaleźć na stronie:

Wybrane działy Informatyki Stosowanej

Rozproszony system udostępniania zasobów oparty na zdalnym wywoływaniu procedur

Zapewnienie wysokiej dostępności baz danych. Marcin Szeliga MVP SQL Server MCT

Tworzenie aplikacji rozproszonej w Sun RPC

Kurs OPC S7. Spis treści. Dzień 1. I OPC motywacja, zakres zastosowań, podstawowe pojęcia dostępne specyfikacje (wersja 1501)

Serwer SSH. Wprowadzenie do serwera SSH Instalacja i konfiguracja Zarządzanie kluczami

Bazy danych 2. Wykład 1

Ograniczenia efektywności systemu pamięci

Wirtualizacja Hyper-V: sposoby wykorzystania i najnowsze wyniki badań

WZÓR UMOWY. Zawarta w Białymstoku, w dniu.. pomiędzy:

Sposoby klastrowania aplikacji webowych w oparciu o rozwiązania OpenSource. Piotr Klimek. piko@piko.homelinux.net

nie trzeba pobierać wszystkich plików z serwera na stację roboczą. Teraz można pobierać tylko te

Kolejki FIFO (łącza nazwane)

Od czego zacząć przy budowaniu środowisk wysokiej dostępności?

Cryptobox Aplikacja do synchronizacji danych użytkownika w systemie KMD2

Wprowadzenie do sieciowych systemów operacyjnych. Moduł 1

Wykaz zmian w programie Win Admin Replikator

Stworzenie programu KSIĄŻKA ADRESOWA posiadającego funkcjonalności przechowywania danych o osobach dodanych przez użytkownika.

Rodzaje pamięci masowych by Silas Mariusz

7. zainstalowane oprogramowanie zarządzane stacje robocze

OPIS TECHNICZNY PRZEDMIOTU ZAMÓWIENIA

Rozproszone i obiektowe systemy baz danych. Wykład 4. Wymagania projektowe systemów rozproszonych

Architektura komputerów

Spis treści. Dzień 1. I Wprowadzenie (wersja 0906) II Dostęp do danych bieżących specyfikacja OPC Data Access (wersja 0906) Kurs OPC S7

Oprogramowanie systemów równoległych i rozproszonych. Wykład 6

Wykaz zmian w programie Win Admin Replikator

Middleware wprowadzenie października 2010

2014 Electronics For Imaging. Informacje zawarte w niniejszej publikacji podlegają postanowieniom opisanym w dokumencie Uwagi prawne dotyczącym tego

Sieci komputerowe i bazy danych

Sieci równorzędne, oraz klient - serwer

Działanie komputera i sieci komputerowej.

Windows Serwer 2008 R2. Moduł 8. Mechanizmy kopii zapasowych

Koncepcja wirtualnej pracowni GIS w oparciu o oprogramowanie open source

Bazy danych - ciągłość działania, spójność danych i disaster recovery. Daniel Polek-Pawlak Jarosław Zdebik

TSMBOX. Backup Appliance Build for Recovery Speed. Przemysław Jagoda. Zbigniew Parys

Wybrane działy Informatyki Stosowanej

Systemy macierzowe. www. qsantechnology. com

Projektowanie i implementacja infrastruktury serwerów

Procesory wielordzeniowe (multiprocessor on a chip) Krzysztof Banaś, Obliczenia wysokiej wydajności.

27/13 ZAŁĄCZNIK NR 4 DO SIWZ. 1 Serwery przetwarzania danych. 1.1 Serwery. dostawa, rozmieszczenie i zainstalowanie 2. serwerów przetwarzania danych.

Fiery Remote Scan. Uruchamianie programu Fiery Remote Scan. Skrzynki pocztowe

MongoDB. wprowadzenie. dr inż. Paweł Boiński, Politechnika Poznańska

T: Wbudowane i predefiniowane domenowe grupy lokalne i globalne.

Sieci komputerowe. Wykład 5: Warstwa transportowa: TCP i UDP. Marcin Bieńkowski. Instytut Informatyki Uniwersytet Wrocławski

Fiery Remote Scan. Łączenie z serwerami Fiery servers. Łączenie z serwerem Fiery server przy pierwszym użyciu

Sektor. Systemy Operacyjne

UMOWY CYWILNOPRAWNE Instalacja, rejestracja i konfiguracja programu

3 Literatura. c Dr inż. Ignacy Pardyka (Inf.UJK) ASK SP.06 Rok akad. 2011/ / 22

U M L. System operacyjny Linux zagnieżdżony w zewnętrznym systemie operacyjnym (Linux)

CyberGuru Wirtualizacja na platformie Hyper-V w pigułce. Prezentuje: Kamil Frankowicz

Sieci komputerowe. Wstęp

Skalowalna Platforma dla eksperymentów dużej skali typu Data Farming z wykorzystaniem środowisk organizacyjnie rozproszonych

Zaawansowane funkcje systemów plików. Ewa Przybyłowicz

Systemy plików FAT, FAT32, NTFS

Serwer pocztowy. QmaiLux. Dokumentacja techniczna mechanizmu książek adresowych (qbook)

Kontrola sesji w PHP HTTP jest protokołem bezstanowym (ang. stateless) nie utrzymuje stanu między dwoma transakcjami. Kontrola sesji służy do

Budowa i oprogramowanie komputerowych systemów sterowania. Laboratorium 4. Metody wymiany danych w systemach automatyki DDE

AKADEMIA GÓRNICZO-HUTNICZA. Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki KATEDRA INFORMATYKI. SyncFile

Middleware wprowadzenie października Dariusz Wawrzyniak (IIPP) 1

System operacyjny MACH

Nr: 12. Tytuł: UDOSTĘPNIANIE DANYCH O SPRAWACH KLIENTOM KANCELARII NA ZEWNĘTRZNYCH SERWERACH WWW. Data modyfikacji:

SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA

JPK Jednolity Plik Kontrolny.

Wywoływanie procedur zdalnych

Jarosław Kuchta. Administrowanie Systemami Komputerowymi. Klastry serwerów

Komputery bezdyskowe - wprowadzenie

Transkrypt:

Przykłady DFS z lotu ptaka :) NFS AFS Coda GoogleFS ZFS

NFS Network File System sieciowy system plików Stworzony przez Sun Microsystems Dostępny dla, m.in.: Unix, Windows, OS/2, Mac OS Pracuje w środowisku heterogenicznym Obsługa stacji bezdyskowych

XDR external Data Representation Jednolity format reprezentacji liczb całkowitych: 32-bitowe big-endian Kodowanie liczb rzeczywistych w formacie IEEE (float i double)

Architektura NFS Koncepcja Współdzielenie plików pomiędzy dowolną liczbą komputerów Dedykowany dla sieci lokalnych (nowsze implementacje wspierają sieci rozległe) Każdy komputer może być jednocześnie klientem i serwerem Eksportowanie danych Udostępnianie katalogów ze wszystkimi podkatalogami Importowanie danych Montowanie zdalnych katalogów przez klientów Zamontowany katalog staje częścią lokalnej hierarchii katalogów serwera Nierozróżnialność plików lokalnych i zdalnych

Cechy NFS Przezroczystość dostępu Przezroczystość położenia poprzez spójną konfigurację montowania zdalnych katalogów Przezroczystość awarii Częściowa przezroczystość wydajności intensywne wykorzystanie pamięci podręcznych Przezroczystość wędrówki NFS nie oferuje Przezroczystości zwielokratniania Przezroczystości współbieżności Nieograniczonej skalowalności

Protokół NFS Zbiór zdalnych procedur (RPC) Klient wysyła żądanie Serwer sprawdza uprawnienia i próbuje wykonać zadanie Serwer odsyła rezultaty lub informacje o błędach

Implementacja NFS (1) Warstwy implementacji NFS Odwołania systemowe (open, read, write, close) Wirtualny system plików, VFS ang. Virtual file system Właściwy klient/serwer NFS

Implementacja NFS (2)

Implementacja NFS (3) Transfer danych Zawsze w paczkach po 8KB Czytanie z wyprzedzeniem przez klienta Opóźniony zapis Spójność pamięci podręcznych klientów Kontrola znaczników czasowych przy każdym dostępie Pamięć danych: ważna maksymalnie 3s Pamięć atrybutów: ważna maksymalnie 30s Problem spójności nie jest do końca rozwiązany

NFS v4 Domyślnie TCP, pojedynczy port, jedno połączenie Zintegrowane protokoły montowania i dostępu do plików Zoptymalizowany transfer danych Bezpieczeństwo Kodowanie RPC Replikacja

AFS Andrew File System Przezroczysty dostęp do zdalnych, współdzielonych plików Skalowalność Przechowywanie całych plików w trwałych pamięciach podręcznych

Scenariusz działania Wywołanie funkcji open, skopiowanie pliku z serwera, wykonanie lokalnie funkcji open Dostęp do pliku realizowany całkowicie lokalnie (read,write) Zamknięcie pliku. Zmodyfikowana kopia jest wysylana na serwer

Wydajność AFS Charakterystyka plików: Większość plików jest mała (<15KB) Odczyty są znacznie częstsze od zapisów Większość plików jest modyfikowana przez jednego użytkownika Odwołania do plików są skumulowane Rozwiązanie efektywne dla większości plików: Tylko do odczytu Rzadko modyfikowanych Nie współdzielonych Duże, modyfikowane i współdzielone => bazy danych

Architektura AFS Implementacja funkcji open Venus: sprawdzenie obecności pliku w pamięci podręcznej. Jeśli nie ma wysłanie zamówienia do procesu Vice Przesłanie kopii pliku do klienta. Rejestracja pobrania kopii na serwerze Lokalne otwarcie pliku i zwrócenie deskryptora Implementacja funkcji close Zamknięcie pliku z lokalną kopią Przesłanie zmodyfikowanej wersji do serwera Powiadomienie innych zainteresowanych węzłów o dokonanych zmianach

Odporność na awarie Serwer rejestruje stan klientów Informacja o pobranych kopiach plików Komunikaty unieważniające Po awarii Klient: kontrola ważności przechowywanych kopii plików Automatyczne unieważnianie replik Brak informacji od serwera przez okres czasu T (typowo kilka minut) powoduje unieważnienie kopii

Coda Replikacja plików modyfikowanych Lepsze tolerowanie uszkodzeń Dostępność zasobów przy braku dostępu do serwerów Skalowalność i emulacja uniksowej semantyki dostępu do plików jak w AFS

open

close

Spójność danych Wektory wersji: Coda Version Vector (CVV) Liczniki modyfikacji pliku na poszczególnych serwerach Użytkownik musi ręcznie rozwiązać konflikty powstające podczas operacji scalania

Konflikt podczas scalania

GoogleFS Mocno dedykowany Stworzony z założeniem, że błędy są czymś naturalnym Oferuje replikacje Przezroczystość współbieżności

Założenia Dużo taniego hardware'u Większość plików >100MB. Pliki po kilka GB są powszechne. Małe pliki występują, ale dostęp nie jest optymalizowany Czytanie dużymi strumieniami lub małe losowe odczyty Zapis zazwyczaj jako dodawanie na koniec Potrzebne wsparcie dla problemu producentkonsument

Architektura Jeden serwer z metadanymi master Wiele maszyn z danymi chunkservers Plik jest dzielony na kawałki (chunks) o stałym rozmiarze Każdy kawałek jest replikowany stałą liczbę razy Master synchronizuje globalnie cały klaster periodycznymi wiadomościami HeartBeat

Odczyt

Zapis

Odśmiecanie Usunięte pliki nie są natychmiast usuwane Sierotki (orphan chunks) są eliminowane :) w regularnych odstępach czasu

ZFS (Zettabyte File System) The last word in file systems Otwarty kod źródłowy 584 pliki 92.000 linii kodu 56 patentów (!) 5 lat pracy Oczywiście za darmo

Podstawowe cechy System plików 128-bitowy System plików i manager wolumenów w jednym Zapewnienie integralności danych end-toend Zabezpieczenie każdego bloku danych przez 256-bitową sumę kontrolną Data self-healing Model zapisów Copy-On-Write Scrubber sprawdzający automatycznie lub na żądanie konsystencję danych

Podstawowe cechy (2) Zmienny rozmiar bloku danych (od 512B do 128KB) Kompresja danych na poziomie bloku Snapshot, clone, rollback Listy kontroli dostępu Niskopoziomowy backup/restore, pełny lub inkrementacyjny Integracja z NFS Niezależność od platformy sprzętowej

COW, snapshoty

Walidacja ścieżki

Automatyczna naprawa danych

Automatyczna naprawa danych