Wykład 10 Systemy plików Interfejs i implementacja. Wojciech Kwedlo, Wykład z Systemów Operacyjnych -1- Wydział Informatyki PB



Podobne dokumenty
ang. file) Pojęcie pliku (ang( Typy plików Atrybuty pliku Fragmentacja wewnętrzna w systemie plików Struktura pliku

System plików warstwa fizyczna

System plików warstwa fizyczna

System plików warstwa fizyczna

obszar bezpośrednio dostępny dla procesora rozkazy: load, store (PAO rejestr procesora)

dr inż. Jarosław Forenc

Systemy plików i zarządzanie pamięcią pomocniczą. Struktura pliku. Koncepcja pliku. Atrybuty pliku

Sektor. Systemy Operacyjne

System plików. Warstwowy model systemu plików

Tworzenie pliku Zapisywanie pliku Czytanie pliku Zmiana pozycji w pliku Usuwanie pliku Skracanie pliku

System plików i zarządzanie pamięcią pomocniczą. Koncepcja pliku. Atrybuty pliku. Struktura pliku. Typ pliku nazwa, rozszerzenie (extension)

System plików warstwa logiczna

Wykład 8. Pamięć wirtualna. Wojciech Kwedlo, Wykład z Systemów Operacyjnych -1- Wydział Informatyki PB

16MB - 2GB 2MB - 128MB

Systemy operacyjne System plików

Podstawowe wiadomości o systemach plików.

SYSTEMY OPERACYJNE WYKLAD 5 - zarządzanie pamięcią pomocniczą

System plików. - warstwa logiczna. - warstwa fizyczna. - przykłady implementacji. Systemy operacyjne Wykład 6 1

System plików. dr inż. Krzysztof Patan. Instytut Sterowania i Systemów Informatycznych Uniwersytet Zielonogórski

1. Pliki i ich organizacja

Systemy plików FAT, FAT32, NTFS

dr inż. Jarosław Forenc

Struktura i funkcjonowanie komputera pamięć komputerowa, hierarchia pamięci pamięć podręczna. System operacyjny. Zarządzanie procesami

Wykład 7. Zarządzanie pamięcią

Zaawansowane funkcje systemów plików. Ewa Przybyłowicz

System plików przykłady. implementacji

Architektura komputerów

System plików. System plików. Operacje plikowe. Inne operacje. Typy plików. Typy dostępu do plików

System plików. Definicje:

Wbudowane systemy operacyjne

Pliki. Operacje na plikach w Pascalu

System plików przykłady implementacji

System plików Linuksa

Tworzenie partycji i dysków logicznych

dr inż. Jarosław Forenc

System plików. Atrybuty pliku. Typy plików. Pojęcie pliku (ang. file) Zadania systemu operacyjnego. Struktura pliku. Dariusz Wawrzyniak 1

System plików. Systemy operacyjne System plików 1. Pojęcie pliku (ang. file)

Schematy zarzadzania pamięcia

Administracja systemem Linux

Systemy operacyjne System plików

System plików warstwa fizyczna. Wykład prowadzą: Jerzy Brzeziński Dariusz Wawrzyniak

KOMPENDIUM I. INFORMACJE OGÓLNE

Systemy operacyjne III

Dyski SSD a systemy plików

Jarosław Kuchta. Administrowanie Systemami Komputerowymi. System plików

Komputerowa pamięć. System dziesiątkowego (decymalny)

Architektura komputerów

Pamięć wirtualna. Przygotował: Ryszard Kijaka. Wykład 4

Wydajność systemów a organizacja pamięci. Krzysztof Banaś, Obliczenia wysokiej wydajności. 1

UNIX SYSTEM PLIKÓW. UNIX System plików


Zarządzanie pamięcią operacyjną

Architektura komputerów

Organizacja pamięci w procesorach graficznych

System pamięci. Pamięć wirtualna

sprowadza się od razu kilka stron!

SYSTEMY OPERACYJNE WYKLAD 4 - zarządzanie pamięcią

dr inż. Jarosław Forenc

dr inŝ. Jarosław Forenc

Architektura komputerów

Struktura dysku. Dyski podstawowe i dynamiczne

System plików warstwa logiczna. Wykład prowadzą: Jerzy Brzeziński Dariusz Wawrzyniak

Zarządzanie dyskowymi operacjami we/wy. Zarządzanie pamięcią operacyjną. dr inż. Jarosław Forenc. Algorytm FIFO (First-In-First-Out)

dr inż. Jarosław Forenc

Wydajność systemów a organizacja pamięci. Krzysztof Banaś, Obliczenia wysokiej wydajności. 1

Zarządzanie dyskowymi operacjami we-wy. Zarządzanie pamięcią operacyjną. dr inż. Jarosław Forenc. systemy plików (NTFS, ext2)

1. Podstawy...P Polecenia podstawowe...p... 18

Linux: System Plików

Prezentacja systemu plików NFS

Steganograficzny system plików

Wykład 4. Tablice. Pliki

System operacyjny UNIX system plików. mgr Michał Popławski, WFAiIS

wykład Organizacja plików Opracował: dr inż. Janusz DUDCZYK

Ćwiczenie Nr 7 Instalacja oraz konfiguracja wskazanego systemu operacyjnego

Komputer. Komputer (computer) jest to urządzenie elektroniczne służące do zbierania, przechowywania, przetwarzania i wizualizacji informacji

Pamięć. Jan Tuziemski Źródło części materiałów: os-book.com

ZADANIE nr 4 Sprawdzian z informatyki

System plików. Implementacja systemu plików. I. Interfejs systemu plików.

Podstawy. Pamięć wirtualna. (demand paging)

Operacje na plikach. Organizacja systemu plików. Typy plików. Struktury plików. Pliki indeksowane. Struktura wewn etrzna

PAMIĘĆ OPERACYJNA...107

architektura komputerów w. 8 Zarządzanie pamięcią

architektura komputerów w. 7 Cache

dr inŝ. Jarosław Forenc

Architektura komputerów

Architektura systemów informatycznych. Systemy plików

2 INSTALACJA OPROGRAMOWANIA. 3 3 GŁÓWNE OKNO PROGRAMU 3 4 MODUŁ OBSŁUGI ARCHIWUM 7

dr inŝ. Jarosław Forenc

Celem wykładu jest prezentacja różnych podejść do implementacji systemu plików. Podejścia opierają się na założeniu, że urządzeniem składowania

Wpisany przez Łukasz Nawrotek Poniedziałek, 20 Październik :57 - Zmieniony Poniedziałek, 20 Październik :02

System pamięci. Pamięć wirtualna

PAMIĘCI. Część 1. Przygotował: Ryszard Kijanka

SYSTEMY OPERACYJNE I SIECI KOMPUTEROWE

Podstawy Informatyki DMA - Układ bezpośredniego dostępu do pamięci

System pamięci. Pamięć wirtualna

Algorytmy i. Wykład 5: Drzewa. Dr inż. Paweł Kasprowski

Wydajność systemów a organizacja pamięci. Krzysztof Banaś, Obliczenia wysokiej wydajności. 1

Wykład 7 Podręczna pamięć buforowa (ang. buffer cache) w systemie Linuks. Wojciech Kwedlo, Systemy Operacyjne II -1- Wydział Informatyki PB

Pliki i systemy plików

Podstawy obsługi komputerów. Budowa komputera. Podstawowe pojęcia

Transkrypt:

Wykład 10 Systemy plików Interfejs i implementacja Wojciech Kwedlo, Wykład z Systemów Operacyjnych -1- Wydział Informatyki PB

Systemy plików Przechowują olbrzymie ilości informacji Gigabajty => Terabajty => Petabajty Przechowywana informacja nie jest tracona po zakończeniu procesu. Czas życia od sekund do lat. Potrzebny jest sposób odnajdywania informacji Wiele procesów musi być w stanie wykorzystywać tę samą informację współbieżnie. Wojciech Kwedlo, Wykład z Systemów Operacyjnych -2- Wydział Informatyki PB

Nazwy plików Konieczność odnalezienia pliku, po tym jak został utworzony. Każdy plik ma co najmniej jędną nazwę. Nazwa może być: Łatwa dla zrozumienia dla człowieka: np. Notatka.txt, program3.cpp. Odczytywana bezpośrednio przez maszynę: np. 65231 Duże i małe litery mogą być rozróżniane lub nie Nazwa może zawierać informacje o przeznaczeniu pliku. Wygodne z punktu widzenia użytkownika. Wykorzystywane przez programy użytkowe Przykład (Nazwa z rozszerzeniem) abc.jpg Obraz w formacie jpeg p1.c Program w języku C f.txt Ogólny plik tekstowy Wojciech Kwedlo, Wykład z Systemów Operacyjnych -3- Wydział Informatyki PB

Struktura pliku Brak struktury: plik jest ciągiem bajtów. Plik rekordów Rekordy o stałej lub zmiennej długości. Plik o skomplikowanej strukturze Tekst sformatowany Program wykonywalny. Każdą strukturę pliku można zasymulować za pomocą ciągu bajtów i wykorzystując znaki kontrolne. Dlatego często system operacyjny traktuje plik jako ciąg bajtów. Struktura pliku jest ustalana na poziomie programu użytkownika (ale nie zawsze - przykład. pliki wykonywalne.exe) Wojciech Kwedlo, Wykład z Systemów Operacyjnych -4- Wydział Informatyki PB

Atrybuty pliku Nazwa pliku Rozmiar Właściciel Prawa dostępu Czasy (utworzenia/ostatniego dostępu/ostatniej modyfikacji). Hasło Inne informacje, z reguły niedostępne dla programu użytkownika Na przykład informacja o położeniu pliku na dysku Wojciech Kwedlo, Wykład z Systemów Operacyjnych -5- Wydział Informatyki PB

Operacje na plikach Utworzenie (ang. create) Usunięcie (ang. delete) Otwarcie (ang. open) przygotowanie pliku do dostępu. Zamknięcie (ang. close) wskazanie, że dostęp do pliku nie będzie dalej potrzebny. Odczyt (ang. read) (do bufora w pamięci procesu) Zapis (ang. write) (z bufora w pamięci procesu) Przesunięcie wskaźnika bieżącej pozycji (ang. seek). Operacje read oraz write wykonują odczyt oraz zapis z miejsca wskazywanego przez wskaźnik bieżącej pozycji; wartość wskaźnika jest zwiększana o liczbę odczytanych lub zapisanych bajtów. Operacja seek pozwala na dostęp swobodny do pliku (ang. random access), jeżeli nie jest zaimplementowana mówimy o dostępie sekwencyjnym. Dołączenie (ang. append) zapis na końcu pliku Odczyt/Zmiana atrybutów (w tym nazwy) Wojciech Kwedlo, Wykład z Systemów Operacyjnych -6- Wydział Informatyki PB

Pliki odwzorowane w pamięci (ang. memory mapped files) Po otwarciu pliku wykonywana jest operacja mmap. abc Plik staje się częścią przestrzeni adresowej procesu. Wygodna abstrakcja Dane Kod Dane Kod Unikamy podwójnego kopiowania danych Implementacja na ogół wykorzystuje mechanizm pamięci wirtualnej Problemy: Plik współdzielony przez kilka procesów. Próba dostępu za końcem pliku. Przed odwzorowaniem Po odwzorowaniu Wojciech Kwedlo, Wykład z Systemów Operacyjnych -7- Wydział Informatyki PB

Katalogi Proste nadawanie nazw nie wystarcza w przypadku tysięcy plików na dysku. Problem: wiele plików o identycznej nazwie, np. różne wersje tego samego programu Ludzie mają tendencję do grupowania informacji związanych ze sobą. Systemy plików umożliwiają to przy pomocy katalogów (ang. directory), zwanych także folderami. Grupowanie pozwala na. Łatwiejsze znalezienie plików. Określenie, które pliki są ze sobą związane. Operacje na katalogach: Głównie odczyt i przeszukiwanie katalogu. Także tworzenie nowych dowiązań. Wojciech Kwedlo, Wykład z Systemów Operacyjnych -8- Wydział Informatyki PB

Katalog o strukturze jednopoziomowej i dwupoziomowej ` Jeden katalog dla wszystkich użytkowników. Problemy: (a) Nie pozwala na grupowania (b) Konflikty nazw plików. Katalog główny + Odrębny katalog dla każdego z użytkowników Nadal nie pozwala na grupowania plików Wojciech Kwedlo, Wykład z Systemów Operacyjnych -9- Wydział Informatyki PB

Katalog o strukturze drzewa Umożliwia grupowanie. Katalog aktualny (ang. current directory). Lokalizacja pliku podana przez ścieżkę. Scieżka bezwlględna: początek w korzeniu drzewa. Ścieżka względna: początek w katalogu aktualnym. /bin/hex albo./p/list (jeżeli /programs jest katalogiem głównym) Wojciech Kwedlo, Wykład z Systemów Operacyjnych -10- Wydział Informatyki PB

Katalog o strukturze grafu acyklicznego Brak cykli w grafie chroni przed ścieżkami o nieskończonej długości. Plik może mieć dwie różne nazwy (aliasy) Problem wiszących wskaźników Gdy usuniemy list Jak zapewnić acykliczność grafu? W Uniksie hard links i symbolic links. twarde dowiązania to kolejna nazwa tego samego pliku. symboliczne dowiązania to specjalny plik wskazujący na inny. Tylko super-użytkownik może utworzyć twarde dowiązanie do katalogu. Wojciech Kwedlo, Wykład z Systemów Operacyjnych -11- Wydział Informatyki PB

Interfejs systemu plików a jego implementacja Użytkownik, programista aplikacji jest zainteresowany interfejsem do systemu plików udostępnianym przez system operacyjny. Operacje na plikach i katalogach. Projektanta systemu interesuje, jak te operacje mogą zostać zaimplementowane. Jak przechowywać informację o blokach dyskowych zajętych przez plik. Jak szybko odnaleźć i-ty blok danego pliku (operacja seek) Jak przechowywać informacje o wolnych blokach (blokach nie zajętych przez żaden z plików, ale które mogą być przydzielone w przyszłości) Gdzie przechowywać informacje o atrybutach pliku Gdzie przechowywać informacje o strukturze (np. drzewiastej) systemu plików.. Wojciech Kwedlo, Wykład z Systemów Operacyjnych -12- Wydział Informatyki PB

Podział dysku na partycje Tablica partycji Główny blok rozruchowy Cały dysk Partycja 1 Partycja 2 Partycja 3 Partycja 4 Blok rozruchowy Super blok Pliki, katalogi, alokacji bloków, lista wolnych bloków Bloki rozruchowe (boot blocks) zawierają kod ładujący system operacyjny do pamięci. Każda partycja zawiera odrębny system plików (mogą to być systemy różnych typów). Tablica partycji zawiera informacje o podziale dysku na partycje (początek i koniec) Super blok zawiera informacje ogólne o systemie (np. całkowita liczba bloków danych, całkowita liczba plików) Wojciech Kwedlo, Wykład z Systemów Operacyjnych -13- Wydział Informatyki PB

Ciągła alokacja bloków danych Plik A Plik B Plik C Plik D Plik E Plik F Plik A Wolne Plik C Wolne Plik E Plik F Każdy plik zajmuje nieprzerwany ciąg bloków. Bardzo szybki odczyt. Bardzo proste zarządzanie informacją o blokach danego pliku wystarczy tylko pamiętać numer pierwszego bloku oraz liczbę bloku. Bardzo szybka operacja seek. Wojciech Kwedlo, Wykład z Systemów Operacyjnych -14- Wydział Informatyki PB

Wady ciągłej alokacji Może powstać fragmentacja (podobnie jak w przypadku pamięci RAM) a kompakcja w pamięci dyskowej jest bardzo wolna. Musimy z góry znać maksymalny rozmiar pliku przy jego tworzeniu problemy przy zwiększaniu rozmiaru pliku. Powyższe wady sprawiają że ciągła alokacja jest stosowana w systemach plików tylko do odczytu np. ISO9600 dla pamięci CD-ROM. W tym przypadku kompletny system plików, wraz ze wszystkimi plikami jest tworzony przy wypalaniu (wytłaczaniu) płytki. Raz utworzony system plików nie będzie już modyfikowany (w płytkach wielosesyjnych każda sesja to odrębny system plików). Nie ma potrzeby zarządzania wolnymi blokami, uwzględnienia możliwości zwiększenia rozmiaru plików etc. Wojciech Kwedlo, Wykład z Systemów Operacyjnych -15- Wydział Informatyki PB

Alokacja listowa Ostatnie (dwa, cztery) bajty bloku danych są zarezerwowane na numer następnego bloku. W katalogu przechowywany jest numer pierwszego bloku + numer ostatniego (aby umożliwić rozrost pliku). -1 oznacza ostatni blok pliku. Zaleta: Plikowi możemy przydzielić dowolny blok danych na dysku. Wada: Nie nadaje się do dostępu swobodnego, ponieważ aby wykonać operację seek musimy przeczytać wiele bloków na liście. Wojciech Kwedlo, Wykład z Systemów Operacyjnych -16- Wydział Informatyki PB

Numer bloku 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 w w 10 11 7 w 3 2 w w 12 14-1 w -1 w Blok wolny Plik Tablica alokacji plików FAT (ang. File Allocation Table) Pierwszy blok Ostatni blok a.txt 4 12 b.txt 6 14 a.txt: 4,7,2,10,12 b.txt: 6,3,11,14 Odmiana alokacji listowej, w której numery następnych bloków przechowywane są w odrębnej tablicy (FAT). Specjalne znaczniki na blok wolny (w) i ostatni blok pliku (-1). Rozwiązany problem zarządzania wolnymi blokami danych. Tablica może znajdować się (w części lub w całości) w pamięci RAM, co zwiększa wydajność, zwłaszcza operacji seek. Problem zapewnienia spójności pomiędzy kopią tablicy w pamięci RAM, a oryginałem w pamięci dyskowej. Uszkodzenie tablicy FAT może prowadzić do utraty całego systemu plików. Potencjalnie bardzo duży rozmiar tablicy np. 80MB dla dysku 20GB Wojciech Kwedlo, Wykład z Systemów Operacyjnych -17- Wydział Informatyki PB

Alokacja indeksowa Oddzielny blok indeksowy poświęcony na numery bloków z danymi. Dobra wydajność. Zakładając 1KB bloki i 32-bitowe numery w bloku indeksowym zmieści się 256 numerów. Co zrobić gdy rozmiar pliku jest większy od 256 KB? Rozwiązanie: Indeksowanie pośrednie Wojciech Kwedlo, Wykład z Systemów Operacyjnych -18- Wydział Informatyki PB

Indeksowanie pośrednie Numer w katalogu Katalog zawiera numer bloku pośredniego, który z kolei zawiera numery bloków indeksowych. Plik może mieć maksymalną długość 256*256 KB=64MB. Pośredni blok indeksowy Potrzebujemy indeksowania podwójnie pośredniego (maks 16GB) lub potrójnie pośredniego. Bloki indeksowe Problem utraty miejsca na bloki indeksowe Bloki danych Wojciech Kwedlo, Wykład z Systemów Operacyjnych -19- Wydział Informatyki PB

Zarządzanie wolnym blokami W systemie plików, w miarę jak pliki są tworzone i usuwane musimy przydzielać i zwalniać bloki danych (i być może indeksowe). W systemach FAT wystarczy wykorzystać specjalny znacznik w tablicy System musi być w stanie szybko odnaleźć wolny blok. Najprostszy sposób: mapy bitowe 0 1 2 n-1 1 0 1 0 0 1 1 Liczba bitów w mapie jest równa liczbie dynamicznie alokowanych bloków Pozycja 0 oznacza blok wolny Pozycja 1 oznacza blok wykorzystywany. Znowu powstaje problem zachowania spójności struktur w pamięci i na dysku Inne rozwiązanie: Lista wolnych obszarów Wojciech Kwedlo, Wykład z Systemów Operacyjnych -20- Wydział Informatyki PB

Przechowywanie atrybutów pliku games atrybuty games mail atrybuty mail news atrybuty news work atrybuty work Struktura danych przechowująca atrybuty Atrybuty przechowują dane zarówno widoczne dla użytkownika (długość,prawa dostępu, daty) jak i niewidoczne np. numer(y) bloków. Rozwiązanie z systemu MS-DOS wszystkie atrybuty przechowywane są w katalogu. Rozwiązanie z systemu UNIX atrybuty przechowywane są w odrębnej strukturze zwanej i-węzłem (ang. i-node) Każdy plik oraz katalog ma swój i-węzeł. Pewna część bloków na dysku jest poświęcona na tablicę i-węzłów. Pozycja katalogu zawiera jedynie numer i-węzła. Wojciech Kwedlo, Wykład z Systemów Operacyjnych -21- Wydział Informatyki PB

Pozycja katalogu w systemie MS-DOS Bajtów 8 3 1 10 2 Nazwa pliku 2 2 4 Rozmiar Rozszerzenie Atrybuty Zarezerwowane Czas Data Numer pierwszego bloku MSDOS wykorzystuje tablicę FAT. Numer bloku w tablicy może mieć 12 (FAT12) 16 (FAT16) albo 32 (FAT32 Windows95SE) bity. Pozycja katalogu ma stały rozmiar (32bajty) i przechowuje wszystkie atrybuty pliku. Katalog jest szczególnym typem pliku. W kolejnych wersjach wykorzystano zarezerwowane bajty (np. dodatkowe 16- bitów numeru pierwszego bloku w systemie FAT32) Sektor startowy przechowuje informacje o liczbie kopii i położeniu tablic FAT oraz o położeniu głównego katalogu. Wojciech Kwedlo, Wykład z Systemów Operacyjnych -22- Wydział Informatyki PB

Klasyczny system plików Uniksa Blok startowy Super blok Mapa bitowa i-węzłów Tablica i-węzłów Mapa bitowa bloków Bloki danych i indeksowe Uniks wykorzystuje alokację indeksową (szczegóły za chwilę). Katalog traktowany jest jako szczególny plik. Wszelkie atrybuty pliku przechowywane są w i-węźle. I-węzły przechowywane są w tablicy na dysku. Potrzebujemy odrębnej mapy bitowej do zarządzania wolnym miejscem w tablicy i- węzłów. (pliki są tworzone i usuwane). Całkowita liczba plików i katalogów w systemie nie może być większa od rozmiaru tablicy i-węzłów. Wojciech Kwedlo, Wykład z Systemów Operacyjnych -23- Wydział Informatyki PB

Postać i-węzła w Uniksie Dla małych plików (np. Do 14 bloków numery są przechowywane bezpośrednio w i-węźle). Dla większych wykorzystuje się blok indeksowy (single indirect). Dla jeszcze większych indeksowanie podwójnie i potrójnie pośrednie. Wojciech Kwedlo, Wykład z Systemów Operacyjnych -24- Wydział Informatyki PB

Katalogi w Uniksie Root directory I-node 6 is for /usr Block 132 is /usr directory I-node 26 is for /usr/ast Block 406 is /usr/ast directory 1 1 4... bin Mode size times 6 1 19 dick Mode size times 26 6 64 grants 7 dev 132 30 erik 406 92 books 14 lib 51 jim 60 mbox 9 etc 26 ast 81 minix 6 usr 45 bal 17 src 8 tmp Looking up usr yields i-node 6 I-node 6 says that /usr is in block 132 /usr/ast is i-node 26 I-node 26 says that /usr/ast is in block 406 /usr/ast/mbox is i-node 60 Tłumaczenie nazwy ścieżki /usr/ast/mbox na numer i-węzła Pozycja katalogu zawiera wyłącznie numer i-węzła Wojciech Kwedlo, Wykład z Systemów Operacyjnych -25- Wydział Informatyki PB

Systemy plików z kroniką (ang. log) Cel - minimalizacja prawdopodobieństwa katastrofalnej awarii systemu plików, skrócenie czasu naprawy systemu po utracie zasilania. Uwaga: systemy z kronikowaniem nie zastąpią UPSa!!! Specjalny obszar zwany kroniką (ang. journal). Zmiana w systemie plików przebiega w sposób następujący: (a) zapisz (commit) bloki dyskowe które zmieniasz do kroniki - zapisywane są bloki składające się na transakcję (b) jeżeli pierwszy commit powiódł się wykonaj właściwy commit do systemu plików (c) jeżeli drugi zapis się powiódł to możesz (niekoniecznie od razu) usuń bloki z kroniki (kronika działa jak trochę podobnie jak kolejka FIFO. Jeżeli awaria nastąpiła przed zakończeniem (a) to nic się nie dzieje - nastąpi utrata danych, ale system plików pozostanie w stanie spójnym. Jeżeli awaria nastąpi pomiędzy (a) - (b), to przy naprawie systemu plików wykonaj ponowny commit transakcji z kroniki. Różne możliwości funkcjonowania kroniki: (a) kronikowane są bloki z danymi jak i metadanymi (np. tablica i-węzłów, bitmapy i-węzłów i bloków, bloki indeksowe), (b) wyłącznie bloki z metadanymi, po awarii zasilania system plików zachowa spójność ale jest duża szansa na utratę danych plików zapisywanych w momencie awarii. Uwaga: gwarancja pozostawienie systemu plików w stanie spójnym nie oznacza gwarancji że dane przechowywane w pliku będą spójne z punktu widzenia aplikacji. Wojciech Kwedlo, Wykład z Systemów Operacyjnych -26- Wydział Informatyki PB

Strategie optymalizacji wydajności Generalnie powinniśmy dążyć do tego aby kolejne bloki danych tego samego pliku zostały umieszczone w kolejnych blokach na dysku. Programy typu Defrag mogą być bardzo czasochłonne. Inne strategie Prealokacja bloków: jeżeli przy zapisie do pliku potrzebujesz jednego nowego bloku, to przydziel od razu k (typowo k=8,16) bloków zajmujących ciągły obszar dysku, w nadziei, że za chwilę będą potrzebne nowe bloki. Jeżeli dodatkowe bloki nie zostaną wykorzystane, to są zwalniane przy zamykaniu pliku. Wykorzystaj pamięć podręczną Zwiększ rozmiar bloku Wojciech Kwedlo, Wykład z Systemów Operacyjnych -27- Wydział Informatyki PB

Wybór rozmiaru bloku (Tannenbaum, 2004) Prędkość transmisji (KB/sek.) 1000 800 600 400 Wykorzystanie miejsca 200 Prędkość transmisji 20 0 0 0 128 256 512 1K 2K 4K 8K 16K 0 Rozmiar bloku 100 80 60 40 Wykorzystanie przydzielonych bloków (procenty) Pamięć masowa jest podzielona na 512-bajtowe sektory (2048 bajtów w CD-ROMie). Blok dyskowy jest wielokrotnością sektora. Typowe rozmiaru bloku to 1,2,4,8 sektortów. Większy rozmiar bloku => większa prędkość transmisji (mniejsza fragmentacja, czyli mniej ruchów głowicą). Większy rozmiar bloku => mniej efektywne wykorzystanie miejsca na dysku. Przeciętnie z każdym plikiem wiąże się utrata miejsca równa połowie długości bloku Wojciech Kwedlo, Wykład z Systemów Operacyjnych -28- Wydział Informatyki PB

Pamięć podręczna (ang. cache ) dysku Idea: Przeznaczyć część pamięci RAM na przechowywanie najczęściej używanych bloków w celu poprawienia wydajności systemu. Musimy dostarczyć mechanizm (np. tablice mieszające) pozwalający szybko sprawdzić czy blok o numerze i jest w pamięci podręcznej. Jeżeli bloku nie ma to jest on wczytywany z dysku i dodawany do pamięci podręcznej. Musimy określić algorytm wyboru bloku usuwanego z pamięci podręcznej (np. LRU). Musimy określić strategię obsługi zapisów: Write-through zapisywany blok trafia jednocześnie do pamięci podręcznej i na dysk. Blok jest zapisywany z opóźnieniem większa wydajność, ale większe niebezpieczeństwo uszkodzenia systemu. Większość systemów wprowadza maksymalne opóźnienie np. 20 s dla bloków danych zwykłych plików (nie katalogów) i 2 sekundy dla pozostałych bloków Wojciech Kwedlo, Wykład z Systemów Operacyjnych -29- Wydział Informatyki PB

Przykład implementacji pamięci podręcznej Tablica mieszająca Front (LRU) Rear (MRU) lista łańcuchowa Lista LRU Tablica mieszająca: pozwala na szybkie sprawdzenie, czy blok jest w pamięci. Każdy element odpowiada jednej wartości funkcji mieszającej. Każdy blok jest elementem dwóch list: dwukierunkowej listy LRU, oraz listy łańcuchowej na której przechowywane są bloki o identycznej wartości funkcji mieszającej. W przypadku trafienia (ang. cache hit) blok pobrany z pamięci jest przesuwany na koniec listy LRU. Nowy blok jest wczytywany w miejsce bloku na pierwszej pozycje listy i przesuwany na koniec. Wojciech Kwedlo, Wykład z Systemów Operacyjnych -30- Wydział Informatyki PB