Wykład 9 Struktury pamięci masowej



Podobne dokumenty
Systemy operacyjne. dr inż. Marcin Czajkowski. Studia podyplomowe Wydział Informatyki PB

Architektura komputerów

Cele RAID. RAID z ang. Redundant Array of Independent Disks, Nadmiarowa macierz niezależnych dysków.

Macierze RAID MARCEL GAŃCZARCZYK 2TI 1


Systemy plików i zarządzanie pamięcią pomocniczą. Struktura pliku. Koncepcja pliku. Atrybuty pliku

System plików i zarządzanie pamięcią pomocniczą. Koncepcja pliku. Atrybuty pliku. Struktura pliku. Typ pliku nazwa, rozszerzenie (extension)

Pamięci masowe. ATA (Advanced Technology Attachments)

RAID 1. str w przypadku różnych szybkości cała macierz będzie pracowała z maksymalną prędkością najwolniejszego dysku

Wykład 14. Zagadnienia związane z systemem IO

Twardy dysk. -urządzenie pamięci masowej

Wykład 2. Temat: (Nie)zawodność sprzętu komputerowego. Politechnika Gdańska, Inżynieria Biomedyczna. Przedmiot:

ZASADY PRZECHOWYWANIA DANYCH

Pamięci zewnętrzne Dysk magnetyczny:

Zagadnienia związane z systemem IO

Systemy Operacyjne Pamięć masowa

Pamięć wirtualna. Przygotował: Ryszard Kijaka. Wykład 4

Pamięć - parametry. 1. Pojemność 2. Szybkość 3. Koszt 4. Pobór mocy

Urządzenia wej.-wyj. Plan (1) Plan (2)

Urządzenia wej.-wyj.

Urządzenia wej.-wyj. Plan (1) Plan (2) Rodzaje urządzeń wejściawyjścia

Architektura komputerów

Wstęp do informatyki. Interfejsy, urządzenia we/wy i komunikacja. Linie magistrali

Architektura komputerów

dr inŝ. Jarosław Forenc

Macierze RAID. UTK Marek Pudełko

System plików warstwa fizyczna

System plików warstwa fizyczna

System plików warstwa fizyczna

Pamięci zewnętrzne Dysk magnetyczny:

Rys. 1. Rozmiary dysków twardych. Z lewej 3.5, z prawej 2.5.

Dyski SSD a systemy plików

Administracja systemem Linux

Sektor. Systemy Operacyjne

O pamięciach. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

System wejścia-wyjścia

Potrzeba instalacji w napędach SSD akumulatorów ograniczała jednak możliwości miniaturyzacji takich napędów.

Technologie cyfrowe semestr letni 2018/2019

Pliki i systemy plików

GOZ /15 Warszawa, dnia r. WYKONAWCY

dr inż. Jarosław Forenc

Struktura dysku. Dyski podstawowe i dynamiczne

System wejścia-wyjścia

PROJEKTOWANIE SYSTEMÓW KOMPUTEROWYCH

27/13 ZAŁĄCZNIK NR 4 DO SIWZ. 1 Serwery przetwarzania danych. 1.1 Serwery. dostawa, rozmieszczenie i zainstalowanie 2. serwerów przetwarzania danych.

Systemy wejścia-wyjścia. wyjścia

Dodatkowa pamięć w kieszeni - o przenośnych nośnikach danych

Haszowanie (adresowanie rozpraszające, mieszające)

KAM-TECH sklep internetowy

Zarządzanie pamięcią operacyjną

Oferta dysków twardych WD do centrów danych Ewolucja dysków o dużej pojemności

Strojenie systemu Linux pod k¹tem serwera bazy danych Oracle 9i

Technologie informacyjne - wykład 2 -

Szybkie i niezawodne. Źródło. wydajności - typowy kontroler RAID, na zdjęciu - firmy Adaptec, z wieloma kanałami i własnym procesorem.

1 Struktura pamięci masowej. 1.1 Wprowadzenie Algorytmy dostępu do dysku Zarządzanie dyskiem Struktury RAID...

Technologie taśmowe wprowadzenie i zastosowania. Jacek Herold, WCSS

Spis treści. UTK Urządzenie techniki komputerowej

Architektura Komputerów

Architektura komputerów

SYSTEMY OPERACYJNE WYKŁAD 5 OBSŁUGA PAMIĘCI MASOWYCH

Ochrona Danych Wrocław 7 marzec 2007

1. Budowa komputera schemat ogólny.

Dyski półprzewodnikowe

Dyski WD do monitoringu

Systemy Operacyjne. Zarządzanie/Administracja Systemem/Procesami. autor: mgr inż. Andrzej Woźniak

Materiały pomocnicze 1

dr inż. Jarosław Forenc

Bazy danych. Plan wykładu. Model logiczny i fizyczny. Operacje na pliku. Dyski. Mechanizmy składowania

Algorytmy i. Wykład 5: Drzewa. Dr inż. Paweł Kasprowski

System plików. Warstwowy model systemu plików

PODSTAWY INFORMATYKI. Storage Pamięci masowe. Dysk twardy Macierze dyskowe

... Podpis osoby - osób upoważnionych do składania oświadczeń woli w imieniu wykonawcy

DYSKI SSD. Skrót SSD pochodzi od Solid State Disk (albo Drive), co po polsku można przetłumaczyć jako dysk (lub napęd) stały.

ang. file) Pojęcie pliku (ang( Typy plików Atrybuty pliku Fragmentacja wewnętrzna w systemie plików Struktura pliku

Partycje bez tajemnic

Wirtualizacja desktopów i aplikacji.

Informatyka 2. Wykład nr 6 ( ) Plan wykładu nr 6. Politechnika Białostocka. - Wydział Elektryczny

Kinowa Biblioteka Filmowa KINOSERWER. KinoSerwer

dr hab. Joanna Jędrzejowicz Podstawy informatyki i komputeryzacji Gdańska Wyższa Szkoła Humanistyczna

Przykładowe zagadnienia na sprawdzian z wiedzy ogólnej. Linux to nazwa: A. Programu biurowego. B. Systemu operacyjnego. C. Przeglądarki internetowej.

Systemy operacyjne System plików

1. Pliki i ich organizacja

Tworzenie partycji i dysków logicznych

ARCHIWUM PAŃSTWOWE W ZIELONEJ GÓRZE

Pamięci masowe. Historia. HDD (ang. Hard Disk Drive) dysk twardy. NEXT, 5/2009. WIKIPEDIA,

O historycznym systemie DOS. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

Nr sprawy: INF-V Załącznik nr 4 do SIWZ /Załącznik nr 2 do umowy część II/ OPIS PRZEDMIOTU ZAMÓWIENIA CZĘŚĆ II

Najważniejsze zalety. Skuteczność pamięci NAS dla profesjonalnych twórców treści kreatywnych oraz w małych i średnich przedsiębiorstwach

Najważniejsze zalety. Skuteczność pamięci NAS dla profesjonalnych twórców treści kreatywnych oraz w małych i średnich przedsiębiorstwach

Nośniki magnetyczne. Pudełko UTK

Partition Wizard Home Edition Aplikacja przeznaczona do partycjonowania dysków twardych, obsługująca również macierze RAID oraz dyski o pojemności

2,5 cala/3,5 cala USB 3.0 Obudowa SSD/HDD RAID SATA

MAZOWIECKI URZĄD WOJEWÓDZKI W WARSZAWIE D Y R E K T O R G E N E R A L N Y Jarosław Szajner. Warszawa, dn. 11 czerwca 2018r.

Struktura pamięci. masowej

Materiały pomocnicze 1

Architektura komputerów

Fizyczne struktury danych

MODYFIKACJA TREŚCI SIWZ

NOWY OPIS TECHNICZNY PRZEDMIOTU ZAMÓWIENIA

Podstawy Informatyki JA-L i Pamięci

Transkrypt:

Wykład 9 Struktury pamięci masowej -1-

Struktura dysku Głowice Dane przechowywane są na powierzchniach Maksimum dwie powierzchnie na talerzu. Conajmniej jeden talerz Dane znajdują ścieżkach. się na sektor koncentrycznych talerz ścieżka Ścieżki podzielone są na sektory Odpowiednie ścieżki na powierzchniach tworzą cylinder cylinder wszystkich Dane są zapisywane i odczytywane przez powierzchnie głowice. Głowice przesuwane są przez napęd krokowy Wszystkie głowice jednocześnie przesuwane Napęd krokowy są Dysk z wymiennym lub niewymiennym nośnikiem -2-

Przykład IBM 360KB floppy WD 18GB HD Cylinders 40 10601 Tracks per cylinder 2 12 Sectors per track 9 281 (średnio!!!) Sectors per disk 720 35742000 Bytes per sector 512 512 Capacity 360 KB 18.3 GB Seek time (minimum) 6 ms 0.8 ms Seek time (average) 77 ms 6.9 ms Rotation time 200 ms 8.33 ms Spinup time 250 ms 20 sec Sector transfer time 22 ms 17 µsec -3-

Adresowanie dysku Dysk może mieć miliony sektorów. Jak je zaadresować. Metoda 1: Cylinder/Głowica/Sektor. Liczba sektorów na ścieżce może się zmieniać. Metoda 2: Numerowanie sekwencyjne Dysk odwzorowuje globalny numer sektora z zakresu [0-max] na numer cylindra,ścieżki oraz sektora w cylindrze. Odwzorowanie może się zmieniać!!! Przemieszczanie błędnych sektorów Optymalizacja wydajności. Nowoczesne dyski wykorzystują metodę 2. Dzięki temu szczegóły geometrii są ukryte przed systemem operacyjnym Ale zawsze opłaca się w jednym żądaniu odczytywać grupę kolejnych sektorów -4-

Układ sektorów na dysku Wewnętrzne ścieżki są krótsze niż zewnętrzne. Dwa rozwiązania: (a) dłuższe bity (b) więcej sektorów na ścieżkach zewnętrznych Stacja dysków rozwiązanie (a) Nowoczesne dyski (b). elastycznych wykorzystuje wykorzystują rozwiązanie Dysk podzielony jest na kilka stref (8-20). W każdej ze stref na jedną ścieżkę przypada stała liczba sektorów W rozwiązaniu (b) odczyt sektorów ze ścieżek zewnętrznych następuje szybciej. -5-

Zapasowe sektory Ścieżka może zawierać dodatkowe sektory. Gdy dany sektor zaczyna sprawiać problemy (dużo błędów poprawianych przez ECC), przenoszony jest do sektora dodatkowego. Pogarsza to wydajność. Aby temu zapobiec, można na nowo posortować sektory na ścieżce, ale zajmuje to dużo czasu Mechanizm ten jest często ukryty przed systemem operacyjnym -6-

Napędy optyczne - CD-ROM, DVD-ROM,... W napędach optycznych nie mamy koncentrycznych ścieżek, a spiralę. Sektor ma 2KB -7-

Struktura sektora dyskowego Preambuła Dane ECC Preambuła zawiera numer sektora, i cylindra Dane (długość 256, 512 lub 1024 bajty) ECC (ang. error correcting code) nadmiarowe informacje pozwalające na wykrycie (prawie) wszystkich błędów i poprawienie niektórych z nich -8-

Czas wykonania operacji Czas operacji=czas dostępu + Czas transferu Czas dostępu, zależy od dwóch składników. Czas wyszukiwania (ang. seek time) czas niezbędny na ustawienie się głowicy dysku nad właściwym cylindrem. Oczekiwanie aż głowica znajdzie się nad odpowiednim sektorem. Zależy od prędkości obrotowej dysku, średnio ½ czasu wykonania obrotu przez talerz. System operacyjny może próbować optymalizować czas wyszukiwania. Czas transferu też zależy od prędkości obrotowej dysku. Przykład Czas wyszukiwania = 7ms; Czas oczekiwania 4ms => Czas dostępu 11ms Czas transferu 22us (trzy rzędy wielkości mniej!!!) Wniosek: staraj się przesyłać wiele kolejnych sektorów w jednym żądaniu. -9-

Planowanie żądań do dysku Cel: Minimalizuj czas spędzany na przesuwaniu głowicy i oczekiwaniu. Na oczekiwanie mamy niewielki wpływ. Umieszczaj bloki składające się na dany plik w pobliżu siebie. Używaj algorytmów planowania do ustalania kolejności obsługi żądań. Istnieje wiele algorytmów planowania. Przykład: Głowica nad blokiem 53. Zakładamy kolejność żądań: 98, 183, 37, 122, 14, 124, 65, 67 Zakładamy, że kontroler przetwarza jedno żądanie - w nowych dyskach nie jest to do końca prawdą. -10-

Algorytm FCFS (ang. First come, First served) Obsługuj żądania w kolejności zgłoszenia. -11-

Algorytm SSTF (ang. Shortest Seek Time First) Wybierz żądanie o najkrótszym czasie oczekiwania. Możliwość zagłodzenia -12-

Algorytm SCAN Zwany również algorytmem windy (ang. Elevator). Ramię dysku porusza się od jednego końca dysku do drugiego, obsługując po drodze żądania. Po dojściu do końca dysku kierunek poruszania się ramienia ulega zmianie. -13-

Algorytm SCAN: Przykład -14-

Algorytm C-SCAN Ulepszona wersja algorytmu SCAN. Gdy głowica dotrze do końca dysku, natychmiast jest przesuwana z powrotem na początek, bez obsługiwania kolejnych żądań. -15-

Algorytm C-LOOK Ramię przesuwa się, nie do końca a tylko tak daleko aby obsłużyć ostatnie żądanie. -16-

Jaki algorytm wybrać SSTF łatwy do zaimplementowania i ma dobrą wydajność, gdy obciążenie dysku jest niewielkie. Algorytmy typu SCAN mają lepszą wydajność przy dużym obciążeniu dysku Brak możliwości zagłodzenia Wersje LOOK unikają niepotrzebnego przesuwania głowicy Przejście od jednego końca dysku do drugiego jest stosunkowo mało kosztowne. Dlatego C-LOOK jest lepszy niż C-LOOK, bo zapewnia małą wariancję czasu dostępu. Konkluzja: SSTF dla słabo obciążonych systemów C-LOOK dla bardzo obciążonych systemów. Ponadto: Wraz ze wzrostem wyrafinowania elektroniki dysku (duże pamięci cache, integracja z pamięciami FLAS) pojawia się tendencja do implementacji części lub całości algorytmów szeregowania przez kontroler. Przykład: Natywne kolejkowanie komend (NCQ - ang. native command queueing) w standardzie Serial ATA. -17-

Jak zbudować lepszy dysk Wydajność procesorów wzrasta wykładniczo. W przypadku dysków nie jest to prawdą. Niezawodność dysków nie jest wysoka. Czas dostępu jest ograniczony przez mechanikę dysku Nic dziwnego, dysk ma miliony sektorów. Rozwiązanie: wykorzystaj kilka dysków Dane przesyłane równolegle z wielu dysków Dane zapamiętane w paskach (ang. Stripe). Bit parzystości na dodatkowym dysku. Technika nosi nazwę RAID (ang. redudant array of independent drives). -18-

Macierze RAID Redudant Array of Inexpensive Discs Nadmiarowa Macierz Tanich Dysków (Patterson i wsp., 1988) - ma działać lepiej niż SLED (Single Large Expensive Disc) Idea: Zbiór (macierz) dysków dzięki specjalnemu kontrolerowi widoczny dla reszty systemu jako jeden virtualny dysk. Virtualny dysk dzielony jest na paski (ang. strips), które są rozpraszane na dyskach tworzących macierz. Pasek ma rozmiar k-sektorów. Redundancja pozwala na zmniejszenie ryzyka awarii. Ponieważ dyski w macierzy pracują równolegle, żądania mogą być realizowane szybciej. Komercyjnie dostępne poziomy 0,1, 0+1, 4,5-19-

RAID Level 0 Nie jest to prawdziwa macierz RAID - nie ma redundancji. Paski są rozpraszane równomiernie po wszystkich dyskach - pojemność dysku się nie marnuje. Dwa żądania mają szanse dotyczyć dwóch niezależnych dysków i być obsłużone równolegle - krótszy czas oczekiwania na żądanie. Duże żądanie może dotyczyć kilku kolejny pasków (np. strip2,strip3, strip4) wtedy czas oczekiwania jest taki sam, ale czas transmisji się znacznie skraca - dyski pracują równolegle. Awaryjność wzrasta (i to znacznie - patrz wykład ze statystyki) -20-

RAID Level 1 Jeden dysk jest kopią drugiego - odtworzenie stanu macierzy po awarii jest szybkie. Mamy zapewnioną redundancję, ale kosztem dwukrotnego zmniejszenia pojemności. Dla żądań odczytu największa możliwa wydajność ze wszystkich konfiguracji RAID (dwa żądania zawsze mogą być obsłużone równolegle). Żądania zapisu nie są przyspieszane. -21-

RAID Level 4 Jeden z dysków przechowuje bity parzystości - w razie awarii któregoś z dysków brakujące dane można odtworzyć na podstawie bitów parzystości i zawartości pozostałych dysków. Odbudowa po awarii macierzy jest czasochłonna. Bardziej efektywne wykorzystanie pojemności dysków. Każdy Zapis wymaga ponownego obliczenia bitów parzystości, dzięki czemu dysk przechowujący te bity staje się wąskim gardłem przy zapisach. Ponadto zapis może wymagać przeprowadzenia odczytów z innych dysków w celu obliczenia parzystości - potencjalnie dwa odczyty i dwa zapisy jeżeli dane zajmują część paska - dwukrotne spowolnienie -22-

RAID Level 5 Podobnie, jak RAID Level 4, ale paski z parzystością są równomiernie rozproszone po wszystkich dyskach macierzy, co usuwa wąskie gardło przy zapisach. -23-

RAID 0+1 oraz RAID 1+0 RAID 0+1: dwie macierze RAID 0 (z przeplotem) tworzą macierz RAID 1. Minimum 4 dyski. Lepsza wydajność niż RAID 5, ale pojemność macierzy 50%. RAID 1+0 (RAID 10). dwie macierze RAID 1 (mirror) tworzą macierz RAID 0 (z przeplotem). Minimum 4 dyski. Pewne zalety w porównaniu z RAID 0+1: np. może przetrwać awarię dwóch dysków. Schematy RAID 0+1 oraz 1+0 często implementowane programowo (np. większość kontrolerów RAID zintegrowanych z płytami głównymi). -24-

Napędy taśmowe Napęd taśmowy wykorzystuje nośnik wymienny. Jeżeli chodzi o koszt jednego bitu, napęd taśma jest znacznie tańsza od dysku. Prędkość transmisji danych jest porównywalna z dyskiem. Czas dostępu jest bardzo duży, rzędy minut Wymagane jest przewinięcie taśmy. Z powyższych powodów napędy taśmowe wykorzystuje się przede wszystkim do archiwizacji danych zapisanych na dysku i tworzenia kopii zapasowych. W przypadku awarii dysku, kopia zapasowa pozwala na odtworzenie danych -25-

Dostęp danych w dyskowych System operacyjny umożliwia programom użytkownika, dostęp do dysku na dwa sposoby. Sposób 1: Dostęp za pomocą systemu plików. Organizacja systemu plików (np. drzewo katalogów) Prawa dostępu do plików. Operacje otwarcia pliku, odczytu, zapisu i zamknięcia. Alokacja sektorów dysku dla pliku Sposób 2: Dostęp surowy (ang. raw): Dysk traktowany jest jako tablica sektorów. Dostęp surowy często wymaga specjalnych przywilejów. Pominięcie warstwy systemu plików pozwala na zwiększenie wydajności. Przykład 1: Baza danych Oracle. Przykład 2: Program fsck w systemach Unix (naprawiający system plików) -26-

Awaryjność Napędy z nośnikami wymiennymi są bardziej narażone na awarie. Nośniki optyczne są mniej awaryjne niż nośniki magnetyczne. Mniej wrażliwe na zakłócenia wewnętrzne W napędzie z nośnikami niewymiennym głowica nie kontaktuje się z nośnikiem Talerz znajdują się w hermetycznie zamkniętej obudowie. Głowica porusza się na poduszce powietrznej. Kontakt głowicy z nośnikiem (np. w wyniku wstrząsu, upadku) bardzo często prowadzi do awarii. Awaria napędu oznacza utratę danych. W napędzie z nośnikiem wymiennym, po awarii napędu bardzo często nie występuje utrata danych. -27-