Wirtualne systemy dyskowe na platformie OpenStack (KVM) Tomasz Paszkowski PLNOG 2012 Warszawa 06.03.2012 r. ss7pro@gmail.com



Podobne dokumenty
Wirtualizacja bez macierzy? Żaden problem.

Szczypta historii Inteligentne rozmieszczanie. Pierwszy magnetyczny dysk twardy. Macierz RAID. Wirtualizacja. danych

Systemy macierzowe. www. qsantechnology. com

Letnia Akademia SUSE. Implementacja nowych rozwiązań open source wszystko, co musisz wiedzieć!

NOWY OPIS TECHNICZNY PRZEDMIOTU ZAMÓWIENIA

Załącznik nr 1 - Szczegółowy opis przedmiotu zamówieni Specyfikacja techniczna - minimalne obligatoryjne wymagania techniczne, funkcjonalne sprzętu

OPIS TECHNICZNY PRZEDMIOTU ZAMÓWIENIA

Rozwiązania NetApp. Łukasz Grzesiak ArrowECS

Know your tools KVM. Dariusz Puchalak Dariusz_Puchalak < at > ProbosIT.pl

Administracja systemem Linux

Budowanie tanich, wysoko wydajnych i wysoko dostępnych systemów pod Linuksem Mariusz Droździel Październik 2009

OpenContrail jako wtyczka do OpenStacka. Bartosz Górski, Paweł Banaszewski CodiLime

ZAŁOŻENIA PROJEKTOWE I SPECYFIKACJA USŁUG

Synergia świata korporacji i OpenSource na przykładzie IBM Spectrum Protect i OpenStack Swift

2. Kontroler Dwa kontrolery pracujące w trybie active-active wyposażone w min. 32GB cache (każdy). Kontroler oparty na architekturze 64 bitowej.

SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA (SOPZ) część 2. Lp. Nazwa parametru Minimalna wartość parametru Dane techniczne oferowanego sprzętu/model 1. 1.

Wirtualizacja desktopów i aplikacji.

Capgemini IT Projekt lokalnego datacenter i problemy z tym związane

z dnia r. wg załącznika nr 1. Maks. 2 gniazda Gen 3, wszystkie x16

Załącznik Dotyczy: połączeń SAN

Software RAID funkcje dostarcza zaimplementowane oprogramowanie, bez wykorzystania z dedykowanych kontrolerów.

WWQ. Wakacyjne Warsztaty QNAP. Zaczynamy o 11:00. Prowadzący: Łukasz Milic Certyfikowany Trener QNAP

Q E M U.

Wydajny Linux. Jakub Woźniak KN Sieci Komputerowych i Systemów Rozproszonych Tenesys

Wykład 2. Temat: (Nie)zawodność sprzętu komputerowego. Politechnika Gdańska, Inżynieria Biomedyczna. Przedmiot:

Wydaj mniej i chroń więcej z Software Defined Storage

OPIS PRZEDMIOTU ZAMÓWIENIA

ZAPYTANIE OFERTOWE. Medialab s.c. Bożena Rożenek, Zbigniew Rożenek, Łódź

2014 LENOVO INTERNAL. ALL RIGHTS RESERVED

szczegółowy opis przedmiotu zamówienia: macierz wyposażona w dwa kontrolery UWAGA!: w ofercie należy wycenić 2 szt. CPV:

Zarządzanie infrastrukturą serwerów Blade

Dyski wirtualne w technologi IBM kolejne poziomy Matrixa

Sposoby klastrowania aplikacji webowych w oparciu o rozwiązania OpenSource. Piotr Klimek. piko@piko.homelinux.net

Cele RAID. RAID z ang. Redundant Array of Independent Disks, Nadmiarowa macierz niezależnych dysków.

ARCHIWUM PAŃSTWOWE W ZIELONEJ GÓRZE

Fujitsu World Tour 2019

Jarosław Kuchta. Administrowanie Systemami Komputerowymi. System plików

Dane bezpieczne w chmurze

Zarządzanie farmami serwerów Linux

Metody i narzędzia ewaluacji

Numer ogłoszenia w BZP: ; data zamieszczenia w BZP: Informacje o zmienianym ogłoszeniu: data r.

Wirtualizacja Hyper-V: sposoby wykorzystania i najnowsze wyniki badań

Nowe produkty w ofercie Red Hat

SZCZEGÓŁOWY OPIS ZAMÓWIENIA. PAKIET 1 minimalna gwarancja 36 miesięcy

1. ZESTAWIENIE PARAMETRÓW TECHNICZNO - JAKOŚCIOWYCH

CZĘŚĆ I DOSTAWA SERWERA W OBUDOWIE Z WYPOSAŻENIEM

1. Minimalne wymagania dla serwera baz danych

CZĘŚĆ XV. Serwer stelażowy węzeł klastra obliczeniowego

... Podpis osoby - osób upoważnionych do składania oświadczeń woli w imieniu wykonawcy

Formularz specyfikacji techniczno cenowej zamawianych/oferowanych serwerów

Załacznik nr 6 do SIWZ. 1. Macierz Dyskowa ilość: 1 szt. NAZWA PRODCENTA:.

TSMBOX. Backup Appliance Build for Recovery Speed. Przemysław Jagoda. Zbigniew Parys

Linux Contextualization

OPIS PRZEDMIOTU ZAMÓWIENIA

1. Serwer rack typ 1 Liczba sztuk: 2

SPECYFIKACJA TECHNICZNA / OPIS PRZEDMIOTU ZAMÓWIENIA

StoreOnce - To więcej niż Backup2Disk

ZAŁĄCZNIK NR 1.8 do PFU Serwery wraz z system do tworzenia kopii zapasowych i archiwizacji danych - wyposażenie serwerowni

Konsolidacja wysokowydajnych systemów IT. Macierze IBM DS8870 Serwery IBM Power Przykładowe wdrożenia

GOZ /15 Warszawa, dnia r. WYKONAWCY

Dell EMC Ready Solutions for Software Defined Data Center GLOBAL SPONSORS

IV. Wymagane parametry techniczne platformy sprzętowo-programowej (serwera) do zarządzania oprogramowaniem do wykonywania kopii zapasowych szt. 1.

Projektowanie i implementacja wysokowydajnych aplikacji w języku

ZP10/2016: Wdrożenie usług E-zdrowie w SP ZOZ Nowe Miasto nad Pilicą.

Zaproszenie do składania ofert. Numer wewnętrzny zapytania ofertowego 02/10/2013

Narzędzia umożliwiające tworzenie scentralizowanej polityki prowadzenia backupów. Adrian Marczyk

Specyfikacje techniczne

Specyfikacja techniczna

Projekt Fstorage. Łukasz Podkalicki Bartosz Kropiewnicki

Nr sprawy: INF-V Załącznik nr 4 do SIWZ /Załącznik nr 2 do umowy część II/ OPIS PRZEDMIOTU ZAMÓWIENIA CZĘŚĆ II

Suma: B) Oprogramowanie do wykonywania kopii bezpieczeństwa (1 licencja) Cena (zł/szt.) Cena łącznie. Suma:

Załącznik nr 1 do projektu umowy Szczegółowy opis przedmiotu zamówienia

Rozwiązania HPE Storage jak zapewnić pełne bezpieczeństwo Twoich danych?

Ochrona danych z NETGEAR Storage. Wykonywanie kopii zapasowych oraz odtwarzanie danych w środowisku SMB oraz Multi-Office

TABELA PORÓWNAWCZA OFEROWANEGO SPRZĘTU

Przedmiotem zadania jest dostawa biblioteki taśmowej o parametrach nie gorszych niż:

Wykaz oferowanego sprzętu komputerowego i oprogramowania podstawowego

Załącznik 1A Opis wymagań w zakresie modernizacji serwerowni:

Big Data. Czym jest Big Data?

GLOBALNA DEDUPLIKACJA BLOKOWA W ŚRODOWISKU BACULA

Wirtualizacja infrastruktury według VMware. Michał Małka DNS Polska

SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA / FORMULARZ ZESTAWIENIA OFEROWANYCH ROZWIĄZAŃ. przetarg nieograniczony. na:

Załącznik nr 4a do Specyfikacji Istotnych Warunków Zamówienia

Elastyczna sieć dla rozwiązań Cloud Open vswitch

Opis Przedmiotu Zamówienia

SPECYFIKACJA TECHNICZNA PRZEDMIOTU ZAMÓWIENIA

Proponowana architektura ZPT

5. Karta graficzna Zintegrowana karta graficzna. bez zmian 6. Wbudowane porty 4x USB 2.0 lub 3.0; bez zmian

Opis przedmiotu zamówienia / Formularz Oferty Technicznej (dokument należy złożyć wraz z ofertą)

Monitorowanie VMware Rafał Szypułka Service Management Solution Architect IBM Software Services for Tivoli

STACJI ROBOCZYCH WIRTUALIZACJA W SEKTORZE MŚP. Krzysztof Waszkiewicz, BZ WBK Michał Aleksander Kania, EMC

Składamy ofertę na: ... PLN. Załącznik nr 1 do SIWZ ZAMAWIAJĄCY: WYKONAWCA:

Petabajtowe systemy przechowywania danych dla dostawców treści

Zadanie nr 1.2: Macierz RAID. Lp. Zwartość karty Opis 1 Specyfikacja techniczna / funkcjonalna przedmiotu zamówienia

Instytut Pamięci Narodowej Komisja Ścigania Zbrodni przeciwko Narodowi Polskiemu

Zasady licencjonowania produktów bazodanowych ORACLE

Partition Wizard Home Edition Aplikacja przeznaczona do partycjonowania dysków twardych, obsługująca również macierze RAID oraz dyski o pojemności

PARAMETRY OFEROWANEGO SPRZĘTU Należy przedstawić producenta i model wraz z parametrami urządzenia 1) Komputer stacjonarny typu All-In-One.

Pamięci masowe. ATA (Advanced Technology Attachments)

Red Hat Grafton Kompletna platforma do wirtualizacji dla MSP w nowej odsłonie

Transkrypt:

Wirtualne systemy dyskowe na platformie OpenStack (KVM) Tomasz Paszkowski PLNOG 2012 Warszawa 06.03.2012 r. ss7pro@gmail.com PLNOG Warszawa 2012 Tomasz Paszkowski 1

Wirtualne systemy dyskowe w OpenStack Nova-volume ISCSI CEPH, RBD (KVM) SHEEPDOG (KVM) VSA (Zadara) Glance SWIFT S3 RBD SWIFT PLNOG Warszawa 2012 Tomasz Paszkowski 2

CEPH Rozproszony sieciowy system przechowywania danych zbudowany w architekturze scale-out (cloud friendly). PLNOG Warszawa 2012 Tomasz Paszkowski 3

CEPH OpenSource SPOF free Brak tzw. wąskich gardeł Brak specjalnych wymagań sprzętowych (commodity hardware) Wydajny (limitem jest jedynie szybkość dysków) Aktywnie rozwijany Aktywna społeczność zgromadzona wokół projektu (irc, lista mailingowa) PLNOG Warszawa 2012 Tomasz Paszkowski 4

CEPH, RBD Rados Block Device (RBD), dwa główne komponenty systemu: mon - nadzorca systemu osd - storage daemon, per pojedyńczy dysk (urządzenie blokowe) PLNOG Warszawa 2012 Tomasz Paszkowski 5

CEPH, RBD, MON MON nadzorca systemu. Bardzo lekki proces który odpowiedzialny jest za: Zarządzanie klastrem (min. polityka dystrybucji danych na dyski twarde, lista węzłów) Pośredniczy przy inicjacji połączenia od klientów, dalsza komunikacja bezpośrednio z klastrem (osd) Wbudowany tryb active/active Brain split, nie możliwy. Quorum N/2+1 (min. 3, nie parzysta suma) PLNOG Warszawa 2012 Tomasz Paszkowski 6

CEPH, RBD, OSD OSD storage daemon. Odpowiedzialny za zapis/odczyt danych z dysków. Każdy dysk/urządzenie blokowe ma dedykowany proces (izolacja awarii) Replikuje zapisy danych na kolejne węzły (dowolna ilość kopi danych Pełen load balancing przy odczytach Journaling DO wyboru tryb (ack-writeahead/commitparallel)! PLNOG Warszawa 2012 Tomasz Paszkowski 7

CEPH, RBD, Architektura PLNOG Warszawa 2012 Tomasz Paszkowski 8

CEPH, RBD, Pule Pule: Przechowują obiekty Definicja reguł dostępu i autoryzacji (ACL+ AUTH) Definicja ilości kopi danych (RAID) Definicja ilości PG Definicja algorytmu rozmieszczenia danych (CRUSH) PLNOG Warszawa 2012 Tomasz Paszkowski 9

CEPH, RBD, PG Placment group: Zawiera obiekty podzielone na 4MB bloki Przydział bloku do PG na podstawie funkcji hash z block # Ilość PG w puli determinuje na maksymalnie ile różnych urządzeń może trafić obiekt PG powiązana z dyskami twardymi za pomocą algorytmu CRUSH PLNOG Warszawa 2012 Tomasz Paszkowski 10

CEPH, RBD, Crush Crush: Algorytm odpowiedzialny za deterministyczne rozmieszczenia PG na dyskach Brak bazy danych. Przypisanie PG do dysków oparte o funkcje hash Algorytm ma na celu takie umieszczanie danych aby unikać trzymania kopi na tych samych: dyskach, serwerach, szafach, rzędach szaf, stref szaf PLNOG Warszawa 2012 Tomasz Paszkowski 11

CEPH, RBD, Crush PLNOG Warszawa 2012 Tomasz Paszkowski 12

CEPH, RBD, OSD Jak budować OSD: Każdy zapis wykonywany dwa razy: journal + storage Journal powinien być na SSD lub architektura jeden dysk + jeden dysk journal. OSD trzyma bloki danych w systemie plików. Najwydajniejszy to btrfs. Najbezpieczniejszy XFS. Ext4 jako złoty środek (uwaga limit na xattr) Dyski do OSD można podłączać w dowolnej technologi, na której można zamontować PLNOG Warszawa 2012 Tomasz Paszkowski 13

CEPH, RBD, client Jak podłączyć RBD do serwera: Modprobe rbd; echo "192.168.1.1,192.168.2.1 name=rbduser,secret=dupa.8 rbd userimage1" > /sys/bus/rbd/add Natywne wsparcie w Qemu/KVM (bezpośrednio z hypervisora). Z pominięciem całego narzutu kernel space: qemu-systemx86_64 --drive format=rbd,file=rbd:rbd/userimage1 Libvirt wspiera rbd PLNOG Warszawa 2012 Tomasz Paszkowski 14 RadosGW. Fastcgi RESTfull module

CEPH, RBD, RadosGW C++ (performance) fastcgi Atomic PUT (temporary PUT, clone) Atomic GET (data tag) Scale-out ready! RGW vs Swift (dobrze oskryptowany rsync) PLNOG Warszawa 2012 Tomasz Paszkowski 15

CEPH, RBD, Co w planach Baza danych Key/value z prawdziwego zdarzenia (przeróbka projektu leveldb). Caching Distributed key/value store with cache!! ROCKS!!!! PLNOG Warszawa 2012 Tomasz Paszkowski 16

CEPH, LEVELDB PLNOG Warszawa 2012 Tomasz Paszkowski 17

CEPH, RBD, Co w planach Libvirt storage pool Implementacja base image (qcow) tzw. image layering PLNOG Warszawa 2012 Tomasz Paszkowski 18

Qcow image layering qemu-img info /var/lib/nova/instances/instance-00000007/disk image: /var/lib/nova/instances/instance-00000007/disk file format: qcow2 virtual size: 2.0G (2147483648 bytes) disk size: 44M cluster_size: 2097152 backing file: /var/lib/nova/instances/_base/36a8aff19301b9751da6041732b329c3714bc9c1 actual path: /var/lib/nova/instances/_base/36a8aff19301b9751da6041732b329c3714bc9c1 Copy on write image Oszczędność przestrzeni dyskowej Obraz ściągany z glance tylko raz (openstack) per serwer W przypadku rbd tylko jedna kopia obrazu na cały cloud!!!!!! PLNOG Warszawa 2012 Tomasz Paszkowski 19

Dlaczego nie Enterprise? PLNOG Warszawa 2012 Tomasz Paszkowski 20

Scale-out vs Scale-up Scale-out Dużo, bardzo dużo Commodity (tanio, bardzo tanio) Architektura gotowa na obsługę awarii, awaria pojedynczego komponentu nie ma znaczenia dla systemu Rozbudowa systemu o dowolne komponenty (dowolne serwery, dyski twarde,...) Prawdzie rozwiązanie cloud PLNOG Warszawa 2012 Tomasz Paszkowski 21

Scale-out vs Scale-up Scale-up Pojedyncze bardzo rozbudowane komponenty Enterprise (drogo, bardzo drogo) Architektura gotowa na obsługę awarii, awaria pojedynczego komponentu ma wpływ na wydajność całego systemu (np. redundatne kontrolery w macierzy enterprise) Vendor & Technology lock in! To nie jest cloud! PLNOG Warszawa 2012 Tomasz Paszkowski 22

Dlaczego nie iscsi? PLNOG Warszawa 2012 Tomasz Paszkowski 23

Dlaczego nie iscsi iscsi @ Linux (Solaris) HA tylko z DRDB (maks. 2 węzły w active/active). Dodatkowo potrzebny peacemaker do ustawiania aktywnego targetu Qemu nie rozpoznaje urządzeń iscsi (konieczne urządzenie blokowe). Dodatkowy kod w kernel space do wykonania. ISCSI @ Enterprise Scale-out vs Scale-up PLNOG Warszawa 2012 Tomasz Paszkowski 24

Dlaczego nie glsuter/inny poprzez fuse? Wielokrotne kopiowanie danych: Qemu(us) - fuse (ks) fuse (us) tcp/ip (ks) Qemu-rbd(us) tcp/ip ks PLNOG Warszawa 2012 Tomasz Paszkowski 25

OpenStack PLNOG Warszawa 2012 Tomasz Paszkowski 26

CEPH, RBD, OpenStack GLANCE Obraz systemów można trzymać bezpośrednio w rbd: rbd_store_pool=pool rbd_store_chunk_size=4 rbd_store_chunk_size=/etc/ceph/ceph.conf That's all :-) PLNOG Warszawa 2012 Tomasz Paszkowski 27

CEPH, RBD, OpenStack novavolume Obraz systemów można trzymać bezpośrednio w rbd: --volume_driver=nova.volume.driver.rbddriver --rbd_pool=rbd qemu-img convert -f qcow2 -O rbd /srv/qemuimages/userimage.qcow2 rbd:rbd/userimage PLNOG Warszawa 2012 Tomasz Paszkowski 28

Pytania? ss7pro@gmail.com PLNOG Warszawa 2012 Tomasz Paszkowski 29