Coraz więcej danych. Prognoza rynku storage do 2010 roku



Podobne dokumenty
Rodzaje pamięci masowych by Silas Mariusz

Systemy macierzowe. www. qsantechnology. com

Rozwiązania HPE Storage jak zapewnić pełne bezpieczeństwo Twoich danych?

27/13 ZAŁĄCZNIK NR 4 DO SIWZ. 1 Serwery przetwarzania danych. 1.1 Serwery. dostawa, rozmieszczenie i zainstalowanie 2. serwerów przetwarzania danych.

... Podpis osoby - osób upoważnionych do składania oświadczeń woli w imieniu wykonawcy

HUAWEI TECHNOLOGIES CO., LTD. BACKUPCUBE BUNDLE APPLIANCE

Cele RAID. RAID z ang. Redundant Array of Independent Disks, Nadmiarowa macierz niezależnych dysków.

NOWY OPIS TECHNICZNY PRZEDMIOTU ZAMÓWIENIA

Odpowiedź II wyjaśnienie na zapytania do Specyfikacji Istotnych Warunków Zamówienia.

IBM FlashSystem V9000

StoreOnce - To więcej niż Backup2Disk

Zmiana treści Specyfikacji Istotnych Warunków Zamówienia.

szczegółowy opis przedmiotu zamówienia: macierz wyposażona w dwa kontrolery UWAGA!: w ofercie należy wycenić 2 szt. CPV:

ZAŁOŻENIA PROJEKTOWE I SPECYFIKACJA USŁUG

Szczegółowy Opis Przedmiotu Zamówienia

Software RAID funkcje dostarcza zaimplementowane oprogramowanie, bez wykorzystania z dedykowanych kontrolerów.

2. Kontroler Dwa kontrolery pracujące w trybie active-active wyposażone w min. 32GB cache (każdy). Kontroler oparty na architekturze 64 bitowej.

PRZETARG 01/EU/2016/SERVERS NA DOSTAWĘ, MONTAŻ I URUCHOMIENIE SERWERÓW, WIRTUALIZATORÓW, MACIERZY I OPROGRAMOWANIA ORAZ WYKUP STAREGO SPRZĘTU

Zarządzanie infrastrukturą serwerów Blade

OPIS TECHNICZNY PRZEDMIOTU ZAMÓWIENIA

Zmiana treści Specyfikacji Istotnych Warunków Zamówienia.

Opis przedmiotu zamówienia

IV. Wymagane parametry techniczne platformy sprzętowo-programowej (serwera) do zarządzania oprogramowaniem do wykonywania kopii zapasowych szt. 1.

Referat pracy dyplomowej

Szybki przewodnik po produkcie. EMC DataDomain

Symantec Backup Exec System Recovery 7.0 Server Edition. Odtwarzanie systemu Windows w ciągu najwyżej kilkudziesięciu minut nie godzin czy dni

Nr sprawy: INF-V Załącznik nr 4 do SIWZ /Załącznik nr 2 do umowy część II/ OPIS PRZEDMIOTU ZAMÓWIENIA CZĘŚĆ II

AE/ZP-27-16/14. Oprogramowanie do wykonywania kopii zapasowych oraz zarządzania maszynami wirtualnymi

Sposób funkcjonowania

Produkty Tivoli dla każdego Wybrane przykłady wdrożeń

Fujitsu World Tour 2018

EPA Systemy Sp. z o.o. Przedstawiciel CTERA Networks Ltd w Polsce Tel gbi@profipc.pl CTERA

Załacznik nr 6 do SIWZ. 1. Macierz Dyskowa ilość: 1 szt. NAZWA PRODCENTA:.

Przedmiotem zadania jest dostawa biblioteki taśmowej o parametrach nie gorszych niż:

Przetwarzanie i zabezpieczenie danych w zewnętrznym DATA CENTER

EZ/2009/697/92/09/ML Warszawa, dnia r.

Petabajtowe systemy przechowywania danych dla dostawców treści

Standard określania klasy systemu informatycznego resortu finansów

Załącznik nr 1 - Szczegółowy opis przedmiotu zamówieni Specyfikacja techniczna - minimalne obligatoryjne wymagania techniczne, funkcjonalne sprzętu

Instalacja SQL Server Express. Logowanie na stronie Microsoftu

High Performance Computers in Cyfronet. Andrzej Oziębło Zakopane, marzec 2009

ZAŁĄCZNIK NR 1.8 do PFU Serwery wraz z system do tworzenia kopii zapasowych i archiwizacji danych - wyposażenie serwerowni

MODYFIKACJA TREŚCI SIWZ

SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA (SOPZ) część 2. Lp. Nazwa parametru Minimalna wartość parametru Dane techniczne oferowanego sprzętu/model 1. 1.

Zapytanie ofertowe nr 03/05/2014. Zakup licencji na oprogramowanie do wirtualizacji Działanie POIG 8.2

Koncepcja wirtualnej pracowni GIS w oparciu o oprogramowanie open source

Rozwiązania NetApp. Łukasz Grzesiak ArrowECS

PRZETARG 01/EU/2016/SERVERS NA DOSTAWĘ, MONTAŻ I URUCHOMIENIE SERWERÓW, WIRTUALIZATORÓW, MACIERZY I OPROGRAMOWANIA ORAZ WYKUP STAREGO SPRZĘTU

STACJI ROBOCZYCH WIRTUALIZACJA W SEKTORZE MŚP. Krzysztof Waszkiewicz, BZ WBK Michał Aleksander Kania, EMC

Xopero Backup Appliance

Pamięci masowe. ATA (Advanced Technology Attachments)

ZAPYTANIE OFERTOWE. Wytworzenie i wprowadzenie na rynek platformy zarządzania systemami chmur obliczeniowych

EPA Systemy Sp. z o.o. Przedstawiciel CTERA Networks Ltd w Polsce Tel CTERA

CZY TWOJE ŚRODOWISKO PLIKOWE RÓWNIEŻ ROŚNIE SZYBCIEJ NIŻ BAZODANOWE?

Case Study: Migracja 100 serwerów Warsaw Data Center z platformy wirtualizacji OpenSource na platformę Microsoft Hyper-V

Dane bezpieczne w chmurze

Macierze RAID MARCEL GAŃCZARCZYK 2TI 1

ARCHIWUM PAŃSTWOWE W ZIELONEJ GÓRZE

Ochrona Danych Wrocław 7 marzec 2007

Oprogramowanie do wirtualizacji

(kody CPV: i )

IBM POWER8 dla SAP HANA

Dokumentacja techniczna SIS2-SAD

The Right Direction.

Kraków Wrocław Poznań Warszawa Gdańsk CLOUD SERVICES & DATA CENTER

Win Admin Replikator Instrukcja Obsługi

Specyfikacja techniczna

SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA. Wieloprocesorowa typu SMP

Implementing HP Rack and Tower & HP BladeSystem Server Solutions

Sposoby klastrowania aplikacji webowych w oparciu o rozwiązania OpenSource. Piotr Klimek. piko@piko.homelinux.net

1.1. Założenia dla architektury korporacyjnej EPL


Wykład 2. Temat: (Nie)zawodność sprzętu komputerowego. Politechnika Gdańska, Inżynieria Biomedyczna. Przedmiot:

Problemy niezawodnego przetwarzania w systemach zorientowanych na usługi

Usługi utrzymaniowe infrastruktury SI PSZ

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

Odpowiedzi Zamawiającego w ramach zgłoszonych wniosków o wyjaśnienie SIWZ Dostarczenie oraz wdroŝenie Systemu kopii bezpieczeństwa (Backup)

Opis przedmiotu zamówienia. Modernizacja środowiska składowania danych

PureSystems zautomatyzowane środowisko aplikacyjne. Emilia Smółko Software IT Architect

TSMBOX. Backup Appliance Build for Recovery Speed. Przemysław Jagoda. Zbigniew Parys

HP StoreOnce B6200 Przykład wdrożenia

WZÓR UMOWY. Zawarta w Białymstoku, w dniu.. pomiędzy:

TABELA PORÓWNAWCZA OFEROWANEGO SPRZĘTU

Szybki przewodnik po produkcie. EMC Avamar

Video Recording Manager 2.0. Przegląd systemu

Do kogo kierujemy ofertę?

Sieciowe dyski wirtualne oraz VM platforma jako usługa. Bogusław Kaczałek Kon-dor GIS Konsulting

Od czego zacząć przy budowaniu środowisk wysokiej dostępności?

Nowe rozwiązania systemów pamięci masowej połączonych firm Overland Storage i Tandberg Data

Tworzenie i obsługa wirtualnego laboratorium komputerowego

MAZOWIECKI URZĄD WOJEWÓDZKI W WARSZAWIE D Y R E K T O R G E N E R A L N Y Jarosław Szajner. Warszawa, dn. 11 czerwca 2018r.

Czy Software-Defined Storage oznacza kres rozwiązań sprzętowych HP StoreOnce? Marek Kozicki / Mariusz Grabowski Wyzwania IT, 14 kwietnia 2015r.

Wirtualizacja desktopów i aplikacji.

ZAPYTANIE OFERTOWE. Zamawiający. Przedmiot zapytania ofertowego. Wrocław, dnia r.

Kinowa Biblioteka Filmowa KINOSERWER. KinoSerwer

Zadanie nr 1.2: Macierz RAID. Lp. Zwartość karty Opis 1 Specyfikacja techniczna / funkcjonalna przedmiotu zamówienia

Jeden partner wiele rozwiązań, jak wybrać to właściwe

Konsolidacja wysokowydajnych systemów IT. Macierze IBM DS8870 Serwery IBM Power Przykładowe wdrożenia

Zapytanie Ofertowe. Osobą udzielającą wyjaśnień w sprawie niniejszego zamówienia jest Zbigniew Gawrych (tel ).

Kopie zapasowe tak szybko, że nie poczujesz

Transkrypt:

Prognoza rynku storage do 2010 roku Coraz więcej danych Zarówno Gartner, jak i IDC przewidują w najbliższych latach wzrost rynku pamięci masowych. Analitycy Gartnera prognozują stały wzrost zainteresowania zakupami urządzeń i usług, natomiast IDC koncentruje się na rosnącej ilości przechowywanych danych. Zdaniem Gartnera, w 2006 r. światowy rynek usług związanych z pamięciami masowymi wart był 25 mld USD, z czego prawie 10 mld USD stanowiły usługi wsparcia sprzętowego. Porównując te liczby z wynikami z ubiegłego roku, oznacza to roczny wzrost o 8% twierdzą twórcy raportu Magic Quadrant for Storage Services. Analitycy prognozują wzrost rynku w 2010 r. do 33 mld USD. Konkurencja i kooperacja Autorzy analiz podkreślają, że w ciągu ostatnich pięciu lat rynek usług storage bardzo się rozwinął. Pozycję liderów rynku utrzymują trzy firmy: HP, IBM i EMC. Analitycy podkreślają, że rynek usług związanych z pamięciami masowymi wchodzi w dojrzałą fazę. Prawie wszyscy gracze w gartnerowskim kwadracie umieszczeni zostali w kategoriach Leaders oraz Challengers, a jedynie Brocade sklasyfikowany został jako gracz niszowy. Firma ta w styczniu 2007 r. kupiła przedsiębiorstwo McData, specjalizujące się w zaawansowanych usługach replikacji danych na duże odległości w rozległych sieciach SAN, i w swojej strategii zakłada dalszy rozwój tego rodzaju oprogramowania. Dalszy rozwój rynku stymulowany jest nie tylko przez konkurencję, ale też poprzez współpracę. W czerwcu 2007 r. firmy Hitachi Data Systems i HP rozszerzyły porozumienie OEM dotyczące oprogramowania do zarządzania zasobami pamięci masowych. Na mocy umowy Hitachi połączył pakiet HP Storage Essentials z własnym oprogramowaniem. Big Bang informacji IDC przygotowało raport prognozujący wzrost ilości przetwarzanych danych w ciągu najbliższych kilku lat. Z opracowania The Expanding Digital Universe: A Forecast of Worldwide Information Growth Through 2010 wynika, że w 2010 r. na świecie będzie przetwarzanych prawie bilion gigabajtów cyfrowych danych. Według szacunków analityków, w 2006 r. na wszystkich nośnikach na świecie przechowywanych było 161 exabajtów danych (161 mld gigabajtów). Gdyby wielkość tę porównać do liczby napisanych i wydrukowanych kiedykolwiek książek, to okazałoby się, że zgromadzonych elektronicznie danych jest ok. 3 mln razy więcej. Aby jeszcze bardziej uzmysłowić tę wielkość, analitycy użyli porównania ilości danych z liczbą książek ustawioną jedna na drugiej. Otóż, gdyby gromadzone elektronicznie dane zapisać na tradycyjnym papierze, to wysokość woluminów jeden na drugim sięgnęłaby 12 odległości z Ziemi do Słońca, która równa jest 150 mln km. Według IDC, najszybciej rosnąć będą informacje elektroniczne przechowywane przez osoby prywatne. Przesłanką do tego twierdzenia jest nie tylko lawinowy w ostatnim czasie wzrost liczby posiadanych urządzeń do cyfrowego zapisu obrazu i dźwięku, ale także wzrost popularności serwisów przechowujących te dane. Z drugiej strony ilość informacji składowana przez przedsiębiorstwa i instytucje użytku publicz-

Wirtualizacja macierzy dyskowych nego także przyrasta lawinowo. Na wzrost ten wpływa nie tylko powiększająca się liczba danych przechowywanych przez systemy klasy ERP, CRM i e-commerce, ale także składowane w bazach danych skany dokumentów, zdjęć np. w medycynie czy zapisów rozmów telefonicznych. Przedsiębiorstwa muszą być przygotowane na dalszą ekspansję wolumenu danych wynikającą z konieczności gromadzenia cech i zachowań klientów przechowywanych w systemach transakcyjnych i systemach finansowo-księgowych. Działające we współpracy z tymi systemami hurtownie danych wymagać będą coraz więcej miejsca na przechowywane informacje. Korzystać z nich będą systemy klasy Business Intelligence i Data Minig najbardziej innowacyjnych firm. Każde przedsiębiorstwo od firm z sektora MSP po duże korporacje potrzebuje także coraz więcej miejsca na dyskach do przechowywania poczty elektronicznej. W ubiegłym roku pokaźnym generatorem danych były także komunikatory internetowe i poczta elektroniczna. E-mailem przekazywane są obecnie nie tylko dokumenty, ale także prezentacje multimedialne, filmy i nagrane rozmowy telefoniczne. Liczbę samych skrzynek pocztowych IDC szacuje na 1,6 mld. Objętość przesłanych w 2006 r. wiadomości e-mail (bez spamu) sięga 6 mld GB. Mniej taśmy Na tle optymistycznych prognoz rozwoju dla całego rynku pamięci masowych, gorsze wyniki notują producenci bibliotek taśmowych. Firma Freeman Reports, specjalizująca się w analizie rynku pamięci masowych, podaje, że sprzedaż bibliotek taśmowych zmniejszyła się o 4,5%, a przychody producentów spadły o ponad 15% i osiągnęły poziom 1,81 mld USD. Eksperci Freeman Reports twierdzą, że efekt ten jest konsekwencją pojawienia się w ofercie tanich macierzy zawierających dyski ATA (SATA). Spadek popytu na biblioteki taśmowe jest znaczący, szczególnie w odniesieniu do obserwowanych na przestrzeni ostatnich lat wzrostów wynoszących ok. 10% rocznie. Wspólna przestrzeń Umieszczenie zasobów w jednej wirtualnej przestrzeni dyskowej ułatwia planowanie rozwoju infrastruktury i bardziej racjonalne zarządzanie inwestycjami informatycznymi. Podnosi wydajność systemów i zwiększa ich dostępność dla użytkowników. Według powszechnie stosowanej definicji wirtualizacja pamięci masowych oznacza przezroczystość transferu danych na poziomie zapisu/odczytu bloków. W skrócie oznacza to odmiejscowienie zasobów i sprowadzenie wszystkich fizycznych nośników informacji do jednej puli, z której poszczególne systemy i aplikacje firmy mogą korzystać zgodnie z polityką wyznaczoną przez administratora. Proces ten ułatwia oddzielenie dostępu logicznego do danych od dostępu do fizycznych nośników. Katalog korzyści płynących z wirtualizacji otwierają niższe koszty rozbudowy systemów pamięci masowych i zarządzania nimi. Jednocześnie wirtualizacja sprzyja lepszemu wykorzystaniu istniejących zasobów dyskowych, a przede wszystkim podniesieniu bezpieczeństwa danych. Dostawcy promują wirtualizację pamięci masowych jako rozwiązanie działające na wielu platformach. Technologie wirtualizacji istotnie wpływają na skalowalność, zwiększając użyteczność systemów pamięci mówi Bob Passmore, wiceprezes Gartner Research. W niedawnym badaniu IDC dotyczącym wirtualizacji Storage Virtualization Survey, którego wyniki opublikowane zostały w grudniu 2006 r., Laura DuBois, dyrektor działu Storage Software stwierdza, że wirtualizacja pamięci wchodzi w okres swojego największego rozwoju. Analitycy IDC podkreślają, że aż 49% respondentów z całego świata jest w trakcie ewaluacji wdrożenia wirtualizacji, natomiast 34% już zaimplementowało wirtualizację pamięci masowych w swoich przedsiębiorstwach. Zarządzanie dyskami logicznymi Wirtualizacja zasobów dyskowych pozwala na dokonywanie dowolnych operacji na fizycznych blokach danych w urządzeniach dyskowych w sposób niewidoczny, przezroczysty dla aplikacji, np. przenoszenie bloków pomiędzy napędami, łączenie bloków (fizycznych LUN) znajdujących się na różnych urządzeniach dyskowych w ramach jednego wirtualnego dysku logicznego i dzielenie fizycznych LUN na mniejsze, wirtualne dyski logiczne. Producenci rozwiązań wirtualizacyjnych dążą do tego, by zasoby dyskowe dostępne na różnych typach sieciowych pamięci masowych, czyli urządzeniach SAN, NAS, a także systemach pamięci masowej dołączonych bezpośrednio do serwera, stanowiły jedną wspólną przestrzeń. Dla dużych i średnich firm wirtualizacja może być najlepszym sposobem na obniżenie rosnących kosztów utrzymania zasobów: ułatwia zarządzanie już istniejącymi zasobami i podłączanie nowych zasobów dyskowych, umożliwia łączenie starych pamięci dyskowych z nowymi. Dostęp do wszystkich dysków HP od wielu lat wdraża unikalne rozwiązanie w zakresie wirtualizacji. Rozwiązaniem działającym w heterogenicznym środowisku SAN jest SVS200. Oprogramowanie StorageWorks External Storage XP umożliwia podłączenie do SVS200 zewnętrznych macierzy HP MSA, EVA i XP oraz macierzy firm EMC, HDS i IBM. Urządzenie to, dzięki wirtualizacji, umożliwia replikację danych między macierzami różnych producentów i migrację danych z drogich systemów pamięci masowej do bardziej ekonomicznych macierzy modułowych. Na szczególną uwagę zasługuje rozwiązanie wirtualizacyjne na poziomie macierzy dyskowej zaimplementowane w HP StorageWorks Enterprise Virtual Array (EVA).

Wirtualizacja macierzy dyskowych Cechą wyróżniającą ten produkt na tle konkurencji są właśnie rozwiązania wirtualizacyjne. Według producenta, wykorzystanie wirtualizacji w sieciach SAN z użyciem macierzy EVA pozwala zminimalizować koszty posiadania zasobów informatycznych, zarówno dla dużych systemów, jak i mniejszych. W macierzy dyskowej EVA wszystkie dyski grupowane są w ramach jednej przestrzeni dyskowej (disk pool). Organizacja dysków logicznych przygotowana została w taki sposób, by każdy z nich złożony był z wielu dysków fizycznych. Dzięki temu możemy przykładowo utworzyć jeden dysk logiczny używając do tego wszystkich fizycznych dysków macierzy. Za proces ten odpowiada oprogramowanie wirtualizacyjne macierzy. Rozwiązanie to zwiększa zarówno bezpieczeństwo danych, jak i przyspiesza wykonywanie operacji odczytu i zapisu dane mogą być pobierane z wielu źródeł (I/O) jednocześnie. Dzięki rozproszeniu informacji po wielu dyskach fizycznych szybciej następuje także odbudowa danych w przypadku awarii. Dane są zapisywane jednocześnie na wielu dyskach, co powoduje znaczne przyspieszenie operacji odtworzenia danych z macierzy RAID. Dodatkowo, odtwarzane są tylko te obszary dysku, które zapisane były danymi, co łącznie z opisanymi wcześniej cechami macierzy EVA powoduje, że odtwarzanie danych po uszkodzeniu dysku fizycznego na dysk zapasowy odbywa się znacznie szybciej niż w innych rozwiązaniach macierzowych. Dużo prostsza jest także rozbudowa macierzy. Dodanie każdego dysku fizycznego oznacza nie tylko większą powierzchnię macierzy (disk pool), którą można dowolnie zarządzać, ale także przyspieszenie operacji zapisu i odczytu, co oprócz zwiększenia bezpieczeństwa danych jest ważną zaletą wirtualizacji w macierzach HP. Wirtualizacja wraz z technologią SAN pozwalają na realizację wielu zadań związanych z zarządzaniem pamięcią masową poprzez ukrycie złożoności i różnorodności zasobów oraz udostępnienie serwerom istniejących logicznie zasobów. Wszystkie zmiany polegające na usunięciu, aktualizacji lub wymianie urządzenia są możliwe bez powiadamiania o tym systemu operacyjnego i wymiany sterowników. Z jednej strony mamy zasoby pamięci masowych firmy, z drugiej serwery, którym administratorzy, korzystając z narzędzi z wygodnym interfejsem użytkownika, mogą te zasoby swobodnie przydzielać. Użycie starszych macierzy dyskowych oraz lepsze wykorzystanie powierzchni dyskowej, dzięki przyporządkowaniu różnych serwerów do różnych zasobów dyskowych, znacznie zmniejsza koszty utrzymania infrastruktury informatycznej. W tradycyjnej macierzy dyskowej dyski zapasowe to napędy śpiące firma zapłaciła za nie, ale podczas normalnej pracy nie wykorzystuje ich możliwości. Tymczasem wirtualizacja HP od wielu lat wdraża unikalne rozwiązanie w zakresie wirtualizacji. pozwala uruchomić niewykorzystywane zasoby. W puli dostępnych dysków wirtualnych dysk zapasowy tworzony jest spośród wszystkich napędów zainstalowanych w macierzy. Dzięki temu wszystkie napędy fizyczne biorą udział w pracy produkcyjnej, co zwiększa szybkość dostępu do danych i w rezultacie poprawia ogólną wydajność systemów firmowych. Zwirtualizowana macierz dyskowa tak samo dobrze radzi sobie z przydzielaniem powierzchni dla tzw. snapshotów, czyli obrazów stanu systemu na daną chwilę. Miejsce na snapshot nie jest rezerwowane na stałe, lecz przydzielane dynamicznie przez oprogramowanie wirtualizujące. Mając gotowy snapshot bardzo łatwo jest odtworzyć dane z momentu jego zapisu w przypadku awarii lub prowadzić testy systemów informatycznych, wykorzystując rzeczywiste dane zapisane w snapshotach. Ułatwienia dla administratora Bardzo ważną zaletą wirtualizacji jest możliwość automatycznej, bez udziału administratora i procedur wspomagających, dystrybucji danych na jak największej liczbie napędów dyskowych. Gdy w tradycyjnej macierzy dyskowej zaczyna brakować miejsca, konieczne jest dodanie nowych napędów i ich konfiguracja, obejmująca backup i odtworzenie danych. Zaś w zasobach zwirtualizowanych po prostu dodajemy dysk do wspólnej puli zasobów, a macierz EVA zajmuje się resztą czynności administracyjnych. Oprogramowanie wirtualizacyjne potrafi także w lepszy sposób gospodarować zasobami dyskowymi zorganizowanymi w systemie RAID zabezpieczającym przed utratą danych i zoptymalizowanym pod kątem wydajności. W tradycyjnej macierzy dyskowej konieczne jest zdefiniowanie tzw. RAID Set, czyli grupy fizycznych, konkretnych dysków twardych. Dla każdego RAID taka grupa posiada minimalną wielkość. Nawet

Pamięci masowe: przegląd rozwiązań jeżeli nie potrzebujemy tak dużej przestrzeni, konieczne jest zarezerwowanie odpowiedniej liczby napędów. W przestrzeni zwirtualizowanej, w której w jednej grupie dyskowej możemy definiować dowolnej wielkości obszary LUN, nie marnujemy przestrzeni dyskowej na same tylko zabezpieczenia, lecz efektywnie wykorzystujemy całą dostępną pojemność. W zależności od potrzeb możemy stosować dowolne poziomy zabezpieczeń RAID. Oferowana przez HP macierz dyskowa EVA wspiera różne rodzaje zabezpieczeń RAID dostępne dla różnych systemów w ramach tej samej, wspólnej przestrzeni dyskowej. Dodatkowo wszystkie wirtualne dyski we wspólnej przestrzeni mogą odwoływać się do wszystkich dostępnych dysków fizycznych. Czynności związane z podłączaniem i odłączaniem nowych zasobów są wykonywane w locie, w sposób niezauważalny dla działania firmowych aplikacji i systemów. Procesy te działają na poziomie Vraid i uaktywniają się zawsze, gdy EVA rozpozna możliwość poprawy wydajności. Zwiększenie dostępności danych i zachowanie elastyczności w stosowaniu technologii RAID przekłada się bezpośrednio na zwiększenie bezpieczeństwa. Oprogramowanie wirtualizujące na bieżąco monitoruje stan techniczny dysków, a dzięki redundancji wirtualnych dysków awaria pojedynczego dysku fizycznego nie powoduje utraty danych. Zwirtualizowane napędy dyskowe różnych rozmiarów mogą być łatwo dołączane do wspólnej puli zasobów. Oprogramowanie wirtualizujące umożliwia podłączenie fizycznych LUN-ów, które są następnie mapowane (LUN wirtualny = LUN fizyczny), sklejane lub dzielone. Jeden LUN wirtualny może być sklejony z kilku fizycznych LUN-ów lub odwrotnie jeden fizyczny LUN może być podzielony na kilka LUN-ów wirtualnych. Zwirtualizowane zasoby dyskowe możemy podłączać do różnych systemów firmy i udostępniać różnym systemom operacyjnym. Możemy także w prosty sposób replikować dane do LUN-ów znajdujących się w innej, odległej lokalizacji. Wystarczy w tym celu wykorzystać rozwiązanie wirtualizujące i szybką sieć. Różnorodność macierzy Nigdy wcześniej na rynku nie było dostępnych tak wiele rodzajów urządzeń, począwszy od najprostszych rozwiązań NAS, a skończywszy na zaawansowanych pamięciach masowych klasy FC pracujących w środowisku sieci SAN (Storage Area Network). Rozwiązania określane terminem storage to obecnie bardzo szerokie spektrum urządzeń. W zależności od potrzeb przedsiębiorstwo może wybrać urządzenia typu FC (Fibre Channel) dołączone poprzez sieć SAN (Storage Area Network), NAS (Network Attached Storage) lub najtańsze w implementacji DAS (Direct Attached Storage). W przyszłości będzie mogło także wykorzystywać sieci plików FAN (File Area Network). FAN: dostęp przez pliki Rozwiązanie FAN to koncepcja relatywnie świeża. W 2006 r. Brad O Neill z firmy analitycznej The Taneja Group zaproponował koncepcję uporządkowanej architektury sieci SAN, w których logika odseparowana jest od zarządzania przechowywaniem i zabezpieczaniem plików. Oznacza to zarządzanie kontrolą dostępu, zasobami, synchronizacją, usuwaniem duplikatów, przestrzenią nazw, indeksowaniem i wyszukiwanie treści oraz szyfrowaniem danych poprzez pliki, a nie jak ma to miejsce w typowej sieci SAN bloki danych. Koncepcja ta, choć tkwi w niej duży potencjał zastosowań, wymaga dostosowania do obecnie istniejących rozwiązań programowych i sprzętowych. Jej twórca spo-

Pamięci masowe: przegląd rozwiązań dziewa się, że FAN zwiększy rzeczywistą kontrolę nad dostępem do informacji i uprości zarządzanie nią przez kontekstowe połączenie różnych usług, które dotychczas działały rozdzielnie. Architekturę FAN da się zbudować za pomocą istniejących rozwiązań, takich jak oprogramowanie wirtualizacyjne działające na przełącznikach Brocade czy Cisco, albo w ramach usług DFS systemu Windows Storage Server. Z drugiej strony należy pamiętać, że użytkownicy nie zrezygnują natychmiast z już wdrożonych architektur, nawet jeśli nowa spełniać będzie ich oczekiwania funkcjonalne. W ramach prac koncepcyjnych rozwijany jest także nowy system plików dostosowany do architektury FAN. Najbardziej zaawansowany jest system plików Lustre, wspierany przez HP. Wysoka skalowalność tego systemu wynika z hierarchicznego modelu sterowników logicznych, które komunikują się ze sterownikami bezpośrednimi (sprzętowymi) lub też innymi sterownikami obiektowymi. Pierwsze z nich mogą realizować równoległy zapis, komunikując się z wieloma logicznymi sterownikami inicjującymi (initiator) i docelowymi (target). Koncepcja ta jest zatem trochę innym podejściem do idei wirtualizacji i rozwinięciem jej na obszar wymiany plików. Najnowsze trzy modele HP EVA charakteryzują się dużą wydajnością, pojemnością i wysoką dostępnością. SAN kontra NAS Technologia FAN pozostaje wciąż na etapie koncepcji. Znacznie więcej konkretów można powiedzieć o najnowszych urządzeniach NAS i macierzach dyskowych FC pracujących w sieciach SAN. SAN umożliwia wzajemną komunikację systemów pamięci masowych i serwerów. Rozwiązaniem komplementarnym jest NAS podłączony do sieci LAN, za pomocą której komunikują się z serwerami, a także stacjami klienckimi. SAN dzięki dostępowi poprzez bloki danych zapewnia wyższą wydajność transferu danych niż rozwiązania NAS. Dzięki koncepcji sieciowej SAN jest też konstrukcją bardziej elastyczną niż NAS, bo w jej budowę wpisana została heterogeniczność. W sieci SAN serwery działające w różnych systemach mogą odwoływać się do danych rozproszonych w sieci pamięci masowych. Zaletą jest możliwość zarządzania zasobami dyskowymi z jednego miejsca. SAN umożliwia konsolidację zasobów rozproszonych po różnych macierzach, dzięki czemu można przydzielać pamięć masową w zależności od potrzeb w sposób dynamiczny, minimalizując koszty niewykorzystanej, zapasowej pamięci dyskowej. Macierze dyskowe W segmencie macierzy dyskowych FC bardzo popularne są macierze klasy HP EVA. Najnowsze trzy modele tych urządzeń charakteryzują się dużą wydajnością, pojemnością i wysoką dostępnością. Oprócz (opisanych w artykule Wspólna przestrzeń ) zalet wirtualizacyjnych, macierze klasy EVA cechuje duża niezawodność. W architekturze EBA wykorzystywane są redundantne łącza FC zamiast backplane. Kontrolery w macierzy pracują w trybie active-active. Oznacza to, że pojedynczy dysk logiczny (LUN) jest równocześnie obsługiwany przez oba kontrolery, co z jednej strony poprawia szybkość transferu danych, z drugiej zaś zapewnia redundancję tego elementu i odporność na awarię pojedynczego układu. W jednej grupie dyskowej macierzy można umieścić dowolnie dużo dysków, co pozytywnie wpływa na wydajność i upraszcza zarządzanie. Natomiast mechanizm przełączania między kanałami I/O Path failover zapewnia ciągłość pracy macierzy w przypadku awarii w ścieżce dostępu do danych. Po ewentualnej awarii dysku, podczas odbudowy danych, brane są pod uwagę tylko zajęte bloki, dzięki czemu macierz szybko powraca do pierwotnej konfiguracji. Zgodnie z wymaganiami Oracle, EVA jest macierzą, która ma sprzętowo zaimplementowany mechanizm Auto-SAME (Stripe and mirror everywhere). Dba on o optymalny rozkład baz danych na zasoby dyskowe,

Pamięci masowe: przegląd rozwiązań co dodatkowo poprawia wydajność w rozwiązaniach bazodanowych. Poprawie wydajności służy także mechanizm wyrównywania obciążenia (load balancing) zapewniający dynamiczne równoważenie zajętości pojedynczego dysku logicznego pomiędzy wiele kanałów I/O. Rozwiązania hybrydowe Poza oczywistym przyspieszeniem transferu danych, zaletą sieci SAN jest łatwość tworzenia backupu, najlepiej z tymczasowej kopii zapasowej (snapshot) i odciążającej sieć LAN (tzw. LAN free backup). Często jest to najlepsza metoda zmieszczenia się w bardzo wąskim tzw. oknie backupowym, choć nie jedyna. Koronnym argumentem przemawiającym za siecią SAN jest możliwość replikacji danych z macierzy produkcyjnej na macierz zapasową w centrum zapasowym i zwiększenie w ten sposób bezpieczeństwa danych. Zunifikowane systemy pamięci masowych cechują się większą elastycznością w zarządzaniu i osiąganiu wyższych poziomów wykorzystania przestrzeni dyskowych oraz całych systemów. Rozwiązanie łączące zalety NAS i SAN wymaga odpowiedniego oprogramowania. Przykładem może być Parametry techniczne macierzy EVA Konstrukcja macierzy dyskowej EVA oparta jest na obudowie typu rack, dwa kontrolery macierzowe wyposażone są w pamięć Cache o pojemności 2GB lub 4 GB (w zależności od modelu). Każdy z kontrolerów posiada 2 porty FC 4Gb/s do podłączenia do sieci SAN. Najnowsza seria urządzeń HP StorageWorks Enterprise Virtual Array zawiera modele 4100, 6100 oraz 8100. Odpowiednio pozwalają one na obsługę 56, 112, 240 dysków FC i FATA. W porównaniu z poprzednimi nowe macierze pobierają o 45% mniej energii i działają średnio o 24% wydajniej. Dzięki wykorzystaniu technologii EVA Dynamic Capacity Management (DCM) oraz Vsnap możliwe jest lepsze wykorzystanie przestrzeni dyskowej oraz zredukowanie poboru energii. pakiet Microsoft iscsi Software Target. Produkt ten umożliwia dodanie funkcjonalności iscsi do rozwiązań typu NAS przeznaczonych dla małych i średnich przedsiębiorstw. Stworzony w ten sposób storage może być jednocześnie serwerem plików, wydruków i może serwować wolumeny danych dla innych serwerów z wykorzystaniem protokołu iscsi. Uwspólnienie zasobów plików, wydruków, poczty elektronicznej i baz danych na jednej platformie pozwala łatwiej i taniej zarządzać zasobami. Umożliwia też uzyskanie wysokiej skalowalności i scentralizowanego backupu. Wszystko to prowadzi do obniżenia kosztów posiadania infrastruktury IT, dzięki wykorzystaniu już istniejącej sieci ethernetowej do stworzenia zaawansowanego technologicznie rozwiązania iscsi. Coraz więcej producentów dostarcza macierze dyskowe, które mogą pełnić rolę zarówno serwerów plików NAS, jak i oferować blokowy zapis danych. Tego rodzaju pamięci masowe mogą być podłączone do serwerów przetwarzających bazy danych, jednocześnie udostępniając pliki pracownikom firmy. Takim właśnie rozwiązaniem jest EVA File Services (EVA FS), umożliwiające przechowywanie danych zarówno w postaci bloków, jak i plików. Dzięki tej funkcjonalności EVA FS doskonale nadaje się do integrowania przez średnie i duże przedsiębiorstwa zasobów dyskowych, umożliwiając osiągnięcie elastyczności i redukcję kosztów. Rozwiązanie umożliwia współdzielenie plików, wykorzystując protokół CIFS (Windows) oraz NFS. Oferowane jest w oparciu o nowe macierze EVA 4100/6100/8100. Prekonfigurowane macierze EVA wraz z usługami File Services opierającymi się na oprogramowaniu PolyServe wraz z dwuwęzłowym klastrem serwerów. W konfiguracji startowej oferowane są 2 węzły urządzenia, a docelowo możliwa jest rozbudowa do 16. Każdy z węzłów zawiera przeinstalowaną dystrybucję SUSE Linux oraz oprogramowanie HP StorageWorks Clustered File System. Zaletą rozwiązania jest nie tylko możliwość łatwej rozbudowy urządzenia, ale też niski koszt startowy. Integracja wszystkich elementów pamięci masowych pozwala usprawnić środowisko informatyczne przedsiębiorstw. StorageWorks Enterprise File Services (EFS) umożliwia przedsiębiorstwu konsolidację i wirtualizację całej posiadanej sieciowej pamięci masowej oraz efektywne zarządzanie potrzebami w zakresie serwerów plików przy niskim koszcie inwestycyjnym. HP oferuje prekonfigurowane macierze EVA wraz z usługami File Services opierającymi się na oprogramowaniu PolyServe z dwuwęzłowym klastrem serwerów. Każdy tradycyjny serwer plików w rozwiązaniu NAS cechuje się ograniczoną wydajnością. Dodatkową barierą wykorzystania tradycyjnych rozwiązań NAS jest istnienie pojedynczych punktów awarii. EVA File Services pozbawione jest tych wad. Pozwala na działanie protokołów CIFS i NFS oraz liniowe skalowanie połączonych rozwiązań storage wraz z liniowym wzrostem wydajności wejść/wyjść (I/O), zapewniając jednocześnie odporność na pojedyncze punkty awarii. HP Enterpise File Serices wykorzystuje oprogramowanie firmy PolyServe, od bieżącego roku należącej do HP. Oprogramowanie działa na platformach Linux i Windows oraz pozwala na konsolidację serwerów plików, a także baz danych. Przeznaczone jest dla rozwiązań NAS i SAN oraz służy do tworzenia współdzielonych zasobów danych i świadczenia usług o wysokiej dostępności. PolyServe umożliwia maksymalnie 16 serwerom Windows lub Linux dostęp do tej samej puli zasobów dyskowych. W tak przygotowanym do pracy środowisku zachowanie równomierności obciążenia (load balancing) jest automatycznie kontrolowane przez software HP. Podłączanie praktycznie dowolnej liczby nowych elementów storage oznacza dla klienta dużą skalowalność. Rozwiązania SAN wsparte przez PolyServe umożliwiają tworzenie relacji każdy do każdego między serwerami a macierzami dyskowymi, co daje niespotykaną w podobnych rozwiązaniach elastyczność.

Technologie i polski rynek Doganiamy światową czołówkę Z Dariuszem Dobkowskim, Business Managerem w dziale HP StorageWorks rozmawiamy o najnowszych technologiach w storage, nowinkach z dziedziny sprzętu i oprogramowania oraz o tym, jak reaguje na nie polski rynek. Jakie są Pana zdaniem najważniejsze kierunki rozwoju rozwiązań storage? Jednym z podstawowych zagadnień jest z pewnością konsolidacja zasobów pamięci masowych. Pozwala ona na znaczne usprawnienie obsługi całego środowiska poprzez zastosowanie mniejszej ilości, ale bardziej wydajnych i niezawodnych rozwiązań. Dzięki temu uzyskujemy też znaczne oszczędności kosztów zarządzania całym środowiskiem, dlatego też producenci koncentrują się na dostarczaniu nowych technologii adresujących to zagadnienie. Kolejnym, bardzo istotnym kierunkiem jest wirtualizacja i to na wielu poziomach przetwarzania danych. W przypadku pamięci masowych należy zwrócić uwagę na wirtualizacje sieci SAN, wirtualizacje zasobów dyskowych a także wirtualizacje w procesie tworzenia kopii bezpieczeństwa. Zastosowanie rozwiązań wirtualizacyjnych pozwala na znaczne usprawnienie procesów z jednoczesnym oderwaniem się od problemów i ograniczeń jakie są generowane przez tradycyjne rozwiązania. Ze względu na przewidywany gwałtowny wzrost sprzedaży pamięci masowych na rynku MSP istotnym zagadnieniem będą rozwiązania Storage projektowane od samego początku właśnie z myślą o potrzebach klienta z tego segmentu. A jakie zagadnienia stają się coraz bardziej istotne dla klientów? Obecnie ważnym tematem jest archiwizacja danych. Liczba danych stale wzrasta i przedsiębiorstwa szukają oszczędności, np. w sytuacji, gdy dane już nie muszą być dostępne online, ale powinny być składowane na wypadek, gdy zaistnieje potrzeba powrotu do nich. Do tego dochodzą uwarunkowania zewnętrzne, przepisy prawa nakazujące HP była pierwszą firmą, która zaczęła mówić o wirtualizacji w pamięciach masowych, wtedy gdy inni dostawcy nie rozumieli jeszcze wagi tego zagadnienia. przechowywanie określonych danych przez ustawowy czas. Rozwiązaniem jest ILM (Information Lifecycle Management). Najważniejszym z tej grupy rozwiązań jest RISS (Reference Information Storage System), przeznaczonych do archiwizacji poczty elektronicznej i dokumentów. RISS dzięki oprogramowaniu rozpoznaje zawartość plików, które są archiwizowane i pozwala na ich indeksowanie nie tylko z uwzględnieniem tytułów, ale również ze względu na ich zawartość. Ułatwia to późniejsze wyszukiwanie informacji. Pojawia się tu także miejsce dla rozwiązań służących do deduplikacji danych. Ze względu na gwałtowny przyrost przechowywanych danych klienci będą zmuszeni do implementowania technologii, które pozwolą im odnaleźć te same dane występujące często kilka lub kilkanaście razy w systemie informatycznym. Przez zmniejszenie ilości ich kopii w pewnym stopniu ograniczyć zapotrzebowanie na konsumpcję zasobów w wykorzystywanych rozwiązaniach. Czy innowacje pojawiają się także w zakresie oprogramowania? Zdecydowanie tak. Warto przede wszystkim wspomnieć o oprogramowaniu RIM for Databases służącym do archiwizacji baz danych. Oprogramowanie to integruje się z bazą danych, odciążając ją od przetwarzania i przechowywania informacji, które po analizie optymalizacyjnej okazują się być rzadko wykorzystywane. Dane te mogą być składowane na nieco wolniejszych macierzach, natomiast dane, do których użytkownicy sięgają najczęściej, będą znajdować się na najszybciej dostępnych nośnikach. Czy zauważa pan nasilającą się tendencję do konwergencji? Tak, z pewnością konwergencja serwerów i pamięci masowych jest zagadnieniem wartym uwagi. Rozwiązania tego typu pozwalają na znaczne ograniczenie stopnia złożoności środowiska IT. Mamy w swojej ofercie tego rodzaju rozwiązania, ale w chwili obecnej są one dedykowane głównie na rynek małych i średnich przedsiębiorstw. Najlepszym przykładem jest rozwiązanie All-in-one, które zaspokaja jednocześnie kilka potrzeb małych i średnich przedsiębiorstw, zwłaszcza tych dopiero startujących. Urządzenie to łączy w sobie funkcjonalność serwera plików, macierzy dyskowej i ochrony danych. Rozwiązanie to, mimo że przeznaczone na rynek SMB, znajduje także swoich nabywców w bardzo dużych firmach. Ostatnio mieliśmy zamówienie na kilkadziesiąt tego rodzaju urządzeń od dużej firmy, która zdecydowała się wyposażyć w nie wszystkie swoje oddziały. Zauważalna jest również konwergencja dotycząca technologii blade jako pierwsi wprowadziliśmy na rynek rozwiązania storage blade, które doskonale uzupełniają funkcjonalność architektury serwerów blade. Na razie jest jeszcze za wcześnie, by ostatecznie decydować o przyszłości tego typu rozwiązań, ale wydaje się to być interesującą propozycją

Technologie i polski rynek kolejne rozwiązania tego typu już wkrótce pojawią się na rynku. W jakim kierunku zmierzają innowacje związane z wirtualizacją, gdzie obecnie koncentrują się wysiłki dostawców rozwiązań? Wirtualizacja to bardzo modne pojęcie o bardzo szerokim zakresie. Możemy mieć do czynienia z wirtualizacją na poziomie serwerów, urządzeń pamięci masowych jak i samych sieci SAN. O ile technologie związane z wirtualizacją serwerów czy pamięci masowych są już stosunkowo dobrze rozwinięte, to na pewno jest jeszcze wiele do zrobienia jeśli chodzi o wirtualizację samych sieci SAN. Kiedyś bardzo modna była idea Open SAN, pozwalająca łączyć wszystkie urządzenia ze wszystkimi dowolny serwer z dowolną macierzą od dowolnego producenta. Praktyka zweryfikowała tę koncepcję dość brutalnie, ponieważ zazwyczaj okazywało się, że nie wszystkie urządzenia ze sobą współpracują. Czasami wystarczyła inna wersja firmware u i już urządzenia odmawiały współdziałania. Dostawcy rozwiązań mają jeszcze wiele do zrobienia, w obszarze zapewnienia heterogeniczności sieć SAN i przewiduję, że właśnie w tym segmencie będzie się dużo działo w najbliższej przyszłości. Czy same firmy są zainteresowane tworzeniem rozwiązań heterogenicznych? Absolutnie tak. Gdyby było inaczej, to rozwiązania te by nie powstawały. Problemem nie są chęci, a raczej złożoność problemu na styku wszystkich światów systemów operacyjnych, producentów macierzy, bibliotek taśmowych, kontrolerów, dysków i oprogramowania. Gdybyśmy mieli platformę łączącą wszystko ze wszystkim, na pewno udałoby się obniżyć koszty posiadania infrastruktury storage. Pomimo wielu ograniczeń jakie niosą ze sobą środowiska heterogeniczne mają też jedną podstawową zaletę. Umożliwiają one użytkownikom wybór najlepszych wg nich komponentów składowych całego środowiska i nie zamykają ich w świecie rozwiązań jednego producenta. Wadą jest to, że jeśli coś nie działa to ustalenie firmy odpowiedzialnej za ewentualny problem jest procesem bardziej bardziej złożonym, no i nie można zapominać o tym, ze często producenci całego portfolio produktów udostępniają rozwiązania pozwalające na zarządzanie całym środowiskiem z jednej konsoli administratora, co w znaczny sposób upraszcza cały proces. Dużo nowości pojawiło się w macierzach dyskowych w ostatnim czasie. Na co przedsiębiorstwa powinny zwrócić szczególną uwagę? Zwracam uwagę na technologię WORM stosowaną w macierzach klasy wyższej np. XP. Oznacza to, że dane zasoby zostaną Dariuszem Dobkowskim, Business Managerem w dziale HP StorageWorks zapisane na dysk tylko raz i nie możemy ich potem ani skasować, ani zapisać czegokolwiek w tym samym miejscu, aż do upłynięcia okresu jaki został wcześniej określony. Rozwiązania te wymagane są w zastosowaniach, dotyczących archiwizacji i długoterminowego przechowywania danych, określonych przepisami prawa lub standardami korporacyjnymi. Z kolei w macierzy EVA możemy w ramach tej samej półki dyskowej instalować zarówno drogie, bardzo wydajne dyski Fibre Channel, jak i dyski FATA, o niższym koszcie zakupu i charakteryzujące się mniej wydajnymi parametrami transferu danych. Na dyskach tańszych możemy przechowywać zarówno dane tymczasowe, takie jak kopie migawkowe, jak i te mniej istotne dla działania przedsiębiorstwa. Ta funkcjonalność w połączeniu z zastosowanie wirtualizacji pomoże firmom obniżyć koszty posiadania macierzy dyskowych i uelastycznić zarządzanie nimi. Jedną z nowości jest także thin provisioning umożliwiającym dynamiczne alokowanie zasobów macierzy w te miejsca, w których zasoby te są najbardziej potrzebne. Na ile nasz polski rynek nadąża za światowymi standardami w dziedzinie pamięci masowych? To, co się obecnie dzieje w Polsce, jest powtórzeniem procesów, które miały miejsce kilka lat temu w krajach najbardziej rozwiniętych technologicznie, takich jak Stany Zjednoczone, Wlk. Brytania czy Niemcy. Należy jednak zauważyć, ze ta rozbieżność w ostatnim czasie bardzo się zmniejszyła. Przykładem mogą być rozwiązania Disaster Recovery. W krajach rozwiniętych DR są już zaimplementowane w zdecydowanej większości dużych i średnich firm, u nas wtedy dopiero zaczynało się o tym mówić. Obecnie nie tylko duże przedsiębiorstwa posiadają tego typu rozwiązania, ale także firmy średnie już je implementują lub przynajmniej są świadome potrzeby posiadania centrów zapasowych. Jak zawsze pozostaje tylko kwestią czasu i zasobów finansowych, kiedy te rozwiązania staną się standardem także dla firm średniej wielkości. Już teraz można podać pozytywne przykłady firm średniej wielkości zdeterminowanych w implementacji rozwiązania Disaster Recovery. Świadomie rezygnują z innych inwestycji, żeby zapewnić bezpieczeństwo danych firmowych, których utrata może wiązać się z poważnymi problemami całego przedsiębiorstwa. Sądzę, że zaawansowane rozwiązania klasy NAS są w Polsce ciągle jeszcze mniej popularne niż w innych krajach i dlatego spodziewam się koncentracji uwagi w tym zakresie. Dlatego też HP zakupiło firmę Polyserve światowego potentata w zaawansowanym i dynamicznie skalowalnym udostępnianiu plików.

Cyfronet: studium przypadku Gridowe centrum regionu Krakowski Cyfronet, w oparciu o macierze HP EVA 8000, tworzy efektywne rozwiązanie do obsługi bardzo dużych ilości danych. Będzie ono wykorzystywane m.in. w procesie przetwarzania wyników eksperymentów płynących z akceleratora cząstek w CERN. Akademickie Centrum Komputerowe Cyfronet AGH, jednostka działająca pod egidą Akademii Górniczo-Hutniczej w Krakowie, od kilku lat poszukiwało rozwiązania do zarządzania dużymi ilościami danych. Są one gromadzone w związku z bieżącymi potrzebami pracowników naukowych oraz badaniami i eksperymentami prowadzonymi przez użytkowników Cyfronetu. Krakowskie centrum zostało także wyznaczone jako ośrodek koordynujący w Europie Środkowej program EGEE (Enabling Grids for E-sciencE). Właśnie tego typu projekty, prowadzone we współpracy z krajowymi i zagranicznymi ośrodkami naukowymi i superkomputerowymi, stawiają w praktyce największe wymagania dotyczące zarządzania danymi. W związku z planowanym wzrostem zapotrzebowania Cyfronet zdecydował się na wdrożenie macierzy dyskowej HP EVA 8000 o pojemności ok. 120 TB. System sprawdził się zarówno pod względem niezawodności i wydajności, jak również jako rozwiązanie elastyczne, przeznaczone do konfiguracji i ergonomiczne w administrowaniu. Dlatego centrum podjęło decyzję o zakupie kolejnej macierzy EVA wyposażonej w nowsze, wydajniejsze kontrolery. Współpraca cząstek EGEE to jedna z inicjatyw związanych z przetwarzaniem danych pochodzących z wielkiego akceleratora cząstek elementarnych budowanego pod Genewą w Europejskim Centrum Badań Jądrowych CERN. Już wstępne analizy i testy CERN wykazały, że potrzeby w dziedzinie mocy obliczeniowej i pojemności na dane będą po uruchomieniu akceleratora znacząco przewyższać możli- wości jednego, a nawet kilku dużych ośrodków obliczeniowych. Szacowane potrzeby na moc obliczeniową to ok. 100 tys. procesorów klasy Pentium, zaś przewidywana pojemność na dane ok. 20 PB rocznie. Tylko fakty: Cel: budowa infrastruktury do bezpiecznego przetwarzania, składowania i udostępniania dużych ilości danych na użytek polskich i zagranicznych środowisk naukowych Zastosowane rozwiązania: macierz HP EVA 8000, 240 dysków FATA 500 GB, dwa kontrolery (4 GB pamięci buforowej każdy), 4 interfejsy Fibre Channel 2 Gb/s oprogramowanie HSM HP StorageWorks File System Extender oprogramowanie HP Data Protector biblioteka taśmowa HP StorageWorks ESL 712e (napędy Ultrium 460 LTO3; 698 slotów) Efekty: wysoka wydajność zapisu i odczytu danych przez wiele aplikacji jednocześnie bardzo dobry stosunek wydajności do ceny łatwość dostosowania parametrów pracy macierzy możliwość zdefiniowania wirtualnych zasobów przy jednoczesnym oszczędnym wykorzystaniu rzeczywistej pojemności. W związku z tym CERN zachęcił do współpracy ośrodki naukowe i centra obliczeniowe z całego świata, co doprowadziło do fali rozbudowy infrastruktury superkomputerowej, m.in. w ramach programów DataGrid i CrossGrid. Równocześnie powstawać zaczęły międzynarodowe środowiska naukowe zainteresowane wykorzystaniem powstających zasobów mocy, także na potrzeby inne niż obróbka danych pochodzących z akceleratora budowanego przez CERN. Na tym etapie nauka jest podstawowym odbiorcą usług superkomputerowych i tak zapewne będzie jeszcze przez wiele lat. Powoli mamy jednak do czynienia z budzeniem się świadomości, że dzięki obliczeniom można osiągnąć więcej w krótszym okresie w wielu dziedzinach życia. Rozwój współpracy z różnymi i różnorodnymi podmiotami wymaga czasu, dlatego w najbliższej przyszłości będziemy skupiać się na rozwoju infrastruktury do przetwarzania i składowania danych oraz doskonaleniu zarządzania nią na potrzeby nauki. Gdy pozostali użytkownicy dojrzeją, my na pewno będziemy gotowi podkreśla prof. dr hab. inż. Kazimierz Wiatr, dyrektor ACK Cyfronet AGH w Krakowie. Porządkowanie danych Program EGEE skupia się nie tylko na projektowaniu i budowie infrastruktury na potrzeby przetwarzania danych, ale dąży również do zwiększenia możliwości zarządzania nimi. Oprogramowanie grid spełnia rolę inteligentnej warstwy pośredniej (middleware), zarządzającej planowaniem obliczeń, zabezpieczaniem na ich potrzeby zasobów aplikacyjnych i sprzętowych, udostępnianiem aplikacji 10

Cyfronet: studium przypadku użytkownikom pracującym lokalnie lub w innych ośrodkach, śledzeniem postępu obliczeń, raportowaniem wyników itp. Aplikacje modelujące, obliczeniowe i inne działające w środowisku grid middleware wykorzystują ogromne ilości danych, jednak ani one, ani środowisko grid nie zarządzają danymi na poziomie operacyjnym. Zaprojektowanie środowiska do przetwarzania dużych ilości danych, a zwłaszcza, jak ma to miejsce u nas, praktycznie w trybie ciągłym, nie sprowadza się jedynie do zakupu urządzeń o pewnych parametrach. Potrzeba dużej wyobraźni i doświadczenia, aby całość środowiska, a nie tylko jego poszczególne elementy, działała sprawnie. Innymi słowy, najpierw architektura, potem rozwiązania podkreśla mgr inż. Karol Krawentek, zastępca dyrektora ACK Cyfronet AGH. W Cyfronecie wiele aplikacji działa równolegle, jednocześnie zapisując i odczytując dane w macierzy dyskowej. Zapisy i odczyty są w większości przypadków sekwencyjne, ale ponieważ równolegle odbywa się ich bardzo dużo na rzecz wielu aplikacji i użytkowników, z punktu widzenia centrum danych jako całości możemy mówić o obciążeniu quasi-transakcyjnym. Obsłużenie obciążeń o takiej charakterystyce wymaga bardzo wydajnej macierzy klasy korporacyjnej, na którą jednak nie mogliśmy sobie pozwolić dodaje mgr inż. Maciej Twardy, kierownik Działu Archiwizacji i Bezpieczeństwa Danych w Cyfronecie. Jednym z ważniejszych czynników podczas rozważań nad wyborem architektury dla podsystemu dyskowego był niski koszt zarządzania i utrzymania. Zmiany w konfiguracji grup RAID, wielkości wolumenów czy podział pasma na interfejsach muszą być dokonywane praktycznie codziennie. Ważnym zagadnieniem był także rzeczywisty poziom wykorzystania zasobów macierzy. Wcześniejsze doświadczenia pokazywały, że po zdefiniowaniu grup RAID będzie możliwe zapełnienie jedynie ok. 75 85% zakupionej pojemności. Wydajnie i tanio Macierz HP EVA 8000 pojawiła się w Cyfronecie w marcu 2006 r. Wcześniej specjaliści Cyfronetu starali się sprawdzić jej możliwości. Testy wydajnościowe z aplikacjami wykorzystywanymi na co dzień przez użytkowników Cyfronetu i próby z aplikacjami gridowymi wypadły nadzwyczaj dobrze. W testach, a także podczas późniejszej eksploatacji udało się nam uzyskać stałą wydajność rzędu 120 150 MB/s na każdym z ośmiu interfejsów Fibre Channel 2 Gb/s. To zasługa równoległego przetwarzania na wszystkie dyski jednocześnie, realizowane przez wewnętrzne mechanizmy wirtualizujące macierzy mówi mgr inż. Maciej Twardy. Wydajność EVA jest tym bardziej godna uwagi, że wewnątrz działają relatywnie tanie dyski FATA z interfejsami komunikacyjnymi w standardzie Fibre Channel. Mitem jak przekonują specjaliści z Cyfronetu jest ich awaryjność. Przy okazji testów okazało się także, że obawy związane z wysokimi kosztami wsparcia technicznego są nieuzasadnione. Przyzwyczajeni do wiersza poleceń specjaliści byli zaskoczeni eleganckim, graficznym interfejsem. Za pomocą konsoli graficznej można zarządzać dowolnym aspektem działania macierzy: definiować grupy RAID, dodawać do nich nowe dyski, tworzyć pule, zwiększać ich pojemność, zarządzać uprawnieniami itp. Wygodny i czytelny graficzny interfejs pozwala na pełne zarządzanie funkcjonowaniem macierzy, a przede wszystkim na zdecydowanie szybsze i efektywniejsze realizowanie bieżących zadań przez administratorów pamięci masowych. Niezwykle cenna okazała się funkcja Thin Provisioning, umożliwiająca przydzielenie aplikacjom dowolnej pojemności, przy jednoczesnym wykorzystaniu tylko takiej pojemności, jaka aktualnie jest rzeczywiście potrzebna. Eliminuje to zagrożenie, że w kluczowym momencie skończy się miejsce na dysku dla aplikacji. Kolejna EVA Bieżące zabezpieczenie danych przetwarzanych w macierzy realizowane jest w Cyfronecie z wykorzystaniem oprogramowania do tworzenia kopii bezpieczeństwa HP Data Protector i oprogramowania typu HSM HP StorageWorks File System Extender. Natomiast do wykonywania bieżących kopii i archiwizowania danych jest wykorzystywana biblioteka taśmowa HP StorageWorks ESL 712e. Backup i archiwizacja odbywają się poprzez sieć SAN, zbudowaną w oparciu o rozwiązania HP StorageWorks SAN Switch: dwa 32-portowe przełączniki Fibre Channel 2 Gb/s HP StorageWorks SAN Switch oraz dwa 32-portowe przełączniki Fibre Channel 4 Gb/s, działające redundantnie (w konfiguracji lustrzanej). W tym roku infrastruktura Cyfronetu wzbogacona zostanie o nową macierz EVA, zawierającą nowsze wersje kontrolerów z portami Fibre Channel 4 Gb/s. 11