TIER CZTERY POZIOMY NIEZAWODNOCI (podstawy i wymagania ze szczególnym zwróceniem uwagi na funkcjonalno systemów klimatyzacji precyzyjnej w odniesieniu do poszczególnych poziomów) 1
Spis treci 1. Definicja stopni niezawodnoci TIER str. 3 2. Wymagania dotyczce systemów elektroenergetyki (zasilanie) i klimatyzacji (HVAC) w oparciu o poziomy niezawodnoci TIER str. 4 3. Opis wymaga dotyczcych redundancji str. 5 4. TIER II: Redundancja elementów infrastruktury technicznej str. 6 5. TIER III: Zapewnienie moliwoci konserwacji infrastruktury technicznej w trakcie pracy serwerowni str. 7 6. TIER IV: Infrastruktura odporna na uszkodzenia str. 8-9 7. Definicja stopni niezawodnoci TIER str. 10 8. Przykład oblicze poziomu niedostpnoci obiektu str. 11-14 9. Standardy dotyczce poziomów niezawodnoci (TIER) w ujciu tematycznym str. 15 10. Charakterystyka systemów klimatyzacji precyzyjnej dedykowanych pomieszczeniom serwerowni, Data Center, UPS str. 16 10a. Funkcjonalno instalacji klimatyzacji str. 17-18 11. Podsumowanie str. 19-20 2
TIA-942 TIA - Telecommunications Industry Association (Stowarzyszenie Przemysłu Telekomunikacyjnego) Ponad 1100 firm, głównie amerykaskich, zajmujcych si telekomunikacj, obróbk i przesyłem danych Cel działania opracowywanie norm, zwłaszcza dotyczcych przewodów i okablowania TIA-942 Infrastruktura telekomunikacyjna dla pomieszcze typu Data Center Cel wydania usystematyzowanie zasad projektowania i wykonania ww. pomieszcze Zakres: - wymagania architektoniczne (architektura sprztowa), - schemat zabudowy serwerowni, - infrastruktura kablowa, - wymagania dla instalacji elektroenergetycznej, - wymagania dla instalacji klimatyzacyjnej, - system bezpieczestwa fizycznego. 3
Wymagania dotyczce systemów elektroenergetyki (ZASILANIE) i klimatyzacji (HVAC) w oparciu o stopnie niezawodnoci TIER TIER I Systemy podstawowe bez jakichkolwiek elementów redundantnych. Poziom dostpnoci 99,671%. TIER II Systemy podstawowe z elementami redundantnymi. Poziom dostpnoci 99,741%. TIER III Systemy podstawowe + systemy redundantne. Redundancja to gotowy w kadej chwili do pracy system rezerwowy. Moliwo bardzo krótkich przerw w działaniu w/w systemów, zwizanych z obsług i konserwacj. Poziom dostpnoci 99,982%. TIER IV Systemy podstawowe, + systemy redundantne rozbudowane o dodatkowe elementy tzw. podwójnej redundancji. Zdublowanie wszystkich instalacji. Brak moliwoci przerw w działaniu w/w systemów, zwizanych z obsług i konserwacj. Poziom dostpnoci 99,995%. 4
N Wymagania podstawowe zgodne z projektem system spełnia wymagania podstawowe i nie jest wyposaony w elementy redundantne. N+1 Redundancja w postaci jednego dodatkowego modułu lub urzdzenia ponad minimum okrelone wymaganiami podstawowymi przy załoeniu: 1 urzdzenie redundantne na 3 lub 4 urzdzenia pracujce lub na jedn stref pracy. 2N 100% Redundancja urzdzenia podstawowego bd kompletnego systemu podstawowego urzdzeniem bd kompletnym systemem rezerwowym (tzw. redundantnym) 1 do 1. Uszkodzenie lub konserwacja 1-go urzdzenia lub systemu nie powoduje przerw w pracy dłuszych ni czas przełczenia systemu podstawowego na system rezerwowy - redundantny 2(N+1) Powyej 100% Redundancja w postaci dwóch kompletnych rezerwujcych si systemów: podstawowego i rezerwowego - patrz 2N wyposaonych w dodatkow redundancj urzdze (N+1). Nawet w wypadku awarii systemu podstawowego i czci rezerwowego (redundantnego), nie dojdzie do przerwy w pracy obiektu. Układ jest odporny na awarie poprzez dodatkowe redundancje urzdze (N+1). 5
TIER II: Redundancja elementów infrastruktury technicznej Podstawowe wymagania Poziom TIER II posiada pojedyncz i nie redundantn lini zasilania sprztu komputerowego. Wymóg zastosowania podwójnej podłogi, UPS-a i agregatu prdotwórczego. Awaria systemu zasilania i HVAC moe mie wpływ na sprzt komputerowy. Awaria linii zasilania spowoduje wyłczenie sprztu komputerowego. Wpływ na eksploatacj System jest podatny na wpływy zarówno z zaplanowanych jak i nie zaplanowanych zdarze. Wymagane jest zastosowanie redundantnych modułów UPS i generatorów prdotwórczych. Aby wykona prace naprawcze lub konserwacyjne, system musi zosta całkowicie wyłczony. Wyjtkowe sytuacje mog spowodowa czste potrzeby przestoju systemu. Brak wykonywania przegldów zwiksza ryzyko nieplanowanych awarii jak równie nasilenie moliwoci wystpienia awarii. Błdy w działaniu lub nieoczekiwane awarie elementów infrastruktury technicznej mog spowodowa uszkodzenie Data Center. 6
TIER III: Zapewnienie moliwoci konserwacji infrastruktury technicznej w trakcie pracy serwerowni Podstawowe wymagania Poziom TIER III posiada obustronne linie zasilania sprztu komputerowego. Jedna linia zasilania jest wykorzystywana w kadej chwili. Kady element systemu zasilania i HVAC bez wyjtku moe zosta wymieniony bezprzerwowo podczas planowanego serwisu konserwacji bez koniecznoci wyłczenia sprztu komputerowego. Wpływ na eksploatacj System jest podatny na wpływy tylko z nie zaplanowanych zdarze. Planowane prace konserwacyjne mona wykonywa na pracujcym sprzcie dziki zastosowaniu redundantnych elementów systemów bd całych systemów HVAC i linii zasilania. Aby ustanowi moliwo jednoczesnej konserwacji systemu zasilania pomidzy modułami UPS a sprztem komputerowym, TIER III wymaga aby wszelki sprzt komputerowy był zasilany z dwóch stron. Podczas prac konserwacyjnych, ryzyko uszkodzenia w Data Center mona wyeliminowa. Błdy w działaniu lub nieoczekiwane awarie elementów infrastruktury mog spowodowa uszkodzenie Data Center. 7
TIER IV: Infrastruktura odporna na uszkodzenia Podstawowe wymagania Data Center odporne na uszkodzenia. Posiada redundancj elementów i systemów HVAC oraz ich wszystkich instalacji hydraulicznych. Zapewniona dwustronna linia zasilania, która jednoczenie zasila sprzt komputerowy wzmocniony redundancj UPS-ów 2(N+1). Cały sprzt IT posiada zasilanie z dwóch stron i jest zainstalowany zgodnie z topologi architektoniczn. Wystpienie pojedynczej nawet najbardziej powanej awarii systemu, elementu systemu lub elementu zasilania nie bdzie miało wpływu na sprzt komputerowy. Bez wyjtku, kady element systemu HVAC i element linii zasilania moe zosta usunity na czas planowanego serwisu bez koniecznoci wyłczenia sprztu komputerowego. Aby zapewni moliwo jednoczesnej konserwacji systemu zasilania pomidzy modułami UPS a sprztem komputerowym, TIER IV wymaga aby wszelki sprzt komputerowy był zasilany z dwóch stron. Systemy uzupełniajce si i linie zasilania musz by całkowicie oddzielone, aby nie spowodowa wpływu jednego systemu na drugi. 8
TIER IV: Infrastruktura odporna na uszkodzenia Wpływ na eksploatacj System nie jest podatny na pojedyncze nieplanowane najgorsze zdarzenie. System nie jest podatny na awari zwizan z planowanymi pracami. Infrastruktura moe by konserwowana podczas cigłej pracy dziki zastosowaniu redundancji systemów i elementów HVAC i systemów zasilania. Podczas prac konserwacyjnych, ryzyko uszkodzenia mona wyeliminowa. Zadziałanie alarmu przeciwpoarowego, gaszenie poaru lub awaryjne wyłczenie zasilania moe spowodowa uszkodzenie Data Center. 9
Definicja stopni niezawodnoci TIER TIER I TIER II TIER III TIER IV Redundancja urzdze N N+1 * N+1 * 2N * 2(N+1) * 2N* 2(N+1)* Odporno systemu na pojedyncz awari Nie Nie Nie/TAK * Tak Moliwo konserwacji w trakcie pracy urzdze/systemów Nie Nie Tak Tak Wymagana stała obecno słub serwisowych na obiekcie Nie Nie Tak 24x365 Tak 60x24x365 Dostpno 99.671% 99.749% 99.982% 99.995% Statystyczny czas przestoju obiektu w roku *) Decyduje uytkownik 28,8 godz. 22 godz. 1,6 godz. ( 95 min ) 0,4 godz. ( 26 min ) 10
Przykład oblicze poziomu niedostpnoci obiektu 1. Wyliczamy poziom dostpnoci (ang. Availability -A) A = MTBF/ (MTBF + MTTR) ZAŁOENIA: MTBF- czas pracy urzdzenia do wystpienia awarii deklarowany przez producenta (Mean Time Between Failures) MTTR czas interwencji słub serwisowych zakoczony napraw urzdzenia po awarii (Mean Time To Repair) Przykład : Przyjmujemy: MTBF 50.000 (co odpowiada nastpstwem 1 awarii co około 5,5 roku) MTTR 10 godzin MTBF - 50.000 godz. (5,5 roku); MTTR = 10 godz. A= [50.000/50.000+10] x100% A=99,98% Wyliczony poziom dostpnoci wynosi 99,98% 11
Przykład oblicze poziomu niedostpnoci obiektu 2. Wyliczamy poziom niedostpnoci: 1 - A = 1-0,9998 = 0,0002 0,0002x60x24x365 = 105 minut (1,75 godz.) Zatem niedostpno pracy obiektu wynosi 105 minut w cigu 1 roku. 12
Wymagany czas interwencji realizacji usługi w trybie awaryjnym dla słub serwisowych na poziomie wymaga zgodnych z TIER3 Dla osignicia wymaganej dostpno obiektu wynoszcej zgodnie z TIER 3 A = 99,982% przeanalizujmy nastpujcy przykład liczbowy: Deklarowana przez producenta awaryjno systemu klimatyzacyjnego klimatyzacji precyzyjnej: MTBF = 40.000h (1 awaria na 4,5roku), Czas naprawy systemu przez słuby serwisowe: MTTR = 7,2 godz. A= [40000/(40000+7,2)] x100% =99,982% 1 0,99982 = 0,00018 0,00018 x 60 x 24 x 365 = 95 minut System klimatyzacyjny moe nie pracowa ~95 minut w roku. 13
Wymagany czas interwencji realizacji usługi w trybie awaryjnym dla słub serwisowych na poziomie wymaga zgodnych z TIER4 Przeanalizujmy czas reakcji serwisowej z poprzedniego przykładu dla wymaga zgodnych z TIER4 A = 99,995% Deklarowana przez producenta awaryjno systemu klimatyzacyjnego klimatyzacji precyzyjnej: MTBF = 40.000h (1 awaria na 4,5roku), Czas naprawy systemu przez słuby serwisowe: MTTR = 2 godz. A= [40000/(40000+2)] *100% =99,995% 1 0,99995 = 0,00005 0,00005 x 60 x 24 x 365 = 26 minut System klimatyzacyjny moe nie pracowa 26 minut w roku. 14
Standardy dotyczce poziomów niezawodnoci (TIER) w ujciu tematycznym TIER I jest odpowiedni dla nastpujcych typów firm: Firmy, w których technologia informatyczna wpływa głównie na wewntrzn działalno biznesow; firmy w pocztkowym stadium działania, które nie przywizuj duej wagi do jakoci usług. TIER II jest odpowiedni dla nastpujcych typów firm: Firmy, w których wymagania dotyczce infrastruktury informatycznej ograniczone s do typowych godzin pracy i pozwalaj na wyłczenie systemu, gdy firma jest zamknita. TIER III jest odpowiedni dla nastpujcych typów firm: Firmy, które obsługuj zewntrznych i wewntrznych klientów w trybie całodobowym. 24 godzinny dyur serwisowy na obiekcie (np. centra serwisowe lub centra pomocy technicznej), ale mog pozwoli sobie na krótkie, planowane okresy ograniczonej funkcjonalnoci. TIER IV jest odpowiedni dla nastpujcych typów firm: Firmy dostarczajce usługi 24 godziny na dob przez 365 dni w roku. Firmy teleinformatyczne i internetowe. Firmy zajmujce si realizacj transakcji finansowych (sektor bankowy, sklepy internetowe). Firmy z sektora uytecznoci publicznej o strategicznym znaczeniu społecznym (szpitale, jednostki powiadamiania i słuby ratownicze, najwaniejsze urzdy Pastwa). 15
Charakterystyka systemów klimatyzacji precyzyjnej dedykowanych pomieszczeniom serwerowni, data center, UPS Systemy klimatyzacji precyzyjnej to prototypowe rozwizania, indywidualnie projektowane, realizowane bezporednio na obiektach a nastpnie serwisowane, dostosowywane do biecych potrzeb pomieszcze o wysokiej i bardzo wysokiej emisji ciepła z urzdze IT i UPS. S to systemy o wielu potencjalnych punktach POWSTAWANIA AWARII przez co zdublowane s redundantnymi urzdzeniami lub systemami klimatyzacyjnymi (N+1), (2N), 2(N+1). Osignicie i utrzymanie funkcjonalnoci systemów podstawowych i redundantnych na poziomie TIER 3/4 jest zadaniem dla serwisu na poziomie bezpieczestwa funkcjonalnoci. 16
Funkcjonalno instalacji klimatyzacyjnych Utrzymanie cigłoci działania instalacji przez 24 godziny na dob 365 dni w roku, na poziomie TIER3 (24x365) lub TIER4 (60x24x365) Bezpieczestwo pracy instalacji, w długofalowym okresie eksploatacji i warunkach ekstremalnych Optymalizacja pracy instalacji Energooszczdno freecooling/kaskadowo, itp. 17
Parametry powietrza w pomieszczeniach serwerowni Temperatura: 20 25 C * Wilgotno: 40 45 RH * Maksymalna zmiana temperatury w czasie: do 5 C/godz. Nadcinienie Czysto pyłowa Eliminacja drga (wibracje) *) Pomiar temperatury, wilgotnoci powinien odbywa si na wysokoci 1,5m od poziomu podłogi wzdłu rodkowej linii zimnego korytarza i w kadym miejscu newralgicznym dla sprztu elektronicznego 18
wiadczenie usługi serwisowej w zalenoci od wymaga na poszczególnych poziomach TIER3 i TIER4 Profesjonalna usługa serwisowa na poziomie TIER3 to systemowe działania słub technicznych, które musz zapewni bezpieczestwo prawidłowego funkcjonowania powierzonych urzdze, instalacji i systemów w ruchu cigłym. Podstaw bezpieczestwa jest spełnienie kryterium jakociowego wymaga jakim jest osignicie i zapewnienie odpowiednich parametrów temperatury i wilgotnoci powietrza w wytypowanych miejscach i wszystkich innych parametrów zdefiniowanych przez uytkownika na poziomie moliwoci technicznych serwisowanych urzdze i instalacji. Do osignicia tego poziomu usługi niezbdne jest zarzdzanie cigłoci działa serwisowych. 19
Zarzdzanie cigłoci działania serwisowego w aspekcie podejcia systemowego Zarzdzanie cigłoci działania to wiadczenie usługi serwisowej w zakresie zapewniania bezpieczestwa funkcjonalnoci w przypadku codziennej 24-godzinnej bezawaryjnej cigłej pracy urzdze instalacji i systemów oraz w przypadku wystpienia nieprawidłowoci, zagroe i awarii w pracy urzdze, instalacji lub systemów klimatyzacji precyzyjnej, w pomieszczeniach o bardzo wysokim reimie utrzymania parametrów. Systemowe podejcie do zarzdzania cigłoci działania to zarzdzanie usług w sposób gwarantujcy osignicie i utrzymanie poziomu niezawodnoci TIER3/TIER4 przez zapewnienie funkcjonalnoci systemów, instalacji i urzdze klimatyzacji precyzyjnej przez 24 godziny, 365 dni w roku 24x365 lub 60x24x365 Zarzdzanie usług jest realizowane w oparciu o elementy zarzdzania specjalistyczn firm serwisow. 20
Dzikuj za uwag. 21