Zarządzanie wieloserwerowym środowiskiem SAS z wykorzystaniem SAS Grid Managera. Katarzyna Wyszomierska

Podobne dokumenty
SAS Institute TECHNICAL SUPPORT )

SAS Lineage. zależności między obiektami w środowisku SAS, perspektywa techniczna i biznesowa

Modelowanie Data Mining na wielką skalę z SAS Factory Miner. Paweł Plewka, SAS

Włącz autopilota w zabezpieczeniach IT

Instrukcja instalacji i obsługi programu Szpieg 3

Szpieg 2.0 Instrukcja użytkownika

Przypisywanie bibliotek w architekturze SAS

SYSTEM VILM ZARZĄDZANIE CYKLEM ŻYCIA ŚRODOWISK WIRTUALNYCH. tel: +48 (032)

Aktualizacja środowiska JAVA a SAS

Referat pracy dyplomowej

Win Admin Replikator Instrukcja Obsługi

Szeregowanie zadań w Linux Kernel 2.6. Daniel Górski Przemysław Jakubowski

SAS Institute Technical Support

Instalacja pakietu SAS 9.3 Audit, Performance and Measurement na platformie Windows

Spis treści MONITOR PRACY... 4

DESlock+ szybki start

Data Protection Suite for VMware?

Od czego zacząć przy budowaniu środowisk wysokiej dostępności?

Win Admin Replikator Instrukcja Obsługi

Sprawa numer: BAK.WZP Warszawa, dnia 16 sierpnia 2016 r.

Funkcje systemu infokadra

Wykaz zmian w programie SysLoger

Praca z programami SAS poza lokalną siecią komputerową UZ. Zestawienie tunelu SSH oraz konfiguracja serwera proxy w przeglądarce WWW

Aktualizacja modemu LTE Speed 1000

4. Podstawowa konfiguracja

Świadczenie usługi hurtowej wysyłki wiadomości SMS dla Urzędu Miasta Torunia w latach

Win Admin Monitor Instrukcja Obsługi

Elektroniczny. Obieg Dokumentów SPRAWNA WYMIANA INFORMACJI W FIRMIE SKUTECZNA APLIKACJA DO ZARZĄDZANIA OBIEGIEM DOKUMENTÓW SPRAWNA WYMIANA

Informacje o wybranych funkcjach systemu klasy ERP Zarządzanie produkcją

Płatniku rozlicz PIT-11 przez internet!

Instalacja SQL Server Express. Logowanie na stronie Microsoftu

Monitorowanie wydajność w bazie Oracle11g

Asix. Konfiguracja serwera MS SQL dla potrzeb systemu Asix. Pomoc techniczna NIEZAWODNE ROZWIĄZANIA SYSTEMÓW AUTOMATYKI

Nowoczesny dział IT w chmurze

Szkolenia SAS Cennik i kalendarz 2017

MONITOROWANIE WINDOWS Z NETCRUNCHEM 7 P A G E 1

WZÓR UMOWY. Zawarta w Białymstoku, w dniu.. pomiędzy:

Zmiana treści Specyfikacji Istotnych Warunków Zamówienia.

Rejestracja użytkownika Bentley Często zadawane pytania techniczne

oprogramowania F-Secure

SAS Institute TECHNICAL SUPPORT

Nowe mechanizmy w wersji 3 Java Card. Mateusz LESZEK (138775)

Axence nvision Nowe możliwości w zarządzaniu sieciami

Win Admin Replikator Instrukcja Obsługi

SYSTEMY OPERACYJNE I SIECI KOMPUTEROWE

Serwerowy system operacyjny musi spełniać następujące wymagania minimalne:

WINDOWS Instalacja serwera WWW na systemie Windows XP, 7, 8.

Opis przedmiotu zamówienia. Część IV. Dostawa niewyłącznej, nieograniczonej czasowo licencji oprogramowania Microsoft Serwer 2012 R2 DataCenter x64.

Szczegółowy opis przedmiotu zamówienia

Załącznik nr 2. Przewodnik instalacyjny systemu e-broker Technologiczny v.1.0. Część 4 - Narzędzia informatyczne przeznaczone dla ośrodków innowacji

Serwer główny bazodanowy. Maksymalnie 1U RACK 19 cali (wraz ze wszystkimi elementami niezbędnymi do zamontowania serwera w oferowanej szafie)

Struktura i funkcjonowanie komputera pamięć komputerowa, hierarchia pamięci pamięć podręczna. System operacyjny. Zarządzanie procesami

Nazwa, typ, model, producent oferowanego urządzenia...

Dane bezpieczne w chmurze

Zarządzaj projektami efektywnie i na wysokim poziomie. Enovatio Projects SYSTEM ZARZĄDZANIA PROJEKTAMI

Rozwiązanie Compuware Data Center - Real User Monitoring

SysLoger. Instrukcja obsługi. maj 2018 dla wersji aplikacji (wersja dokumentu 2.5)

Koniec problemów z zarządzaniem stacjami roboczymi BigFix. Włodzimierz Dymaczewski, IBM

Efektywne zarządzanie infrastrukturą IT, inwentaryzacja sprzętu i oprogramowania oraz ochrona danych przed wyciekiem dzięki wdrożeniu Axence nvesion

Bezpieczeństwo dla wszystkich środowisk wirtualnych

Fiery Remote Scan. Łączenie z serwerami Fiery servers. Łączenie z serwerem Fiery server przy pierwszym użyciu

SPOSOBY DYSTRYBUCJI OPROGRAMOWANIA PANDA

Uniwersytet Mikołaja Kopernika w Toruniu. Profilowanie ruchu sieciowego w systemie GNU/Linux

Nazwa usługi. Usługa nie obejmuje: Telefonii VOIP telefonii PSTN Stanowiska pracy nie związanego z IT (akcesoria biurowe)

Laboratorium - Task Manager (zarządzanie procesami) w Windows Vista

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego. Opis oferowanego przedmiotu zamówienia

DOKUMENTACJA BI SOW PFRON. Powykonawcza. dla BI INSIGHT S.A. UL. WŁADYSŁAWA JAGIEŁŁY 4 / U3, WARSZAWA. Strona 1 z 23

2014 Electronics For Imaging. Informacje zawarte w niniejszej publikacji podlegają postanowieniom opisanym w dokumencie Uwagi prawne dotyczącym tego

Autorytatywne serwery DNS w technologii Anycast + IPv6 DNS NOVA. Dlaczego DNS jest tak ważny?

Zarządzanie licencjami dla opcji Fiery na komputerze klienta

Aplikacja serwerowa Platformy Prezentacyjnej Opis produktu

Przetwarzanie i zabezpieczenie danych w zewnętrznym DATA CENTER

EasyExchangeRates Automatyczne przejmowanie kursów wymiany walut NBP do SAP. Prezentacja rozwiązania

NETWORK Monitorowanie serwerów, urządzeń i aplikacji INVENTORY Inwentaryzacja sprzętu i oprogramowania, audyty legalności USERS Monitorowanie

Graficzny terminal sieciowy ABA-X3. część druga. Podstawowa konfiguracja terminala

System komputerowy. Sprzęt. System komputerowy. Oprogramowanie

Wprowadzenie. Co to jest klaster? Podział ze względu na przeznaczenie. Architektury klastrów. Cechy dobrego klastra.

JAVA (wersja 1.5.x SUN Microsystems), ShockWave FLASH, lokalne wyświetlanie plików w standardzie PDF (moduł zewnętrzny).

Wykonać Ćwiczenie: Active Directory, konfiguracja Podstawowa

WIZUALNA EKSPLORACJA DANYCH I RAPORTOWANIE W SAS VISUAL ANALYTICS ORAZ WSTĘP DO SAS VISUAL STATISTICS

Zmiana treści Specyfikacji Istotnych Warunków Zamówienia.

NETWORK Monitorowanie serwerów, urządzeń i aplikacji INVENTORY Inwentaryzacja sprzętu i oprogramowania, audyty legalności USERS Monitorowanie

2. Informacje o mechanizmie limitów

Fiery Remote Scan. Uruchamianie programu Fiery Remote Scan. Skrzynki pocztowe

Dokumentacja fillup - MS SQL

Opcje raportów. łatwe i czytelne raportowanie

Firma Informatyczna ASDER. Prezentacja. Serwer danych lokalnych. Przemysław Kroczak ASDER

Laboratorium - Menedżer zadań (zarządzanie procesami) w Windows 7

EasyExchangeRates Automatyczne przejmowanie kursów wymiany walut z do SAP (ECB lub NBP) Prezentacja rozwiązania

ZAPYTANIE OFERTOWE. Wsparcie projektów celowych

Przetwarzanie danych w chmurze

System generacji raportów

Migracja Business Intelligence do wersji

Podstawowe możliwości programu Spectro Market Faktura

TAK, WYMAGA NIE WYMAGA

Praktyczne wykorzystanie mechanizmów zabezpieczeń w aplikacjach chmurowych na przykładzie MS Azure

Konfiguracja vsftpd ( Very Secure FTP Server )

Systemy Open Source w zarządzaniu projektami, na przykładzie Redmine i OpenProject. Rafał Ciszyński

Systemy Operacyjne I: Procesy

Z pojedynczym obiekcie zasady grupy znajdziemy dwa główne typy ustawień:

Transkrypt:

Zarządzanie wieloserwerowym środowiskiem SAS z wykorzystaniem SAS Grid Managera Katarzyna Wyszomierska

Wyzwania administratora Nowe oprogra mowanie Sprzęt Użytkownicy Dane

Wyzwania administratora Potrzebne nowe raporty! Wykonajmy bardziej skomplikowane analizy! Za mało danych! Po pewnym czasie Dane My też chcemy!

Wyzwania administratora Po pewnym czasie Dlaczego czekamy dłużej na wyniki??? Dane Dlaczego ja też muszę czekać?

Wyzwania administratora Po pewnym czasie Niektóre wyzwania administratora: Coraz dłuższe czasy przetwarzania danych Dane i raporty nie są gotowe na czas Coraz bardziej obciążony serwer Większe prawdopodobieństwo awarii serwera Zapewnienie wysokiej dostępności krytycznych procesów Brak czasu na wykonywanie czynności administracyjnych na serwerze

Wyzwania administratora Różne sposoby rozwiązania Jednym z nich jest SAS GRID Manager

SAS Grid Manager SAS Grid Manager to rozwiązanie pozwalające na zarządzanie procesami SAS przesłanymi do wykonania lub już uruchomionymi na jednym lub więcej serwerach.

SAS GRID Manager Równe obciążenie zasobów Równoległe przetwarzania Priorytety zadań Harmonogramowanie Wysoka dostępność Skalowalność

Równe obciążenie zasobów SAS GRID Manager pozwala między innymi na: uruchamianie zadań na najmniej obciążonym serwerze definiowanie limitów zadań uruchamianych na serwerze definiowanie limitów zadań uruchamianych przez użytkownika uzależnienie wykonania zadań na serwerze od dostępnych zasobów ustalanie priorytetów zadań z możliwością wstrzymywania zadań na czas wykonania procesu z większym priorytetem ustawianie różnych opcji SASa w zależności od aplikacji, z której zadanie zostało wysłane do wykonania uruchamianie zadań na jednym z wybranego podzbioru serwerów

Równe obciążenie zasobów Funkcjonalność ta jest osiągana poprzez zarządzanie: serwerami kolejkami użytkownikami aplikacjami dodatkowymi zasobami

Kolejki Aplikacja SAS SAS Grid Manager Kolejka

Kolejki Przesłane do wykonania zadanie zawiera informację, w jakiej kolejce ma być umieszczone. Parametry kolejek mają wpływ na to, w jakiej kolejności zadania będą uruchamiane, na jakim serwerze i kiedy.

Paramtery kolejki Pojemność Zasoby Serwery Czas Kolejka Użytkownicy Wywłaszczanie Priorytet

Parametry kolejki Pojemność maksymalna liczba zadań w kolejce maksymalna liczba zadań użytkownika w kolejce Użytkownicy lub grupy użytkowników, którzy mogą umieszczać zadania w kolejce Serwery, na których mogą być uruchamiane zadania z kolejki Priorytet

Parametry kolejki Wywłaszczanie czy kolejka może wywłaszczać zadania pochodzące z innych kolejek czy zadania z tej kolejki mogą być wywłaszczane przez zadania z innych kolejek Zasoby Dodatkowe wymagania dla zadań w kolejce Czas kiedy zadania z kolejki mogą być wysyłane i uruchamiane Kiedy dany atrybut obowiązuje

Kolejki Kolejka priorytetowa SERWER A Kolejka normalna Aplikacja SAS SAS Grid Manager Kolejka nocna SERWER B Kolejka zadań krótkich SERWER C

Kolejki O kolejności uruchamianych zadań decyduje priorytet kolejki. Pierwszeństwo mają kolejki z wysokim priorytetem. W przypadku kolejek o tym samym priorytecie, zadania są przesyłane do wykonania w kolejności przybycia do kolejki. Domyślnie zadania czekają na wolne zasoby, ale można to zmienić przez ustawienie opcji wywłaszczania. Aby uniknąć zawłaszczenia zasobów przez zadania z jednej kolejki można zdefiniować mechanizm Fairshare scheduling. Mechanizm ten sprawiedliwie dzieli dostępne zasoby pomiędzy użytkowników i kolejki.

FairShare Scheduling Mechanizm FairShare może być zdefiniowany na poziomie kolejki dla użytkowników lub pomiędzy kolejkami: dla użytkowników kolejki precyzuje podział zasobów między użytkownikami danej kolejki FAIRSHARE=USER_SHARES [[user1, 6] [user2, 4] [user3, 2]] dla użytkowników pomiędzy kolejkami precyzuje podział zasobów pomiędzy użytkownikami różnych kolejek: FAIRSHARE = USER_SHARES[[user1, 80] [group2, 40] [default, 1]] FAIRSHARE_QUEUES = queue2 queue3 dla różnych kolejek reprezentuje, jaką część wszystkich zadań stanowią zadania z danej kolejki: SLOT_SHARE=40

Serwery Definicje serwerów pozwalają na: ograniczenie liczby procesów na serwerze ograniczenie liczby procesów uruchomionych przez danego użytkownika uruchamianie procesów w zależności od obciążenia uruchamianie procesów w określonym czasie.

Serwery Serwer stanowi zestaw zasobów wykorzystywanych do wykonania programu. Różne aplikacje wymagają różnych zasobów. Serwery mogą różnić się od siebie i oferować różne zasoby, dlatego nie każdy program może być uruchomiony na każdym z nich. Program przesłany do wykonania zawiera informację o zasobach, których potrzebuje. Są one podane przy przesyłaniu zadania lub zapisane w definicji kolejki. Z kolei w definicji serwera są zapisane zasoby, które serwer oferuje, jak również warunki przyjęcia nowego zadania do wykonania.

Zasoby statyczne - przykłady Zasób Opis Jednostka type Typ maszyny (serwer/klient) Tekst model Model maszyny Tekst hname Nazwa maszyny Tekst server Czy maszyna może wykonywać zadania Wartość logiczna ncpus Liczba procesorów Procesory ndisks Liczba lokalnych dysków Dyski maxmem Maksymalna wielkość dostępnej pamięci MB RAM maxswp Maksymalna wielkość obszaru SWAP MB maxtmp Maksymalna wielkość obszaru dostępna w /tmp MB

Zasoby dynamiczne - przykłady Zasób Opis Jednostka Średnia przez okres status Status maszyny Tekst N/A 15s r15s Długość kolejki do CPU Liczba procesów 15 sekund 15s r1m (cpu) Długość kolejki do CPU Liczba procesów 1 minuta 15s r15m Długość kolejki do CPU Liczba procesów 15 minut 15s ut Wykorzystanie CPU % 1 minuta 15s pg Paging rate (in+out)/sec 1 minuta 15s ls (login) Liczba użytkowników Liczba N/A 30s it (idle) Czas bezczynności Minuty N/A 30s swp (swap) Dostępny obszar swap MB N/A 15s mem Dostępna pamięć MB N/A 15s Czas aktualizacji tmp Dostępna wielkość obszaru w /tmp MB N/A 120s io Wydajność I/O KB/sec 1 minuta 15s

Zasoby Zasoby można wykorzystać: w definicji kolejki do podania, jakie są wymagania zadań przesyłanych z tej kolejki, w definicji serwera do podania, co serwer oferuje oraz jakie ma ograniczenia w przyjmowaniu zadań. Przykładowo: Serwer przyjmuje nowe zadania, kiedy dostępnych jest co najmniej 10G pamięci RAM, a obciążenie procesora nie przekracza 70%. Jeżeli obciążenie procesora wzrośnie do 80%, serwer może zacząć zawieszać wykonywane zadania do czasu zmniejszenia obciążenia.

Zasoby Zasoby można również wykorzystać w środowisku SAS do wskazania serwerów, na których mogą być wykonywane konkretne przetwarzania lub zadania wygenerowane przez określone aplikacje. W definicji serwera podaje się, które z tych zasobów są dostępne: A w definicji kolejki lub przy uruchamianiu zadania podaje się, które zasoby są niezbędne:

AplikacjeFinanse SAS Enterprise Miner Opcje SAS: Zasoby: Opcje grid: ZADANIA -memsize 2G SASSTAT SASAppEm queue=normal Finanse SAS Enterprise Guide SAS Enterprise Guide ZADANIA Opcje SAS: -memsize 512 Zasoby: SASSTAT SASApp Opcje grid: queue=priority ZADANIA ETL SAS Data Integration Studio Opcje SAS: Zasoby: Opcje grid: -memsize 4G SASApp queue=night

SAS Grid Manager SAS oferuje rozwiązanie SAS Grid Manager w 2 wersjach: SAS Grid Manager + Platform Suite for SAS SAS Grid Manager dla Hadoopa SAS Grid Manager dla Hadoopa nie oferuje pełnej, opisanej poprzednio funkcjonalności.

SAS Grid Manager + Platform Suite for SAS

SAS Grid Manager dla Hadoopa

Zalety SAS Grid Managera Lepiej wykorzystane dostępne zasoby zarówno dla przetwarzań interaktywnych jak i dla wsadowych dystrybucja zadań w oparciu o rzeczywiste obciążenie priorytetyzacja zadań wykonywanie zadania na maszynie, która posiada niezbędne dla tego zadania zasoby definiowanie różnych opcji uruchomieniowych dla różnych aplikacji i użytkowników Wysoka dostępność definiowanie wysokiej dostępności dla wybranych procesów możliwość zdefiniowania wysokiej dostępności w trybie active-passive lub active-active definiowanie zależności między procesami restart zadań od początku lub od momentu, kiedy zadanie zostało przerwane Harmonogramowanie zadań definiowanie zależności między zadaniami, zależności od plików oraz czasowych

Zalety SAS Grid Managera Przetwarzanie równoległe automatycznie dla niektórych aplikacji (SAS Data Integration Studio, SAS Enterprise Miner, SAS Enterprise Guide) procedura SCAPROC do analizy kodów i przepisania ich na wersję gridową (dostępna automatycznie w SAS Data Integration Studio i SAS Enterprise Guide) Narzędzie SASGSUB do wsadowego uruchamiania zadań z linii poleceń Łatwiejsza administracja i monitorowanie dostępne poprzez przeglądarkę narzędzia do monitorowania i zarządzania środowiskiem SAS Grid śledzenie na bieżąco wykorzystywania zasobów na poszczególnych serwerach możliwość generowania alertów łatwe rozszerzanie środowiska wykorzystanie tańszego sprzętu (commodity hardware)

SAS Grid Manager Nie zawsze przeniesienie przetwarzania na środowisko SAS GRID spowoduje, że programy zaczną działać szybciej: jeżeli będą dokładnie takie same zasoby (szczególnie I/O) podzielenie zadania na części może wymagać długiego czasu łączenia wyników przy krótkim czasie przetwarzania czas wyboru serwera i wystartowania jednej lub więcej sesji może być znaczący. SAS Grid Manager wymaga wspólnego, szybkiego filesystemu

Kiedy warto zastosować SAS Grid Manager? Stworzenie wysoko dostępnego środowiska dla krytycznych usług. Zapewnienie odpowiednich zasobów zgodnie z potrzebami wielu użytkownikach korzystających z różnych aplikacji SAS. Regularnie uruchamiane zadania, które mają krótki przedział czasowy i muszą by wykonane na czas. Potrzeba skalowalnego środowiska dla wzrastającej liczby użytkowników i wielkości analizowanych danych. Dużo bardzo długich przetwarzań, które można zrównoleglić.

Analityka kluczem do innowacyjnych usług Agenda Informacje o prezentacjach i prelegentach Możliwość oceny prezentacji Copyright 2015, SAS Institute Inc. All rights reserved.

Dziękuję za uwagę