GRID - globalny system przetwarzania danych



Podobne dokumenty
Równoległe aplikacje duŝej skali w środowisku PL-Grid. Kick-off PL-GRID Kraków, kwietnia 2009

Infrastruktura PLGrid dla młodych naukowców

Infrastruktura PLGrid Nowa jakość usług informatycznych w służbie nauki

Infrastruktura gridowa

Infrastruktura PLGrid Nowa jakość usług informatycznych dla Polskiej Nauki

Infrastruktura PLGrid Nowa jakość usług informatycznych w służbie nauki

Usługi HEP w PLGrid. Andrzej Olszewski

Infrastruktura PLGrid dla młodych polskich naukowców

Wrocławskie Centrum Sieciowo-Superkomputerowe

Infrastruktura PLGrid Nowa jakość usług informatycznych dla Polskiej Nauki

Zasoby i usługi Wrocławskiego Centrum Sieciowo-Superkomputerowego

Infrastruktura PLGrid (nie tylko) dla młodych naukowców

Jacek Kitowski i Łukasz Dutka ACK CYFRONET AGH, Kraków, Polska

"System CC1 jak zbudować prywatną chmurę obliczeniową w jedno popołudnie. M. Witek, M. Zdybał w imieniu CC1

Polityka wspierania prac naukowych i wdrożeniowych w obszarze informatyki jako element budowy społeczeństwa informacyjnego w Polsce

PLGrid: informatyczne usługi i narzędzia wsparcia w nauce

Mateusz Kurleto NEOTERIC. Analiza projektu B2B Kielce, 18 października 2012

Infrastruktura PLGrid

GRIDY OBLICZENIOWE. Piotr Majkowski

Infrastruktura PLGrid Nowa jakość usług informatycznych dla Polskiej Nauki

Piotr Dziubecki Piotr Grabowski, Tomasz Kuczyński Tomasz Piontek, Dawid Szejnfeld, PCSS

Sieć PIONIER i sieci miejskie Warsztaty

USŁUGI HIGH PERFORMANCE COMPUTING (HPC) DLA FIRM. Juliusz Pukacki,PCSS

Nowe aplikacje i usługi w środowisku Grid

Skalowalna Platforma dla eksperymentów dużej skali typu Data Farming z wykorzystaniem środowisk organizacyjnie rozproszonych

INTERNET - Wrocław Usługi bezpieczeństwa w rozproszonych strukturach obliczeniowych typu grid

Uslugi chmurowe dla nauki na podstawie BonFIRE

Przetwarzanie danych w chmurze

Przetwarzanie i zabezpieczenie danych w zewnętrznym DATA CENTER

Program Obliczeń Wielkich Wyzwań Nauki i Techniki (POWIEW)

Na podstawie 6 ust. 1 oraz 10 ust. 1 Regulaminu Organizacyjnego ACK Cyfronet AGH z dnia 28 kwietnia 2005 roku zarządzam co następuje:

Laboratorium Wirtualne w środowisku gridowym

Infrastruktura PL-Grid wsparciem dla naukowców

Infrastruktura PLGrid Usługi dla chemii obliczeniowej

Infrastruktura PL-Grid wsparciem dla naukowców

Wirtualizacja zasobów IPv6 w projekcie IIP

Usługi przechowywania danych KMD/PLATON-U4 dla bibliotek cyfrowych. Maciej Brzeźniak, Norbert Meyer, Rafał Mikołajczak, Maciej Stroiński

Usługi i rozwiązania IT dla biznesu

Dobre praktyki w doborze technologii rozwiązań informatycznych realizujących usługi publiczne

Działanie 2.3: Inwestycje związane z rozwojem infrastruktury informatycznej nauki

Światowy Grid komputerowy LHC Michał Turała IFJ PAN/ ACK Cyfronet AGH, Kraków

Nazwa jednostki Temat pracy (w języku polskim i angielskim) Rodzaj pracy Ilość osób realizujących pracę

High Performance Computers in Cyfronet. Andrzej Oziębło Zakopane, marzec 2009

Model funkcjonowania MPTI

Cyfronet w CTA. Andrzej Oziębło DKDM

Budowa Data Center. Zmagania Inwestora. Konferencja. 30 października 2014

Automatyzacja procesu tworzenia i zarządzania Wirtualnymi Organizacjami w oparciu o wiedzę w zastosowaniu do architektur zorientowanych na usługi

Opis wdrożenia Platformy Technologicznej epodreczniki.pl na zasobach Poznańskiego Centrum Superkomputerowo-Sieciowego

Prezentacja Grupy Atende

Prezentacja Grupy Atende 2017

Usługi IT rozwijane i utrzymywane przez Centrum Usług Informatycznych Politechniki Gdańskiej. Paweł Lubomski Gdańsk, 7 czerwca 2019 r.

Infrastruktura PLGrid: narzędzia wsparcia w nauce i dydaktyce. Mariola Czuchry, Klemens Noga, Katarzyna Zaczek. ACK Cyfronet AGH

Dyrektor ACK Cyfronet AGH. z dnia 2 października 2017 roku w sprawie zmian organizacyjnych

Sterowany jakością dostęp do usług składowania danych dla e-nauki

Budowa uniwersalnej architektury dla Laboratorium Wirtualnego

Efektywne wykorzystanie zasobów PLGrid w chemii obliczeniowej

IMP PAN. Zaplecze obliczeniowe Centrum Zaawansowanych Technologii AERONET. Dolina Lotnicza

Technologie taśmowe wprowadzenie i zastosowania. Jacek Herold, WCSS

Bartosz Bosak Piotr Kopta Tomasz Piontek

Laboratorium Chmur obliczeniowych. Paweł Świątek, Łukasz Falas, Patryk Schauer, Radosław Adamkiewicz

Virtual Grid Resource Management System with Virtualization Technology

Wirtualizacja sieci - VMware NSX

Usługi i narzędzia QCG

Rola polskich bibliotek cyfrowych w zapewnianiu otwartego dostępu

Architektury usług internetowych. Tomasz Boiński Mariusz Matuszek

Laboratorium Wirtualne

Wsparcie migracji obliczeń poprzez wirtualizację zasobów sieciowych

Architektura komputerów

Prace informatyczne dla projektu CTA

PL-Grid i PLGrid Plus fundusze unijne wspierają przyspieszenie procesów innowacyjnych w obszarze e-science w Polsce

Systemy komputerowe wspomagania gospodarki energetycznej w gminach

BCC Data Centers. Oferta: Outsourcing IT, cloud computing Optymalizacja i bezpieczeństwo IT. Tytuł prezentacji 1

W Stanach Zjednoczonych jest to popularne określenie sieci elektrycznej

Zagadnienia egzaminacyjne INFORMATYKA. Stacjonarne. I-go stopnia. (INT) Inżynieria internetowa STOPIEŃ STUDIÓW TYP STUDIÓW SPECJALNOŚĆ

Infrastruktura PL-LAB2020

System INTEGRYB jako zintegrowane repozytorium danych umożliwiające zaawansowaną analitykę badawczą

Poznańskie Centrum Superkomputerowo - Sieciowe

Lista projektów rekomendowanych do dofinansowania złożonych w ramach Programu Operacyjnego Innowacyjna Gospodarka, Działanie 2.

Lista rankingowa/suplement/korekta* Dla projektów o wartości wydatków kwalifikowanych co najmniej 15 mln PLN

Klaster obliczeniowy

e-infrastruktura: nowe strategie i wyzwania

Platforma Informatyczna Wdrażania Oprogramowania Dedykowanego w PL-Grid

Dekada polskiego Internetu w nauce

ROZWÓJ SYSTEMÓW SZTUCZNEJ INTELIGENCJI W PERSPEKTYWIE "PRZEMYSŁ 4.0"

Podpis elektroniczny dla firm jako bezpieczna usługa w chmurze. mgr inż. Artur Grygoruk

DLA SEKTORA INFORMATYCZNEGO W POLSCE

Dodatkowo, w przypadku modułu dotyczącego integracji z systemami partnerów, Wykonawca będzie przeprowadzał testy integracyjne.

Hosting i backup danych w środowisku operatorskim

Dane bezpieczne w chmurze

Aktywne formy kreowania współpracy

Realizacja idei OpenADR dwukierunkowa komunikacja dostawcy energii-odbiorcy rozwój i implementacja niezbędnej infrastruktury systemowej i programowej

Małopolska Chmura Edukacyjna Projekt pilotażowy MRPO, działanie 1.2

Europeana Cloud: Wykorzystanie technologii chmurowych do współdzielenia on-line baz danych dziedzictwa kulturowego

SNP Poland. do BCC

Kraków Wrocław Poznań Warszawa Gdańsk CLOUD SERVICES & DATA CENTER

ZAŁĄCZNIK NR 3 OPIS PRZEDMIOTU ZAMÓWIENIA DOTYCZĄCY WDROŻENIA PLATFORMY ZAKUPOWEJ

Wydział Fizyki AGH" Kraków, 11 grudnia 2009"

SYSTEM VILM ZARZĄDZANIE CYKLEM ŻYCIA ŚRODOWISK WIRTUALNYCH. tel: +48 (032)

Chmura obliczeniowa jako źródło dostępu do usług świadczonych na drodze elektronicznejd

System Użytkowników Wirtualnych

Transkrypt:

GRID - globalny system przetwarzania danych Dlaczego GRID? Jak jest zbudowany, zorganizowany i jak działa Międzynarodowe i krajowe inicjatywy gridowe Zastosowania Trudne do pogodzenia sprzeczności interesów GRID dla energetyki? Wojciech Wiślicki, IPJ, 25/9/2010

Dlaczego GRID? Produkcja i zapis informacji Możliwości CPU Więcej informacji będziemy reprodukowali i silniej ją zredukujemy przed zapisem

Dlaczego GRID? Prawa Moore'a dla nośników danych ( lat i bandwidth 100/(10 Ale najszybciej tanieje bandwidth Wniosek: wzrasta ruch w sieci

Dlaczego GRID? Złożoność problemów Złożoność urządzeń i grup ludzkich

Czym jest grid? Grid jest rodzajem rozproszonego computingu, tzn. do zadania używamy zasobów zlokalizowanych w różnych miejscach i połączonych siecią Grid organizuje przetwarzanie danych, zarówno zasoby, jak użytkowników, lecz nie zarządza nimi centralnie. Zasoby należą do różnych właścicieli Używane są tzw. open standards Zapewnia Quality of service

Pierwszy historycznie przykład GRIDu: SETI @ home Każdy komputer podłączony do Internetu może zainstalować oprogramowanie do analizy danych z radioteleskopu San Mateo CA Niebo podzielone jest na małe obszary i każdy komputer dostaje kawałek do przeanalizowania w czasie, gdy jest nieobciążony (zasada ( screen-savera

Pierwszy historycznie przykład GRIDu: SETI @ home, c.d. Poszukuje się w widmie częstości struktur niepodobnych do znanych wzorców

Pierwszy historycznie przykład GRIDu: SETI @ home, c.d. Obecnie SETI @ home ma 5.5 mln uczestników SETI @ home nie jest jednak prawdziwie rozwiniętym gridem (brak prawdziwych serwisów ( QoS i

Pierwszy historycznie przykład GRIDu: SETI @ home, c.d. Dotychczas (ok. 10 lat) nie znaleziono ET

Architektura gridu (opartego na ( glite systemie Model przetwarzania danych Łączność: sieć GEANT i sieciowa koordynacja operacyjna ruchu Organizacja w dużej skali: struktury globalne, federacje, społeczności użytkowników Struktura węzła gridowego Dostęp do zasobów i usługi gridowe Aplikacje

Wielowarstwowy (multi-tier) model przetwarzania danych: LHC w CERN

Najniższy poziom przetwarzania w gridzie WLCG: Tier-3 Poziom ten nie jest udostępniany w gridzie Służy lokalnym grupom do celów deweloperskich Może być też mocną lokalną farmą do analizy na wysokim poziomie, np. do zrównoleglonej analizy PROOF'em Tier-3 może mieć minimalną funkcjonalność gridową (np. tylko user interface i gridowy ( danych transfer

Łączność: sieć GEANT wraz z EGEE Network Operations Centre

Organizacja GRIDU z lotu ptaka Pl: NREN=PIONIER, RGI=PlGrid

Podstawowe elementy struktuaralne: węzły gridowe

Podstawowe usługi gridowe (system ( glite Katalogi zbiorów i metadanych Workflow management Monitoring Accounting Zarządzanie rozproszonymi zbiorami danych Zarządzanie wirtualnymi organizacjami użytkowników Wsparcie dla użytkowników

Dostęp do gridu Trzeba skutecznie rozpoznać użytkownika i dać mu bezpieczny dostęp do zasobów obliczeniowych

Dostęp do gridu, c.d. Grid Security Infrastructure, oparta na certyfikatach dla użytkowników, wystawianych przez narodowe Certificate Authorities Certyfikaty użytkowników w formacie X.509, umożliwiające autentykację (sprawdzenie tożsamości) użytkownika Autoryzacja na zasoby udzielana w ramach wirtualnych organizacji przez serwisy Virtual ( VOMS ) Organization Membership Service

Trochę statystyki: Enabling Grids for E-science 54 kraje, 267 węzłów sieciowych 114 000 CPU dostępnych 24/7 20 PB pamięci dyskowej + tape MS 200 wirtualnych organizacji 16 000 użytkowników 150 000 zadań/dzień 15 obszarów tematycznych aplikacji

Infrastruktura obliczeniowa Serwisy produkcyjne (PS), używane w bieżącej pracy operacyjnej, np. Worldwide LHC Computing Grid Serwisy pre-produkcyjne (PPS), używane do testowania nowych narzędzi i usług gridowych przed ich wdrożeniem do produkcji Infrastruktura szkoleniowa (portal szkoleniowy GILDA), umożliwiająca przeprowadzanie kursów gridowych bez wpuszczania użytkowników na infrastrukturę produkcyjną

Wsparcie dla użytkowników

Monitoring gridu: GIIS w Academia Sinica Klaster warszawski w domenie polgrid.pl

Monitoring gridu: GIIS w Academia Sinica, c.d. Klaster warszawski w domenie polgrid.pl

Aplikacje Dwa największe gridy typu general purpose, to ( USA ) EGEE (EC) i OSG Ich największymi użytkownikami są eksperymenty nowej generacji w fizyce wysokich energii, głównie przy Large Hadron Collider w CERNie Istnieją też duże aplikacje biomedyczne, geologiczne, meteorologiczne, chemiczne, z fizyki plazmy.., uprawiane zarówno na EGEE, OSG, jak i na gridach dziedzinowych

Narodowa inicjatywa gridowa Pl- Grid Od 2009 organizacja gridów WLCG i EGEE oparta jest o narodowe projekty gridowe Pl-Grid, konsorcjum finansowane przez MNiSW w ramach Programu Operacyjnego Innowacyjna Gospodarka Finansowany w ramach umowy POIG.02.03.00-00-007/08-00 2009-11

Pl-Grid, partnerzy ACK Cyfronet ICM UW PCSS PAN CI TASK WCSS

Pl-Grid, partnerzy Oparty na tym samym szkielecie sieciowym co EGEE

Pl-Grid, struktura

Pl-Grid, struktura warstwy sprzętowej i narzędziowej Równoległe działanie dwóch infrastruktur w warstwie narzędziowej i operacyjnej - glite i Unicore Wykorzystanie dorobku narzędziowego i serwisowego projektów gridowych z FP 5,6,7 Struktura serwisów wzorowana na EGEE Sprzęt obliczeniowy i sieciowy częściowo odziedziczony po EGEE/WLCG, uzupełniony o duże zakupy w ramach pl-grid

Pl-Grid, zadania i koordynatorzy Z1- Zarządzanie Projektem ACK CYFRONET AGH (Kraków) Z2 - Infrastruktura sprzętowa CI TASK ( Gdańsk ) Z3 - Centrum Operacyjne ACK CYFRONET ( Kraków ) AGH Z4 - Rozwój oprogramowania e-infrastruktury i ( Poznań ) narzędzi użytkownika PCSS Z5 - Szkolenia i wsparcie użytkowników ICM ( Warszawa ) UW Z6 - Bezpieczeństwo infrastruktury WCSS (Wrocław).

Pl-Grid, struktura organizacyjna

Pl-Grid, zadania merytoryczne Wsparcie dla EGEE i DEISA Wspieranie nowych inicjatyw i systemów gridowych Przydział zasobów do celów naukowobadawczych i R&D Stworzenie i wsparcie infrastruktury produkcyjnej Zarządzanie zasobami Wsparcie sieciowe Wsparcie aplikacji Własne R&D

Pl-Grid, dostępność usług ( SAM ) Service Availability Monitoring

Pl-Grid, dostępność infrastruktur informatycznych Monitoring GSTAT oparty na narzędziu EGEE Program instalacji zasobów do 2011 obejmuje 215 Tflops i 2500 TB, zlokalizowanych w 5 ośrodkach

Pl-Grid, wsparcie dla użytkowników Obsługa zapytań w ramach helpdesk, opartego ( 1or0 na systemach rd-tracker (wcześniej https://helpdesk.plgrid.pl Specjalistyczna pomoc w przypadku problemów operacyjnych i badawczo-rozwojowych Dostęp poprzez certyfikaty użytkowników

Pl-Grid, narzędzia dla użytkowników Bazaar G-Eclipse Grid Commander Grid Space Migrating Desktop QosCosGrid Vine

Pl-Grid, narzędzia zarządzania FiVO konfiguracja VO Acarm Gemini2 StorMon X2R

Pl-Grid, szkolenia Szkolenia dla użytkowników zaawansowanych ze świata nauki i przemysłu w formie kursów hands-on Szkolenia wprowadzające dla nowych użytkowników Różne formy szkoleń: Regularne kursy tradycyjne, o różnych poziomach szczegółowości i zaawansowania Zdalne kursy przy użyciu platformy Blackboard

Pl-Grid, oprogramowanie specjalistyczne Freeware z różnych dziedzin, wypracowywany stopniowo przez społeczności naukowe Oprogramowanie licencyjne potrzebne użytkownikom Reprezentowane dziedziny: fizyka wysokich energii, fizyka molekularna, fizyka płynów, geofizyka, chemia kwantowa, biologia obliczeniowa, ogólne metody numeryczne i symulacyjne

Trudne do pogodzenia sprzeczności interesów Kto jest właścicielem i kto zarządza zasobami obliczeniowymi? Różne podmioty porozumiewają się, nikt nie zrzeka się praw do swoich części Jeden właściciel i administrator Kto finansuje infrastrukturę i serwisy? Provider(zy): wolny dostęp dla użytkowników Użytkownicy: dostęp płatny

Trudne do pogodzenia sprzeczności interesów, c.d. Bezpieczeństwo serwisów i rzetelność infrastruktury Podstawowe bezpieczeństwo w ramach Grid Security Infrastructure, bez odpowiedzialności finansowo-prawnej provider'ów Wysokie wymagania niezawodności (>99.99%) i predefiniowane bezpieczeństwo danych, z określoną odpowiedzialnością finansowo-prawną

Dwa modele przetwarzania: GRID vs. CLOUD GRID Współdzielone zasoby należące do wielu właścicieli, znajdujące się w różnych miejscach, połączone, brak zarządzania centralnego. ( USA ) Przykłady: EGEE (EU+), OSG CLOUD Zasoby rozproszone, lecz zarządzane i posiadane przez jednego właściciela. Użytkownik płaci za (.. pamięć usługi (dostęp, cykle, Przykłady: Amazon Elastic Compute Cloud, Google App Engine

GRID vs CLOUD Provider: nauka Technologia open source Użytkownik wpływa na infrastrukturę i dostosowuje do specyficznych zadań Złożony do używania wymagana wstępna wiedza Provider: komercja Technologia proprietary Użytkownik dzierżawi dostęp do zdefiniowanej infrastruktury Prosty w użyciu od poziomu zero

GRID vs CLOUD, c.d. Niepewna jakość usług Możliwość tworzenia własnych, specyficznych serwisów Bezpieczeństwo danych: repliki w różnych miejscach Łatwe współdzielenie danych Komercyjnie gwarantowana jakość Brak wysokospecjalizowanych serwisów aplikacyjnych Bezpieczeństwo danych: specjalna usługa Współdzielenie po wykupie dostępu

Pro domo sua: przetwarzanie rozproszone dla energetyki Zadania computingu wspierającego energetykę w Polsce: Konfiguracja i eksploatacja siłowni jądrowych Dystrybucja energii Monitoring zagrożeń radiacyjnych i chemicznych oraz wspomaganie decyzyjne Bezpieczeństwo energetyczne

Przetwarzanie rozproszone dla energetyki, c.d. Koncepcja computingu na potrzeby długofalowego programu rozwoju energetyki w Polsce: Centrum Informatyczne w Świerku jako główny węzeł wsparcia informatycznego Planowana częściowa integracja z Pl-grid Architektura CIŚ uwzględniająca specyfikę (? CLOUD zadań (kiedy GRID, a kiedy Specjalne wymagania bezpieczeństwa a rekonfigurowalność klastra

Monitoring zagrożeń radiologicznych

Monitoring zagrożeń chemicznych

Monitoring zagrożeń radiologicznych i chem., c.d. Charakter serwisu wymaga całkowitego bezpieczeństwa danych i gwarantowanej jakości (wysoki poziom Service Level ( Agreement Potrzebne zasoby na życzenie (on demand) z możliwością szybkiej alokacji Bezpieczniejszym rozwiązaniem jest CLOUD, aniżeli GRID

LEAD: huragany tropikalne w USA Models and Algorithms Driving Sensors The CS challenge: Build cyberinfrastructure services that provide adaptability, scalability, availability, useability, and real-time response. Product Generation Display, Dissemination

Zadania off-line, wymagające bezpieczeństwa baz danych, lecz nie obliczeń Transport materii i promieniowania, obliczenia reaktorowe oraz optymalizacja eksploatacji siłowni jądrowych Optymalizacja dystrybucji energii w sieciach, projektowanie sieci przesyłu energii i surowców (zadania typu routingu na grafach i optymalizacji dyskretnej; bardzo wymagające ( obliczeniowo Zadania doskonałe dla GRIDu

Sieć szkieletowa w CIŚ

Uwagi końcowe Architekturę gridu dominują usługi serwisowe ( architecture (Service-oriented Infrastruktura staje się niewidoczna dla użytkownika Przetwarzanie rozproszone jest dominowane przez dwa trendy: grid i cloud Wsparcie informatyczne dla energetyki prawdopodobnie wymaga mariażu obu