EGEE: europejski grid naukowy Piotr Siwczak Poznańskie Centrum Superkomputerowo Sieciowe
Plan prezentacji EGEE przedstawienie projektu Dostęp do zasobów gridu EGEE Korzystanie z gridu w praktyce
EGEE Cele projektu Uczestnicy projektu Struktura organizacyjna Stan obecny Klaster PCSS w EGEE
Cele projektu EGEE Enabling Grids for E science http://www.eu egee.org CEL: Rozwój usług gridowych w Europie i udostępnienie gridu środowisku naukowemu w trybie 24x7
Cele projektu (2) Główne kierunki rozwoju 48% usługi (udostępnianie usług gridowych, udostępnianie zasobów sieciowych) 24% rozwój middleware'u (testy jakości, bezpieczeństwa, rozwój nowych usług) 28% infrastruktura sieciowa (szkolenia dla użytkowników, zarządzanie aplikacjami, współpraca międzynarodowa)
Cele projektu (3) Główne kierunki rozwoju Network Activity NA1 zarządzanie projektem NA2 koordynacja działań NA3 szkolenia dla użytkowników NA4 wsparcie dot. aplikacji NA5 współpraca międzynarodowa Specific Service Activity SA1 administracja i utrzymanie usług gridowych SA2 zarządzanie zasobami sieciowymi Joint Research Activity JRA1 projektowanie i integracja middleware'u JRA2 zapewnienie jakości JRA3 bezpieczeństwo JRA4 rozwój usług sieciowych
Uczestnicy 70 partnerów (organizacje i kraje) pogrupowanych w regionalne federacje Planowana moc obliczeniowa: 20000 CPU
Struktura organizacyjna Operations Management Centre (CERN) koordynacja i zarządzanie całością projektu współpraca z innymi projektami gridowymi Core Infrastructure Centres zarządzanie kluczowymi usługami gridu (także specyficznymi dla konkretnych VO) rozwój nowych narzędzi do zarządzania infrastrukturą gridową wsparcie dla ROC Regional Operations Centres Resource Centres Koordynacja projektu zarządzanie infrastrukturą gridową na poziomie regionalnym dostarczanie zasobów obliczeniowych
Struktura organizacyjna (2) Resource Center (Processors, disks) Grid server Nodes Operatio ns Center Regio nal Supp ort Regio nal Supp ort Regio nal Supp ort Regiona l Support Center (Support for Applications Local Resources) Resource Center Resource Center Resource Center
Stan obecny zasobów Infrastruktura obliczeniowa liczba procesorów: 8314 klastry oparte głównie o architekturę ia32 system operacyjny: RedHat Linux
Klaster PCSS w EGEE jeden z nielicznych ośrodków EGEE oparty o procesory Itanium2 (ia64) w najbliższym czasie, dostępnych w ramach EGEE będzie 50 węzłów obliczeniowych (100 procesorów) wykorzystywane technologie: Fibrechannel (storage), Infiniband, Gigabit Ethernet (interconnect)
Stan obecny zasobów (2) Organizacje wirtualne Związane z eksperymentem LHC (CERN) ALICE ALICE experiment ATLAS ATLAS experiment CMS CMS experiment DTEAM Grid (LCG) Deployment Group LHCB LHCb experiment SixTrack Single Particle Tracking Code
Stan obecny zasobów (3) Organizacje wirtualne Nie związane z LHC BaBar BaBar experiment D0 D0 experiment H1 H1 experiment Zeus Zeus experiment Biomed EGEE Biomedical activity ESR Earth Science Research EGEODE Expanding GEOsciences on DEmand
Dostępne aplikacje Projekt EGEE jest otwarty na wszelkie aplikacje o charakterze naukowym Uwzględniono także możliwość instalacji aplikacji o charakterze biznesowym Pilot New
Przykłady aplikacji GATE: Geant4 Application for Tomographic Emission GPS@ genomic web portal CDSS Clinical Decision Support System
Dostęp do zasobów gridu EGEE 2 sposoby korzystania z gridu EGEE rejestracja w gridzie EGEE tworzenie nowej organizacji wirtualnej
2 sposoby korzystania z zasobów gridu EGEE Rejestracja w istniejącej VO dostęp do standardowych aplikacji dla danej VO odpowiednie dla osób indywidualnych łatwa i szybka rejestracja Stworzenie nowej VO odpowiednie dla grup o wspólnych potrzebach możliwość tworzenia i korzystania z własnych aplikacji potencjalne trudności związane z konfiguracją potencjalne trudności z dostępem do infrastruktury (nie każdy ośrodek będzie wspierał nowo utworzone VO) PCSS oferuje wsparcie przy zakładaniu nowej organizacji wirtualnej
Proces rejestracji w istniejącej VO Uzyskanie certyfikatu z CA rozpoznawanego przez LCG. W Polsce jest to PolishGrid CA http://www.man.poznan.pl/plgrid ca Certyfikat należy załadować do przeglądarki Odwiedzić stronę https://lcg registrar.cern.ch Wybrać organizację wirtualną Wypełnić formularz https://lcg registrar.cern.ch/cgibin/register/account.pl
Tworzenie nowej VO Od strony technicznej Należy uruchomić 3 usługi: VO server, Registration Service, Replica Location Service (RLS) Określona ilość ośrodków musi dostarczyć mocy obliczeniowej i przestrzeni dyskowej, aby supportować nową VO rozwiązania techniczne: LDAP vs VOMS VO SERVER (obecne ograniczenia)
Tworzenie nowej VO (2) Organy związane z tworzeniem VO Activity NA4: zatwierdzanie nowych wniosków Activity SA1: zarządzanie infrastrukturą techniczną EGEE Generic Applications Advisory Panel (EGAAP): wstępne oszacowanie wniosku Operation Advisory Group (OAG): finalizacja rejestracji nowej VO
Tworzenie nowej VO (3) Od strony organizacyjnej 1) Nowe wnioski Instala cja i konfig uracja 2) EGAAP 5) OAG Zalecani kandydaci na VO 3) NA4 Prośba o zmianę wymagań Wniosek dot. Zasobow (resource proposal) 4) SA1 Wymagania dla VO
Dodawanie nowych zasobów (Resource Centres) do EGEE Wymagania Oficjalny middleware: LCG2 ver.2_3_0 http://grid deployment.web.cern.ch Systemy operacyjne http://linuxsoft.cern.ch : RedHat Linux 7.3 Scientific Linux CERN 3 Hardware najlepiej ia32 nieoficjalnie wspierane są także architektury ia64 (CERN Openlab)
Dodawanie nowych zasobów do EGEE (2) Administrator wypełnia formularz kontaktowy dla Resource Centre (RC) RC uzyskuje dostęp do GOC DB (Grid Operations Centre Database) możliwość monitorowania zasobów RC instaluje i konfiguruje middleware LCG2 RC przeprowadza samodzielne testy LCG2 Jeżeli wyniki testów są pozytywne, LCG2 Deployment Team dodaje RC do tzw. TestZone (Grupa Testowa) RC umieszcza pliki konfiguracyjne LCG2 w repozytorium CVS Testing Group uruchamia testy certyfikacyjne Deployment Team uruchamia dodatkowe testy związane z aplikacjami gridowymi (specyficznymi dla VO) RC zostaje przeniesiony do tzw. CoreZone
Korzystanie z Gridu EGEE w praktyce Przepływ zadań w LCG2 Reprezentacja danych w LCG2 Zlecanie zadań
Przepływ zadań w LCG2 (2)
Reprezentacja danych w LCG2 Atrybuty plików Grid Unique IDentifier (GUID) unikalny identyfikator Logical File Name (LFN) ludzki alias dla GUID Storage URL (SURL) lokalizacja pliku Transport URL (TURL) sposób dotarcia do pliku
Reprezentacja danych w LCG2 (2) Przykład GUID: LFN: SURL: TURL: guid:f81d4fae 7dec 11d0 a765 00a0c91e6bf6 lfn:cms/20030203/run2/track1 sfn://lxshare0209.cern.ch/data/alice/ntuples.dat gsiftp://lxshare0209.cern.ch//data/alice/ntuples.da
Zlecanie zadania Wymagania początkowe Zainstalowany certyfikat pochodzący od CA respektowanego w LCG Pozytywnie zakończona procedura rejestracyjna Zainstalowany interfejs użytkownika (UI) dystrybuowany w formie pakietów RPM istnieje klient X window oraz CLI
Zlecanie zadania (2) Generacja certyfikatu proxy (grid proxy init) Specyfikacja atrybutów zadania (JDL) Zlecenie zadania (edg job submit) Informacja o statusie zadania (edg job status) Pobranie wyniku (edg job get output)
Generacja certyfikatu proxy (grid proxy init) grid proxy init autoryzuje użytkownika do zasobów gridowych certyfikat jest ważny przez określony czas >>grid proxy init Your identity: /C=PL/O=GRID/O=PSNC/CN=Piotr Siwczak Creating proxy... Done Your proxy is valid until: Tue Jan 18 20:21:11 2005
JDL Job Description Language specyfikacja żądanych zasobów (wymagania co do parametrów CE i SE) specyfikacja wykonywanego polecenia określenie środowiska wykonywania zadania (zmienne systemowe) możliwość przekazania plików razem z zadaniem szczegółowy opis w Job Description Language Howto (DataGrid) <hostname.jdl> Executable="/bin/hostname"; Arguments=" i"; StdOutput="hostname.out"; StdError="hostname.err"; OutputSandbox={"hostname.out","hostname.err"};
JDL Job Description Language GRID UI JDL CE /bin/hostname i {hostname.out, hostname.err}
Zlecanie zadania (edg job submit) edg job submit vo dteam o jobs.tmp./hostname.jdl vo <nasza_organizacja_wirtualna> o <plik>, do którego zapisywany jest identyfikator zadania >>edg job submit vo dteam o jobs.tmp./hostnam e.jdl Selected Virtual Organisation name (from vo option): dteam Connecting to host lxn1177.cern.ch, port 7772 Logging to host lxn1177.cern.ch, port 9002 ================================ edg job submit Success ================ The job has been successfully submitted to the Network Server. Use edg job status command to check job current status. Your job identifier (ed g_jobid) is: https://lxn1177.cern.ch:9000/lrddluhj4yvpnhdceiydxg The edg_jobid has been saved in the following file: /home/psiwczak/exercise/jobs.tmp ==================================================================
Status zadania (edg job status) edg job status i jobs.tmp >>edg job status i jobs.tmp 1 : https://lxn1177.cern.ch:9000/t4y_y0z2tbffdgh7mkbdlq 2 : https://lxn1177.cern.ch:9000/lrddluhj4yvpnhdceiydxg a : all q : quit Choose one or more edg_jobid(s) in the list [1 2]all:2 ************************************************************* BOOKKEEPING INFORMATION: Status info for the Job : https://lxn1177.cern.ch:9000/lrddluhj4yvpnhdceiydxg Current Status: Status Reason: Destination: Scheduled Job successfully submitted to Globus node001.grid.auth.gr:2119/jobmanager lcgpbs short reached on: Mon Jan 17 22:02:28 2005 *************************************************************
Pobranie wyniku (edg job get output) edg job get output i jobs.tmp >>edg job get output i jobs.tmp 1 : https://lxn1177.cern.ch:9000/t4y_y0z2tbffdgh7mkbdlq 2 : https://lxn1177.cern.ch:9000/lrddluhj4yvpnhdceiydxg a : all q : quit Choose one or more edg_jobid(s) in the list [1 2]all:2 Retrieving files from host: lxn1177.cern.ch ( for https://lxn1177.cern.ch:9000/lrddluhj4yvpnhdceiydxg ) ********************************************************************************* JOB GET OUTPUT OUTCOME Output sandbox files for the job: https://lxn1177.cern.ch:9000/lrddluhj4yvpnhdceiydxg have been successfully retrieved and stored in the directory: /tmp/joboutput/psiwczak_lrddluhj4yvpnhdceiydxg *********************************************************************************
Zarządzanie danymi GRID RMS UI SE (plik) SE (plik_replika) SE (plik_replika) lcg cr skopiowanie pliku na SE i jego rejestracja w RMS lcg cp kopiowanie pliku z SE do UI lcg del usunięcie pliku i jego replik lcg rep utworzenie repliki pliku na innym SE GFAL library biblioteka umożliwiająca zarządzanie plikami gridowymi
Podsumowanie EGEE jeden z największych realizowanych obecnie projektów gridowych, uruchomiony w ramach 6 FP (04.2004 06.2006), oferuje dostęp do zasobów przekraczających możliwości większości centrów komputerowych, planowany jest rozwój i wdrażanie nowych aplikacji wykorzystujących możliwości Gridu, możliwość zastosowania własnego modelu (w sensie aplikacji, zasobów, stosowanej polityki dostępu) korzystania z gridu w formie wirtualnej organizacji, zachęcamy do wykorzystania infrastruktury sprzętowej EGEE (w tym równierz sprzętu udostępnionego przez PCSS), oferujemy wsparce w ubieganiu się o dostęp do zasobów i tworzenia nowych VO (dla zrzeszonych grup).
Linki http://www.eu egee.org oficjalna strona projektu EGEE http://linuxsoft.cern.ch/ strona domowa Scientific Linux CERN http://grid deployment.web.cern.ch strona z informacjami dot. middleware'u gridowego LCG 2 (korzystanie, administracja) http://server11.infn.it/workload grid/docs/datagrid 01 TEN 0142 0_2.pdf dokument ze specyfikacją JDL http://server11.infn.it/workload grid/docs/datagrid 01 TEN 0102 0_2 Document.pdf Job Description Language Howto