Jak znaleźć igłę w stogu siana

Podobne dokumenty
Jak znaleźć igłę w stogu siana

i IFJ PAN w Krakowie S. Gadomski, "CERN i komputery",

Polityka wspierania prac naukowych i wdrożeniowych w obszarze informatyki jako element budowy społeczeństwa informacyjnego w Polsce

PIONIER: Polski Internet Optyczny - stan aktualny i plany rozwoju

Wyznaczanie efektywności mionowego układu wyzwalania w CMS metodą Tag & Probe

LHC: program fizyczny

LHC i po co nam On. Piotr Traczyk CERN

Witamy w CERN Marek Kowalski

Jak działają detektory. Julia Hoffman

Światowy Grid komputerowy LHC Michał Turała IFJ PAN/ ACK Cyfronet AGH, Kraków

Stanisław Rejowski Dyrektor Działu Produkcji Serwerów ACTION S.A. Polskie serwery w służbie nauki

Cyfronet w CTA. Andrzej Oziębło DKDM

High Performance Computers in Cyfronet. Andrzej Oziębło Zakopane, marzec 2009

dr hab. Szymon Gadomski Uniwersytet Genewski i Instytut Fizyki Jądrowej PAN w Krakowie S. Gadomski, "CERN i komputery",

Technologia GRID w badaniach naukowych na Wielkim Zderzaczu Hadronów w CERN

System wyzwalania i filtracji w eksperymencie ATLAS na LHC

Kraków Wrocław Poznań Warszawa Gdańsk CLOUD SERVICES & DATA CENTER

Dobre miejsce do życia

Usługi HEP w PLGrid. Andrzej Olszewski

Compact Muon Solenoid

IMP PAN. Zaplecze obliczeniowe Centrum Zaawansowanych Technologii AERONET. Dolina Lotnicza

Poszukiwania bozonu Higgsa w rozpadzie na dwa leptony τ w eksperymencie CMS

LEPTON TAU : jako taki, oraz zastosowania. w niskich i wysokich energiach. Zbigniew Wąs

OFERTA. Załącznik nr 1 do zapytania ofertowego: Wzór oferty. Dane oferenta. Pełna nazwa oferenta: Adres:. REGON:.. Tel./fax.: .

Programowanie dla Wielkiego Zderzacza Hadronów

Laboratorium Chmur obliczeniowych. Paweł Świątek, Łukasz Falas, Patryk Schauer, Radosław Adamkiewicz

Wrocławskie Centrum Sieciowo-Superkomputerowe

Witamy w CERNie. Bolesław Pietrzyk LAPP Annecy (F) Wykład przygotowany przez polskich fizyków w CERNie.

Wszechświat czastek elementarnych

Cenniki. Taryfa opłat dla linii Warszawa - Gda sk. Warszawa - Ostróda 45

Zakłady Naukowe Oddziału Fizyki i Astrofizyki Cząstek w Instytucie Fizyki Jądrowej

1. Wcześniejsze eksperymenty 2. Podstawowe pojęcia 3. Przypomnienie budowy detektora ATLAS 4. Rozpady bozonów W i Z 5. Tło 6. Detekcja sygnału 7.

Czego oczekujemy od LHC? Piotr Traczyk. IPJ Warszawa

Prace informatyczne dla projektu CTA


Perspektywa 2020: Innowacyjna gospodarka. Polska będzie wielka albo nie będzie jej wcale. Józef Piłsudski

LICZBA OBIEKTÓW PODLEGAJĄCYCH OBOWIĄZKOWEJ OCHRONIE

ZESTAWIENIE ZBIORCZYCH WYNIKÓW GŁOSOWANIA NA KANDYDATÓW NA PREZYDENTA RZECZYPOSPOLITEJ POLSKIEJ W DNIU 20 CZERWCA 2010 R.

Epiphany Wykład II: wprowadzenie

Wszechświat czastek elementarnych

Cenniki. Taryfa opłat dla linii Warszawa - Gda sk

WYKŁAD 8. Wszechświat cząstek elementarnych dla przyrodników

Wszechświat czastek elementarnych

Jak to działa: poszukiwanie bozonu Higgsa w eksperymencie CMS. Tomasz Früboes

LICZBA SPECJALISTYCZNYCH UZBROJONYCH FORMACJI OCHRONNYCH ORAZ LICZBA KONTROLI SUFO


Pierwsze dwa lata LHC

Obserwacja Nowej Cząstki o Masie 125 GeV

th- Zakład Zastosowań Metod Obliczeniowych (ZZMO)

Nowe aplikacje i usługi w środowisku Grid

LICZBA SPECJALISTYCZNYCH UZBROJONYCH FORMACJI OCHRONNYCH ORAZ LICZBA KONTROLI SUFO

MasterClass-międzynarodowy program zajęć dla uczniów szkół średnich

Komputery Dużej Mocy w Cyfronecie. Andrzej Oziębło Patryk Lasoń, Łukasz Flis, Marek Magryś

SPRAWOZDANIE. ANKIETA KANDYDATA NA STUDIA WYŻSZE ZUT w SZCZECINIE na rok akademicki 2011/2012

Plan. Motywacja fizyczna. Program badań. Akcelerator LHC. Detektor LHCb. Opis wybranych systemów

Wszechświat czastek elementarnych

WYKŁAD 8. Wszechświat cząstek elementarnych dla przyrodników. Maria Krawczyk, Wydział Fizyki UW

Komputer. Komputer (computer) jest to urządzenie elektroniczne służące do zbierania, przechowywania, przetwarzania i wizualizacji informacji

się także urządzenia do odzyskiwania ciepła, które przy tak dużych maszynach obliczeniowych, zajmują dużo miejsca wyjaśnił Krawentek.

Oddziaływania podstawowe

Eksperyment ALICE i plazma kwarkowo-gluonowa

Ćwiczenie 1: Wyznaczanie lokalizacji magazynów metoda środka ciężkości.

Cyfrowy rejestrator parametrów lotu dla bezzałogowych statków powietrznych. Autor: Tomasz Gluziński

Fizyka cząstek elementarnych warsztaty popularnonaukowe

Polska w CERN. Kurs dla polskich nauczycieli w CERN maja Jan Paweł Nassalski Instytut Problemów Jądrowych im.

Zasoby i usługi Wrocławskiego Centrum Sieciowo-Superkomputerowego

Cząstki i siły. Piotr Traczyk. IPJ Warszawa

OLDENBURG HBF/ZOB Oldenburg, Gem. Oldenburg (Oldenburg)

Jak działają detektory. Julia Hoffman

Bezpłatność czy bezkosztowość prawa do informacji wnioski de lege ferenda

GRIDY OBLICZENIOWE. Piotr Majkowski

Podstawy Technik Informatycznych. Mariusz Stenchlik

Po co nam CERN? Po co nam LHC? Piotr Traczyk

Wdrażanie anie naziemnej telewizji cyfrowej w Polsce

System projektów celowych dla msp. realizowany przez Centrum Innowacji NOT

"System CC1 jak zbudować prywatną chmurę obliczeniową w jedno popołudnie. M. Witek, M. Zdybał w imieniu CC1

Raport z cen korepetycji w Polsce 2016/2017. Na podstawie cen z serwisu e-korepetycje.net

Optymalizacja kryteriów selekcji dla rozpadu Λ+c pμ+μza pomocą wielowymiarowej analizy danych

dr hab. Joanna Jędrzejowicz Podstawy informatyki i komputeryzacji Gdańska Wyższa Szkoła Humanistyczna

Fizyka do przodu w zderzeniach proton-proton

Wykaz Specjalistycznych Ośrodków/Poradni Diagnozy i Rehabilitacji Dzieci i Młodzieży z Wadą Słuchu

ilość nazwa producenta/ nr katalogowy/ okres gwarancji ilość nazwa producenta/ nr katalogowy/ okres gwarancji szt. 1

Wykaz kalendarzy na 2016 rok

Dwa lub więcej komputerów połączonych ze sobą z określonymi zasadami komunikacji (protokołem komunikacyjnym).

I rocznica utworzenia Narodowego Centrum Badań Jądrowych

I. 1) NAZWA I ADRES: Uniwersytet Warszawski, Wydział Fizyki, ul. Hoża 69, Warszawa, woj. mazowieckie, tel , faks

PLGrid: informatyczne usługi i narzędzia wsparcia w nauce

Promieniowanie kosmiczne składa się głównie z protonów, z niewielką. domieszką cięższych jąder. Przechodząc przez atmosferę cząstki

Agencja Rozwoju Przemysłu S.A.

Jednostka centralna. Miejsca na napędy 5,25 :CD-ROM, DVD. Miejsca na napędy 3,5 : stacja dyskietek

Rządowy program Mieszkanie dla młodych dane wg stanu na r.

Konsolidacja wysokowydajnych systemów IT. Macierze IBM DS8870 Serwery IBM Power Przykładowe wdrożenia

Postrzeganie miast wojewódzkich. Grudzień Postrzeganie miast wojewódzkich. TNS grudzień 2013 K.077/13

elektronicznych fizyki

Rządowy program Mieszkanie dla młodych Dane za I kwartał 2015r.

Wszystko, co kiedykolwiek chcieliście wiedzieć o CERNie i o fizyce cząstek

Plany kanałowe wykorzystania częstotliwości z zakresu MHz przeznaczonych dla DVB-T w Polsce zgodnie z Porozumieniem GE06

Obsługa Klientów w ostatnich dniach 2018 roku

Raport z cen korepetycji w Polsce Na podstawie cen z serwisu e-korepetycje.net

Rządowy program Mieszkanie dla młodych Dane za IV kwartał 2014r.

Transkrypt:

Jak znaleźć igłę w stogu siana Rola obliczeń komputerowych w eksperymentach fizyki wysokich energii Piotr Golonka CERN EN/ICE-SCD

Plan Co jest igłą a co stogiem siana... między teorią a doświadczeniem Seria złożonych problemów Zbieranie danych Opracowywanie danych Analiza danych Technologie Klastry, GRID 2

Co jest stogiem siana? - LHC Genewa protony protony 14 TeV = 14 1012 ev 3

Co jest stogiem siana?... i detektory LHC Eksperyment Interesujące oddziaływania proton-proton 4

Co jest igłą? Większość zderzeń to zwykłe, dobrze znane oddziaływania. Te interesujące które niosą informacje o nieznanych zjawiskach są bardzo rzadkie. Typowo 1 przypadek na 100 mln! Jak zauważyć taki przypadek w aparaturze i zapisać go na taśmę gdy mamy tak duży strumień danych tak mało czasu na analizę on-line? 5

Czego szukamy w eksperymentach? Przykład: eksperyment LHCb Łamanie CP w układzie mezonów pięknych (B) Zjawiska rzadkie ~ 10-4 10-8 Pozostałe eksperymenty na LHC mają swoje zestawy igieł Cząstka Higgsa (ATLAS, CMS) Supersymetria (ATLAS, CMS) Plazma kwarkowo-gluonowa (ALICE)... 6

Przykład: rekonstrukcja śladów cząstek Symulacja komputerowa danych z 1 przypadku w detektorze wewnętrznym eksperymentu ATLAS Zagadka: znajdź 4 proste ślady 7

Przykład: rekonstrukcja śladów cząstek Rozwiązanie: Rozpad cząstki Higgsa na 4 miony: H 4μ 8

Analiza danych: co zobaczy Fizyk: Cząstki Higgsa o masie ~150 GeV Tło od innych rozpadów dających 4 miony Masa inwariantna 4 leptonów [GeV] 9

Teoria, doświadczenie i... komputery (?) Teoria = Doświadczenie Metody komputerowe 10

doświadczenie = teoria (?) Generator(y) przypadków Filtr przypadków Symulacja detektora Dane 11

Modelowanie aparatury Detektor wierzchołka Detektor RICH Identyfikacja cząstek Pełny spektrometr 12

Symulacja zjawisk w detektorach Slajd ze strony www eksperymentu CMS 13

Symulacja i prawdziwy eksperyment W efekcie modelowania otrzymujemy dane symulowane w formacie takim jakie będą napływać z elektroniki odczytu aparatury eksperymentalnej. Symulacja 1. 2. Prawdziwy eksperyment Generator przypadków (teoria) Modelowanie odpowiedzi aparatury (Geant4) Rekonstrukcja Detektor działa wspaniale wewnątrz komputerów. Czy w takim razie potrzebujemy budować prawdziwy? Tak. W prawdziwym eksperymencie pojawiają się zjawiska o których być może nawet nie pomyśleliśmy. Analiza fizyczna 14

Co jest stogiem siana Przecięcia pęków wiązek: co 25 nanosekund (częstotliwość LHC: 40 MHz) Nie wszystkie pęczki są pełne zderzenia: 31 MHz 10 * 106 zderzeń w ciągu 1 sekundy widocznych w eksperymencie LHC-b! Dane przepływające przez eksperyment Sekunda Dzień Rok l. przypadków 107 1012 1014 Ilość danych 300 GB 30 PB 3 EB ( 3*1018 ) l. dysków (300 GB) 1 100 tys 10 mln Dla eksperymentów ATLAS i CMS jest znacznie gorzej ATLAS 2PB/sek 3 mln CD/s 15

Dygresja... ile to bajtów? 1 Megabajt (1MB) zdjęcie z aparatu cyfrowego: 2 MB 1 Gigabajt (1GB) = 1000MB film na nośniku DVD: 6 GB 1 Terabajt (1TB) = 1000GB Światowa roczna produkcja książek 1 Petabajt (1PB) = 1000TB Roczne składowanie danych w LHC: 14 PB 1 Eksabajt (1EB) = 1000 PB Roczna produkcja informacji w 2002 (zapisana cyfrowo): 5 EB Wszystkie dotąd wypowiedziane słowa: 5EB Przepływ cyfrowej informacji w 2002: 18 EB ( z czego 98% to telefony) Ilość danych widzianych przez eksperyment na LHC: 3 EB Źródło: http://www2.sims.berkeley.edu/research/projects/how much info 2003/execsum.htm 16

Co jest stogiem siana Przecięcia pęków wiązek: co 25 nanosekund (częstotliwość LHC: 40 MHz) Nie wszystkie pęczki są pełne zderzenia: 31 MHz 10 * 106 zderzeń w ciągu 1 sekundy widocznych w eksperymencie LHC-b! Dane przepływające przez eksperyment Sekunda Dzień Rok l. przypadków 107 1012 1014 Ilość danych 300 GB 30 PB 3 EB ( 3*1018 ) l. dysków (300 GB) 1 100 tys 10 mln Dla eksperymentów ATLAS i CMS jest znacznie gorzej ATLAS 2PB/sek 3 mln CD/s Zapis wszystkich przypadków jest niemożliwy Na każdy przypadek należy jednak zerknąć i zadecydować czy jest interesujący. Do przeglądania przypadków służy system wyzwalania czyli filtracji przypadków ( tzw. tryger). 17

Zbieranie danych - system wyzwalania Zadaniem systemu wyzwalania jest przede wszystkim jak najszybsze odrzucanie zbędnych przypadków (a nie wybieranie tych interesujących). W kolejnych stopniach filtrowania mamy do dyspozycji coraz więcej czasu na dokładniejszą analizę przypadków zaakceptowanych i dokładniejsze odrzucanie.? NIE 1 ms TAK NIE 10 ms TAK 18

Zbieranie danych 30 MHz 35 GB/s 2 khz 1 MHz L0 (hardware) HLT (algorytmy) Wstępny poziom wyzwalania Wyższy stopień wyzwalania 2 1010 przyp./rok 1000 procesorów 1 ms/przypadek 1 MHz 1μs/przypadek. W ciagu 1 μs nie można nawet zdekodowac danych Co zrobic??? Możliwa staje się rekonstrukcja sladow w detektorze wierzcholka w rzucie rφ 19

Farma procesorów on-line 1m 1 MHz na wejściu 30 GB/s Force10 E1200, 1260 GbE ports Przepustowość 50 GB/s 1000 CPU 2 khz na wyjściu Zapis 250 MB/s 20

Igła czy stóg siana? LHC Interesujące oddziaływania p-p Eksperymenty Filtrowanie Redukcja > 105 3 Eksabajty/rok 15 Petabajtów/rok 15 Petabajtów / rok przefiltrowanych danych z czterech eksperymentow na LHC 21

Analiza danych Analiza danych zapisanych na taśmy Niespotykane dotąd wyzwania ~kilkanaście PB danych na rok 200 tys procesorów 10 tys dysków Skoncentrowanie infrastruktury w jednym miejscu jest niesłychanie trudne (i niecelowe bo blokuje rozwój innych ośrodków). Przypadki przefiltrowane Instalacja, zasilanie, chłodzenie, obsługa systemów operacyjnych i oprogramowania Konieczny model rozproszonych obliczeń czyli zespól współpracujących ze sobą farm komputerowych. Czy można jednak stworzyć coś bardziej uniwersalnego co byłoby przydatne także dla innych dziedzin? 22

GRID globalny komputer WWW przewrót w dostępie do informacji (wynalezione w CERN). Jednolity dostęp do informacji bez względu na miejsce na Ziemi. GRID jednolity dostęp do zasobów obliczeniowych. GRID widziany przez każdego użytkownika jako jeden wielki komputer. Dobra platforma współpracy dla dużych projektów. Wspólne narzędzia i dane, dostęp do mocy obliczeniowej. Analogia z siecią elektryczna (także w przypadku opłat za pobraną moc obliczeniowa) Pierwszą udaną inicjatywą na dużą skalę były obliczenia w ramach projektu SETI (Search for Extra-Terrestrial Intelligence) Każdy posiadacz PC mógł udostępnić moc obliczeniowa np. w nocy i uruchomić program analizujący sygnały przychodzące z kosmosu. Projekt zaoszczędził wiele milionów $ 23

Ogólnoświatowa sieć GRID EGEE jest największym ogólnoświatowym projektem GRID Obecnie ponad 80 tys procesorów 300 ośrodków naukowych w 50 krajach na całym świecie 10 000 użytkowników 100 tys zadań wykonywanych jednocześnie 15 PB przestrzeni dyskowej Koordynatorem projektu jest CERN Fizyka cząstek jest głównym użytkownikiem (największe potrzeby) 24

EGEE Normalised CPU time [units 1K.SI2K.Hours] 231,171,317 godzin CPU! 25

LCG: LHC Computing Grid 26

27

Więcej informacji... http://www.gridcafe.org http://lcg.web.cern.ch/lcg/monitor.htm Real-Time grid monitor: http://gridportal.hep.ph.ic.ac.uk/rtm/ 28

Struktura hierarchiczna (Multi Tier) Univ. B CERN Tier 1 Univ. A USA Lab. A UK Francja Włochy Lab. C Tier 0 Univ. D Taipei? Tier 1 Tier 2 Japonia Univ. C Niemcy Lab. B Tier 3 (Departament) 29

Struktura hierarchiczna (Multi Tier) 30

Polska infrastruktura WLCG GDAŃSK KOSZALIN OLSZTYN Tier1 FZK Karlsruhe SZCZECIN DFN 10 Gb/s GÉANT 10+10 Gb/s GÉANT/TELIA 2x2,5 Gb/s TORUŃ BYDGOSZCZ BASNET 34 Mb/s BIAŁYSTOK Gorzów POZNAŃ Tier2 PCSS Poznań Tier2 WARSZAWA ICM Warszawa ZIELONA GÓRA ŁÓDŹ GTS 1,6 Gb/s RADOM WROCŁAW CZĘSTOCHOWA PIONIER S FIBERS 2 x 10 Gb/s KIELCE OPOLE KATOWICE 10 Gb/s (1 lambda) CBDF 10 Gb/s Tier2 ACK Cyfronet KRAKÓW Kraków PUŁAWY LUBLIN RZESZÓW Bielsko-Biała 1 Gb/s CESNET, SANET MAN 31

Technologie: farmy PC Początkowo CERN zdecydował zakupić komputery w formie zwykłych PC dostępnych w sklepach. W międzyczasie technologie RACK i BLADE osiągnęły konkurencyjne ceny. Obecnie w dużych ośrodkach wygrywają technologie specjalistyczne RACK i BLADE Pierwsze klastry w CERN w standardowej technologii. Hala w CERN przygotowana do montażu PC w szafach RACK Serwery typu rack w centrum komputerowym CERN PC typu RACK i BLADE 32

Technologie - c.d. Około 7500 procesorów (rdzeni) Kilka procesorów w komputerze, kilka rdzeni w procesorze Ultra-szybkie połączenia sieciowe 1, 10Gb Ethernet Fiber Channel Składowanie danych: taśmy np. robot: Sun StorageTek SL8500 Do 300 tys taśm, 500 GB każda Do 2048 napędów o prędkości 100MB/s System operacyjny: CERN Scientific Linux 33

CERN openlab Partnerstwo z czołowymi firmami informatycznymi: Najnowsze procesory i technologie sieciowe Bazy danych Automatyka przemysłowa Bezpieczeństwo 34

World Wide Web, europejski Internet WWW:Tim Berners-Lee, 1989-2009! CERNET: 1984 (first European TCP/IP network) http://info.cern.ch/www20/ 35

Podsumowanie Eksperymenty na LHC dostarczają ogromnej ilości danych. Przypadki których szukamy zdarzają się bardzo rzadko, ~1 na 100 mln. Jedynie dzięki komputerom udaje się zebrać, przetworzyć i analizować dane. CERN stymuluje rozwój nowych technologii informatycznych (WWW, GRID) 36