Jak znaleźć igłę w stogu siana

Podobne dokumenty
Jak znaleźć igłę w stogu siana

Wyznaczanie efektywności mionowego układu wyzwalania w CMS metodą Tag & Probe

LHC: program fizyczny

LHC i po co nam On. Piotr Traczyk CERN

Jak działają detektory. Julia Hoffman

i IFJ PAN w Krakowie S. Gadomski, "CERN i komputery",

Witamy w CERN Marek Kowalski

Technologia GRID w badaniach naukowych na Wielkim Zderzaczu Hadronów w CERN

System wyzwalania i filtracji w eksperymencie ATLAS na LHC

Wszechświat czastek elementarnych

Stanisław Rejowski Dyrektor Działu Produkcji Serwerów ACTION S.A. Polskie serwery w służbie nauki

Programowanie dla Wielkiego Zderzacza Hadronów

Compact Muon Solenoid

OFERTA. Załącznik nr 1 do zapytania ofertowego: Wzór oferty. Dane oferenta. Pełna nazwa oferenta: Adres:. REGON:.. Tel./fax.: .

Epiphany Wykład II: wprowadzenie

Poszukiwania bozonu Higgsa w rozpadzie na dwa leptony τ w eksperymencie CMS

Wszechświat czastek elementarnych

LEPTON TAU : jako taki, oraz zastosowania. w niskich i wysokich energiach. Zbigniew Wąs

Podstawy Technik Informatycznych. Mariusz Stenchlik

Eksperyment ALICE i plazma kwarkowo-gluonowa

Cząstki elementarne wprowadzenie. Krzysztof Turzyński Wydział Fizyki Uniwersytet Warszawski

th- Zakład Zastosowań Metod Obliczeniowych (ZZMO)

High Performance Computers in Cyfronet. Andrzej Oziębło Zakopane, marzec 2009

Wszechświat czastek elementarnych

Pierwsze dwa lata LHC

Polityka wspierania prac naukowych i wdrożeniowych w obszarze informatyki jako element budowy społeczeństwa informacyjnego w Polsce


Obserwacja Nowej Cząstki o Masie 125 GeV

Jak to działa: poszukiwanie bozonu Higgsa w eksperymencie CMS. Tomasz Früboes

Laboratorium Chmur obliczeniowych. Paweł Świątek, Łukasz Falas, Patryk Schauer, Radosław Adamkiewicz

WYKŁAD 8. Wszechświat cząstek elementarnych dla przyrodników

"System CC1 jak zbudować prywatną chmurę obliczeniową w jedno popołudnie. M. Witek, M. Zdybał w imieniu CC1

Wszechświat czastek elementarnych

TABELA PORÓWNAWCZA OFEROWANEGO SPRZĘTU

NOWE MODELE ZEWNĘTRZNYCH DYSKOW Z SERII CANVIO O WIĘKSZEJ POJEMNOŚCI

Światowy Grid komputerowy LHC Michał Turała IFJ PAN/ ACK Cyfronet AGH, Kraków

Jednostka centralna. Miejsca na napędy 5,25 :CD-ROM, DVD. Miejsca na napędy 3,5 : stacja dyskietek

Cyfronet w CTA. Andrzej Oziębło DKDM

Czego oczekujemy od LHC? Piotr Traczyk. IPJ Warszawa

Poszukiwany: bozon Higgsa

Składowanie danych. Tomasz Lewicki. maj WWSIS, Wrocław. Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych maj / 17

Oddziaływania podstawowe

WYKŁAD 8. Wszechświat cząstek elementarnych dla przyrodników. Maria Krawczyk, Wydział Fizyki UW

Bozon Higgsa oraz SUSY

Cyfrowy rejestrator parametrów lotu dla bezzałogowych statków powietrznych. Autor: Tomasz Gluziński

1. Wcześniejsze eksperymenty 2. Podstawowe pojęcia 3. Przypomnienie budowy detektora ATLAS 4. Rozpady bozonów W i Z 5. Tło 6. Detekcja sygnału 7.

Część V - Serwery. UWAGA! Część V stanowi nierozerwalną całość. Ocena będzie łączna dla 4 zadań. Zadanie nr 1. SERWER BAZODANOWY KWESTURA

Witamy w CERNie. Bolesław Pietrzyk LAPP Annecy (F) Wykład przygotowany przez polskich fizyków w CERNie.

Na tropach czastki Higgsa

Optymalizacja kryteriów selekcji dla rozpadu Λ+c pμ+μza pomocą wielowymiarowej analizy danych

Cząstki i siły. Piotr Traczyk. IPJ Warszawa

dr hab. Szymon Gadomski Uniwersytet Genewski i Instytut Fizyki Jądrowej PAN w Krakowie S. Gadomski, "CERN i komputery",

dr hab. Joanna Jędrzejowicz Podstawy informatyki i komputeryzacji Gdańska Wyższa Szkoła Humanistyczna

ilość nazwa producenta/ nr katalogowy/ okres gwarancji ilość nazwa producenta/ nr katalogowy/ okres gwarancji szt. 1

SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA Część 1: Dostawa sprzętu serwerowego i sieciowego oraz oprogramowania

Wszystko, co kiedykolwiek chcieliście wiedzieć o CERNie i o fizyce cząstek

I. 1) NAZWA I ADRES: Uniwersytet Warszawski, Wydział Fizyki, ul. Hoża 69, Warszawa, woj. mazowieckie, tel , faks

Fizyka cząstek elementarnych warsztaty popularnonaukowe

Konsolidacja wysokowydajnych systemów IT. Macierze IBM DS8870 Serwery IBM Power Przykładowe wdrożenia

Opis Przedmiotu Zamówienia

1. Serwer. 2. Komputer desktop 9szt. Załącznik nr 1 do SIWZ

Tom II: SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA (SOPZ): Przedmiotem zamówienia jest dostawa sprzętu infrastruktury serwerowej i sieciowej.

Fizyka do przodu w zderzeniach proton-proton

BUDOWA KOMPUTERA. Monika Słomian

Globalna firma oferująca skalowalne składowanie i ochronę danych

OPIS PRZEDMIOTU ZAMÓWIENIA

Gil, Piotr Trybuchowicz zwraca się o prośbą o przedstawienie oferty cenowej na zakup:

znak postępowania OIGd /13 załącznik nr 2 FORMULARZ OFERTY

Wymagania techniczne. Serwer bazy danych dla KRK szt. 2. Oferowany model.. Producent..

Jak działają detektory. Julia Hoffman

Usługi HEP w PLGrid. Andrzej Olszewski

Podróż do początków Wszechświata: czyli czym zajmujemy się w laboratorium CERN

OGŁOSZENIE O ZAMÓWIENIU

Po co nam CERN? Po co nam LHC? Piotr Traczyk

Czym materia różni się od antymaterii - najnowsze wyniki z eksperymentu LHCb

ZAPYTANIE OFERTOWE NR UE/6

PAKIET nr 7 Instytut Fizyki Doświadczalnej

OPIS PRZEDMIOTU ZAMÓWIENIA SPECYFIKACJA SPRZĘTU KOMPUTEROWEGO

Fizyka cząstek elementarnych i oddziaływań podstawowych

USŁUGI HIGH PERFORMANCE COMPUTING (HPC) DLA FIRM. Juliusz Pukacki,PCSS

Plan. Motywacja fizyczna. Program badań. Akcelerator LHC. Detektor LHCb. Opis wybranych systemów

1. Serwer rack typ 1 Liczba sztuk: 2

Pakiet ROOT. prosty generator Monte Carlo. Maciej Trzebiński. Instytut Fizyki Jądrowej Polskiej Akademii Nauki

Przyspiesz swój biznes i obniż koszty dzięki IBM FlashSystems. Artur Król Artur.Krol@pl.ibm.com Senior Storage Sales Consultant

Eksperyment CMS w oczekiwaniu na wiązki: plany poszukiwania Nowej Fizyki. Część 1

WSTĘP DO FIZYKI CZĄSTEK. Julia Hoffman (NCU)

Jak Big Data rewolucjonizuje naukę oraz współpracę centrów badawczych z biznesem?

Fundusze Europejskie dla rozwoju innowacyjnej gospodarki. Inwestujemy w Waszą przyszłość. Zapytanie ofertowe

Szczegółowy opis przedmiotu zamówienia

Zakłady Naukowe Oddziału Fizyki i Astrofizyki Cząstek w Instytucie Fizyki Jądrowej

Komputery Dużej Mocy w Cyfronecie. Andrzej Oziębło Patryk Lasoń, Łukasz Flis, Marek Magryś

Komputer. Komputer (computer) jest to urządzenie elektroniczne służące do zbierania, przechowywania, przetwarzania i wizualizacji informacji

IMP PAN. Zaplecze obliczeniowe Centrum Zaawansowanych Technologii AERONET. Dolina Lotnicza

Technologia informacyjna. Urządzenia techniki komputerowej

Wykład II. Administrowanie szkolną siecią komputerową. dr Artur Bartoszewski

Bardzo rzadki rozpad został zaobserwowany przez CMS

Prace informatyczne dla projektu CTA

Systemy operacyjne. dr inż. Marcin Czajkowski. Studia podyplomowe Wydział Informatyki PB

Polska w CERN. Kurs dla polskich nauczycieli w CERN maja Jan Paweł Nassalski Instytut Problemów Jądrowych im.

Opis przedmiotu zamówienia

Transkrypt:

Jak znaleźć igłę w stogu siana Rola obliczeń komputerowych w eksperymentach fizyki wysokich energii Krzysztof Korcyl na bazie wykładu Piotra Golonki CERN EN/ICE-SCD Użytkowanie i kopiowanie dozwolone na warunkach Licencji CC-BY (Creative Commons Attribution)

Plan Co jest igłą a co stogiem siana... między teorią a doświadczeniem Seria złożonych problemów Zbieranie danych Opracowywanie danych Analiza danych Technologie Klastry, GRID 2

Co jest stogiem siana? - LHC Genewa protony protony 4 + 4 TeV = 8 10 12 ev 3

Co jest stogiem siana?... i detektory LHC Eksperyment Interesujące oddziaływania proton-proton 4

Co jest igłą? Większość zderzeń to zwykłe, dobrze znane oddziaływania. Te interesujące które niosą informacje o nieznanych zjawiskach są bardzo rzadkie. Typowo 1 przypadek na 100 mln! Jak zauważyć taki przypadek w aparaturze i zapisać go na taśmę gdy mamy tak duży strumień danych tak mało czasu na analizę on-line? 5

Czego szukamy w eksperymentach? Przykład: eksperyment LHCb Łamanie CP w układzie mezonów pięknych (B) Zjawiska rzadkie ~ 10-4 10-8 Pozostałe eksperymenty na LHC mają swoje zestawy igieł Cząstka Higgsa (ATLAS, CMS) Supersymetria (ATLAS, CMS) Plazma kwarkowo-gluonowa (ALICE)... 6

Przykład: rekonstrukcja śladów cząstek Symulacja komputerowa danych z 1 przypadku w detektorze wewnętrznym eksperymentu ATLAS Zagadka: znajdź 4 proste ślady 7

Przykład: rekonstrukcja śladów cząstek Rozpad cząstki Higgsa na 4 miony: H 4μ 8

Analiza danych: co zobaczy Fizyk: Cząstki Higgsa (?) o masie ~125 GeV Tło od innych rozpadów dających 4 miony Masa inwariantna 4 leptonów [GeV] 9

Teoria, doświadczenie i... komputery (?) Teoria = Doświadczenie Metody komputerowe 10

Symulacja i prawdziwy eksperyment W efekcie modelowania otrzymujemy dane symulowane w formacie takim jakie będą napływać z elektroniki odczytu aparatury eksperymentalnej. Symulacja 1.Generator przypadków (teoria) 2.Modelowanie odpowiedzi aparatury (Geant4) Rekonstrukcja Eksperyment Analiza fizyczna 11

Symulacja zjawisk w detektorach Slajd ze strony www eksperymentu CMS 12

Co jest stogiem siana Przecięcia pęków wiązek: co 25 nanosekund (częstotliwość LHC: 40 MHz) Nie wszystkie pęczki są pełne zderzenia: 31 MHz 10 * 10 6 zderzeń w ciągu 1 sekundy widocznych w eksperymencie LHC-b! Dane przepływające przez eksperyment Sekunda Dzień Rok l. przypadków 10 7 10 12 10 14 Ilość danych 300 GB 30 PB 3 EB ( 3*10 18 ) l. dysków (300 GB) 1 100 tys 10 mln Dla eksperymentów ATLAS i CMS jest znacznie gorzej ATLAS 2PB/sek 3 mln CD/s 13

Dygresja... ile to bajtów? 1 Megabajt (1MB) zdjęcie z aparatu cyfrowego: 6 MB 1 Gigabajt (1GB) = 1000MB film na nośniku DVD: 6 GB, BluRay: 25GB 1 Terabajt (1TB) = 1000GB Największe twarde dyski: 4 TB Światowa roczna produkcja książek: 8TB Biblioteka kongresu USA: 10 TB 1 Petabajt (1PB) = 1000TB Roczne składowanie danych w LHC: 25 PB Informacja w WWW: 8PB 1 Eksabajt (1EB) = 1000 PB Roczna produkcja informacji zapisanej cyfrowo: 5 EB Wszystkie dotąd wypowiedziane słowa: 5EB Wszystkie twarde dyski w stanie Minesota, USA (5 mln mieszkańców): 1EB Przepływ cyfrowej informacji w 2002: 18 EB ( z czego 98% to telefony) Ilość danych widzianych przez eksperyment na LHC: 3 EB 1 Zetabajt (1ZB) = 1000 EB Roczna konsumpcja informacji w USA: 3.6 ZB (55% to gry komputerowe, 35% telewizja) Źródło: HMI Report 2009, http://hmi.ucsd.edu/howmuchinfo.php ; 14

Co jest stogiem siana Przecięcia pęków wiązek: co 25 nanosekund (częstotliwość LHC: 40 MHz) Nie wszystkie pęczki są pełne zderzenia: 31 MHz 10 * 10 6 zderzeń w ciągu 1 sekundy widocznych w eksperymencie LHC-b! Dane przepływające przez eksperyment Sekunda Dzień Rok l. przypadków 10 7 10 12 10 14 Ilość danych 300 GB 30 PB 3 EB ( 3*10 18 ) l. dysków (300 GB) 1 100 tys Dla eksperymentów ATLAS i CMS jest znacznie gorzej ATLAS 2PB/sek 3 mln CD/s 10 mln Zapis wszystkich przypadków jest niemożliwy Na każdy przypadek należy jednak zerknąć i zadecydować czy jest interesujący. Do przeglądania przypadków służy system wyzwalania czyli filtracji przypadków ( tzw. tryger). 15

Zbieranie danych - system wyzwalania Zadaniem systemu wyzwalania jest przede wszystkim jak najszybsze odrzucanie zbędnych przypadków (a nie wybieranie tych interesujących). W kolejnych stopniach filtrowania mamy do dyspozycji coraz więcej czasu na dokładniejszą analizę przypadków zaakceptowanych i dokładniejsze odrzucanie. 1 ms 10 ms? TAK TAK NIE NIE 16

Zbieranie danych 30 MHz 35 GB/s L0 (hardware) Wstępny poziom wyzwalania 1 MHz 2 khz HLT (algorytmy) Wyższy stopień wyzwalania 2 10 10 przyp./rok 1 MHz 1μs/przypadek. W ciagu 1 μs nie można nawet zdekodowac danych Co zrobic??? 1000 procesorów 1 ms/przypadek Możliwa staje się rekonstrukcja sladow w detektorze wierzcholka w rzucie rφ 17

Farma procesorów on-line 1 MHz na wejściu 30 GB/s 1 m Force10 E1200: 1260 portów GbE Przepustowość 50 GB/s 1000 CPU 2 khz na wyjściu Zapis 250 MB/s 18

Igła czy stóg siana? LHC Eksperymenty Filtrowanie Interesujące oddziaływania p-p Redukcja > 10 5 3 Eksabajty/rok 15 Petabajtów/rok 15 Petabajtów / rok przefiltrowanych danych z czterech eksperymentow na LHC 19

Analiza danych Analiza danych zapisanych na taśmy Przypadki przefiltrowane Niespotykane dotąd wyzwania ~25 PB danych na rok 200 tys procesorów 10 tys dysków Skoncentrowanie infrastruktury w jednym miejscu jest niesłychanie trudne (i niecelowe bo blokuje rozwój innych ośrodków). Instalacja, zasilanie, chłodzenie, obsługa systemów operacyjnych i oprogramowania Konieczny model rozproszonych obliczeń czyli zespól współpracujących ze sobą farm komputerowych. Czy można jednak stworzyć coś bardziej uniwersalnego co byłoby przydatne także dla innych dziedzin? 20

GRID globalny komputer WWW przewrót w dostępie do informacji (wynalezione w CERN). Jednolity dostęp do informacji bez względu na miejsce na Ziemi. GRID jednolity dostęp do zasobów obliczeniowych. GRID widziany przez każdego użytkownika jako jeden wielki komputer. Dobra platforma współpracy dla dużych projektów. Wspólne narzędzia i dane, dostęp do mocy obliczeniowej. Analogia z siecią elektryczna (także w przypadku opłat za pobraną moc obliczeniowa) Pierwszą udaną inicjatywą na dużą skalę były obliczenia w ramach projektu SETI (Search for Extra-Terrestrial Intelligence) Każdy posiadacz PC mógł udostępnić moc obliczeniowa np. w nocy i uruchomić program analizujący sygnały przychodzące z kosmosu. Dzięki projektowi zaoszczędzono wiele milionów $ 21

Ogólnoświatowa sieć GRID: WLCG WLCG: Worldwide LHC Computing Grid największy projektem GRID 170 ośrodków obliczeniowych w 36 krajach Ok. 330 tyś procesorów (rdzeni), z czego ~30 tys w CERN, 22 tys w Polsce(!)) 220 PB miejsca na dane (30 PB w CERN, 1.2PB w Polsce(!)) Koordynatorem projektu jest CERN Fizyka cząstek jest głównym użytkownikiem (największe potrzeby) 22

Struktura hierarchiczna (Multi Tier) Univ. B USA CERN Tier 1 UK Lab. A Univ. A Lab. C Univ. D Włochy Holandia Korea Nordic Tier 0 Tier 1 Tier 2 Francja Japonia Niemcy Hiszpania Lab. B Univ. C Tier 3 23

Struktura hierarchiczna (Multi Tier) 24

Technologie: farmy PC Początkowo CERN zdecydował zakupić komputery w formie zwykłych PC dostępnych w sklepach. W międzyczasie technologie RACK i BLADE osiągnęły konkurencyjne ceny. Obecnie w dużych ośrodkach wygrywają technologie specjalistyczne RACK i BLADE Pierwsze klastry w CERN w standardowej technologii. Hala w CERN przygotowana do montażu PC w szafach RACK Serwery typu rack w centrum komputerowym CERN PC typu RACK i BLADE 25

Technologie - c.d. O(10000) procesorów (rdzeni) Kilka procesorów w komputerze, kilka rdzeni w procesorze, wirtualizacja... Ultra-szybkie połączenia sieciowe 1, 10Gb Ethernet Fiber Channel Składowanie danych: taśmy np. robot: Sun StorageTek SL8500 Do 300 tys taśm, 500 GB każda Do 2048 napędów o prędkości 100MB/s System operacyjny: CERN Scientific Linux 26

Podsumowanie Eksperymenty na LHC dostarczają ogromnej ilości danych. Przypadki których szukamy zdarzają się bardzo rzadko, ~1 na 100 mln. Jedynie dzięki komputerom udaje się zebrać, przetworzyć i analizować dane. CERN stymuluje rozwój nowych technologii informatycznych (WWW, GRID) 27