Projekt Nowe metody nauczania w matematyce Nr POKL.09.04.00-14-133/11 Nowoczesne technologie przetwarzania informacji Mgr Maciej Cytowski (ICM UW) Lekcja 1: Obliczenia naukowe na systemach wieloprocesorowych
Jak wyobrażamy sobie superkomputery? GERTY 3000 Moon, 2009 HAL 9000 2001: Odyseja Kosmiczna, 1968 RED QUEEN Resident Evil, 2002? - Park Jurajski, 1993 2
Co to są superkomputery? Mają swoje nazwy Duże możliwości obliczeniowe Duża ilość rdzeni obliczeniowych: setki tysięcy rdzeni Duża ilość pamięci operacyjnej: setki TB pamięci RAM Duże zapotrzebowanie na przestrzeń oraz prąd: ogromne serwerownie i pobór prądu sięgający kilkudziesięciu Mega Watów Jaguar Cray XT4/5 Procesor: AMD Opteron System: Linux Liczba rdzeni: 224 162 Miejsce instalacji: Oak Ridge National Laboratories 3
Prawo Moore a rok 1965 Ilość tranzystorów w układach scalonych rośnie wykładniczo, podwajając się mniej więcej co dwa lata. 4
Jak zmienia się wydajność komputerów? Komputer przenośny Osborne Executive z 1982 roku i iphone z roku 2007. Komputer Executive waży 100 razy więcej, jest mniej więcej 500 razy większy, kosztuje 10 razy więcej i ma 100 krotnie mniejsze taktowanie procesora. http://en.wikipedia.org/wiki/moore s_law 5
Jak szybki może być mikroprocesor? 20 czerwca 2006 Georgia Tech i IBM przedstawiły procesor działający z częstotliwością ponad 500 GHz Wykonanie: krzem i german Chłodzenie: ciekły hel Temperatura: 4.5K ~ -268.65 C Częstotliwość w temp. pokojowej: 350GHz Pobór mocy:?? 7 Maja 2004 the end of frequency scaling Intel wstrzymuje rozwój technologii Tejas i Jayhawk (następców Pentium4 i Xeon) ~ 7GHz Współczesne komputery wyposażone są w wiele procesorów i rdzeni 6
Współczesne procesory Do obliczeń używa się obecnie wiele rodzajów urządzeń oraz architektur komputerowych. AMD Barcelona QuadCore PowerXCell8i MD Grape-3 NVIDIA Fermi 7
Wydajność superkomputerów Wydajność obliczeniowa mierzona jest zwykle jako liczba Flop/s (Floating Point Operations Per Second) Przykładowe wyliczenie dla procesora AMD Opteron Barcelona: 2.3 GHz * 4 rdzenie * 4 operacje w cyklu = 36.8 Giga Flop/s Obecnie największe superkomputery osiągają wydajność 1 Peta Flop/s = 10 15 Flop/s Lista TOP500 klasyfikacja 500 najmocniejszych superkomputerów świata pod względem wydajności praktycznej na komputerach uruchamiany jest program LINPACK z dziedziny algebry liniowej miejsce komputera na liście zależy od liczby Flop/s zmierzonych programem LINPACK 8
Lista TOP500 na przestrzeni lat The TOP500 Project: Looking Back over 15 Years of Supercomputing Experience Hans Werner Meuer 9
Najnowsza edycja listy TOP500 Polskie komputery na liście TOP500 88 - Cyfronet AGH, Zeus 279 - TASK Gdańsk, Galera 296 - ICM Warszawa 298 - PCSS Poznań 348 Allegro 360 - WCSS Wrocław # Producent Wydajność TFlops 1 Fujitsu 10510 2 NUDT 2566 3 Cray 1759 4 Dawn- ing 1271 5 HP 1192 6 Cray 1110 7 SGI 1088 8 Cray 1054 9 Bull 1050 10 IBM 1042 Instalacja RIKEN K Computer Japan (SPARC64 VIIIfx 2.0GHz) NUDT Tianhe 1A China (Westmere/NVIDIA GPU) Oak Ridge NL - Jaguar (XT5 6C 2.6 GHz Opteron) NSCS-China (6C Xeon+NVIDIA GPU) TiTech Tsubame 2.0 Japan (Westmere/NVIDIA GPU) Sandia - Cielo (XE6 8core 2.4GHz Opteron) NASA/AMES (Altix Harpertown/Westmere) NERSC Hopper (XE6 12core Opteron) CEA France (Nehalem-EX) DOE/NNSA/LANL - RR (QS22/LS21) 10
Pierwsze miejsce listy TOP500 11
Lista TOP500 (listopad 2011) najciekawsze fakty Nr 1: Fujitsu K Computer (SPARC64) w RIKEN (Japonia) - 10.5 PF (12.66 MW) Wydajność potrzebna do zakwalifikowania się na liście: 50.9 TF Najmniejszy system na liście listopadowej był #300 na liście czerwcowej Największa ilość systemów: IBM ( 223), HP (142), Cray (27) 12
Lista TOP500 (listopad 2011) najciekawsze fakty Trendy technologiczne: 62% systemów używa 6-rdzeniowych i więcej procesorów 76.8% systemów używa architektury Intel 38 systemów używa kart graficznych GPU: 35 NVIDIA osiągają średnio 48.7% teoretycznej wydajności 2 PowerXCell8i osiągają średnio 76% teoretycznej wydajności 2 ATI osiągają średnio 55.7% teoretycznej wydajności 13
Przykłady zastosowań: Numeryczna prognoza pogody Model atmosfery określony na tzw. siatkach obliczeniowych naniesionych na interesujący nas fragment atmosfery ziemskiej Zestaw wielu równań matematycznych opisujących zmienność zjawiska takich jak ciśnienie, wiatr, temperatura, opady Numeryczna prognoza pogody w ICM Model UM prognoza 48 godzinna Obliczany 4 razy na dobę 35 węzłów po 16 rdzeni = 560 rdzeni Czas obliczeń: ok. 1 godziny http://meteo.pl 14
Przykłady zastosowań: Neurobiologia Blue Brain Project (EPFL & IBM) symulacje oddziaływań w sieci neuronów mózgu szczura 22.8 Tflops BG/L 100 milionów neuronów (połowa mózgu szczura) 1 PFlops 1 bilion neuronów ludzki mózg 100 bilionów neuronów Symulacje oddziaływań w mózgu szczura w ICM (Projekt POWIEW) 15
Przykłady zastosowań: Kosmologia Symulacje kosmologiczne Symulacja kosmologiczna powstawania wszechświata (galaktyki, czarna materia,..). Więcej niż 10 10 cząstek. 16
Przykłady zastosowań: Obliczenia inżynierskie Drużyny F1 budują duże superkomputery aby projektować bolidy Model komputerowy i symulacje Prototyp w tunelu aerodynamicznym Nowy model bolidu 17
IBM Watson superkomputer kontra człowiek Watson superkomputer stworzony przez IBM do odpowiadania na pytania zadawane w języku naturalnym (2880 rdzeni obliczeniowych, 15 TB pamięci, brak połączenia z internetem) Watson wystąpił w teleturnieju Jeopardy! (Va banque) w trzydniowej rozgrywce 14 16 lutego 2011 roku. Przeciwnicy: Brad Rutter (zwycięzca największej puli pieniędzy w Jeopardy!) Ken Jennings (najdłużej niepokonany mistrz Jeopardy!) Watson zwyciężył tę rozgrywkę, z wynikiem $77 147 Ken Jennings uzyskał wynik $24 000 Brad Rutter uzyskał wynik $21 600 18
Jak wygląda praca na superkomputerach? Praca w środowisku tzw. terminala (konsoli). 19
Dostęp do mocy obliczeniowych w Polsce W Polsce działa pięć Centrów Komputerów Dużej Mocy (KDM): w Gdańsku (TASK), Krakowie (CYFRONET), Poznaniu (PCSS), Warszawie (ICM) i Wrocławiu (WCSS). Centra te powstały w ramach realizowanego przez Komitet Badań Naukowych w latach 1993-1999 programu budowy infrastruktury informatycznej nauki. Dostęp do zasobów centrów KDM jest bezpłatny dla wszystkich polskich naukowców. Naukowcy mogą aplikować o moc obliczeniową w ramach tzw. grantów obliczeniowych. Rozliczenie na podstawie rocznych sprawozdań i publikacji naukowych. 20