Analiza porównawcza wydajności prognozowania pogody na klastrze TRYTON z wykorzystaniem modelu WRF

Wielkość: px
Rozpocząć pokaz od strony:

Download "Analiza porównawcza wydajności prognozowania pogody na klastrze TRYTON z wykorzystaniem modelu WRF"

Transkrypt

1 Analiza porównawcza wydajności prognozowania pogody na klastrze TRYTON z wykorzystaniem modelu WRF Mariusz J. FIGURSKI, Grzegorz NYKIEL Wydział Inżynierii Lądowej i Środowiska, Politechnika Gdańska INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

2 Plan prezentacji 1. Wprowadzenie co to jest model WRF. 2. Cele badawcze benchmarków z WRF. 3. Przetwarzanie danych w modelu WRF. 4. Dane do benchmarków. 5. Infrastruktura obliczeniowa i konfiguracja modelu. 6. Benchmark 3dhrlev i CONUS 2.5km. 7. Model METEOPG optymalizacja Tryton. 8. Podsumowanie i wnioski. 9. Dodatek portal pogodowy METEOPG. 10. Dodatek symulacja huraganu z 11 sierpnia INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

3 WRF - Weather Research and Forecast Zaprojektowany do badań i celów operacyjnych Dwie wersje Numeryczna prognoza pogody Symulacje atmosfery ARW zaawansowana wersja badawcza modelu WRF NMM niehydrostatyczny model mezoskalowy Elastyczny i przenośny kod Sekwencyjny Równoległy (MPI) bez lub z wielowątkowością Obsługuje dwa poziomy dekompozycji domen. Podział na podobszary (prostokąty) w pamięci rozproszonej Następnie w obrębie każdego wielowątkowego podobszaru jest stosowany podział dla pamięci współdzielonej. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

4 Cele badawcze Rozwój narzędzi ułatwiających wykonanie procedur symulacyjnych WRF na infrastrukturze HPC. Lokalne klastry HPC. Infrastruktura typu GRID, np. PL-GRID. Badanie skuteczności równoległego modelu WRF w celu znalezienia najlepszej konfiguracji zadanego scenariusza dla meteorologicznego modelowania w przestrzeni 3D. MPI, MPI+OpenMP, Liczba węzłów, rdzeni, procesów MPI, wątków OpenMP. Narzędzia zarządzania obliczeniami w modelu WRF wykorzystywane są również do ustalania (optymalizowania) parametrów modeli, które wymagają: Dziesiątek ocen parametrycznej (cykli symulacyjnych) dokładności modelu. Każda ocena parametrów modelu wymaga ponownego uruchomienia setek sytuacji meteorologicznych zebranych w ciągu wielu lat oraz porównania wyników modelu z danymi obserwacyjnymi. Wykorzystanie modelu WRF do benchmarków komputerów. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

5 Przetwarzanie danych w modelu WRF Obiekt 1: MPI/Serial WRF preprocessing Obiekt 2: MPI/MPI+OpenMP P i = MPI proces WRF model P 0,,P n P i =(T 0,,T m ) T m = wątek OpenMP Obiekt 3: Parametric MPI/Serial UPP postprocessing P 0,,P k UPP postprocessing P 0,,P k UPP postprocessing P 0,,P k Symulacje w modelu WRF składają się z szeregu programów różnego typu i złożoności, sekwencyjne i równoległe, wykorzystujące różną liczbę rdzeni i procesorów. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

6 Przetwarzanie danych w modelu WRF Przepływ informacji Obiekt 1 Przygotowanie danych WPS: konwersja danych z formatu GRIB do netcdf przy użyciu: GEOGRID.EXE (serial/mpi) UNGRIB.EXE (Serial) METGRID.EXE (Serial/MPI) Obiekt 2 Modelowanie WRF modelowanie numeryczne przy użyciu: REAL.EXE inicjalizacja przygotowanie danych rzeczywistych (MPI/MPI+OpenMP). WRF.EXE całkowanie numeryczne ARW (MPI/MPI+OpenMP). Obiekt 3 UPP post processing Konwersja danych wynikowych w formacie netcdf do formatu GRIB przy użyciu programu UNIPOST.EXE (Serial/MPI) dla okresu czasu objętego prognozą. Nie ma zależności pomiędzy opracowywanymi danymi z kolejnych godzin. Procesy można sparametryzować jako nienależne zadania. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

7 Dane do benchmarków WRF Dane do benchmarków przygotowywane są przez jedną z grup roboczych Rady Aplikacji Badawczych WRF (WG2 Software architecture, standard and implementation). Dostępne są dane dla dwóch pojedynczych siatek 12.5 km (2001) i 2.5 km (2005) sieci CONUS. Oprogramowanie WRF Symulacja o długości 3 godz. Problem z weryfikacją wyników. I/O serial/parallel. Rozdzielczość Liczba węzłów 12.5 km 425x300x35 = 4.46 mln 2.5 km 1500x1200x35 = 63 mln INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

8 Dane do benchmarków modelu WRF Arctic Region Supercomputing Center WRF Benchmarking. Dane dla siatek zanurzonych obejmujące obszar Europy i Alaski. WRF Symulacja o długości 3h na bazie danych z 2007 roku. Dane obecnie niedostępne. 3dhrlev Rozdzielczość Liczba węzłów 7.2 km 585x495x63 = 18.2 mln 2.4 km 823x652x63 = 33.8 mln 800 m 1777x1066x63 = mln INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

9 Superkomputery VSC PACMAN CHUGACH KRAKEN HPC academic system University of Vienna Sun Fire X2270 compute nodes, each equipped with 2 Quadcore processors (Intel, X5550, 2.66 GHz) and 24 GB memory (3 GB per core). Infiniband QDR network (40 Gbps). Filesystem ext3 Academic system, Arctic Region Supercomputing Center. Pacific Area Climate Monitoring and Analysis Network (PACMAN). Sixteen-core compute nodes consisting of 2 eight-core 2.3 GHz AMD Opteron processors with 64 GB memory (4 GB per core). Mellanox QDR Infiniband interconnect. Cray XE6 currently administered by ARSC for the DoD High Performance Computing and Modernization Program. 16-core compute nodes consisting of 2 eight-core 2.3 GHz AMD Opteron processors with 32 GB memory (2 GB per core). Cray Gemini interconnect. Lustre scalable filesystem used on compute nodes. Cray XT5 at National Institute for Computational Sciences. 12-core compute nodes consisting of 2 six-core 2.6 GHz AMD Opteron processors with 16 GB memory (1.5 GB per core). Cray SeaStar2+ interconnect. Lustre filesystem used on compute nodes. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

10 Superkomputery - Tryton Tryton - superkomputer w Centrum Informatycznym Trójmiejskiej Akademickiej Sieci Komputerowej (CI TASK) o architekturze klastrowej o następujących parametrach: Procesory: Intel Xeon Processor E5 2,3 GHz, 12-core (Haswell), 30MB cache Akceleratory: Pamięć: Sieć: Nvidia Tesla, Intel Xeon Phi, AMD FirePro 128/256 GB RAM DDR4 na serwer InfiniBand FDR 56 Gb/s, topologia fat tree, przełączniki Mellanox Razem: 1607 serwerów, 3214 procesorów, rdzeni, 48 akceleratorów, 218 TB RAM Szafy: System operacyjny: Moc obliczeniowa: 40 szt. linux 1,48 PFLOPS INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

11 WRF Konfiguracja Kompilator Intel fortran i c OpenMPI interfejs programowania aplikacji (API) umożliwiający tworzenie programów komputerowych dla systemów wieloprocesorowych z pamięcią dzieloną. HDF format plików i biblioteka do przechowywania danych naukowych z obsługą plików powyżej 2GB; wspiera równoległe We/Wy. Parallel-netcdf format zapisu danych; wspiera równoległe We/Wy. Netcdf Netcdf WRF oraz WRF 3.9 Wszystkie biblioteki muszą być kompilowane tym samym kompilatorem INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

12 WRF konfiguracja M.F. Standardowa instalacja modelu WRF dla procesorów Intel Xeon Zaawansowana instalacja modelu WRF z optymalizacją dla procesorów Haswell Optymalizacja kodu dostosowana do funkcji procesora. Np. flaga xcore_avx2 generuje instrukcje rozszerzenia wykorzystujące architekturę Haswell. Agresywna optymalizacja kodu wynikowego. Instalacja modelu WRF z obsługą seryjnego i równoległego zapisu i odczytu danych. Kompilacja ze zmienną środowiskową PNETCDF wskazującą położenie biblioteki równoległej netcdf. Instalacja hybrydowa smpar/dmpar. Wersja z równoległą biblioteką netcdf oraz z optymalizacją dla procesorów Haswell. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

13 Benchmark 3dhrlev - wyniki Wykorzystanie pamięci operacyjnej: ponad 200GB. Symulacje wykonane modelem WRF oraz Zwiększenie ilości rdzeni z 512 do 1920 nie przyspiesza symulacji problem skalowalności procesów. Brak danych dla nowszych wersji modelu WRF np. 3.8 lub 3.9. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

14 Benchmark CONUS 2.5km - wyniki Optymalizacja kompilacji z opcjami dla procesorów Intel Xeon-Haswell przyspiesza czas wykonania obliczeń o około 15-20% jeśli proces jest dobrze skalowalny. Występuje problem z długim czasem zapisu danych w wersji sekwencyjnej. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

15 Benchmark 3dhrlev Ethernet 1GB Klaster FENIX Centrum Geomatyki Stosowanej WAT Procesory: Intel Xeon Processor 2,93 GHz, 12-core, 12Mb cache Węzły: Pamięć: Sieć: 32 każdy po 12 rdzeni 12 GB RAM DDR3 na procesor Ethernet 1GB Razem: 16 serwerów, 32 procesorów, 384 rdzenie, 768 GB RAM Szafy: System operacyjny: 1 szt. Linux Superkomputer TRYTON mpirun np ${NPROC} --mca btl tcp,vader,self --mca btl_tcp_if_include eth0 INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

16 Benchmark 3dhrlev Ethernet 1GB - wyniki Symulacje bez optymalizacji kodu WRF standard. Sekwencyjny zapis wyników symulacji. Słaba skalowalność procesów. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

17 WRF METEOPG model operacyjno-badawczy Model z 3 siatkami zanurzonymi, możliwość aktywowania siatki 4 o rozdzielczości 100m. Modelowanie lokalnych zjawisk meteorologicznych w czasie i przestrzeni. Wysoka rozdzielczość modelu w czasie i przestrzeni. Meteorologiczne warunki początkowe i brzegowe. Globalny model GFS (Global Forecasting Systemof US National Weather Service) ERA-Interim/ERA5 (tylko analizy klimatyczne). Wysokorozdzielcze modele DTM (30m) i zagospodarowania terenu (100m). Rozdzielczość Liczba węzłów 12.5 km 146x146x62 = 1.27 mln 2.5 km 306x306x62 = 5.9 mln 500 m 245x245x62 = 3.7 mln INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

18 WRF METEOPG model operacyjno-badawczy Jeden sposób zanurzania siatek, 1:5 Schemat modelu mikrofizyki: WSM6 RRTMG schemat dla krótkofalowego i długofalowego promieniowania. Model konwekcji: Grell-Freitas (tylko siatka 1) Planetarna wartwa graniczna: siatki 1,2 i 3: model YSU Model powierzchni lądu: NOAh LSM Numeryczny model terenu - SRTM (Shuttle Radar Topography Mission) Numeryczny model pokrycia (zagospodarowania) terenu CORINE (CLC2012), program Copernicus INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

19 WRF METEOPG dane wejściowe Dane wejściowe Zgromadzenie danych wejściowych: Obserwacje meteo GFS Pola meteo Pre-processing Dane satelitarne WRF Model oceanu Modelowanie Dane geograficzne Model pokrycia terenu Wyniki

20 Całkowity czas symulacji 6h dwie siatki Dobra skalowalność procesów do około 200 rdzeni Optymalizacja kodu dla procesorów Haswell przyspiesza obliczenia o koło 12% INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

21 Całkowity czas symulacji 6h - trzy siatki Dla 3 siatek optymalizacja modelu dla procesorów Haswell przyspiesza obliczenia o około 20%. Skalowalność procesów do 350 rdzeni. Przyspieszenie jest obserwowane tylko dla procesów dobrze skalowalnych. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

22 Dekompozycja siatek WRF domyślnie wyznacza wartości nproc_x i nproc_y z pierwiastka kwadratowego przydzielonych przez ilość rdzeni/procesorów. Jeśli jest to niemożliwe używane są wartości zbliżone do siebie. Dekompozycja odnosi się do siatki nadrzędnej 2D. X Y Zadanie, proces obliczeniowy MPI/OpenMP komunikacja z sąsiednimi zadaniami INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

23 Dekompozycja siatek model METEOPG Z praktycznego punku widzenia przyjęcie takich samych wartości nproc_x i nproc_y nie jest optymalne. WRF lepiej pracuje jeśli dekompozycja ma bardziej prostokątny charakter. Prowadzi to do lepszego wykorzystania pamięci podręcznej i bardziej efektywnej komunikacji. W analizowanym przypadku domyślna wartość nproc_y=8 (nproc_x=8), zmieniając tą wartość na 16 (nproc_x=4), czas obliczeń zmniejsza się o około 8%. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

24 WRF I/O Compute processes I/O processes Compute process Node 0 Compute processes parallel file system Rysunek na podstawie artykułu Opportunities for WRF Model Acceleration, John Michalakes, Andrew Porter INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

25 WRF I/O I/O processes Compute processes Kiedy podzielimy pliki netcdf, każdy proces MPI zapisuje własny plik. Poprawa zależy od wielkości danych na proces. Dla modelu METEOPG wydajność zapisu danych wzrosła 10 razy dla 528 rdzeni. Wada: musimy połączyć wszystkie pliki. WRF oficjalnie nie wspiera tego rozwiązania. Rozwiązanie: Połączenie pnetcdf z warstwą Tryton MPI oznacza, że szeregi MPI są łączone w grupy, a następnie jeden z każdej grupy agregator wykonuje zapis do pliku. nproc = nproc_x*nproc_y+(nio_groups*nio_task_per_group), wartość nio_task_per_group nie może przekroczyć wartości nproc_y. Optymalne rozwiązanie nproc_y powinno być wielokrotnością nio_task_per_group. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

26 Koligacja procesorów Wykorzystanie wszystkich rdzeni procesora spowalnia proc obliczeniowy 11%!!! Optymalne rozwiązanie, zmniejszenie z 24 do rdzeni/procesor. Rozwiązanie. Zmiana przyporządkowanego rdzeni procesorów do konkretnego procesu lub wątku, działa poprawnie jeśli jest wystarczająca ilość pamięci podręcznej. mpirun bycore bind-to-core report-bindings./wrf.exe Procedura powyższa nie zezwala na migrację procesów. Jest to ważne ponieważ jeśli proces migruje, nie może odnaleźć wcześniej zapisanych danych w nowej pamięci podręcznej. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

27 METEOPG podsumowanie Proces Serial Parallel Pobieranie danych godzinnych GFS 0.25deg. Czas [s] Czas [s] GEOGRID METGRID Prognoza WRF I/O SUMA WRF forecast (parallel) Model operacyjny METEOPG 528 rdzeni, czas prognozy 60 godz. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

28 Podsumowanie i wnioski Benchmark superkomputerów z wykorzystaniem numerycznych modeli pogody jest wydajnym narzędziem, które może być stosowane na różnych platformach sprzętowych. Operacje wejścia/wyjścia ograniczają skalowalność procesów obliczeniowych dla dużej ilości rdzeni. Wprowadzając równoległy zapis i odczyt danych można redukować ten efektu. Stare dane do benchmarków z modelu WRF. Brak prostej możliwości wiarygodnej oceny wydajności superkomputerów dla nowych wersji WRF. W TASK zostanie przygotowany zestaw danych do benchmarku HPC z najnowszymi danymi wejściowymi i modelem WRF 3.9/ Nowy zestaw danych do benchmarku powinien być aktualizowany dla każdej wersji modelu. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

29 Dziękuję za uwagę! Koniec części I kontakt: Mariusz Figurski, mariusz.figurski@pg.edu.pl Obliczenia wykonano na komputerach Centrum Informatycznego Trójmiejskiej Akademickiej Sieci Komputerowej. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września

Składowanie, archiwizacja i obliczenia modelowe dla monitorowania środowiska Morza Bałtyckiego

Składowanie, archiwizacja i obliczenia modelowe dla monitorowania środowiska Morza Bałtyckiego Składowanie, archiwizacja i obliczenia modelowe dla monitorowania środowiska Morza Bałtyckiego Rafał Tylman 1, Bogusław Śmiech 1, Marcin Wichorowski 2, Jacek Wyrwiński 2 1 CI TASK Politechnika Gdańska,

Bardziej szczegółowo

i3: internet - infrastruktury - innowacje

i3: internet - infrastruktury - innowacje i3: internet - infrastruktury - innowacje Wykorzystanie procesorów graficznych do akceleracji obliczeń w modelu geofizycznym EULAG Roman Wyrzykowski Krzysztof Rojek Łukasz Szustak [roman, krojek, lszustak]@icis.pcz.pl

Bardziej szczegółowo

USŁUGI HIGH PERFORMANCE COMPUTING (HPC) DLA FIRM. Juliusz Pukacki,PCSS

USŁUGI HIGH PERFORMANCE COMPUTING (HPC) DLA FIRM. Juliusz Pukacki,PCSS USŁUGI HIGH PERFORMANCE COMPUTING (HPC) DLA FIRM Juliusz Pukacki,PCSS Co to jest HPC (High Preformance Computing)? Agregowanie dużych zasobów obliczeniowych w sposób umożliwiający wykonywanie obliczeń

Bardziej szczegółowo

Cyfronet w CTA. Andrzej Oziębło DKDM

Cyfronet w CTA. Andrzej Oziębło DKDM Cyfronet w CTA Andrzej Oziębło DKDM ACK CYFRONET AGH Akademickie Centrum Komputerowe CYFRONET Akademii Górniczo-Hutniczej im. Stanisława Staszica w Krakowie ul. Nawojki 11 30-950 Kraków 61 tel. centrali:

Bardziej szczegółowo

MESco. Testy skalowalności obliczeń mechanicznych w oparciu o licencje HPC oraz kartę GPU nvidia Tesla c2075. Stanisław Wowra

MESco. Testy skalowalności obliczeń mechanicznych w oparciu o licencje HPC oraz kartę GPU nvidia Tesla c2075. Stanisław Wowra MESco Testy skalowalności obliczeń mechanicznych w oparciu o licencje HPC oraz kartę GPU nvidia Tesla c2075 Stanisław Wowra swowra@mesco.com.pl Lider w dziedzinie symulacji na rynku od 1994 roku. MESco

Bardziej szczegółowo

Algorytmy i Struktury Danych

Algorytmy i Struktury Danych POLITECHNIKA KRAKOWSKA - WIEiK KATEDRA AUTOMATYKI i TECHNIK INFORMACYJNYCH Algorytmy i Struktury Danych www.pk.edu.pl/~zk/aisd_hp.html Wykładowca: dr inż. Zbigniew Kokosiński zk@pk.edu.pl Wykład 12: Wstęp

Bardziej szczegółowo

Klaster obliczeniowy

Klaster obliczeniowy Warsztaty promocyjne Usług kampusowych PLATON U3 Klaster obliczeniowy czerwiec 2012 Przemysław Trzeciak Centrum Komputerowe Politechniki Łódzkiej Agenda (czas: 20min) 1) Infrastruktura sprzętowa wykorzystana

Bardziej szczegółowo

PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK

PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK 1 PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK POLITECHNIKA CZĘSTOCHOWSKA 2 Część teoretyczna Informacje i wstępne wymagania Cel przedmiotu i zakres materiału Zasady wydajnego

Bardziej szczegółowo

Procesory wielordzeniowe (multiprocessor on a chip) Krzysztof Banaś, Obliczenia wysokiej wydajności.

Procesory wielordzeniowe (multiprocessor on a chip) Krzysztof Banaś, Obliczenia wysokiej wydajności. Procesory wielordzeniowe (multiprocessor on a chip) 1 Procesory wielordzeniowe 2 Procesory wielordzeniowe 3 Intel Nehalem 4 5 NVIDIA Tesla 6 ATI FireStream 7 NVIDIA Fermi 8 Sprzętowa wielowątkowość 9 Architektury

Bardziej szczegółowo

Budowa komputera. Magistrala. Procesor Pamięć Układy I/O

Budowa komputera. Magistrala. Procesor Pamięć Układy I/O Budowa komputera Magistrala Procesor Pamięć Układy I/O 1 Procesor to CPU (Central Processing Unit) centralny układ elektroniczny realizujący przetwarzanie informacji Zmiana stanu tranzystorów wewnątrz

Bardziej szczegółowo

Obliczenia równoległe i rozproszone. Praca zbiorowa pod redakcją Andrzeja Karbowskiego i Ewy Niewiadomskiej-Szynkiewicz

Obliczenia równoległe i rozproszone. Praca zbiorowa pod redakcją Andrzeja Karbowskiego i Ewy Niewiadomskiej-Szynkiewicz Obliczenia równoległe i rozproszone Praca zbiorowa pod redakcją Andrzeja Karbowskiego i Ewy Niewiadomskiej-Szynkiewicz 15 czerwca 2001 Spis treści Przedmowa............................................

Bardziej szczegółowo

Sprzęt komputerowy 2. Autor prezentacji: 1 prof. dr hab. Maria Hilczer

Sprzęt komputerowy 2. Autor prezentacji: 1 prof. dr hab. Maria Hilczer Sprzęt komputerowy 2 Autor prezentacji: 1 prof. dr hab. Maria Hilczer Budowa komputera Magistrala Procesor Pamięć Układy I/O 2 Procesor to CPU (Central Processing Unit) centralny układ elektroniczny realizujący

Bardziej szczegółowo

Zasoby i usługi Wrocławskiego Centrum Sieciowo-Superkomputerowego

Zasoby i usługi Wrocławskiego Centrum Sieciowo-Superkomputerowego Zasoby i usługi Wrocławskiego Centrum Sieciowo-Superkomputerowego Mateusz Tykierko WCSS 20 stycznia 2012 Mateusz Tykierko (WCSS) 20 stycznia 2012 1 / 16 Supernova moc obliczeniowa: 67,54 TFLOPS liczba

Bardziej szczegółowo

Programowanie równoległe i rozproszone. Praca zbiorowa pod redakcją Andrzeja Karbowskiego i Ewy Niewiadomskiej-Szynkiewicz

Programowanie równoległe i rozproszone. Praca zbiorowa pod redakcją Andrzeja Karbowskiego i Ewy Niewiadomskiej-Szynkiewicz Programowanie równoległe i rozproszone Praca zbiorowa pod redakcją Andrzeja Karbowskiego i Ewy Niewiadomskiej-Szynkiewicz 23 października 2009 Spis treści Przedmowa...................................................

Bardziej szczegółowo

Budowa komputera. Magistrala. Procesor Pamięć Układy I/O

Budowa komputera. Magistrala. Procesor Pamięć Układy I/O Budowa komputera Magistrala Procesor Pamięć Układy I/O 1 Procesor to CPU (Central Processing Unit) centralny układ elektroniczny realizujący przetwarzanie informacji Zmiana stanu tranzystorów wewnątrz

Bardziej szczegółowo

Porównanie wydajności CUDA i OpenCL na przykładzie równoległego algorytmu wyznaczania wartości funkcji celu dla problemu gniazdowego

Porównanie wydajności CUDA i OpenCL na przykładzie równoległego algorytmu wyznaczania wartości funkcji celu dla problemu gniazdowego Porównanie wydajności CUDA i OpenCL na przykładzie równoległego algorytmu wyznaczania wartości funkcji celu dla problemu gniazdowego Mariusz Uchroński 3 grudnia 2010 Plan prezentacji 1. Wprowadzenie 2.

Bardziej szczegółowo

Obliczenia Wysokiej Wydajności

Obliczenia Wysokiej Wydajności Obliczenia wysokiej wydajności 1 Wydajność obliczeń Wydajność jest (obok poprawności, niezawodności, bezpieczeństwa, ergonomiczności oraz łatwości stosowania i pielęgnacji) jedną z najważniejszych charakterystyk

Bardziej szczegółowo

Procesory wielordzeniowe (multiprocessor on a chip) Krzysztof Banaś, Obliczenia wysokiej wydajności.

Procesory wielordzeniowe (multiprocessor on a chip) Krzysztof Banaś, Obliczenia wysokiej wydajności. Procesory wielordzeniowe (multiprocessor on a chip) 1 Procesory wielordzeniowe 2 Procesory wielordzeniowe 3 Konsekwencje prawa Moore'a 4 Procesory wielordzeniowe 5 Intel Nehalem 6 Architektura Intel Nehalem

Bardziej szczegółowo

SUPERKOMPUTER OKEANOS BADAWCZE GRANTY OBLICZENIOWEWE

SUPERKOMPUTER OKEANOS BADAWCZE GRANTY OBLICZENIOWEWE SUPERKOMPUTER OKEANOS BADAWCZE GRANTY OBLICZENIOWEWE SUPERKOMPUTER OKEANOS Z początkiem lipca 2016 roku ICM UW udostępni naukowcom superkomputer Okeanos system wielkoskalowego przetwarzania Cray XC40.

Bardziej szczegółowo

Wprowadzenie. Co to jest klaster? Podział ze względu na przeznaczenie. Architektury klastrów. Cechy dobrego klastra.

Wprowadzenie. Co to jest klaster? Podział ze względu na przeznaczenie. Architektury klastrów. Cechy dobrego klastra. N Wprowadzenie Co to jest klaster? Podział ze względu na przeznaczenie. Architektury klastrów. Cechy dobrego klastra. Wprowadzenie (podział ze względu na przeznaczenie) Wysokiej dostępności 1)backup głównego

Bardziej szczegółowo

Programowanie procesorów graficznych GPGPU

Programowanie procesorów graficznych GPGPU Programowanie procesorów graficznych GPGPU 1 GPGPU Historia: lata 80 te popularyzacja systemów i programów z graficznym interfejsem specjalistyczne układy do przetwarzania grafiki 2D lata 90 te standaryzacja

Bardziej szczegółowo

Politechnika Gdańska Centrum Informatyczne Trójmiejskiej Akademickiej Sieci Komputerowej,

Politechnika Gdańska Centrum Informatyczne Trójmiejskiej Akademickiej Sieci Komputerowej, Politechnika Gdańska Centrum Informatyczne Trójmiejskiej Akademickiej Sieci Komputerowej, INFORMACJA Superkomputer Galera Najszybciej liczącą maszyną w Polsce jest w chwili obecnej superkomputer o nazwie

Bardziej szczegółowo

Wrocławskie Centrum Sieciowo-Superkomputerowe

Wrocławskie Centrum Sieciowo-Superkomputerowe Wrocławskie Centrum Sieciowo-Superkomputerowe Mateusz Tykierko WCSS 26 czerwca 2012 Mateusz Tykierko (WCSS) 26 czerwca 2012 1 / 23 Wstęp Wrocławskie Centrum Sieciowo-Superkomputerowe Jednostka działająca

Bardziej szczegółowo

Dostęp do europejskich systemów obliczeniowych Tier-0 w ramach PRACE

Dostęp do europejskich systemów obliczeniowych Tier-0 w ramach PRACE Dostęp do europejskich systemów obliczeniowych Tier-0 w ramach PRACE KONFERENCJA UŻYTKOWNIKÓW KDM 2016 W kierunku obliczeń Exaskalowych Mirosław Kupczyk, PCSS 28.06.2016 Misja PRACE HPC Dla Przemysłu Zagwarantowanie

Bardziej szczegółowo

Sprzęt komputerowy 2. Autor prezentacji: 1 prof. dr hab. Maria Hilczer

Sprzęt komputerowy 2. Autor prezentacji: 1 prof. dr hab. Maria Hilczer Sprzęt komputerowy 2 Autor prezentacji: 1 prof. dr hab. Maria Hilczer Budowa komputera Magistrala Procesor Pamięć Układy I/O 2 Procesor to CPU (Central Processing Unit) centralny układ elektroniczny realizujący

Bardziej szczegółowo

Równoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami

Równoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami Równoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami dr inż. Mariusz Uchroński Wrocławskie Centrum Sieciowo-Superkomputerowe Agenda Cykliczny problem przepływowy

Bardziej szczegółowo

Komputery Dużej Mocy w Cyfronecie. Andrzej Oziębło Patryk Lasoń, Łukasz Flis, Marek Magryś

Komputery Dużej Mocy w Cyfronecie. Andrzej Oziębło Patryk Lasoń, Łukasz Flis, Marek Magryś Komputery Dużej Mocy w Cyfronecie Andrzej Oziębło Patryk Lasoń, Łukasz Flis, Marek Magryś Administratorzy KDM Baribal, Mars, Panda, Platon U3: Stefan Świąć Piotr Wyrostek Zeus: Łukasz Flis Patryk Lasoń

Bardziej szczegółowo

PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK

PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK 1 PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK POLITECHNIKA CZĘSTOCHOWSKA 2 Trendy rozwoju współczesnych procesorów Budowa procesora CPU na przykładzie Intel Kaby Lake

Bardziej szczegółowo

Programowanie współbieżne Wykład 2. Iwona Kochańska

Programowanie współbieżne Wykład 2. Iwona Kochańska Programowanie współbieżne Wykład 2 Iwona Kochańska Miary skalowalności algorytmu równoległego Przyspieszenie Stały rozmiar danych N T(1) - czas obliczeń dla najlepszego algorytmu sekwencyjnego T(p) - czas

Bardziej szczegółowo

10/14/2013 Przetwarzanie równoległe - wstęp 1. Zakres przedmiotu

10/14/2013 Przetwarzanie równoległe - wstęp 1. Zakres przedmiotu Literatura 1. Introduction to Parallel Computing; Grama, Gupta, Karypis, Kumar; Addison Wesley 2003 2. Wprowadzenie do obliczeń równoległych, Zbigniew Czech, Wydawnictwo Naukowe PWN, 2010. 3. Designing

Bardziej szczegółowo

Infrastruktura PLGrid (nie tylko) dla młodych naukowców

Infrastruktura PLGrid (nie tylko) dla młodych naukowców Infrastruktura PLGrid (nie tylko) dla młodych naukowców Mariola Czuchry, Mariusz Sterzel ACK Cyfronet AGH Wydział Mechaniczny, PK, Kraków 16 XI 2015 Agenda ACK Cyfronet AGH Infrastruktura PLGrid Charakterystyka

Bardziej szczegółowo

Wprowadzenie. Klastry komputerowe. Superkomputery. informatyka +

Wprowadzenie. Klastry komputerowe. Superkomputery. informatyka + Wprowadzenie Klastry komputerowe Superkomputery Wprowadzenie Klastry komputerowe Superkomputery Wprowadzenie Filozofia przetwarzania równoległego polega na podziale programu na fragmenty, z których każdy

Bardziej szczegółowo

Literatura. 11/16/2016 Przetwarzanie równoległe - wstęp 1

Literatura. 11/16/2016 Przetwarzanie równoległe - wstęp 1 Literatura 1. Wprowadzenie do obliczeń równoległych, Zbigniew Czech, Wydawnictwo Naukowe PWN, 2010, 2013 2. Introduction to Parallel Computing; Grama, Gupta, Karypis, Kumar; Addison Wesley 2003 3. Designing

Bardziej szczegółowo

Efektywne wykorzystanie zasobów obliczeniowych KDM w PCSS

Efektywne wykorzystanie zasobów obliczeniowych KDM w PCSS Efektywne wykorzystanie zasobów obliczeniowych KDM w PCSS Radosław Januszewski, Marcin Pospieszny, Piotr Brona, Bartłomiej Burba, Maciej Brzeźniak Poznańskie Centrum Superkomputerowo-Sieciowe Zasoby HPC:

Bardziej szczegółowo

Literatura. 3/26/2018 Przetwarzanie równoległe - wstęp 1

Literatura. 3/26/2018 Przetwarzanie równoległe - wstęp 1 Literatura 1. Wprowadzenie do obliczeń równoległych, Zbigniew Czech, Wydawnictwo Naukowe PWN, 2010, 2013 2. Introduction to Parallel Computing; Grama, Gupta, Karypis, Kumar; Addison Wesley 2003 3. Designing

Bardziej szczegółowo

Symulacje kinetyczne Par2cle In Cell w astrofizyce wysokich energii Wykład 7

Symulacje kinetyczne Par2cle In Cell w astrofizyce wysokich energii Wykład 7 Symulacje kinetyczne Par2cle In Cell w astrofizyce wysokich energii Wykład 7 dr Jacek Niemiec Instytut Fizyki Jądrowej PAN, Kraków Jacek.Niemiec@ifj.edu.pl www.oa.uj.edu.pl/j.niemiec/symulacjenumeryczne

Bardziej szczegółowo

Architektura komputerów

Architektura komputerów Architektura komputerów Wykład 7 Jan Kazimirski 1 Pamięć podręczna 2 Pamięć komputera - charakterystyka Położenie Procesor rejestry, pamięć podręczna Pamięć wewnętrzna pamięć podręczna, główna Pamięć zewnętrzna

Bardziej szczegółowo

OFERTA. Załącznik nr 1 do zapytania ofertowego: Wzór oferty. Dane oferenta. Pełna nazwa oferenta: Adres:. REGON:.. Tel./fax.: .

OFERTA. Załącznik nr 1 do zapytania ofertowego: Wzór oferty. Dane oferenta. Pełna nazwa oferenta: Adres:. REGON:.. Tel./fax.:  . Załącznik nr 1 do zapytania ofertowego: Wzór oferty (miejscowość, data) OFERTA Dane oferenta Pełna nazwa oferenta:. Adres:. NIP: REGON:.. Tel./fax.: e-mail:. W odpowiedzi na upublicznione przez Info-Projekt

Bardziej szczegółowo

Wykorzystanie architektury Intel MIC w obliczeniach typu stencil

Wykorzystanie architektury Intel MIC w obliczeniach typu stencil Wykorzystanie architektury Intel MIC w obliczeniach typu stencil Kamil Halbiniak Wydział Inżynierii Mechanicznej i Informatyki Kierunek informatyka, Rok IV Instytut Informatyki Teoretycznej i Stosowanej

Bardziej szczegółowo

16. Taksonomia Flynn'a.

16. Taksonomia Flynn'a. 16. Taksonomia Flynn'a. Taksonomia systemów komputerowych według Flynna jest klasyfikacją architektur komputerowych, zaproponowaną w latach sześćdziesiątych XX wieku przez Michaela Flynna, opierająca się

Bardziej szczegółowo

O superkomputerach. Marek Grabowski

O superkomputerach. Marek Grabowski O superkomputerach Marek Grabowski Superkomputery dziś Klastry obliczeniowe Szafy (od zawsze) Bo komputery są duże Półki i blade'y (od pewnego czasu) Większe upakowanie mocy obliczeniowej na m^2 Łatwiejsze

Bardziej szczegółowo

Obliczenia Wysokiej Wydajności

Obliczenia Wysokiej Wydajności Obliczenia wysokiej wydajności 1 Wydajność obliczeń Wydajność jest (obok poprawności, niezawodności, bezpieczeństwa, ergonomiczności i łatwości stosowania i pielęgnacji) jedną z najważniejszych charakterystyk

Bardziej szczegółowo

Dr inż. hab. Siergiej Fialko, IF-PK,

Dr inż. hab. Siergiej Fialko, IF-PK, Dr inż. hab. Siergiej Fialko, IF-PK, http://torus.uck.pk.edu.pl/~fialko sfialko@riad.pk.edu.pl 1 Osobliwości przedmiotu W podanym kursie główna uwaga będzie przydzielona osobliwościom symulacji komputerowych

Bardziej szczegółowo

Architektura komputerów

Architektura komputerów Architektura komputerów Wykład 13 Jan Kazimirski 1 KOMPUTERY RÓWNOLEGŁE 2 Klasyfikacja systemów komputerowych SISD Single Instruction, Single Data stream SIMD Single Instruction, Multiple Data stream MISD

Bardziej szczegółowo

Projektowanie nowoczesnych mieszadeł elektromagnetycznych dla pieców łukowych z wykorzystaniem HPC. Mirosław Kupczyk (PCSS) Poznań

Projektowanie nowoczesnych mieszadeł elektromagnetycznych dla pieców łukowych z wykorzystaniem HPC. Mirosław Kupczyk (PCSS) Poznań Projektowanie nowoczesnych mieszadeł elektromagnetycznych dla pieców łukowych z wykorzystaniem HPC Mirosław Kupczyk (PCSS) Poznań 13.09.2016 Projektowanie nowoczesnych mieszadeł elektromagnetycznych dla

Bardziej szczegółowo

Program Obliczeń Wielkich Wyzwań Nauki i Techniki (POWIEW)

Program Obliczeń Wielkich Wyzwań Nauki i Techniki (POWIEW) Program Obliczeń Wielkich Wyzwań Nauki i Techniki (POWIEW) Maciej Cytowski, Maciej Filocha, Maciej E. Marchwiany, Maciej Szpindler Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego

Bardziej szczegółowo

KLASTER SINGLE SYSTEM IMAGE W OBLICZENIACH NAUKOWO-INŻYNIERSKICH SINGLE SYSTEM IMAGE CLUSTER IN SCIENTIFIC ENGINEERING COMPUTATIONS

KLASTER SINGLE SYSTEM IMAGE W OBLICZENIACH NAUKOWO-INŻYNIERSKICH SINGLE SYSTEM IMAGE CLUSTER IN SCIENTIFIC ENGINEERING COMPUTATIONS MARIUSZ KRAWCZYK KLASTER SINGLE SYSTEM IMAGE W OBLICZENIACH NAUKOWO-INŻYNIERSKICH SINGLE SYSTEM IMAGE CLUSTER IN SCIENTIFIC ENGINEERING COMPUTATIONS S t r e s z c z e n i e A b s t r a c t W artykule przedstawiono

Bardziej szczegółowo

Skalowalna Platforma dla eksperymentów dużej skali typu Data Farming z wykorzystaniem środowisk organizacyjnie rozproszonych

Skalowalna Platforma dla eksperymentów dużej skali typu Data Farming z wykorzystaniem środowisk organizacyjnie rozproszonych 1 Skalowalna Platforma dla eksperymentów dużej skali typu Data Farming z wykorzystaniem środowisk organizacyjnie rozproszonych D. Król, Ł. Dutka, J. Kitowski ACC Cyfronet AGH Plan prezentacji 2 O nas Wprowadzenie

Bardziej szczegółowo

Serwer biznesowy o podwójnym zastosowaniu moc obliczeniowa i pamięć masowa w jednej obudowie

Serwer biznesowy o podwójnym zastosowaniu moc obliczeniowa i pamięć masowa w jednej obudowie QNAP TDS-16489U-SB3 66 636,11 PLN brutto 54 175,70 PLN netto Producent: QNAP Firma QNAP rozwija innowacyjność w segmencie serwerów biznesowych i wprowadza do oferty TDS-16489U wydajny podwójny serwer łączący

Bardziej szczegółowo

Infrastruktura PLGrid dla młodych polskich naukowców

Infrastruktura PLGrid dla młodych polskich naukowców Infrastruktura PLGrid dla młodych polskich naukowców Mariola Czuchry ACK Cyfronet AGH WFiIS, AGH, Kraków 5 X 2015 Agenda ACK Cyfronet AGH Infrastruktura PLGrid Charakterystyka Struktura Oferta Dostęp do

Bardziej szczegółowo

High Performance Computers in Cyfronet. Andrzej Oziębło Zakopane, marzec 2009

High Performance Computers in Cyfronet. Andrzej Oziębło Zakopane, marzec 2009 High Performance Computers in Cyfronet Andrzej Oziębło Zakopane, marzec 2009 Plan Podział komputerów dużej mocy Podstawowe informacje użytkowe Opis poszczególnych komputerów Systemy składowania danych

Bardziej szczegółowo

Wprowadzenie do obsługi systemów obliczeniowych PCSS

Wprowadzenie do obsługi systemów obliczeniowych PCSS Wprowadzenie do obsługi systemów obliczeniowych PCSS Marcin Pospieszny Poznańskie Centrum Superkomputerowo-Sieciowe 17 listopada 2011 Plan prezentacji 1 Architektura maszyn 2 Linux: podstawy 3 PBS 4 Aplikacje

Bardziej szczegółowo

REFERAT PRACY DYPLOMOWEJ

REFERAT PRACY DYPLOMOWEJ REFERAT PRACY DYPLOMOWEJ Temat pracy: Implementacja i porównanie wydajności wybranych algorytmów grafowych w warunkach obliczeń równoległych Autor pracy: Michał Podstawski Promotor: Prof. WSTI, dr hab.

Bardziej szczegółowo

Nowe aplikacje i usługi w środowisku Grid

Nowe aplikacje i usługi w środowisku Grid Nowe aplikacje i usługi w środowisku Grid Wstęp Pojęcie GRID Aplikacje/Usługi Laboratorium Wirtualne Krajowy Magazyn Danych Zastosowanie Skala i zasięg Użytkownik końcowy Uwarunkowania ekonomiczne Laboratorium

Bardziej szczegółowo

Zintegrowanego Systemu

Zintegrowanego Systemu Zintegrowany System Informacji o Zlewni - CRIS Dane meteorologiczne dla Zintegrowanego Systemu Informacji o Zlewni CRIS dr Czesław Kliś Instytut Ekologii Terenów Uprzemysłowionych w Katowicach Projekt

Bardziej szczegółowo

2014 LENOVO INTERNAL. ALL RIGHTS RESERVED

2014 LENOVO INTERNAL. ALL RIGHTS RESERVED 2014 LENOVO INTERNAL. ALL RIGHTS RESERVED 3 SUSE OpenStack - Architektura SUSE OpenStack - Funkcje Oprogramowanie Open Source na bazie OpenStack Scentralizowane monitorowanie zasobów Portal samoobsługowy

Bardziej szczegółowo

Badania testów porównawczych: Optymalizacja testów zrzutowych za pomocą technologii Dell, Intel i Altair

Badania testów porównawczych: Optymalizacja testów zrzutowych za pomocą technologii Dell, Intel i Altair Badania testów porównawczych: Optymalizacja testów zrzutowych za pomocą technologii Dell, Intel i Altair Fredrik Nordgren, mgr inż. (magister inżynierii mechanicznej), inżynier aplikacji, Altair Eric Lequiniou,

Bardziej szczegółowo

Tworzenie programów równoległych cd. Krzysztof Banaś Obliczenia równoległe 1

Tworzenie programów równoległych cd. Krzysztof Banaś Obliczenia równoległe 1 Tworzenie programów równoległych cd. Krzysztof Banaś Obliczenia równoległe 1 Metodologia programowania równoległego Przykłady podziałów zadania na podzadania: Podział ze względu na funkcje (functional

Bardziej szczegółowo

System komputerowy. System komputerowy

System komputerowy. System komputerowy System komputerowy System komputerowy System komputerowy układ współdziałających ze sobą (według pewnych zasad) dwóch składowych: sprzętu komputerowego (hardware) oraz oprogramowania (software) po to,

Bardziej szczegółowo

Welcome to the waitless world. Inteligentna infrastruktura systemów Power S812LC i S822LC

Welcome to the waitless world. Inteligentna infrastruktura systemów Power S812LC i S822LC Inteligentna infrastruktura systemów Power S812LC i S822LC Przedstawiamy nową linię serwerów dla Linux Clouds & Clasters IBM Power Systems LC Kluczowa wartość dla klienta Specyfikacje S822LC Technical

Bardziej szczegółowo

Programowanie Rozproszone i Równoległe

Programowanie Rozproszone i Równoległe Programowanie Rozproszone i Równoległe OpenMP (www.openmp.org) API do pisania wielowątkowych aplikacji Zestaw dyrektyw kompilatora oraz procedur bibliotecznych dla programistów Ułatwia pisanie programów

Bardziej szczegółowo

AMD Ryzen recenzja procesora. Wpisany przez Mateusz Ponikowski Piątek, 11 Październik :47

AMD Ryzen recenzja procesora. Wpisany przez Mateusz Ponikowski Piątek, 11 Październik :47 Sprawdzamy niedrogi procesor od AMD. Składając niedrogi komputer do pracy z multimediami i okazjonalnego grania musimy zacząć od wyboru platformy i tutaj pojawia się odwieczne pytanie, Intel czy AMD? Budując

Bardziej szczegółowo

Nowoczesne technologie przetwarzania informacji

Nowoczesne technologie przetwarzania informacji Projekt Nowe metody nauczania w matematyce Nr POKL.09.04.00-14-133/11 Nowoczesne technologie przetwarzania informacji Mgr Maciej Cytowski (ICM UW) Lekcja 2: Podstawowe mechanizmy programowania równoległego

Bardziej szczegółowo

IMPLEMENTACJA I PORÓWNANIE WYDAJNOŚCI WYBRANYCH ALGORYTMÓW GRAFOWYCH W WARUNKACH OBLICZEŃ RÓWNOLEGŁYCH

IMPLEMENTACJA I PORÓWNANIE WYDAJNOŚCI WYBRANYCH ALGORYTMÓW GRAFOWYCH W WARUNKACH OBLICZEŃ RÓWNOLEGŁYCH IMPLEMENTACJA I PORÓWNANIE WYDAJNOŚCI WYBRANYCH ALGORYTMÓW GRAFOWYCH W WARUNKACH OBLICZEŃ RÓWNOLEGŁYCH Michał Podstawski Praca dyplomowa napisana pod kierunkiem Prof. WSTI dr hab. inż. Jarosława Śmiei

Bardziej szczegółowo

Tworzenie programów równoległych. Krzysztof Banaś Obliczenia równoległe 1

Tworzenie programów równoległych. Krzysztof Banaś Obliczenia równoległe 1 Tworzenie programów równoległych Krzysztof Banaś Obliczenia równoległe 1 Tworzenie programów równoległych W procesie tworzenia programów równoległych istnieją dwa kroki o zasadniczym znaczeniu: wykrycie

Bardziej szczegółowo

Dostęp do europejskich systemów obliczeniowych Tier-0/Tier-1 w ramach PRACE

Dostęp do europejskich systemów obliczeniowych Tier-0/Tier-1 w ramach PRACE Dostęp do europejskich systemów obliczeniowych Tier-0/Tier-1 w ramach PRACE KONFERENCJA UŻYTKOWNIKÓW KDM 2017 Nowe trendy w użytkowaniu KDM Mirosław Kupczyk, PCSS 24.5.2017 Tier-0: komputery klasy Petaflops

Bardziej szczegółowo

KATALOG SERWERÓW ACTINA SOLAR

KATALOG SERWERÓW ACTINA SOLAR KATALOG SERWERÓW ACTINA SOLAR Serwery: wolnostojące stelażowe wielowęzłowe kasetowe Właścicielem marki Actina oraz producentem komputerów i serwerów Actina jest firma ACTION S.A. wiodący dostawca branży

Bardziej szczegółowo

Infrastruktura PLGrid

Infrastruktura PLGrid Infrastruktura PLGrid Andrzej Zemła ACK Cyfronet AGH Konferencja Użytkowników Komputerów Dużej Mocy Zakopane 2019 Zakopane, 2019.03.07 Infrastruktura PLGrid Polska Infrastruktura Informatycznego Wspomagania

Bardziej szczegółowo

Opracowanie obserwacji satelitarnych GPS/GLONAS w klastrowych systemach superkomputerowych

Opracowanie obserwacji satelitarnych GPS/GLONAS w klastrowych systemach superkomputerowych Opracowanie obserwacji satelitarnych GPS/GLONAS w klastrowych systemach superkomputerowych Mariusz Figurski Marcin Gałuszkiewicz Krzysztof Kroszczyński Wojskowa Akademia Techniczna, Warszawa SEMINARIUM

Bardziej szczegółowo

CUDA Median Filter filtr medianowy wykorzystujący bibliotekę CUDA sprawozdanie z projektu

CUDA Median Filter filtr medianowy wykorzystujący bibliotekę CUDA sprawozdanie z projektu CUDA Median Filter filtr medianowy wykorzystujący bibliotekę CUDA sprawozdanie z projektu inż. Daniel Solarz Wydział Fizyki i Informatyki Stosowanej AGH 1. Cel projektu. Celem projektu było napisanie wtyczki

Bardziej szczegółowo

XPRI Team. Szybka i elastyczna współpraca podczas montażu nieliniowego dla grup roboczych. Omówienie. XPRI Team 1

XPRI Team. Szybka i elastyczna współpraca podczas montażu nieliniowego dla grup roboczych. Omówienie. XPRI Team 1 XPRI Team Szybka i elastyczna współpraca podczas montażu nieliniowego dla grup roboczych Omówienie Łatwa i ekonomiczna współpraca praca w zespołowych owych systemach NLE, stanowiących doskonałe e uzupełnienie

Bardziej szczegółowo

OPIS PRZEDMIOTU ZAMÓWIENIA SPECYFIKACJA SPRZĘTU KOMPUTEROWEGO

OPIS PRZEDMIOTU ZAMÓWIENIA SPECYFIKACJA SPRZĘTU KOMPUTEROWEGO Załącznik nr 3 do Ogłoszenia o zamówieniu Znak postępowania ZZ.2130.312.2019.LZI OPIS PRZEDMIOTU ZAMÓWIENIA SPECYFIKACJA SPRZĘTU KOMPUTEROWEGO 1. Przedmiotem zamówienia jest dostawa platformy badawczej

Bardziej szczegółowo

Moduł meteorologiczny w serwisie CRIS

Moduł meteorologiczny w serwisie CRIS Zintegrowana strategia zrównoważonego zarządzania wodami w zlewni Moduł meteorologiczny w serwisie CRIS Czesław Kliś Instytut Ekologii Terenów Uprzemysłowionych Projekt finansowany ze środków funduszy

Bardziej szczegółowo

Architektura Systemów Komputerowych. Rozwój architektury komputerów klasy PC

Architektura Systemów Komputerowych. Rozwój architektury komputerów klasy PC Architektura Systemów Komputerowych Rozwój architektury komputerów klasy PC 1 1978: Intel 8086 29tys. tranzystorów, 16-bitowy, współpracował z koprocesorem 8087, posiadał 16-bitową szynę danych (lub ośmiobitową

Bardziej szczegółowo

Laboratorium Chmur obliczeniowych. Paweł Świątek, Łukasz Falas, Patryk Schauer, Radosław Adamkiewicz

Laboratorium Chmur obliczeniowych. Paweł Świątek, Łukasz Falas, Patryk Schauer, Radosław Adamkiewicz Laboratorium Chmur obliczeniowych Paweł Świątek, Łukasz Falas, Patryk Schauer, Radosław Adamkiewicz Agenda SANTOS Lab laboratorium badawcze Zagadnienia badawcze Infrastruktura SANTOS Lab Zasoby laboratorium

Bardziej szczegółowo

Ćwiczenie nr: 9 Obliczenia rozproszone MPI

Ćwiczenie nr: 9 Obliczenia rozproszone MPI Ćwiczenie nr: 9 Temat: Obliczenia rozproszone MPI 1. Informacje ogólne MPI (Message Passing Interface) nazwa standardu biblioteki przesyłania komunikatów dla potrzeb programowania równoległego w sieciach

Bardziej szczegółowo

Wydajność systemów a organizacja pamięci. Krzysztof Banaś, Obliczenia wysokiej wydajności. 1

Wydajność systemów a organizacja pamięci. Krzysztof Banaś, Obliczenia wysokiej wydajności. 1 Wydajność systemów a organizacja pamięci Krzysztof Banaś, Obliczenia wysokiej wydajności. 1 Motywacja - memory wall Krzysztof Banaś, Obliczenia wysokiej wydajności. 2 Organizacja pamięci Organizacja pamięci:

Bardziej szczegółowo

Tworzenie programów równoległych. Krzysztof Banaś Obliczenia równoległe 1

Tworzenie programów równoległych. Krzysztof Banaś Obliczenia równoległe 1 Tworzenie programów równoległych Krzysztof Banaś Obliczenia równoległe 1 Tworzenie programów równoległych W procesie tworzenia programów równoległych istnieją dwa kroki o zasadniczym znaczeniu: wykrycie

Bardziej szczegółowo

Audyt oprogramowania. Artur Sierszeń asiersz@kis.p.lodz.pl http://bzyczek.kis.p.lodz.pl

Audyt oprogramowania. Artur Sierszeń asiersz@kis.p.lodz.pl http://bzyczek.kis.p.lodz.pl Audyt oprogramowania Artur Sierszeń asiersz@kis.p.lodz.pl http://bzyczek.kis.p.lodz.pl Cel audytu Audyt oprogramowania polega na analizie stanu oprogramowania zainstalowanego w firmie uporządkowaniu i

Bardziej szczegółowo

Konsolidacja wysokowydajnych systemów IT. Macierze IBM DS8870 Serwery IBM Power Przykładowe wdrożenia

Konsolidacja wysokowydajnych systemów IT. Macierze IBM DS8870 Serwery IBM Power Przykładowe wdrożenia Konsolidacja wysokowydajnych systemów IT Macierze IBM DS8870 Serwery IBM Power Przykładowe wdrożenia Mirosław Pura Sławomir Rysak Senior IT Specialist Client Technical Architect Agenda Współczesne wyzwania:

Bardziej szczegółowo

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu: PROGRAMOWANIE WSPÓŁBIEŻNE I ROZPROSZONE I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK PO PRZEDMIOCIE C1. Uzyskanie przez studentów wiedzy na temat architektur systemów równoległych i rozproszonych,

Bardziej szczegółowo

Rozproszona korelacja w radioastronomii

Rozproszona korelacja w radioastronomii Rozproszona korelacja w radioastronomii Dominik Stokłosa Poznańskie Centrum Superkomputerowo Sieciowe Konferencja I3: internet infrastruktury innowacje, Poznań 4-6 listopada 2009 Obserwacje radiowe i optyczne

Bardziej szczegółowo

Ćwiczenie nr: 9 Obliczenia rozproszone MPI

Ćwiczenie nr: 9 Obliczenia rozproszone MPI Ćwiczenie nr: 9 Temat: Obliczenia rozproszone MPI 1. Informacje ogólne MPI (Message Passing Interface) nazwa standardu biblioteki przesyłania komunikatów dla potrzeb programowania równoległego w sieciach

Bardziej szczegółowo

Przygotowanie kilku wersji kodu zgodnie z wymogami wersji zadania,

Przygotowanie kilku wersji kodu zgodnie z wymogami wersji zadania, Przetwarzanie równoległe PROJEKT OMP i CUDA Temat projektu dotyczy analizy efektywności przetwarzania równoległego realizowanego przy użyciu komputera równoległego z procesorem wielordzeniowym z pamięcią

Bardziej szczegółowo

Zamieszczanie ogłoszenia: obowiązkowe. Ogłoszenie dotyczy: zamówienia publicznego.

Zamieszczanie ogłoszenia: obowiązkowe. Ogłoszenie dotyczy: zamówienia publicznego. Gdańsk: Dostawa oprogramowania dla Wydziału Elektroniki, Telekomunikacji i Informatyki Politechniki Gdańskiej Numer ogłoszenia: 58219-2013; data zamieszczenia: 17.04.2013 OGŁOSZENIE O ZAMÓWIENIU - dostawy

Bardziej szczegółowo

Parametry wydajnościowe systemów internetowych. Tomasz Rak, KIA

Parametry wydajnościowe systemów internetowych. Tomasz Rak, KIA Parametry wydajnościowe systemów internetowych Tomasz Rak, KIA 1 Agenda ISIROSO System internetowy (rodzaje badań, konstrukcja) Parametry wydajnościowe Testy środowiska eksperymentalnego Podsumowanie i

Bardziej szczegółowo

Spis treści. I. Skuteczne. Od autora... Obliczenia inżynierskie i naukowe... Ostrzeżenia...XVII

Spis treści. I. Skuteczne. Od autora... Obliczenia inżynierskie i naukowe... Ostrzeżenia...XVII Spis treści Od autora..................................................... Obliczenia inżynierskie i naukowe.................................. X XII Ostrzeżenia...................................................XVII

Bardziej szczegółowo

Moc płynąca z kart graficznych

Moc płynąca z kart graficznych Moc płynąca z kart graficznych Cuda za darmo! Czyli programowanie generalnego przeznaczenia na kartach graficznych (GPGPU) 22 października 2013 Paweł Napieracz /20 Poruszane aspekty Przetwarzanie równoległe

Bardziej szczegółowo

Podstawy pracy w ICM

Podstawy pracy w ICM Podstawy pracy w ICM Zespół KDM Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego Uniwerystet Warszawski Szkolenie KDM (Kontakt: pomoc@icm.edu.pl) Podstawy pracy w ICM Szkolenie KDM

Bardziej szczegółowo

Zalecenia dotyczące budowania infrastruktury sprzętowej systemu Comarch ERP XL 2016.0. Aktualizacja dokumentu: 2015-09-25

Zalecenia dotyczące budowania infrastruktury sprzętowej systemu Comarch ERP XL 2016.0. Aktualizacja dokumentu: 2015-09-25 Zalecenia dotyczące budowania infrastruktury sprzętowej systemu Comarch ERP XL 2016.0 Aktualizacja dokumentu: 2015-09-25 Copyright 2015 COMARCH Wszelkie prawa zastrzeżone Nieautoryzowane rozpowszechnianie

Bardziej szczegółowo

Równoległe aplikacje duŝej skali w środowisku PL-Grid. Kick-off PL-GRID Kraków, 16-17 kwietnia 2009

Równoległe aplikacje duŝej skali w środowisku PL-Grid. Kick-off PL-GRID Kraków, 16-17 kwietnia 2009 Polska Infrastruktura Informatycznego Wspomagania Nauki w Europejskiej Przestrzeni Badawczej Równoległe aplikacje duŝej skali w środowisku PL-Grid Tomasz Piontek, Krzysztof Kurowski, Piotr Kopta, Mariusz

Bardziej szczegółowo

Komputery równoległe. Zbigniew Koza. Wrocław, 2012

Komputery równoległe. Zbigniew Koza. Wrocław, 2012 Komputery równoległe Zbigniew Koza Wrocław, 2012 Po co komputery równoległe? Przyspieszanie obliczeń np. diagnostyka medyczna; aplikacje czasu rzeczywistego Przetwarzanie większej liczby danych Przykład:

Bardziej szczegółowo

Architektury komputerów Architektury i wydajność. Tomasz Dziubich

Architektury komputerów Architektury i wydajność. Tomasz Dziubich Architektury komputerów Architektury i wydajność Tomasz Dziubich Przetwarzanie potokowe Przetwarzanie sekwencyjne Przetwarzanie potokowe Architektura superpotokowa W przetwarzaniu potokowym podczas niektórych

Bardziej szczegółowo

Dwa lub więcej komputerów połączonych ze sobą z określonymi zasadami komunikacji (protokołem komunikacyjnym).

Dwa lub więcej komputerów połączonych ze sobą z określonymi zasadami komunikacji (protokołem komunikacyjnym). Sieci komputerowe Dwa lub więcej komputerów połączonych ze sobą z określonymi zasadami komunikacji (protokołem komunikacyjnym). Zadania sieci - wspólne korzystanie z plików i programów - współdzielenie

Bardziej szczegółowo

Programowanie procesorów graficznych NVIDIA (rdzenie CUDA) Wykład nr 1

Programowanie procesorów graficznych NVIDIA (rdzenie CUDA) Wykład nr 1 Programowanie procesorów graficznych NVIDIA (rdzenie CUDA) Wykład nr 1 Wprowadzenie Procesory graficzne GPU (Graphics Processing Units) stosowane są w kartach graficznych do przetwarzania grafiki komputerowej

Bardziej szczegółowo

Tom II: SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA (SOPZ): Przedmiotem zamówienia jest dostawa sprzętu infrastruktury serwerowej i sieciowej.

Tom II: SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA (SOPZ): Przedmiotem zamówienia jest dostawa sprzętu infrastruktury serwerowej i sieciowej. Tom II: SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA (SOPZ): 1. Wstęp 1.1 Wymagania projektu Przedmiotem zamówienia jest dostawa sprzętu infrastruktury serwerowej i sieciowej. Lp Nazwa urządzenia Liczba sztuk

Bardziej szczegółowo

Systemy rozproszone. na użytkownikach systemu rozproszonego wrażenie pojedynczego i zintegrowanego systemu.

Systemy rozproszone. na użytkownikach systemu rozproszonego wrażenie pojedynczego i zintegrowanego systemu. Systemy rozproszone Wg Wikipedii: System rozproszony to zbiór niezależnych urządzeń (komputerów) połączonych w jedną, spójną logicznie całość. Połączenie najczęściej realizowane jest przez sieć komputerową..

Bardziej szczegółowo

Metody optymalizacji soft-procesorów NIOS

Metody optymalizacji soft-procesorów NIOS POLITECHNIKA WARSZAWSKA Wydział Elektroniki i Technik Informacyjnych Instytut Telekomunikacji Zakład Podstaw Telekomunikacji Kamil Krawczyk Metody optymalizacji soft-procesorów NIOS Warszawa, 27.01.2011

Bardziej szczegółowo

Systemy operacyjne i sieci komputerowe Szymon Wilk Superkomputery 1

Systemy operacyjne i sieci komputerowe Szymon Wilk Superkomputery 1 i sieci komputerowe Szymon Wilk Superkomputery 1 1. Superkomputery to komputery o bardzo dużej mocy obliczeniowej. Przeznaczone są do symulacji zjawisk fizycznych prowadzonych głównie w instytucjach badawczych:

Bardziej szczegółowo

Autor: inż. Wojciech Zatorski Opiekun pracy: dr inż. Krzysztof Małecki

Autor: inż. Wojciech Zatorski Opiekun pracy: dr inż. Krzysztof Małecki Autor: inż. Wojciech Zatorski Opiekun pracy: dr inż. Krzysztof Małecki Cel Konfiguracja i testowanie serwera WWW Apache w celu optymalizacji wydajności. 2/25 Zakres Konfigurowanie serwera Apache jako wydajnego

Bardziej szczegółowo