Analiza porównawcza wydajności prognozowania pogody na klastrze TRYTON z wykorzystaniem modelu WRF
|
|
- Monika Sosnowska
- 6 lat temu
- Przeglądów:
Transkrypt
1 Analiza porównawcza wydajności prognozowania pogody na klastrze TRYTON z wykorzystaniem modelu WRF Mariusz J. FIGURSKI, Grzegorz NYKIEL Wydział Inżynierii Lądowej i Środowiska, Politechnika Gdańska INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
2 Plan prezentacji 1. Wprowadzenie co to jest model WRF. 2. Cele badawcze benchmarków z WRF. 3. Przetwarzanie danych w modelu WRF. 4. Dane do benchmarków. 5. Infrastruktura obliczeniowa i konfiguracja modelu. 6. Benchmark 3dhrlev i CONUS 2.5km. 7. Model METEOPG optymalizacja Tryton. 8. Podsumowanie i wnioski. 9. Dodatek portal pogodowy METEOPG. 10. Dodatek symulacja huraganu z 11 sierpnia INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
3 WRF - Weather Research and Forecast Zaprojektowany do badań i celów operacyjnych Dwie wersje Numeryczna prognoza pogody Symulacje atmosfery ARW zaawansowana wersja badawcza modelu WRF NMM niehydrostatyczny model mezoskalowy Elastyczny i przenośny kod Sekwencyjny Równoległy (MPI) bez lub z wielowątkowością Obsługuje dwa poziomy dekompozycji domen. Podział na podobszary (prostokąty) w pamięci rozproszonej Następnie w obrębie każdego wielowątkowego podobszaru jest stosowany podział dla pamięci współdzielonej. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
4 Cele badawcze Rozwój narzędzi ułatwiających wykonanie procedur symulacyjnych WRF na infrastrukturze HPC. Lokalne klastry HPC. Infrastruktura typu GRID, np. PL-GRID. Badanie skuteczności równoległego modelu WRF w celu znalezienia najlepszej konfiguracji zadanego scenariusza dla meteorologicznego modelowania w przestrzeni 3D. MPI, MPI+OpenMP, Liczba węzłów, rdzeni, procesów MPI, wątków OpenMP. Narzędzia zarządzania obliczeniami w modelu WRF wykorzystywane są również do ustalania (optymalizowania) parametrów modeli, które wymagają: Dziesiątek ocen parametrycznej (cykli symulacyjnych) dokładności modelu. Każda ocena parametrów modelu wymaga ponownego uruchomienia setek sytuacji meteorologicznych zebranych w ciągu wielu lat oraz porównania wyników modelu z danymi obserwacyjnymi. Wykorzystanie modelu WRF do benchmarków komputerów. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
5 Przetwarzanie danych w modelu WRF Obiekt 1: MPI/Serial WRF preprocessing Obiekt 2: MPI/MPI+OpenMP P i = MPI proces WRF model P 0,,P n P i =(T 0,,T m ) T m = wątek OpenMP Obiekt 3: Parametric MPI/Serial UPP postprocessing P 0,,P k UPP postprocessing P 0,,P k UPP postprocessing P 0,,P k Symulacje w modelu WRF składają się z szeregu programów różnego typu i złożoności, sekwencyjne i równoległe, wykorzystujące różną liczbę rdzeni i procesorów. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
6 Przetwarzanie danych w modelu WRF Przepływ informacji Obiekt 1 Przygotowanie danych WPS: konwersja danych z formatu GRIB do netcdf przy użyciu: GEOGRID.EXE (serial/mpi) UNGRIB.EXE (Serial) METGRID.EXE (Serial/MPI) Obiekt 2 Modelowanie WRF modelowanie numeryczne przy użyciu: REAL.EXE inicjalizacja przygotowanie danych rzeczywistych (MPI/MPI+OpenMP). WRF.EXE całkowanie numeryczne ARW (MPI/MPI+OpenMP). Obiekt 3 UPP post processing Konwersja danych wynikowych w formacie netcdf do formatu GRIB przy użyciu programu UNIPOST.EXE (Serial/MPI) dla okresu czasu objętego prognozą. Nie ma zależności pomiędzy opracowywanymi danymi z kolejnych godzin. Procesy można sparametryzować jako nienależne zadania. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
7 Dane do benchmarków WRF Dane do benchmarków przygotowywane są przez jedną z grup roboczych Rady Aplikacji Badawczych WRF (WG2 Software architecture, standard and implementation). Dostępne są dane dla dwóch pojedynczych siatek 12.5 km (2001) i 2.5 km (2005) sieci CONUS. Oprogramowanie WRF Symulacja o długości 3 godz. Problem z weryfikacją wyników. I/O serial/parallel. Rozdzielczość Liczba węzłów 12.5 km 425x300x35 = 4.46 mln 2.5 km 1500x1200x35 = 63 mln INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
8 Dane do benchmarków modelu WRF Arctic Region Supercomputing Center WRF Benchmarking. Dane dla siatek zanurzonych obejmujące obszar Europy i Alaski. WRF Symulacja o długości 3h na bazie danych z 2007 roku. Dane obecnie niedostępne. 3dhrlev Rozdzielczość Liczba węzłów 7.2 km 585x495x63 = 18.2 mln 2.4 km 823x652x63 = 33.8 mln 800 m 1777x1066x63 = mln INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
9 Superkomputery VSC PACMAN CHUGACH KRAKEN HPC academic system University of Vienna Sun Fire X2270 compute nodes, each equipped with 2 Quadcore processors (Intel, X5550, 2.66 GHz) and 24 GB memory (3 GB per core). Infiniband QDR network (40 Gbps). Filesystem ext3 Academic system, Arctic Region Supercomputing Center. Pacific Area Climate Monitoring and Analysis Network (PACMAN). Sixteen-core compute nodes consisting of 2 eight-core 2.3 GHz AMD Opteron processors with 64 GB memory (4 GB per core). Mellanox QDR Infiniband interconnect. Cray XE6 currently administered by ARSC for the DoD High Performance Computing and Modernization Program. 16-core compute nodes consisting of 2 eight-core 2.3 GHz AMD Opteron processors with 32 GB memory (2 GB per core). Cray Gemini interconnect. Lustre scalable filesystem used on compute nodes. Cray XT5 at National Institute for Computational Sciences. 12-core compute nodes consisting of 2 six-core 2.6 GHz AMD Opteron processors with 16 GB memory (1.5 GB per core). Cray SeaStar2+ interconnect. Lustre filesystem used on compute nodes. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
10 Superkomputery - Tryton Tryton - superkomputer w Centrum Informatycznym Trójmiejskiej Akademickiej Sieci Komputerowej (CI TASK) o architekturze klastrowej o następujących parametrach: Procesory: Intel Xeon Processor E5 2,3 GHz, 12-core (Haswell), 30MB cache Akceleratory: Pamięć: Sieć: Nvidia Tesla, Intel Xeon Phi, AMD FirePro 128/256 GB RAM DDR4 na serwer InfiniBand FDR 56 Gb/s, topologia fat tree, przełączniki Mellanox Razem: 1607 serwerów, 3214 procesorów, rdzeni, 48 akceleratorów, 218 TB RAM Szafy: System operacyjny: Moc obliczeniowa: 40 szt. linux 1,48 PFLOPS INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
11 WRF Konfiguracja Kompilator Intel fortran i c OpenMPI interfejs programowania aplikacji (API) umożliwiający tworzenie programów komputerowych dla systemów wieloprocesorowych z pamięcią dzieloną. HDF format plików i biblioteka do przechowywania danych naukowych z obsługą plików powyżej 2GB; wspiera równoległe We/Wy. Parallel-netcdf format zapisu danych; wspiera równoległe We/Wy. Netcdf Netcdf WRF oraz WRF 3.9 Wszystkie biblioteki muszą być kompilowane tym samym kompilatorem INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
12 WRF konfiguracja M.F. Standardowa instalacja modelu WRF dla procesorów Intel Xeon Zaawansowana instalacja modelu WRF z optymalizacją dla procesorów Haswell Optymalizacja kodu dostosowana do funkcji procesora. Np. flaga xcore_avx2 generuje instrukcje rozszerzenia wykorzystujące architekturę Haswell. Agresywna optymalizacja kodu wynikowego. Instalacja modelu WRF z obsługą seryjnego i równoległego zapisu i odczytu danych. Kompilacja ze zmienną środowiskową PNETCDF wskazującą położenie biblioteki równoległej netcdf. Instalacja hybrydowa smpar/dmpar. Wersja z równoległą biblioteką netcdf oraz z optymalizacją dla procesorów Haswell. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
13 Benchmark 3dhrlev - wyniki Wykorzystanie pamięci operacyjnej: ponad 200GB. Symulacje wykonane modelem WRF oraz Zwiększenie ilości rdzeni z 512 do 1920 nie przyspiesza symulacji problem skalowalności procesów. Brak danych dla nowszych wersji modelu WRF np. 3.8 lub 3.9. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
14 Benchmark CONUS 2.5km - wyniki Optymalizacja kompilacji z opcjami dla procesorów Intel Xeon-Haswell przyspiesza czas wykonania obliczeń o około 15-20% jeśli proces jest dobrze skalowalny. Występuje problem z długim czasem zapisu danych w wersji sekwencyjnej. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
15 Benchmark 3dhrlev Ethernet 1GB Klaster FENIX Centrum Geomatyki Stosowanej WAT Procesory: Intel Xeon Processor 2,93 GHz, 12-core, 12Mb cache Węzły: Pamięć: Sieć: 32 każdy po 12 rdzeni 12 GB RAM DDR3 na procesor Ethernet 1GB Razem: 16 serwerów, 32 procesorów, 384 rdzenie, 768 GB RAM Szafy: System operacyjny: 1 szt. Linux Superkomputer TRYTON mpirun np ${NPROC} --mca btl tcp,vader,self --mca btl_tcp_if_include eth0 INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
16 Benchmark 3dhrlev Ethernet 1GB - wyniki Symulacje bez optymalizacji kodu WRF standard. Sekwencyjny zapis wyników symulacji. Słaba skalowalność procesów. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
17 WRF METEOPG model operacyjno-badawczy Model z 3 siatkami zanurzonymi, możliwość aktywowania siatki 4 o rozdzielczości 100m. Modelowanie lokalnych zjawisk meteorologicznych w czasie i przestrzeni. Wysoka rozdzielczość modelu w czasie i przestrzeni. Meteorologiczne warunki początkowe i brzegowe. Globalny model GFS (Global Forecasting Systemof US National Weather Service) ERA-Interim/ERA5 (tylko analizy klimatyczne). Wysokorozdzielcze modele DTM (30m) i zagospodarowania terenu (100m). Rozdzielczość Liczba węzłów 12.5 km 146x146x62 = 1.27 mln 2.5 km 306x306x62 = 5.9 mln 500 m 245x245x62 = 3.7 mln INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
18 WRF METEOPG model operacyjno-badawczy Jeden sposób zanurzania siatek, 1:5 Schemat modelu mikrofizyki: WSM6 RRTMG schemat dla krótkofalowego i długofalowego promieniowania. Model konwekcji: Grell-Freitas (tylko siatka 1) Planetarna wartwa graniczna: siatki 1,2 i 3: model YSU Model powierzchni lądu: NOAh LSM Numeryczny model terenu - SRTM (Shuttle Radar Topography Mission) Numeryczny model pokrycia (zagospodarowania) terenu CORINE (CLC2012), program Copernicus INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
19 WRF METEOPG dane wejściowe Dane wejściowe Zgromadzenie danych wejściowych: Obserwacje meteo GFS Pola meteo Pre-processing Dane satelitarne WRF Model oceanu Modelowanie Dane geograficzne Model pokrycia terenu Wyniki
20 Całkowity czas symulacji 6h dwie siatki Dobra skalowalność procesów do około 200 rdzeni Optymalizacja kodu dla procesorów Haswell przyspiesza obliczenia o koło 12% INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
21 Całkowity czas symulacji 6h - trzy siatki Dla 3 siatek optymalizacja modelu dla procesorów Haswell przyspiesza obliczenia o około 20%. Skalowalność procesów do 350 rdzeni. Przyspieszenie jest obserwowane tylko dla procesów dobrze skalowalnych. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
22 Dekompozycja siatek WRF domyślnie wyznacza wartości nproc_x i nproc_y z pierwiastka kwadratowego przydzielonych przez ilość rdzeni/procesorów. Jeśli jest to niemożliwe używane są wartości zbliżone do siebie. Dekompozycja odnosi się do siatki nadrzędnej 2D. X Y Zadanie, proces obliczeniowy MPI/OpenMP komunikacja z sąsiednimi zadaniami INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
23 Dekompozycja siatek model METEOPG Z praktycznego punku widzenia przyjęcie takich samych wartości nproc_x i nproc_y nie jest optymalne. WRF lepiej pracuje jeśli dekompozycja ma bardziej prostokątny charakter. Prowadzi to do lepszego wykorzystania pamięci podręcznej i bardziej efektywnej komunikacji. W analizowanym przypadku domyślna wartość nproc_y=8 (nproc_x=8), zmieniając tą wartość na 16 (nproc_x=4), czas obliczeń zmniejsza się o około 8%. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
24 WRF I/O Compute processes I/O processes Compute process Node 0 Compute processes parallel file system Rysunek na podstawie artykułu Opportunities for WRF Model Acceleration, John Michalakes, Andrew Porter INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
25 WRF I/O I/O processes Compute processes Kiedy podzielimy pliki netcdf, każdy proces MPI zapisuje własny plik. Poprawa zależy od wielkości danych na proces. Dla modelu METEOPG wydajność zapisu danych wzrosła 10 razy dla 528 rdzeni. Wada: musimy połączyć wszystkie pliki. WRF oficjalnie nie wspiera tego rozwiązania. Rozwiązanie: Połączenie pnetcdf z warstwą Tryton MPI oznacza, że szeregi MPI są łączone w grupy, a następnie jeden z każdej grupy agregator wykonuje zapis do pliku. nproc = nproc_x*nproc_y+(nio_groups*nio_task_per_group), wartość nio_task_per_group nie może przekroczyć wartości nproc_y. Optymalne rozwiązanie nproc_y powinno być wielokrotnością nio_task_per_group. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
26 Koligacja procesorów Wykorzystanie wszystkich rdzeni procesora spowalnia proc obliczeniowy 11%!!! Optymalne rozwiązanie, zmniejszenie z 24 do rdzeni/procesor. Rozwiązanie. Zmiana przyporządkowanego rdzeni procesorów do konkretnego procesu lub wątku, działa poprawnie jeśli jest wystarczająca ilość pamięci podręcznej. mpirun bycore bind-to-core report-bindings./wrf.exe Procedura powyższa nie zezwala na migrację procesów. Jest to ważne ponieważ jeśli proces migruje, nie może odnaleźć wcześniej zapisanych danych w nowej pamięci podręcznej. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
27 METEOPG podsumowanie Proces Serial Parallel Pobieranie danych godzinnych GFS 0.25deg. Czas [s] Czas [s] GEOGRID METGRID Prognoza WRF I/O SUMA WRF forecast (parallel) Model operacyjny METEOPG 528 rdzeni, czas prognozy 60 godz. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
28 Podsumowanie i wnioski Benchmark superkomputerów z wykorzystaniem numerycznych modeli pogody jest wydajnym narzędziem, które może być stosowane na różnych platformach sprzętowych. Operacje wejścia/wyjścia ograniczają skalowalność procesów obliczeniowych dla dużej ilości rdzeni. Wprowadzając równoległy zapis i odczyt danych można redukować ten efektu. Stare dane do benchmarków z modelu WRF. Brak prostej możliwości wiarygodnej oceny wydajności superkomputerów dla nowych wersji WRF. W TASK zostanie przygotowany zestaw danych do benchmarku HPC z najnowszymi danymi wejściowymi i modelem WRF 3.9/ Nowy zestaw danych do benchmarku powinien być aktualizowany dla każdej wersji modelu. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
29 Dziękuję za uwagę! Koniec części I kontakt: Mariusz Figurski, mariusz.figurski@pg.edu.pl Obliczenia wykonano na komputerach Centrum Informatycznego Trójmiejskiej Akademickiej Sieci Komputerowej. INFOBAZY 2017, VIII Konferencja Bazy Danych dla Nauki, GDAŃSK września
Składowanie, archiwizacja i obliczenia modelowe dla monitorowania środowiska Morza Bałtyckiego
Składowanie, archiwizacja i obliczenia modelowe dla monitorowania środowiska Morza Bałtyckiego Rafał Tylman 1, Bogusław Śmiech 1, Marcin Wichorowski 2, Jacek Wyrwiński 2 1 CI TASK Politechnika Gdańska,
Bardziej szczegółowoi3: internet - infrastruktury - innowacje
i3: internet - infrastruktury - innowacje Wykorzystanie procesorów graficznych do akceleracji obliczeń w modelu geofizycznym EULAG Roman Wyrzykowski Krzysztof Rojek Łukasz Szustak [roman, krojek, lszustak]@icis.pcz.pl
Bardziej szczegółowoUSŁUGI HIGH PERFORMANCE COMPUTING (HPC) DLA FIRM. Juliusz Pukacki,PCSS
USŁUGI HIGH PERFORMANCE COMPUTING (HPC) DLA FIRM Juliusz Pukacki,PCSS Co to jest HPC (High Preformance Computing)? Agregowanie dużych zasobów obliczeniowych w sposób umożliwiający wykonywanie obliczeń
Bardziej szczegółowoCyfronet w CTA. Andrzej Oziębło DKDM
Cyfronet w CTA Andrzej Oziębło DKDM ACK CYFRONET AGH Akademickie Centrum Komputerowe CYFRONET Akademii Górniczo-Hutniczej im. Stanisława Staszica w Krakowie ul. Nawojki 11 30-950 Kraków 61 tel. centrali:
Bardziej szczegółowoMESco. Testy skalowalności obliczeń mechanicznych w oparciu o licencje HPC oraz kartę GPU nvidia Tesla c2075. Stanisław Wowra
MESco Testy skalowalności obliczeń mechanicznych w oparciu o licencje HPC oraz kartę GPU nvidia Tesla c2075 Stanisław Wowra swowra@mesco.com.pl Lider w dziedzinie symulacji na rynku od 1994 roku. MESco
Bardziej szczegółowoAlgorytmy i Struktury Danych
POLITECHNIKA KRAKOWSKA - WIEiK KATEDRA AUTOMATYKI i TECHNIK INFORMACYJNYCH Algorytmy i Struktury Danych www.pk.edu.pl/~zk/aisd_hp.html Wykładowca: dr inż. Zbigniew Kokosiński zk@pk.edu.pl Wykład 12: Wstęp
Bardziej szczegółowoKlaster obliczeniowy
Warsztaty promocyjne Usług kampusowych PLATON U3 Klaster obliczeniowy czerwiec 2012 Przemysław Trzeciak Centrum Komputerowe Politechniki Łódzkiej Agenda (czas: 20min) 1) Infrastruktura sprzętowa wykorzystana
Bardziej szczegółowoPROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK
1 PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK POLITECHNIKA CZĘSTOCHOWSKA 2 Część teoretyczna Informacje i wstępne wymagania Cel przedmiotu i zakres materiału Zasady wydajnego
Bardziej szczegółowoProcesory wielordzeniowe (multiprocessor on a chip) Krzysztof Banaś, Obliczenia wysokiej wydajności.
Procesory wielordzeniowe (multiprocessor on a chip) 1 Procesory wielordzeniowe 2 Procesory wielordzeniowe 3 Intel Nehalem 4 5 NVIDIA Tesla 6 ATI FireStream 7 NVIDIA Fermi 8 Sprzętowa wielowątkowość 9 Architektury
Bardziej szczegółowoBudowa komputera. Magistrala. Procesor Pamięć Układy I/O
Budowa komputera Magistrala Procesor Pamięć Układy I/O 1 Procesor to CPU (Central Processing Unit) centralny układ elektroniczny realizujący przetwarzanie informacji Zmiana stanu tranzystorów wewnątrz
Bardziej szczegółowoObliczenia równoległe i rozproszone. Praca zbiorowa pod redakcją Andrzeja Karbowskiego i Ewy Niewiadomskiej-Szynkiewicz
Obliczenia równoległe i rozproszone Praca zbiorowa pod redakcją Andrzeja Karbowskiego i Ewy Niewiadomskiej-Szynkiewicz 15 czerwca 2001 Spis treści Przedmowa............................................
Bardziej szczegółowoSprzęt komputerowy 2. Autor prezentacji: 1 prof. dr hab. Maria Hilczer
Sprzęt komputerowy 2 Autor prezentacji: 1 prof. dr hab. Maria Hilczer Budowa komputera Magistrala Procesor Pamięć Układy I/O 2 Procesor to CPU (Central Processing Unit) centralny układ elektroniczny realizujący
Bardziej szczegółowoZasoby i usługi Wrocławskiego Centrum Sieciowo-Superkomputerowego
Zasoby i usługi Wrocławskiego Centrum Sieciowo-Superkomputerowego Mateusz Tykierko WCSS 20 stycznia 2012 Mateusz Tykierko (WCSS) 20 stycznia 2012 1 / 16 Supernova moc obliczeniowa: 67,54 TFLOPS liczba
Bardziej szczegółowoProgramowanie równoległe i rozproszone. Praca zbiorowa pod redakcją Andrzeja Karbowskiego i Ewy Niewiadomskiej-Szynkiewicz
Programowanie równoległe i rozproszone Praca zbiorowa pod redakcją Andrzeja Karbowskiego i Ewy Niewiadomskiej-Szynkiewicz 23 października 2009 Spis treści Przedmowa...................................................
Bardziej szczegółowoBudowa komputera. Magistrala. Procesor Pamięć Układy I/O
Budowa komputera Magistrala Procesor Pamięć Układy I/O 1 Procesor to CPU (Central Processing Unit) centralny układ elektroniczny realizujący przetwarzanie informacji Zmiana stanu tranzystorów wewnątrz
Bardziej szczegółowoPorównanie wydajności CUDA i OpenCL na przykładzie równoległego algorytmu wyznaczania wartości funkcji celu dla problemu gniazdowego
Porównanie wydajności CUDA i OpenCL na przykładzie równoległego algorytmu wyznaczania wartości funkcji celu dla problemu gniazdowego Mariusz Uchroński 3 grudnia 2010 Plan prezentacji 1. Wprowadzenie 2.
Bardziej szczegółowoObliczenia Wysokiej Wydajności
Obliczenia wysokiej wydajności 1 Wydajność obliczeń Wydajność jest (obok poprawności, niezawodności, bezpieczeństwa, ergonomiczności oraz łatwości stosowania i pielęgnacji) jedną z najważniejszych charakterystyk
Bardziej szczegółowoProcesory wielordzeniowe (multiprocessor on a chip) Krzysztof Banaś, Obliczenia wysokiej wydajności.
Procesory wielordzeniowe (multiprocessor on a chip) 1 Procesory wielordzeniowe 2 Procesory wielordzeniowe 3 Konsekwencje prawa Moore'a 4 Procesory wielordzeniowe 5 Intel Nehalem 6 Architektura Intel Nehalem
Bardziej szczegółowoSUPERKOMPUTER OKEANOS BADAWCZE GRANTY OBLICZENIOWEWE
SUPERKOMPUTER OKEANOS BADAWCZE GRANTY OBLICZENIOWEWE SUPERKOMPUTER OKEANOS Z początkiem lipca 2016 roku ICM UW udostępni naukowcom superkomputer Okeanos system wielkoskalowego przetwarzania Cray XC40.
Bardziej szczegółowoWprowadzenie. Co to jest klaster? Podział ze względu na przeznaczenie. Architektury klastrów. Cechy dobrego klastra.
N Wprowadzenie Co to jest klaster? Podział ze względu na przeznaczenie. Architektury klastrów. Cechy dobrego klastra. Wprowadzenie (podział ze względu na przeznaczenie) Wysokiej dostępności 1)backup głównego
Bardziej szczegółowoProgramowanie procesorów graficznych GPGPU
Programowanie procesorów graficznych GPGPU 1 GPGPU Historia: lata 80 te popularyzacja systemów i programów z graficznym interfejsem specjalistyczne układy do przetwarzania grafiki 2D lata 90 te standaryzacja
Bardziej szczegółowoPolitechnika Gdańska Centrum Informatyczne Trójmiejskiej Akademickiej Sieci Komputerowej,
Politechnika Gdańska Centrum Informatyczne Trójmiejskiej Akademickiej Sieci Komputerowej, INFORMACJA Superkomputer Galera Najszybciej liczącą maszyną w Polsce jest w chwili obecnej superkomputer o nazwie
Bardziej szczegółowoWrocławskie Centrum Sieciowo-Superkomputerowe
Wrocławskie Centrum Sieciowo-Superkomputerowe Mateusz Tykierko WCSS 26 czerwca 2012 Mateusz Tykierko (WCSS) 26 czerwca 2012 1 / 23 Wstęp Wrocławskie Centrum Sieciowo-Superkomputerowe Jednostka działająca
Bardziej szczegółowoDostęp do europejskich systemów obliczeniowych Tier-0 w ramach PRACE
Dostęp do europejskich systemów obliczeniowych Tier-0 w ramach PRACE KONFERENCJA UŻYTKOWNIKÓW KDM 2016 W kierunku obliczeń Exaskalowych Mirosław Kupczyk, PCSS 28.06.2016 Misja PRACE HPC Dla Przemysłu Zagwarantowanie
Bardziej szczegółowoSprzęt komputerowy 2. Autor prezentacji: 1 prof. dr hab. Maria Hilczer
Sprzęt komputerowy 2 Autor prezentacji: 1 prof. dr hab. Maria Hilczer Budowa komputera Magistrala Procesor Pamięć Układy I/O 2 Procesor to CPU (Central Processing Unit) centralny układ elektroniczny realizujący
Bardziej szczegółowoRównoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami
Równoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami dr inż. Mariusz Uchroński Wrocławskie Centrum Sieciowo-Superkomputerowe Agenda Cykliczny problem przepływowy
Bardziej szczegółowoKomputery Dużej Mocy w Cyfronecie. Andrzej Oziębło Patryk Lasoń, Łukasz Flis, Marek Magryś
Komputery Dużej Mocy w Cyfronecie Andrzej Oziębło Patryk Lasoń, Łukasz Flis, Marek Magryś Administratorzy KDM Baribal, Mars, Panda, Platon U3: Stefan Świąć Piotr Wyrostek Zeus: Łukasz Flis Patryk Lasoń
Bardziej szczegółowoPROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK
1 PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK POLITECHNIKA CZĘSTOCHOWSKA 2 Trendy rozwoju współczesnych procesorów Budowa procesora CPU na przykładzie Intel Kaby Lake
Bardziej szczegółowoProgramowanie współbieżne Wykład 2. Iwona Kochańska
Programowanie współbieżne Wykład 2 Iwona Kochańska Miary skalowalności algorytmu równoległego Przyspieszenie Stały rozmiar danych N T(1) - czas obliczeń dla najlepszego algorytmu sekwencyjnego T(p) - czas
Bardziej szczegółowo10/14/2013 Przetwarzanie równoległe - wstęp 1. Zakres przedmiotu
Literatura 1. Introduction to Parallel Computing; Grama, Gupta, Karypis, Kumar; Addison Wesley 2003 2. Wprowadzenie do obliczeń równoległych, Zbigniew Czech, Wydawnictwo Naukowe PWN, 2010. 3. Designing
Bardziej szczegółowoInfrastruktura PLGrid (nie tylko) dla młodych naukowców
Infrastruktura PLGrid (nie tylko) dla młodych naukowców Mariola Czuchry, Mariusz Sterzel ACK Cyfronet AGH Wydział Mechaniczny, PK, Kraków 16 XI 2015 Agenda ACK Cyfronet AGH Infrastruktura PLGrid Charakterystyka
Bardziej szczegółowoWprowadzenie. Klastry komputerowe. Superkomputery. informatyka +
Wprowadzenie Klastry komputerowe Superkomputery Wprowadzenie Klastry komputerowe Superkomputery Wprowadzenie Filozofia przetwarzania równoległego polega na podziale programu na fragmenty, z których każdy
Bardziej szczegółowoLiteratura. 11/16/2016 Przetwarzanie równoległe - wstęp 1
Literatura 1. Wprowadzenie do obliczeń równoległych, Zbigniew Czech, Wydawnictwo Naukowe PWN, 2010, 2013 2. Introduction to Parallel Computing; Grama, Gupta, Karypis, Kumar; Addison Wesley 2003 3. Designing
Bardziej szczegółowoEfektywne wykorzystanie zasobów obliczeniowych KDM w PCSS
Efektywne wykorzystanie zasobów obliczeniowych KDM w PCSS Radosław Januszewski, Marcin Pospieszny, Piotr Brona, Bartłomiej Burba, Maciej Brzeźniak Poznańskie Centrum Superkomputerowo-Sieciowe Zasoby HPC:
Bardziej szczegółowoLiteratura. 3/26/2018 Przetwarzanie równoległe - wstęp 1
Literatura 1. Wprowadzenie do obliczeń równoległych, Zbigniew Czech, Wydawnictwo Naukowe PWN, 2010, 2013 2. Introduction to Parallel Computing; Grama, Gupta, Karypis, Kumar; Addison Wesley 2003 3. Designing
Bardziej szczegółowoSymulacje kinetyczne Par2cle In Cell w astrofizyce wysokich energii Wykład 7
Symulacje kinetyczne Par2cle In Cell w astrofizyce wysokich energii Wykład 7 dr Jacek Niemiec Instytut Fizyki Jądrowej PAN, Kraków Jacek.Niemiec@ifj.edu.pl www.oa.uj.edu.pl/j.niemiec/symulacjenumeryczne
Bardziej szczegółowoArchitektura komputerów
Architektura komputerów Wykład 7 Jan Kazimirski 1 Pamięć podręczna 2 Pamięć komputera - charakterystyka Położenie Procesor rejestry, pamięć podręczna Pamięć wewnętrzna pamięć podręczna, główna Pamięć zewnętrzna
Bardziej szczegółowoOFERTA. Załącznik nr 1 do zapytania ofertowego: Wzór oferty. Dane oferenta. Pełna nazwa oferenta: Adres:. REGON:.. Tel./fax.: .
Załącznik nr 1 do zapytania ofertowego: Wzór oferty (miejscowość, data) OFERTA Dane oferenta Pełna nazwa oferenta:. Adres:. NIP: REGON:.. Tel./fax.: e-mail:. W odpowiedzi na upublicznione przez Info-Projekt
Bardziej szczegółowoWykorzystanie architektury Intel MIC w obliczeniach typu stencil
Wykorzystanie architektury Intel MIC w obliczeniach typu stencil Kamil Halbiniak Wydział Inżynierii Mechanicznej i Informatyki Kierunek informatyka, Rok IV Instytut Informatyki Teoretycznej i Stosowanej
Bardziej szczegółowo16. Taksonomia Flynn'a.
16. Taksonomia Flynn'a. Taksonomia systemów komputerowych według Flynna jest klasyfikacją architektur komputerowych, zaproponowaną w latach sześćdziesiątych XX wieku przez Michaela Flynna, opierająca się
Bardziej szczegółowoO superkomputerach. Marek Grabowski
O superkomputerach Marek Grabowski Superkomputery dziś Klastry obliczeniowe Szafy (od zawsze) Bo komputery są duże Półki i blade'y (od pewnego czasu) Większe upakowanie mocy obliczeniowej na m^2 Łatwiejsze
Bardziej szczegółowoObliczenia Wysokiej Wydajności
Obliczenia wysokiej wydajności 1 Wydajność obliczeń Wydajność jest (obok poprawności, niezawodności, bezpieczeństwa, ergonomiczności i łatwości stosowania i pielęgnacji) jedną z najważniejszych charakterystyk
Bardziej szczegółowoDr inż. hab. Siergiej Fialko, IF-PK,
Dr inż. hab. Siergiej Fialko, IF-PK, http://torus.uck.pk.edu.pl/~fialko sfialko@riad.pk.edu.pl 1 Osobliwości przedmiotu W podanym kursie główna uwaga będzie przydzielona osobliwościom symulacji komputerowych
Bardziej szczegółowoArchitektura komputerów
Architektura komputerów Wykład 13 Jan Kazimirski 1 KOMPUTERY RÓWNOLEGŁE 2 Klasyfikacja systemów komputerowych SISD Single Instruction, Single Data stream SIMD Single Instruction, Multiple Data stream MISD
Bardziej szczegółowoProjektowanie nowoczesnych mieszadeł elektromagnetycznych dla pieców łukowych z wykorzystaniem HPC. Mirosław Kupczyk (PCSS) Poznań
Projektowanie nowoczesnych mieszadeł elektromagnetycznych dla pieców łukowych z wykorzystaniem HPC Mirosław Kupczyk (PCSS) Poznań 13.09.2016 Projektowanie nowoczesnych mieszadeł elektromagnetycznych dla
Bardziej szczegółowoProgram Obliczeń Wielkich Wyzwań Nauki i Techniki (POWIEW)
Program Obliczeń Wielkich Wyzwań Nauki i Techniki (POWIEW) Maciej Cytowski, Maciej Filocha, Maciej E. Marchwiany, Maciej Szpindler Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego
Bardziej szczegółowoKLASTER SINGLE SYSTEM IMAGE W OBLICZENIACH NAUKOWO-INŻYNIERSKICH SINGLE SYSTEM IMAGE CLUSTER IN SCIENTIFIC ENGINEERING COMPUTATIONS
MARIUSZ KRAWCZYK KLASTER SINGLE SYSTEM IMAGE W OBLICZENIACH NAUKOWO-INŻYNIERSKICH SINGLE SYSTEM IMAGE CLUSTER IN SCIENTIFIC ENGINEERING COMPUTATIONS S t r e s z c z e n i e A b s t r a c t W artykule przedstawiono
Bardziej szczegółowoSkalowalna Platforma dla eksperymentów dużej skali typu Data Farming z wykorzystaniem środowisk organizacyjnie rozproszonych
1 Skalowalna Platforma dla eksperymentów dużej skali typu Data Farming z wykorzystaniem środowisk organizacyjnie rozproszonych D. Król, Ł. Dutka, J. Kitowski ACC Cyfronet AGH Plan prezentacji 2 O nas Wprowadzenie
Bardziej szczegółowoSerwer biznesowy o podwójnym zastosowaniu moc obliczeniowa i pamięć masowa w jednej obudowie
QNAP TDS-16489U-SB3 66 636,11 PLN brutto 54 175,70 PLN netto Producent: QNAP Firma QNAP rozwija innowacyjność w segmencie serwerów biznesowych i wprowadza do oferty TDS-16489U wydajny podwójny serwer łączący
Bardziej szczegółowoInfrastruktura PLGrid dla młodych polskich naukowców
Infrastruktura PLGrid dla młodych polskich naukowców Mariola Czuchry ACK Cyfronet AGH WFiIS, AGH, Kraków 5 X 2015 Agenda ACK Cyfronet AGH Infrastruktura PLGrid Charakterystyka Struktura Oferta Dostęp do
Bardziej szczegółowoHigh Performance Computers in Cyfronet. Andrzej Oziębło Zakopane, marzec 2009
High Performance Computers in Cyfronet Andrzej Oziębło Zakopane, marzec 2009 Plan Podział komputerów dużej mocy Podstawowe informacje użytkowe Opis poszczególnych komputerów Systemy składowania danych
Bardziej szczegółowoWprowadzenie do obsługi systemów obliczeniowych PCSS
Wprowadzenie do obsługi systemów obliczeniowych PCSS Marcin Pospieszny Poznańskie Centrum Superkomputerowo-Sieciowe 17 listopada 2011 Plan prezentacji 1 Architektura maszyn 2 Linux: podstawy 3 PBS 4 Aplikacje
Bardziej szczegółowoREFERAT PRACY DYPLOMOWEJ
REFERAT PRACY DYPLOMOWEJ Temat pracy: Implementacja i porównanie wydajności wybranych algorytmów grafowych w warunkach obliczeń równoległych Autor pracy: Michał Podstawski Promotor: Prof. WSTI, dr hab.
Bardziej szczegółowoNowe aplikacje i usługi w środowisku Grid
Nowe aplikacje i usługi w środowisku Grid Wstęp Pojęcie GRID Aplikacje/Usługi Laboratorium Wirtualne Krajowy Magazyn Danych Zastosowanie Skala i zasięg Użytkownik końcowy Uwarunkowania ekonomiczne Laboratorium
Bardziej szczegółowoZintegrowanego Systemu
Zintegrowany System Informacji o Zlewni - CRIS Dane meteorologiczne dla Zintegrowanego Systemu Informacji o Zlewni CRIS dr Czesław Kliś Instytut Ekologii Terenów Uprzemysłowionych w Katowicach Projekt
Bardziej szczegółowo2014 LENOVO INTERNAL. ALL RIGHTS RESERVED
2014 LENOVO INTERNAL. ALL RIGHTS RESERVED 3 SUSE OpenStack - Architektura SUSE OpenStack - Funkcje Oprogramowanie Open Source na bazie OpenStack Scentralizowane monitorowanie zasobów Portal samoobsługowy
Bardziej szczegółowoBadania testów porównawczych: Optymalizacja testów zrzutowych za pomocą technologii Dell, Intel i Altair
Badania testów porównawczych: Optymalizacja testów zrzutowych za pomocą technologii Dell, Intel i Altair Fredrik Nordgren, mgr inż. (magister inżynierii mechanicznej), inżynier aplikacji, Altair Eric Lequiniou,
Bardziej szczegółowoTworzenie programów równoległych cd. Krzysztof Banaś Obliczenia równoległe 1
Tworzenie programów równoległych cd. Krzysztof Banaś Obliczenia równoległe 1 Metodologia programowania równoległego Przykłady podziałów zadania na podzadania: Podział ze względu na funkcje (functional
Bardziej szczegółowoSystem komputerowy. System komputerowy
System komputerowy System komputerowy System komputerowy układ współdziałających ze sobą (według pewnych zasad) dwóch składowych: sprzętu komputerowego (hardware) oraz oprogramowania (software) po to,
Bardziej szczegółowoWelcome to the waitless world. Inteligentna infrastruktura systemów Power S812LC i S822LC
Inteligentna infrastruktura systemów Power S812LC i S822LC Przedstawiamy nową linię serwerów dla Linux Clouds & Clasters IBM Power Systems LC Kluczowa wartość dla klienta Specyfikacje S822LC Technical
Bardziej szczegółowoProgramowanie Rozproszone i Równoległe
Programowanie Rozproszone i Równoległe OpenMP (www.openmp.org) API do pisania wielowątkowych aplikacji Zestaw dyrektyw kompilatora oraz procedur bibliotecznych dla programistów Ułatwia pisanie programów
Bardziej szczegółowoAMD Ryzen recenzja procesora. Wpisany przez Mateusz Ponikowski Piątek, 11 Październik :47
Sprawdzamy niedrogi procesor od AMD. Składając niedrogi komputer do pracy z multimediami i okazjonalnego grania musimy zacząć od wyboru platformy i tutaj pojawia się odwieczne pytanie, Intel czy AMD? Budując
Bardziej szczegółowoNowoczesne technologie przetwarzania informacji
Projekt Nowe metody nauczania w matematyce Nr POKL.09.04.00-14-133/11 Nowoczesne technologie przetwarzania informacji Mgr Maciej Cytowski (ICM UW) Lekcja 2: Podstawowe mechanizmy programowania równoległego
Bardziej szczegółowoIMPLEMENTACJA I PORÓWNANIE WYDAJNOŚCI WYBRANYCH ALGORYTMÓW GRAFOWYCH W WARUNKACH OBLICZEŃ RÓWNOLEGŁYCH
IMPLEMENTACJA I PORÓWNANIE WYDAJNOŚCI WYBRANYCH ALGORYTMÓW GRAFOWYCH W WARUNKACH OBLICZEŃ RÓWNOLEGŁYCH Michał Podstawski Praca dyplomowa napisana pod kierunkiem Prof. WSTI dr hab. inż. Jarosława Śmiei
Bardziej szczegółowoTworzenie programów równoległych. Krzysztof Banaś Obliczenia równoległe 1
Tworzenie programów równoległych Krzysztof Banaś Obliczenia równoległe 1 Tworzenie programów równoległych W procesie tworzenia programów równoległych istnieją dwa kroki o zasadniczym znaczeniu: wykrycie
Bardziej szczegółowoDostęp do europejskich systemów obliczeniowych Tier-0/Tier-1 w ramach PRACE
Dostęp do europejskich systemów obliczeniowych Tier-0/Tier-1 w ramach PRACE KONFERENCJA UŻYTKOWNIKÓW KDM 2017 Nowe trendy w użytkowaniu KDM Mirosław Kupczyk, PCSS 24.5.2017 Tier-0: komputery klasy Petaflops
Bardziej szczegółowoKATALOG SERWERÓW ACTINA SOLAR
KATALOG SERWERÓW ACTINA SOLAR Serwery: wolnostojące stelażowe wielowęzłowe kasetowe Właścicielem marki Actina oraz producentem komputerów i serwerów Actina jest firma ACTION S.A. wiodący dostawca branży
Bardziej szczegółowoInfrastruktura PLGrid
Infrastruktura PLGrid Andrzej Zemła ACK Cyfronet AGH Konferencja Użytkowników Komputerów Dużej Mocy Zakopane 2019 Zakopane, 2019.03.07 Infrastruktura PLGrid Polska Infrastruktura Informatycznego Wspomagania
Bardziej szczegółowoOpracowanie obserwacji satelitarnych GPS/GLONAS w klastrowych systemach superkomputerowych
Opracowanie obserwacji satelitarnych GPS/GLONAS w klastrowych systemach superkomputerowych Mariusz Figurski Marcin Gałuszkiewicz Krzysztof Kroszczyński Wojskowa Akademia Techniczna, Warszawa SEMINARIUM
Bardziej szczegółowoCUDA Median Filter filtr medianowy wykorzystujący bibliotekę CUDA sprawozdanie z projektu
CUDA Median Filter filtr medianowy wykorzystujący bibliotekę CUDA sprawozdanie z projektu inż. Daniel Solarz Wydział Fizyki i Informatyki Stosowanej AGH 1. Cel projektu. Celem projektu było napisanie wtyczki
Bardziej szczegółowoXPRI Team. Szybka i elastyczna współpraca podczas montażu nieliniowego dla grup roboczych. Omówienie. XPRI Team 1
XPRI Team Szybka i elastyczna współpraca podczas montażu nieliniowego dla grup roboczych Omówienie Łatwa i ekonomiczna współpraca praca w zespołowych owych systemach NLE, stanowiących doskonałe e uzupełnienie
Bardziej szczegółowoOPIS PRZEDMIOTU ZAMÓWIENIA SPECYFIKACJA SPRZĘTU KOMPUTEROWEGO
Załącznik nr 3 do Ogłoszenia o zamówieniu Znak postępowania ZZ.2130.312.2019.LZI OPIS PRZEDMIOTU ZAMÓWIENIA SPECYFIKACJA SPRZĘTU KOMPUTEROWEGO 1. Przedmiotem zamówienia jest dostawa platformy badawczej
Bardziej szczegółowoModuł meteorologiczny w serwisie CRIS
Zintegrowana strategia zrównoważonego zarządzania wodami w zlewni Moduł meteorologiczny w serwisie CRIS Czesław Kliś Instytut Ekologii Terenów Uprzemysłowionych Projekt finansowany ze środków funduszy
Bardziej szczegółowoArchitektura Systemów Komputerowych. Rozwój architektury komputerów klasy PC
Architektura Systemów Komputerowych Rozwój architektury komputerów klasy PC 1 1978: Intel 8086 29tys. tranzystorów, 16-bitowy, współpracował z koprocesorem 8087, posiadał 16-bitową szynę danych (lub ośmiobitową
Bardziej szczegółowoLaboratorium Chmur obliczeniowych. Paweł Świątek, Łukasz Falas, Patryk Schauer, Radosław Adamkiewicz
Laboratorium Chmur obliczeniowych Paweł Świątek, Łukasz Falas, Patryk Schauer, Radosław Adamkiewicz Agenda SANTOS Lab laboratorium badawcze Zagadnienia badawcze Infrastruktura SANTOS Lab Zasoby laboratorium
Bardziej szczegółowoĆwiczenie nr: 9 Obliczenia rozproszone MPI
Ćwiczenie nr: 9 Temat: Obliczenia rozproszone MPI 1. Informacje ogólne MPI (Message Passing Interface) nazwa standardu biblioteki przesyłania komunikatów dla potrzeb programowania równoległego w sieciach
Bardziej szczegółowoWydajność systemów a organizacja pamięci. Krzysztof Banaś, Obliczenia wysokiej wydajności. 1
Wydajność systemów a organizacja pamięci Krzysztof Banaś, Obliczenia wysokiej wydajności. 1 Motywacja - memory wall Krzysztof Banaś, Obliczenia wysokiej wydajności. 2 Organizacja pamięci Organizacja pamięci:
Bardziej szczegółowoTworzenie programów równoległych. Krzysztof Banaś Obliczenia równoległe 1
Tworzenie programów równoległych Krzysztof Banaś Obliczenia równoległe 1 Tworzenie programów równoległych W procesie tworzenia programów równoległych istnieją dwa kroki o zasadniczym znaczeniu: wykrycie
Bardziej szczegółowoAudyt oprogramowania. Artur Sierszeń asiersz@kis.p.lodz.pl http://bzyczek.kis.p.lodz.pl
Audyt oprogramowania Artur Sierszeń asiersz@kis.p.lodz.pl http://bzyczek.kis.p.lodz.pl Cel audytu Audyt oprogramowania polega na analizie stanu oprogramowania zainstalowanego w firmie uporządkowaniu i
Bardziej szczegółowoKonsolidacja wysokowydajnych systemów IT. Macierze IBM DS8870 Serwery IBM Power Przykładowe wdrożenia
Konsolidacja wysokowydajnych systemów IT Macierze IBM DS8870 Serwery IBM Power Przykładowe wdrożenia Mirosław Pura Sławomir Rysak Senior IT Specialist Client Technical Architect Agenda Współczesne wyzwania:
Bardziej szczegółowoPRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: PROGRAMOWANIE WSPÓŁBIEŻNE I ROZPROSZONE I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK PO PRZEDMIOCIE C1. Uzyskanie przez studentów wiedzy na temat architektur systemów równoległych i rozproszonych,
Bardziej szczegółowoRozproszona korelacja w radioastronomii
Rozproszona korelacja w radioastronomii Dominik Stokłosa Poznańskie Centrum Superkomputerowo Sieciowe Konferencja I3: internet infrastruktury innowacje, Poznań 4-6 listopada 2009 Obserwacje radiowe i optyczne
Bardziej szczegółowoĆwiczenie nr: 9 Obliczenia rozproszone MPI
Ćwiczenie nr: 9 Temat: Obliczenia rozproszone MPI 1. Informacje ogólne MPI (Message Passing Interface) nazwa standardu biblioteki przesyłania komunikatów dla potrzeb programowania równoległego w sieciach
Bardziej szczegółowoPrzygotowanie kilku wersji kodu zgodnie z wymogami wersji zadania,
Przetwarzanie równoległe PROJEKT OMP i CUDA Temat projektu dotyczy analizy efektywności przetwarzania równoległego realizowanego przy użyciu komputera równoległego z procesorem wielordzeniowym z pamięcią
Bardziej szczegółowoZamieszczanie ogłoszenia: obowiązkowe. Ogłoszenie dotyczy: zamówienia publicznego.
Gdańsk: Dostawa oprogramowania dla Wydziału Elektroniki, Telekomunikacji i Informatyki Politechniki Gdańskiej Numer ogłoszenia: 58219-2013; data zamieszczenia: 17.04.2013 OGŁOSZENIE O ZAMÓWIENIU - dostawy
Bardziej szczegółowoParametry wydajnościowe systemów internetowych. Tomasz Rak, KIA
Parametry wydajnościowe systemów internetowych Tomasz Rak, KIA 1 Agenda ISIROSO System internetowy (rodzaje badań, konstrukcja) Parametry wydajnościowe Testy środowiska eksperymentalnego Podsumowanie i
Bardziej szczegółowoSpis treści. I. Skuteczne. Od autora... Obliczenia inżynierskie i naukowe... Ostrzeżenia...XVII
Spis treści Od autora..................................................... Obliczenia inżynierskie i naukowe.................................. X XII Ostrzeżenia...................................................XVII
Bardziej szczegółowoMoc płynąca z kart graficznych
Moc płynąca z kart graficznych Cuda za darmo! Czyli programowanie generalnego przeznaczenia na kartach graficznych (GPGPU) 22 października 2013 Paweł Napieracz /20 Poruszane aspekty Przetwarzanie równoległe
Bardziej szczegółowoPodstawy pracy w ICM
Podstawy pracy w ICM Zespół KDM Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego Uniwerystet Warszawski Szkolenie KDM (Kontakt: pomoc@icm.edu.pl) Podstawy pracy w ICM Szkolenie KDM
Bardziej szczegółowoZalecenia dotyczące budowania infrastruktury sprzętowej systemu Comarch ERP XL 2016.0. Aktualizacja dokumentu: 2015-09-25
Zalecenia dotyczące budowania infrastruktury sprzętowej systemu Comarch ERP XL 2016.0 Aktualizacja dokumentu: 2015-09-25 Copyright 2015 COMARCH Wszelkie prawa zastrzeżone Nieautoryzowane rozpowszechnianie
Bardziej szczegółowoRównoległe aplikacje duŝej skali w środowisku PL-Grid. Kick-off PL-GRID Kraków, 16-17 kwietnia 2009
Polska Infrastruktura Informatycznego Wspomagania Nauki w Europejskiej Przestrzeni Badawczej Równoległe aplikacje duŝej skali w środowisku PL-Grid Tomasz Piontek, Krzysztof Kurowski, Piotr Kopta, Mariusz
Bardziej szczegółowoKomputery równoległe. Zbigniew Koza. Wrocław, 2012
Komputery równoległe Zbigniew Koza Wrocław, 2012 Po co komputery równoległe? Przyspieszanie obliczeń np. diagnostyka medyczna; aplikacje czasu rzeczywistego Przetwarzanie większej liczby danych Przykład:
Bardziej szczegółowoArchitektury komputerów Architektury i wydajność. Tomasz Dziubich
Architektury komputerów Architektury i wydajność Tomasz Dziubich Przetwarzanie potokowe Przetwarzanie sekwencyjne Przetwarzanie potokowe Architektura superpotokowa W przetwarzaniu potokowym podczas niektórych
Bardziej szczegółowoDwa lub więcej komputerów połączonych ze sobą z określonymi zasadami komunikacji (protokołem komunikacyjnym).
Sieci komputerowe Dwa lub więcej komputerów połączonych ze sobą z określonymi zasadami komunikacji (protokołem komunikacyjnym). Zadania sieci - wspólne korzystanie z plików i programów - współdzielenie
Bardziej szczegółowoProgramowanie procesorów graficznych NVIDIA (rdzenie CUDA) Wykład nr 1
Programowanie procesorów graficznych NVIDIA (rdzenie CUDA) Wykład nr 1 Wprowadzenie Procesory graficzne GPU (Graphics Processing Units) stosowane są w kartach graficznych do przetwarzania grafiki komputerowej
Bardziej szczegółowoTom II: SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA (SOPZ): Przedmiotem zamówienia jest dostawa sprzętu infrastruktury serwerowej i sieciowej.
Tom II: SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA (SOPZ): 1. Wstęp 1.1 Wymagania projektu Przedmiotem zamówienia jest dostawa sprzętu infrastruktury serwerowej i sieciowej. Lp Nazwa urządzenia Liczba sztuk
Bardziej szczegółowoSystemy rozproszone. na użytkownikach systemu rozproszonego wrażenie pojedynczego i zintegrowanego systemu.
Systemy rozproszone Wg Wikipedii: System rozproszony to zbiór niezależnych urządzeń (komputerów) połączonych w jedną, spójną logicznie całość. Połączenie najczęściej realizowane jest przez sieć komputerową..
Bardziej szczegółowoMetody optymalizacji soft-procesorów NIOS
POLITECHNIKA WARSZAWSKA Wydział Elektroniki i Technik Informacyjnych Instytut Telekomunikacji Zakład Podstaw Telekomunikacji Kamil Krawczyk Metody optymalizacji soft-procesorów NIOS Warszawa, 27.01.2011
Bardziej szczegółowoSystemy operacyjne i sieci komputerowe Szymon Wilk Superkomputery 1
i sieci komputerowe Szymon Wilk Superkomputery 1 1. Superkomputery to komputery o bardzo dużej mocy obliczeniowej. Przeznaczone są do symulacji zjawisk fizycznych prowadzonych głównie w instytucjach badawczych:
Bardziej szczegółowoAutor: inż. Wojciech Zatorski Opiekun pracy: dr inż. Krzysztof Małecki
Autor: inż. Wojciech Zatorski Opiekun pracy: dr inż. Krzysztof Małecki Cel Konfiguracja i testowanie serwera WWW Apache w celu optymalizacji wydajności. 2/25 Zakres Konfigurowanie serwera Apache jako wydajnego
Bardziej szczegółowo