Komputerowe Obliczenia Równoległe: Wstęp do OpenMP i MPI

Wielkość: px
Rozpocząć pokaz od strony:

Download "Komputerowe Obliczenia Równoległe: Wstęp do OpenMP i MPI"

Transkrypt

1 Komputerowe Obliczenia Równoległe: Wstęp do OpenMP i MPI Patryk Mach Uniwersytet Jagielloński, Instytut Fizyki im. Mariana Smoluchowskiego

2 OpenMP (Open Multi Processing) zbiór dyrektyw kompilatora, funkcji bibliotecznych, zmiennych środowiskowych pozwalających na zrównoleglenie programów wykonywanych na komputerach współdzielących pamięć. OpenMP standaryzuje lata doświadczeń w programowaniu z wykorzystaniem współdzielonej pamięci. Implementacje dla Fortranu oraz C/C++ dostarczane przez producentów kompilatorów. Strona internetowa projektu: można pobrać najnowszą specyfikację.

3 Dyrektywy OpenMP mają formę odpowiednich komentarzy (Fortran) lub dyrektyw #pragma (C/C++). Kompilator wspierający OpenMP interpretuje je jako odpowiednie instrukcje. Kompilator bez wsparcia OpenMP lub z wyłączonym wsparciem może je łatwo zignorować. Wsparcie OpenMP wymaga zwykle zastosowania odpowiedniej flagi podczas kompilacji, np. ifort -openmp prog.f90 -o prog icc -openmp prog.c -o prog Dla kompilatorów z grupy gcc stosowna flaga ma postać -fopenmp.

4 Równoległość w OpenMP uzyskuje się w ramach modelu fork join.

5 Przykład na dobry początek: Podstawowa konstrukcja parallel rozpoczyna obszar równoległy. Do momentu jej napotkania program wykonywany jest seryjnie, po czym tworzony jest zespół wątków wykonujących dalsze zadania. Po wyjściu z obszaru równoległego program wykonywany jest przez jeden wątek. program hello1 write(*,*) 'Jestem w obszarze seryjnym.'!$omp parallel write(*,*) 'Jestem w obszarze rownoleglym.'!$omp end parallel write(*,*) 'Jestem w obszarze seryjnym.' end program hello1

6 Wersja C++ powyższego programu: #include <iostream> using namespace std; main(){ cout << "Jestem w obszarze seryjnym.\n"; #pragma omp parallel { cout << "Jestem w obszarze rownoleglym.\n"; } } cout << "Jestem w obszarze seryjnym.\n";

7 Dyrektywy w Fortranie: W formie fixed source wszystkie linijki dyrektyw muszą rozpoczynać się od!$omp, c$omp lub *$omp. Powyższe komentarze muszą rozpoczynać się w 1. kolumnie. W kolumnie 6. pierwszej dyrektywy musi znajdować się spacja lub zero. Kolumna 6. kontynuacji dyrektywy nie może zawierać zera ani spacji. Stosują się przy tym zwykłe zasady dotyczące długości linii, kontynuacji, pozycji w kolumnach itp. Przykład równoważnych dyrektyw: c !$omp parallel do shared(a,b,c) c$omp parallel do c$omp+shared(a,b,c) c$omp paralleldoshared(a,b,c)

8 W formie free source dyrektywy rozpoczynają się od!$omp. Dyrektywa musi być poprzedzona białymi znakami. Stosują się zwykłe zasady dotyczące kontynuacji linii. Przykład:! !$omp parallel do &!$omp shared(a,b,c)!$omp parallel &!$omp&do shared(a,b,c)

9 Kompilacja warunkowa chcemy, aby pewne fragmenty kodu były wykonywane jedynie gdy wspierany jest OpenMP. Fortran: Odpowiednie fragmenty kodu umieszczamy w linijkach rozpoczynających się znacznikiem typu komentarza. W notacji fixed source możliwe są znaczniki!$, *$ oraz c$. Znaczniki te wymieniane są na 2 spacje. Po takiej wymianie muszą być spełnione normalne reguły notacji. W notacji free source możliwy jest tylko jeden znacznik!$. C/C++: W implementacjach wspierających OpenMP i preprocesor, zdefiniowane jest makro _OPENMP. Wartość _OPENMP ustalona jest na yyyymm, gdzie yyyy oznacza rok, a mm miesiąc indentyfikujące wspieraną wersję OpenMP.

10 Przykład: program hello2!$ use omp_lib implicit none!$ integer :: num_threads write(*,*) 'Jestem w obszarze seryjnym'!$omp parallel write (*,*) 'Jestem w obszarze rownoleglym'!$omp single!$ num_threads = omp_get_num_threads()!$ write(*,*) 'liczba watkow: ', num_threads!$omp end single!$omp end parallel write (*,*) 'Jestem w obszarze seryjnym' end program hello2

11 Podstawowa kwestia do dobrego zrozumienia: model pamięci używany przez OpenMP. Każdy z wątków ma dostęp do wspólnej części pamięci. Każdy z wątków może używać tymaczasowego widoku (temporary view) pamięci pamięci pełniącej rolę typu cache odwoływanie się do zmiennych ze wspólnej pamięci nie musi faktycznie oznaczać zmianu stanu zmiennych wspólnej pamięci. Zmiana ta może odbyć się w ramach tymczasowego widoku. Każdy z wątków dysponuje obszarem pamięci zarezerwowanym dla zmiennych prywatnych dostępnych jedynie dla danego wątku.

12 Zmienne w ramach OpenMP mogą być deklarowane jako współdzielone (shared) bądź prywatne (private). Zmienne wspołdzielone przechowywane są we wspólnej części pamięci, a ich kopie mogą znajdować się również w tymczasowym widoku pamięci. Operacja synchronizująca tymczasowy widok pamięci danego wątku oraz wspólną pamięć to operacja flush. Operacja flush jest wywoływana automatycznie przez część konstrukcji OpenMP, ale może być też wymuszona dedykowaną dyrektywą flush, gdy zachodzi taka potrzeba.

13 W chwili, w której rozpoczyna się wykonywanie obszaru równoległego, w prywatnej pamięci każdego z wątków tworzona jest osobna kopia każdej zmiennej zadeklarowanej jako zmienna prywatna w danym obszarze równoległym. Zmiany takiej zmiennej dokonywane przez poszczególne wątki dotyczą jedynie pamięci prywatnej i nie wpływają na wartość danej zmiennej widzianej przez pozostałe wątki. Kopie zmiennych prywatnych mogą być inicjalizowane wartością z obszaru seryjnego, jeśli jest to wyraźnie zaznaczone (klauzula firstprivate).

14 Składnia konstrukcji parallel w Fortranie:!$omp parallel [klauzula[[,] klauzula]...] blok!$omp end parallel W C/C++: #pragma omp parallel [klauzula[[, ]klauzula]...] blok Dopuszczalne klauzule: if, num_threads, default, private, firstprivate, shared, copyin, reduction. Będzie o nich mowa w dalszej części wykładu.

15 Klauzula if ma postać if(wyrażenie warunkowe). Jeśli wyrażenie warunkowe ma wartość.false. (Fortran) lub 0 (C/C++), obszar określony strukturą parallel wykonywany jest przez jeden wątek (seryjnie). W przeciwnym wypadku liczba wątków może zostać określona kaluzulą num_threads(liczba watków). Domyślna liczba wątków przechowywana jest przez zmienną środowiskową OMP_NUM_THREADS. W obrębie struktury parallel liczba wątków zwracana jest przez funkcję biblioteczną omp_get_num_threads(). Każdy z wątków w obszarze równoległym (określonym poprzez konstrukcję parallel) numerowany jest począwszy od 0, do n 1, gdzie n jest liczbą wątków. Wątek może uzyskać swój numer wywołująć funkcję omp_get_thread_num(). Reguły określania liczby wątków stają się bardziej skomplikowne w przypadku zagnieżdżonych obszarów równoległych.

16 Zmienne wymienione w klauzuli shared(lista zmiennych rozdzielana przecinkami) są traktowane jako współdzielone w obszarze zadanym konstrukcją parallel. Domyślnie, większość zmiennych jest współdzielona. Wyjątek stanowią np. indeksy występujące w pętlach do (Fortran) oraz for (C/C++), z którymi związane są odpowiednie dyrektywy OpenMP. Indeksy te traktowane są jako zmienne prywatne. Podobnie prywatne są zmienne wymienione w klauzuli private(lista zmiennych rozdzielana przecinkami).

17 Przykład: obliczany liczbę π. Wiemy, że 1 dx π = x 2. spróbujmy obliczyć tę wartość metodą trapezów.

18 program pi_integral implicit none integer, parameter :: lp = selected_int_kind(8) integer, parameter :: dp = kind(1.0d0) real(dp) :: pi, x, dx integer(lp) :: num_points, i num_points = 1000 dx = 1.0_dp/real(num_points,dp) pi = 0.0_dp do i = 1, num_points x = (i - 0.5_dp)*dx pi = pi + 4.0_dp/(1.0_dp + x**2 ) end do pi = pi*dx write(*,*) 'wartosc pi: ', pi end program pi_integral

19 Poniższy kod przedstawia wersję programu pi_integral zrównolegloną wyłącznie przy użyciu konstrukcji parallel. program pi_integral!$ use omp_lib implicit none integer, parameter :: lp = selected_int_kind(8) integer, parameter :: dp = kind(1.0d0) real(dp) :: pi, x, dx integer(lp) :: num_points, i integer(lp) :: num_i, num_f!$ integer(lp) :: thread_num, num_threads, points_per_thread, reszta!$ real(dp), dimension(:), allocatable :: pi_parts num_points = 1000 num_i = 1 num_f = num_points dx = 1.0_dp/real(num_points,dp)

20 !$omp parallel!$omp single!$ num_threads = omp_get_num_threads()!$omp end single!$omp end parallel!$ allocate(pi_parts (0:num_threads - 1))!$ points_per_thread = num_points«um_threads!$ reszta = mod(num_points, num_threads)!$omp parallel private(thread_num, num_i, num_f, x, pi, i)!$ thread_num = omp_get_thread_num()!$ if (thread_num.lt. reszta) then!$ num_i = thread_num*(points_per_thread+1) + 1!$ num_f = num_i + points_per_thread!$ else!$ num_i = reszta + thread_num*points_per_thread + 1!$ num_f = num_i + points_per_thread - 1!$ endif

21 pi = 0.0_dp do i = num_i, num_f x = (i - 0.5_dp)*dx pi = pi + 4.0_dp/(1.0_dp + x**2 ) end do!$ pi_parts(thread_num) = pi!$omp end parallel!$ pi = 0.0_dp!$ do i = 0, num_threads-1!$ pi = pi + pi_parts(i)!$ end do!$ deallocate (pi_parts) pi = pi*dx write(*,*) 'wartosc pi: ', pi end program pi_integral

22 W powyższym przykładzie mamy do czynienia z 2 konstrukcjami, które stworzyliśmy ręcznie, a które pojawiają się często w zastosowaniach i którym dedykowane są odpowiednie dyrektywy OpenMP. Pierwsza konstrukcja polega na rozdzieleniu pracy wykonywanej w pętli do (Fortran) lub for (C/C++) na poszczególne wątki tak, aby każdy wątek wykonywał pracę odpowiadającą jedynie pewne u zakresowi indeksów pętli. Jest to przykład ogólniejszej kategorii konstrukcji dzielących pracę (work-sharing constructs). Po drugie, wprowadzamy mechanizm zbierania wyników pracy każdego z wątków (macierz pi_parts), a następnie sumujemy uzyskane wyniki, tak aby uzyskać pożądaną wartość całki. Jest to przykład tak zwanej redukcji. Redukcja implementowana jest w OpenMP jako klauzula dyrektywy parallel.

C++ i Pascal kurs podstawowy

C++ i Pascal kurs podstawowy C++ i Pascal kurs podstawowy Wykład: program, algorytm, kompilator, interpreter, debugger, linker, zmienne, typy danych, komentarze, instrukcje wejścia, wyjścia, operatory, instrukcja warunkowa if, pętla

Bardziej szczegółowo

PROGRAMOWANIE W EXCELU W JĘZYKU VISUAL BASIC FOR APPLICATIONS

PROGRAMOWANIE W EXCELU W JĘZYKU VISUAL BASIC FOR APPLICATIONS ZACHODNIOPOMORSKI UNIWERSYTET TECHNOLOGICZNY INSTYTUT TECHNOLOGII MECHANICZNEJ PROGRAMOWANIE W EXCELU W JĘZYKU VISUAL BASIC FOR APPLICATIONS mgr Tadeusz Ziębakowski Szczecin 2009 T.Ziębakowski PROGRAMOWANIE

Bardziej szczegółowo

Język C++ podstawy programowania

Język C++ podstawy programowania Język C++ podstawy programowania Uniwersytet Marii Curie-Skłodowskiej Wydział Matematyki, Fizyki i Informatyki Instytut Informatyki Język C++ podstawy programowania Paweł Mikołajczak Lublin 2011 Instytut

Bardziej szczegółowo

Dodatek A. CUDA. 1 Stosowany jest w tym kontekście skrót GPCPU (od ang. general-purpose computing on graphics processing units).

Dodatek A. CUDA. 1 Stosowany jest w tym kontekście skrót GPCPU (od ang. general-purpose computing on graphics processing units). Dodatek A. CUDA Trzy ostatnie rozdziały książki poświęcone są zagadnieniom związanym z programowaniem równoległym. Skłoniła nas do tego wszechobecność maszyn wieloprocesorowych. Nawet niektóre notebooki

Bardziej szczegółowo

OBSŁUGA WYJĄTKÓW. Mechanizm języka PL/SQL. Wyjątki:

OBSŁUGA WYJĄTKÓW. Mechanizm języka PL/SQL. Wyjątki: OBSŁUGA WYJĄTKÓW W języku PL/SQL zaimplementowano obsługę błędów za pomocą: mechanizmu wyjątków programów obsługi wyjątków w tzw. sekcji obsługi wyjątków. Wyjątki mogą być związane z: błędami systemu Oracle

Bardziej szczegółowo

ZASTOSOWANIE PROCEDUR, FUNKCJI I PAKIETÓW

ZASTOSOWANIE PROCEDUR, FUNKCJI I PAKIETÓW ZASTOSOWANIE PROCEDUR, FUNKCJI I PAKIETÓW Położenie podprogramów Jak wiemy, podprogramy i pakiety jako bloki nazwane, mogą być składowane w słowniku danych. Podprogram najpierw tworzy się za pomocą polecenia

Bardziej szczegółowo

Ryszard Myhan. Wykład 4: Języki programowania PHP

Ryszard Myhan. Wykład 4: Języki programowania PHP Ryszard Myhan Wykład 4: Języki programowania PHP PHP - bibliografia PHP5. Praktyczny kurs Marcin Lis ISBN: 83-246-0307-7 PHP5. Tworzenie stron WWW. Ćwiczenia praktyczne Andrzej Kierzkowski, Andrzej Kierzkowski

Bardziej szczegółowo

GRAFFITI RAPORTY PODRĘCZNIK UŻYTKOWNIKA

GRAFFITI RAPORTY PODRĘCZNIK UŻYTKOWNIKA GRAFFITI RAPORTY PODRĘCZNIK UŻYTKOWNIKA Podręcznik użytkownika Graffiti Raporty, aplikacji tworzenia raportów definiowalnych dla systemu Graffiti.ERP. Graffiti.ERP jest zintegrowanym systemem informatycznym

Bardziej szczegółowo

Moduł 4 - Tworzenie obiektów i metod

Moduł 4 - Tworzenie obiektów i metod MODUŁ 4 - TWORZENIE OBIEKTÓW I METOD 32 Moduł 4 - Tworzenie obiektów i metod Zawartość jednostki Po zrealizowaniu jednostki będziesz w stanie: wskazać różnice między zmienną typu prostego, a obiektem (zmienną

Bardziej szczegółowo

Programowanie komputerowe

Programowanie komputerowe Programowanie komputerowe dr inż. Sławomir Koczubiej Politechnika Świętokrzyska Wydział Zarządzania i Modelowania Komputerowego Katedra Informatyki Stosowanej (14 kwietnia 2014) dr inż. Sławomir Koczubiej

Bardziej szczegółowo

Wprowadzenie do programowania

Wprowadzenie do programowania Michał Włodarczyk Wprowadzenie do programowania ITA-104 Wersja 1 Warszawa, Wrzesień 2009 Michał Włodarczyk 2009 Michał Włodarczyk. Autor udziela prawa do bezpłatnego kopiowania i dystrybuowania wśród pracowników

Bardziej szczegółowo

2. Składnia, środowisko i konwencje w Javie

2. Składnia, środowisko i konwencje w Javie Gdańsk, 2014 Ogólnie o Javie Środowisko Java jest językiem programowania, którego podstawowym celem jest realizacja zasady write once, run anywhere. Oznacza to możliwość wykonania tego samego programu,

Bardziej szczegółowo

Wstęp do programowania w C#

Wstęp do programowania w C# Anna Kempa Tomasz Staś Wstęp do programowania w C# Łatwy podręcznik dla początkujących Aktualna wersja podręcznika na stronie http://c-sharp.ue.katowice.pl Katowice, kwiecień 2014 Wersja 1.1 Anna Kempa,

Bardziej szczegółowo

Przegląd specyfikacji związanych z wykorzystaniem usług sieciowych (Web Services)

Przegląd specyfikacji związanych z wykorzystaniem usług sieciowych (Web Services) Przegląd specyfikacji związanych z wykorzystaniem usług sieciowych (Web Services) Spis treści 1. XPDL... 3 2. XML... 7 3. XSL Transformations [XSLT]... 10 4. XML Path Language [XPath]... 19 5. XML Linking

Bardziej szczegółowo

Java wstęp do języka. Andrzej Chybicki Andrzej.Chybicki@eti.pg.gda.pl Pok. 738

Java wstęp do języka. Andrzej Chybicki Andrzej.Chybicki@eti.pg.gda.pl Pok. 738 Java wstęp do języka Andrzej Chybicki Andrzej.Chybicki@eti.pg.gda.pl Pok. 738 To co już powinniśmy wiedzieć Składnia, gramatyka i doświadczenie w programowaniu w C/C++ Idea i zasada programowania obiektowego

Bardziej szczegółowo

1 / 38 JAVA - OOP. Programowanie w środowisku rozproszonym. Wykład -01[SUM]

1 / 38 JAVA - OOP. Programowanie w środowisku rozproszonym. Wykład -01[SUM] 1 / 38 JAVA - OOP Programowanie w środowisku rozproszonym. Wykład -01[SUM] Plan wykładu 2 / 38 Obiektowa analiza i projektowanie - wstęp do programowania obiektowego w Javie Paradygmaty programowania obiektowego

Bardziej szczegółowo

Podstawy programowania w języku Java. mgr inż. Piotr Kowalski

Podstawy programowania w języku Java. mgr inż. Piotr Kowalski Podstawy programowania w języku Java mgr inż. Piotr Kowalski 18 stycznia 2013 Spis treści 1 Podstawy architektury komputera 5 1.1 Części składowe komputera..................... 5 1.1.1 Rzecz o rejestrach......................

Bardziej szczegółowo

Coraz więcej programistów poznaje programowanie

Coraz więcej programistów poznaje programowanie Olaf Spinczyk Daniel Lohmann Matthias Urban AspectC++: aspektowe rozszerzenie C++ Na CD: Na płycie dołączonej do numeru znajduje się wersja próbna dodatku AspectC++ dla Visual Studio.NET, darmowy zestaw

Bardziej szczegółowo

Analiza porównawcza języków procedur składowanych PL/SQL, SQL PL, PL/pgSQL i T-SQL

Analiza porównawcza języków procedur składowanych PL/SQL, SQL PL, PL/pgSQL i T-SQL POLITECHNIKA WARSZAWSKA Wydział Elektroniki i Technik Informacyjnych PRACA DYPLOMOWA MAGISTERSKA Marta Bańkowska Nr albumu: 161484 Analiza porównawcza języków procedur składowanych PL/SQL, SQL PL, PL/pgSQL

Bardziej szczegółowo

JSystems. Administracja Oracle. Kompendium wiedzy 2010-01-04

JSystems. Administracja Oracle. Kompendium wiedzy 2010-01-04 JSystems Administracja Oracle Kompendium wiedzy 2010-01-04 1 2 Globalny obszar systemowy - SGA Serwer Oracle składa się z plików bazy danych oraz instancji Oracle, której budowa jest przedstawiona na powyższym

Bardziej szczegółowo

Różne podejścia do projektowania aplikacji internetowych

Różne podejścia do projektowania aplikacji internetowych Wydział Informatyki Katedra Inżynierii Oprogramowania Inżynieria Oprogramowania i Baz Danych Przemysław Walerianczyk Nr albumu 7143 Różne podejścia do projektowania aplikacji internetowych Praca magisterska

Bardziej szczegółowo

Implementacja modelu FHP w technologii NVIDIA CUDA

Implementacja modelu FHP w technologii NVIDIA CUDA Uniwersytet Wrocławski Wydział Fizyki i Astronomii Instytut Fizyki Teoretycznej Sebastian Szkoda Implementacja modelu FHP w technologii NVIDIA CUDA Opiekun: dr hab. Zbigniew Koza, prof. UWr. 2 Streszczenie

Bardziej szczegółowo

Język C# A.1. Aplikacje konsolowe w języku C# A.1.1. Wprowadzenie

Język C# A.1. Aplikacje konsolowe w języku C# A.1.1. Wprowadzenie A Język C# A.1. Aplikacje konsolowe w języku C# A.1.1. Wprowadzenie Język C# (wymawiamy: C sharp ) jest językiem przeznaczonym do tworzenia aplikacji, które działają w środowisku.net Framework. Jest to

Bardziej szczegółowo

Język JAVA podstawy programowania

Język JAVA podstawy programowania Język JAVA podstawy programowania [43] Na ogół łatwiej daje się człowiek przekonać racjom, do których sam doszedł, niż tym, które nastręczyły się komuś innemu. Myśli Blaise Pascal Jacek Rumiński, 1999

Bardziej szczegółowo

Poznajemy język ACTIONSCRIPT 3.0

Poznajemy język ACTIONSCRIPT 3.0 Poznajemy język ACTIONSCRIPT 3.0 Informacje prawne Informacje prawne Informacje prawne można znaleźć na stronie http://help.adobe.com/pl_pl/legalnotices/index.html. iii Spis treści Rozdział 1: Wprowadzenie

Bardziej szczegółowo

SQL i PL/SQL podstawy

SQL i PL/SQL podstawy O Oracle ludzkim głosem SQL i PL/SQL podstawy Andrzej Klusiewicz \ Podstawy SQL i PL/SQL. Bezpłatny e-book wersja: 1.1 06-05-2013 www.jsystems.pl str. 1/140 Spis treści O Oracle ludzkim głosem...1 Licencja

Bardziej szczegółowo

Zapisywanie algorytmów w języku programowania wysokiego poziomu

Zapisywanie algorytmów w języku programowania wysokiego poziomu Temat 7 program Zapisywanie algorytmów w języku programowania wysokiego poziomu 1. Język programowania 1.1. Klasyfikacja języków programowania 2. Struktura programu w języku Pascal 3. Etapy programowania

Bardziej szczegółowo

Programowanie współbieżne i rozproszone w języku Java

Programowanie współbieżne i rozproszone w języku Java Programowanie współbieżne i rozproszone w języku Java Uniwersytet Marii Curie-Skłodowskiej Wydział Matematyki, Fizyki i Informatyki Instytut Informatyki Programowanie współbieżne i rozproszone w języku

Bardziej szczegółowo

Agnieszka Nowak - Brzezińska

Agnieszka Nowak - Brzezińska Agnieszka Nowak - Brzezińska Wystarczy raz zapisać kod a program można uruchomić wszędzie Java język programowania stworzony przez James a Goslinga i Patric a Naughton a z firmy Sun Microsystems. Krótka

Bardziej szczegółowo