Page 1. Strategie przesyłania - store and forward (zapamiętaj i prześlij) - cut-through routing

Podobne dokumenty
Miary Wydajności. Efektywność programu równoległego (E) jest definiowana jako stosunek przyśpieszenia do liczby procesorów

Operacje grupowego przesyłania komunikatów. Krzysztof Banaś Obliczenia równoległe 1

Programowanie Równoległe Wykład 5. MPI - Message Passing Interface. Maciej Matyka Instytut Fizyki Teoretycznej

Programowanie współbieżne... (4) Andrzej Baran 2010/11

Modele programowania równoległego. Programowanie z przekazywaniem komunikatów Message-Passing Programming Rafał Walkowiak

Modele programowania równoległego. Programowanie z przekazywaniem komunikatów Message-Passing Programming Rafał Walkowiak dla PR PP

Operacje grupowego przesyłania komunikatów

Operacje kolektywne MPI

Helena Boguta, klasa 8W, rok szkolny 2018/2019

Programowanie Równoległe Wykład 4. MPI - Message Passing Interface. Maciej Matyka Instytut Fizyki Teoretycznej

Programowanie w modelu przesyłania komunikatów specyfikacja MPI. Krzysztof Banaś Obliczenia równoległe 1

Programowanie współbieżne... (12) Andrzej Baran 2010/11

Weronika Mysliwiec, klasa 8W, rok szkolny 2018/2019

Wprowadzenie. System rozproszony jest kolekcją niezależnych, autonomicznych komputerów, które dla użytkownika prezentują się jak jeden komputer.

Message Passing Interface

Wykład 15. Literatura. Kompilatory. Elementarne różnice. Preprocesor. Słowa kluczowe

INSTRUKCJE JAK AKTYWOWAĆ SWOJE KONTO PAYLUTION

OpenPoland.net API Documentation

Zarządzanie sieciami telekomunikacyjnymi

ARNOLD. EDUKACJA KULTURYSTY (POLSKA WERSJA JEZYKOWA) BY DOUGLAS KENT HALL

Programowanie współbieżne Wykład 12 MPI c.d. Rafał Skinderowicz

Page 1. Programowanie równoległe i rozproszone - INZ3774 wykład - 3 ECTS, laboratorium 3 ECTS. Wykładowca: Jan Kwiatkowski, pokój 201/15, D-2

Hard-Margin Support Vector Machines

Jak wygląda praca na klastrze

EGZAMIN MATURALNY OD ROKU SZKOLNEGO

General Certificate of Education Ordinary Level ADDITIONAL MATHEMATICS 4037/12

Surname. Other Names. For Examiner s Use Centre Number. Candidate Number. Candidate Signature

Zasady rejestracji i instrukcja zarządzania kontem użytkownika portalu

Wydajność komunikacji grupowej w obliczeniach równoległych. Krzysztof Banaś Obliczenia wysokiej wydajności 1

MS Visual Studio 2005 Team Suite - Performance Tool

Raport bieżący: 44/2018 Data: g. 21:03 Skrócona nazwa emitenta: SERINUS ENERGY plc

PLSH1 (JUN14PLSH101) General Certificate of Education Advanced Subsidiary Examination June Reading and Writing TOTAL

Programowanie Równoległe Wykład 5. MPI - Message Passing Interface (część 3) Maciej Matyka Instytut Fizyki Teoretycznej

Immigration Studying. Studying - University. Stating that you want to enroll. Stating that you want to apply for a course.

POLITYKA PRYWATNOŚCI / PRIVACY POLICY

Macierzowe algorytmy równoległe

Tychy, plan miasta: Skala 1: (Polish Edition)

Arrays -II. Arrays. Outline ECE Cal Poly Pomona Electrical & Computer Engineering. Introduction

kdpw_stream Struktura komunikatu: Status komunikatu z danymi uzupełniającymi na potrzeby ARM (auth.ste ) Data utworzenia: r.

Weryfikacja oprogramowania, korzystajacego z MPI

Sieciowa komunikacja procesów - XDR i RPC

Wykaz linii kolejowych, które są wyposażone w urządzenia systemu ETCS

Życie za granicą Studia

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

DODATKOWE ĆWICZENIA EGZAMINACYJNE

Wykaz linii kolejowych, które są wyposażone w urzadzenia systemu ETCS

Machine Learning for Data Science (CS4786) Lecture11. Random Projections & Canonical Correlation Analysis

MaPlan Sp. z O.O. Click here if your download doesn"t start automatically

Karpacz, plan miasta 1:10 000: Panorama Karkonoszy, mapa szlakow turystycznych (Polish Edition)

Podstawa prawna: Art. 70 pkt 1 Ustawy o ofercie - nabycie lub zbycie znacznego pakietu akcji

Detekcja zakleszczenia (1)

Systemy wbudowane. Poziomy abstrakcji projektowania systemów HW/SW. Wykład 9: SystemC modelowanie na różnych poziomach abstrakcji

Proposal of thesis topic for mgr in. (MSE) programme in Telecommunications and Computer Science

Extraclass. Football Men. Season 2009/10 - Autumn round

Instrukcja konfiguracji usługi Wirtualnej Sieci Prywatnej w systemie Mac OSX

SubVersion. Piotr Mikulski. SubVersion. P. Mikulski. Co to jest subversion? Zalety SubVersion. Wady SubVersion. Inne różnice SubVersion i CVS

Automatyczne generowanie testów z modeli. Bogdan Bereza Automatyczne generowanie testów z modeli

JĘZYK ANGIELSKI ĆWICZENIA ORAZ REPETYTORIUM GRAMATYCZNE

Interfejs MPI. Maciej Kasperski, Rafał Kozik. 16 kwietnia 2008

Gradient Coding using the Stochastic Block Model

SSW1.1, HFW Fry #20, Zeno #25 Benchmark: Qtr.1. Fry #65, Zeno #67. like

OBWIESZCZENIE MINISTRA INFRASTRUKTURY. z dnia 18 kwietnia 2005 r.

PoniŜej znajdują się pytania z egzaminów zawodowych teoretycznych. Jest to materiał poglądowy.

ZARZADZANIE RYZYKIEM WALUTOWYM PDF

Marzec: food, advertising, shopping and services, verb patterns, adjectives and prepositions, complaints - writing

Zasady Programowania Strukturalnego

ITIL 4 Certification

All Saints Day. Chants of the Proper of the Mass for. Adapted to English words and Edited by. Bruce E. Ford

Miedzy legenda a historia: Szlakiem piastowskim z Poznania do Gniezna (Biblioteka Kroniki Wielkopolski) (Polish Edition)

CPX Cisco Partner Excellence CSPP program partnerski

Budowa przełączników modularnych. Piotr Głaska Senior Product Manager Enterprise Networking Solutions


DIGA Object Dictionary opis

PROGRAMOWANIE SYSTEMÓW CZASU RZECZYWISTEGO

Maximum Ride Ostatnie Ostrzezenie Globalne Ocieplenie (Polska Wersja Jezykowa)

Shared memory and messages. Functions. process 0. process 1. program 0. program 0. data 0. data 1. program 1. data 0. data 1.

ANKIETA ŚWIAT BAJEK MOJEGO DZIECKA

How to share data from SQL database table to the OPC Server? Jak udostępnić dane z tabeli bazy SQL do serwera OPC? samouczek ANT.

Ankiety Nowe funkcje! Pomoc Twoje konto Wyloguj. BIODIVERSITY OF RIVERS: Survey to students

Optymalizacja komunikacji w systemach rozproszonych i równoległych

Instrukcje podsumowanie. Proste: - przypisania - wejścia-wyjścia (read, readln, write, writeln) - pusta - po prostu ; (średnik) Strukturalne:

Zygmunt Kubiak Instytut Informatyki Politechnika Poznańska

DO MONTAŻU POTRZEBNE SĄ DWIE OSOBY! INSTALLATION REQUIRES TWO PEOPLE!

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

Karpacz, plan miasta 1:10 000: Panorama Karkonoszy, mapa szlakow turystycznych (Polish Edition)

SQL 4 Structured Query Lenguage

Zakopane, plan miasta: Skala ok. 1: = City map (Polish Edition)

HISZPANSKI NA POZIOMIE PDF

Pielgrzymka do Ojczyzny: Przemowienia i homilie Ojca Swietego Jana Pawla II (Jan Pawel II-- pierwszy Polak na Stolicy Piotrowej) (Polish Edition)

y = The Chain Rule Show all work. No calculator unless otherwise stated. If asked to Explain your answer, write in complete sentences.

KOMUNIKAT 2. The 44 th International Biometrical Colloquium and IV Polish-Portuguese Workshop on Biometry. Conference information:

Pobieranie argumentów wiersza polecenia

METHOD 2 -DIAGNOSTIC OUTSIDE

Planowanie eksperymentu 2 (k p) w 2 r blokach. Stanisław Jaworski, Wojciech Zieliński

Mechanizmy rozgłaszania niezawodnego

PLSH1 (JUN11PLSH101) General Certificate of Education Advanced Subsidiary Examination June Reading and Writing TOTAL

WYŁĄCZNIK CZASOWY OUTDOOR TIMER

Wstęp do programowania. Różne różności

Polska Szkoła Weekendowa, Arklow, Co. Wicklow KWESTIONRIUSZ OSOBOWY DZIECKA CHILD RECORD FORM

Transkrypt:

Miary Wydajności Cza ykonania rónoległego (par) jet czaem pomiędzy momentem rozpoczęcia obliczeń do momentu gdy otatni proceor zakończy obliczenia Przypiezenie (S) jet definioane jako tounek czau niezbędnego do roziązania problemu z ykorzytaniem jednego proceora (eq) do czau potrzebnego do roziązania tego amego problemu z ykorzytaniem ytemu rónoległego o "p" proceorach (par) zględne - eq jet czaem ykonania algorytmu rónoległego na jednym z proceoró ytemu ieloproceoroego rzeczyite - eq jet czaem ykonania najlepzego algorytmu ekencyjnego na jednym z proceoró ytemu rónoległego bezględne - eq jet czaem ykonania najlepzego algorytmu ekencyjnego na najlepzym komputerze ekencyjnym Miary Wydajności Efektyność programu rónoległego (E) jet definioana jako tounek przyśpiezenia do liczby proceoró Kozt jet zykle definioany jako iloczyn rónoległego czau przetarzania i liczby proceoró. Skaloalność ytemu rónoległego jet miarą jego zdolności do ziękzenia przyśpiezenia proporcjonalnie do liczby proceoró. Kozt komunikacji ieciach tatycznych Podtaoe parametry - cza przygotoania (tartup time) (t ) - cza przełania nagłóka (per-hop time) (t h ) - cza przełania jednego łoa (t ) Strategie przeyłania - tore and forard (zapamiętaj i prześlij) - cut-through routing Page

Komunikat przeyłany od proceora P 0 do P ime P 0 P P P P 0 P P Komunikat przeyłany metodą SF ime P Komunikat przeyłany metodą C (podział na die części) ime P 0 P P P Komunikat przeyłany metodą C (podział na cztery części) Kozt Komunikacji Store and forard routing (SF) komunikat jet przeyłany pomiędzy proceorami taki poób, że każdy z pośredniczących przełaniu proceoró najpier zapamiętuje cały komunikat ojej lokalnej pamięci i dopiero potem yyła komunikat dalej tcomm t ( mt th) l Cut-through routing (C) komunikat jet dzielony na róne części, które ą przeyłane pomiędzy proceorami bez oczekiania na odebranie całego komunikatu tcomm t lth mt Podtaoe Prymityy komunikacyjne -Pojedynczy komunikat pomiędzy doma proceorami - One-to-all broadcat - All-to-all broadcat - One-to-all peronalized - All-to-all peronalized - Circular hift Page

Komunikacja grupoa One-to-all broadcat M M M M 0 p- Single-node accumulation 0 p- M p- M p- M p- All-to-all broadcat M M 0 M M p- M 0 0 p- 0 p- Multinode accumulation M M 0 M M 0 Komunikacja grupoa M p- M M 0 One-to-all peronalized M 0 M M p- 0 p- 0 p- Single-node gather M 0,p- M,p- M p-,p- M p-,0 M p-, M p-.p- M 0, M 0,0 M, M,0 M p-, M p-,0 All-to-all peronalized M,0 M 0,0 M, M 0, M,p- M 0,p- 0 p- 0 p- Multinode gather 8 8 One-to-all broadcat - SF 0 Dla ieci typu ring one _ to_ all_ b p t t m 0 9 9 Page

One-to-all broadcat - SF 8 9 0 0 Dla ieci typu meh z zapętleniem one _ to_ all_ b t tm p 0 0 One-to-all broadcat - SF (0) () (00) (0) (00) (0) 0 (000) (00) t t m log Dla ieci hypercube p one_ to_ all_ b One-to-all broadcat - SF procedure ONE_O_ALL_BC(d,my_id,X); mak:= d -; for i:=d- donto 0 do mak:=mak XOR i ; if (my_id AND mak)=0 then if (my_id AND i )=0 then mg_detination:=my_id XOR i ; end X to mg_detination; endif ele mg_ource:=my_id XOR i ; receive X from mg_ource; endele; endfor; end ONE_O_ALL_BC Proceor 0 yyła komunikat Page

All-to-all broadcat - SF () () () () () () () () (0) () () () 0 (0) () () () Pierzy krok () () () (,) (,) (,) (,) () (0,) (0,) (,) (,) 0 () (0) () () Drugi krok All-to-all broadcat - SF (0) () () (..) (0..) (0..,) (0..,,) (0,..) (0,,..) (0..,..) (0..,..) 0 () Siódmy krok () () () All-to-all broadcat - SF procedure ALL_O_ALL_BC_RING(my_id,my_mg,p,reult); left:=(my_id - ) mod p; right:=(my_id + ) mod p; reult:=my_mg; mg:=reult; for i:= to p- do end mg to right; receive mg from left; reult:=reult mg; endfor; end ALL_O_ALL_BC_RING; alltoallbc t t m p Page

All-to-all broadcat - SF () () (,) (,) () () (,) (,) () (0) 0 () () (0,) 0 (,) (,) (0,) a) Wtępne b) Rozmiezczenie rozmiezczenie komunikató przed komunikató drugim krokiem All-to-all broadcat - SF (..) (..) (0..) (0..) (0..) (0..) (0..) (0..) (0..) 0 (..) (..) (0..) (0..) 0 (0..) (0..) (0..) c) Rozmiezczenie komunikató przed trzecim krokiem d) Końcoe rozmiezczenie komunikató alltoallbc t log p t m p One-to-all peronalized - SF 0 Pierzy krok () 0 Drugi krok () () 8 8 Page

One-to-all peronalized - SF () () () () Siódmy krok 0 () () () onetoall per t t m p 9 9 One-to-all peronalized - SF (..) (8..) 8 9 0 (..) (0..) 0 0 0 One-to-all peronalized - SF () () () () 8 9 0 (0) () (8) (9) () () () () 0 (0) () () () onetoall per p t mp t Page

8 One-to-all peronalized broadcat - SF (0..) 0 (0..) 0 (..) a) Wtępne rozmiezczenie komunikató b) Rozmiezczenie komunikató przed drugim krokiem One-to-all peronalized broadcat - SF (,) () () (,) () () (0,) 0 (,) () (0) 0 () () c) Rozmiezczenie komunikató przed trzecim krokiem d) Końcoe rozmiezczenie komunikató onetoall per t log p t m p Collective Communication MPI provide a variety of routine for ditributing & reditributing data, gathering data, performing global um etc. communication involving a group of procee It alay involve every proce in the communicator. hree clae of collective operation: ynchronization - barrier data movement - broadcat, catter, gather collective computation - global um, global maximum, etc. Page 8

9 Characteritic of collective communication Collective communication cannot interfere ith point-to-point communication and vice vera Collective and point-to-point communication are tranparent to one another. A collective communication may or may not ynchronize the procee involved Completion implie the buffer can be ued or re-ued. Hoever, there i no uch thing a a non-blocking collective communication in MPI. All procee in the communicator mut call the collective communication. Similaritie & Difference ith PP Similaritie: A meage i an array of a particular data type. Data type mut match beteen end and receive. Difference: here i no concept of tag. he ent meage mut fill the pecified receive buffer. Barrier ynchronization hi i the implet of all the collective operation and involve no data at all. It block the calling procee until all group member have called it. In one phae of computation, all procee participate in riting a file. he file i to be ued for the next phae of computation. herefore, no proce hould proceed to the econd phae until all procee are completed in phae one. MPI_Barrier(MPI_Comm communicator); Page 9

0 One_to_all Broadcat data from one proce to all procee in a communicator A broadcat ha a pecified root proce and every proce receive one copy of the meage from the root. All procee mut pecify the ame root. data rank broadcat MPI_Bcat(void *buf, /* INOU buffer */ int count, MPI_Datatype datatype, int root, MPI_COMM_WORLD) 8 8 MPI_SCAER Scatter data from one proce to all procee in a communicator hee routine alo pecify a root proce and all procee mut pecify the ame root. he main difference from broadcat i that end & receive detail are different. 9 9 MPI_SCAER data rank A A A catter A A A MPI_Scatter(void *endbuf, int endcount, /* ent to each proce */ MPI_Datatype endtype, void *recvbuf, int recvcount, MPI_Datatype recvtype, int root, MPI_COMM_WORLD); 0 0 Page 0

MPI_ALLGAHER, MPI_ALLOALL Gather data from all procee in a group to one proce hee routine don t have a pecified root proce. Send & receive detail are ignificant on all procee and can be different. MPI_ALLGAHER, MPI_ALLOALL data rank A A A gather A A A MPI_Gather(void *endbuf, int endcount, MPI_Datatype endtype, void *recvbuf, int recvcount, /* for any ingle recv */ MPI_Datatype recvtype, int root, MPI_COMM_WORLD); Global reduction operation hee are ued hen e ant to compute a reult hich involve data ditributed acro a group of procee. Sum of to integer Product of to real number he product of to quare matrice Maximum of to integer return a reult to a proce or all procee MPI_Reduce( ); MPI_Allredule( ); Page