Wydajność komunikacji grupowej w obliczeniach równoległych. Krzysztof Banaś Obliczenia wysokiej wydajności 1

Podobne dokumenty
Przetwarzanie równoległesprzęt

Operacje grupowego przesyłania komunikatów

Wydajność obliczeń równoległych. Krzysztof Banaś Obliczenia Wysokiej Wydajności 1

Message Passing Interface

Przetwarzanie równoległesprzęt. Rafał Walkowiak Wybór

Algorytmy równoległe: prezentacja i ocena efektywności prostych algorytmów dla systemów równoległych

Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych

Skalowalność obliczeń równoległych. Krzysztof Banaś Obliczenia Wysokiej Wydajności 1

Sieci komputerowe. Zadania warstwy łącza danych. Ramka Ethernet. Adresacja Ethernet

Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych

Spis treści. 1 Wprowadzenie. 1.1 Podstawowe pojęcia. 1 Wprowadzenie Podstawowe pojęcia Sieci komunikacyjne... 3

Wydajność systemów a organizacja pamięci. Krzysztof Banaś, Obliczenia wysokiej wydajności. 1

Operacje grupowego przesyłania komunikatów. Krzysztof Banaś Obliczenia równoległe 1

Analiza efektywności przetwarzania współbieżnego. Wykład: Przetwarzanie Równoległe Politechnika Poznańska Rafał Walkowiak Grudzień 2015

Algorytmy Komunikacyjne dla Trójwymiarowych Sieci Opartych na Plastrze Miodu. Ireneusz Szcześniak. Politechnika Śląska 20 czerwca 2002 r.

Procesory wielordzeniowe (multiprocessor on a chip) Krzysztof Banaś, Obliczenia wysokiej wydajności.

Wydajność systemów a organizacja pamięci. Krzysztof Banaś, Obliczenia wysokiej wydajności. 1

Problemy rozwoju Internetu kwantowego

Technologie informacyjne (5) Zdzisław Szyjewski

Numeryczna algebra liniowa

DWA ZDANIA O TEORII GRAFÓW. przepływ informacji tylko w kierunku

Routing. mgr inż. Krzysztof Szałajko

Algorytmy równoległe. Rafał Walkowiak Politechnika Poznańska Studia inżynierskie Informatyka 2010

Wydajność systemów a organizacja pamięci, czyli dlaczego jednak nie jest aż tak źle. Krzysztof Banaś, Obliczenia wysokiej wydajności.

Podstawy Techniki Mikroprocesorowej wykład 13: MIMD. Dr inż. Jacek Mazurkiewicz Katedra Informatyki Technicznej

Temat: Algorytm kompresji plików metodą Huffmana

358,98 PLN brutto 291,85 PLN netto

Programowanie współbieżne Wstęp do obliczeń równoległych. Rafał Skinderowicz

Sieci komputerowe. Zajęcia 2 Warstwa łącza, sprzęt i topologie sieci Ethernet

Mosty przełączniki. zasady pracy pętle mostowe STP. Domeny kolizyjne, a rozgłoszeniowe

Kody blokowe Wykład 5a;

Przetwarzanie równoległe- 2. Komputery równoległe

Algorytmy Równoległe i Rozproszone Część VI - Systemy rozproszone, podstawowe pojęcia

5. Model komunikujących się procesów, komunikaty

Wydajność obliczeń a architektura procesorów. Krzysztof Banaś Obliczenia Wysokiej Wydajności 1

Ćwiczenie Wyznaczanie tras sumarycznych dla adresów IPv4 i IPv6

Projektowanie algorytmów równoległych. Zbigniew Koza Wrocław 2012

Plan wykładu. Wyznaczanie tras. Podsieci liczba urządzeń w klasie C. Funkcje warstwy sieciowej

Stan globalny. Krzysztof Banaś Systemy rozproszone 1

Akademickie Centrum Informatyki PS. Wydział Informatyki PS

Analityczne modelowanie systemów równoległych

Modelowanie sieci złożonych

Wydajność systemów a organizacja pamięci. Krzysztof Banaś, Obliczenia wysokiej wydajności. 1

Systemy i Sieci Radiowe

Topologie sieci lokalnych

Protokoły sieciowe model ISO-OSI Opracował: Andrzej Nowak

Przetwarzanie równoległe

teoria informacji Kanały komunikacyjne, kody korygujące Mariusz Różycki 25 sierpnia 2015

Przetwarzanie równoległe Zadanie domowe III

Routery RTR-XXX/XXX - Router RTR-FT10/FT10

Ruting. Protokoły rutingu a protokoły rutowalne

Procesy i wątki. Krzysztof Banaś Obliczenia równoległe 1

Obliczenia równoległe i rozproszone. Praca zbiorowa pod redakcją Andrzeja Karbowskiego i Ewy Niewiadomskiej-Szynkiewicz

Wybrane bloki i magistrale komputerów osobistych (PC) Opracował: Grzegorz Cygan 2010 r. CEZ Stalowa Wola

Aby lepiej zrozumieć działanie adresów przedstawmy uproszczony schemat pakietów IP podróżujących w sieci.

DANE W SIECIACH TELEKOMUNIKACYJNYCH

teoria informacji Entropia, informacja, kodowanie Mariusz Różycki 24 sierpnia 2015

Sieci komputerowe - administracja

Sieci komputerowe - Wstęp do intersieci, protokół IPv4

Wstęp Roofnet i ExOR Meraki Podsumowanie. Sieci mesh. Michał Świtakowski. 17 grudnia 2009

21 Model z pamięcią współdzieloną (model PRAM) - Parallel Random Access Machine

Akademickie Centrum Informatyki PS. Wydział Informatyki PS

Sieci komputerowe - Urządzenia w sieciach

PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK

PODSTAWOWE PODZIAŁY SIECI KOMPUTEROWYCH

Sieć Interbus. Automatyzacja przed 20 laty z PLC. dr inŝ. Stefan Brock. Wprowadzone PLC zastąpiły układy logiki stykowej.

KODY SYMBOLI. Kod Shannona-Fano. Algorytm S-F. Przykład S-F

PAMIĘCI. Część 1. Przygotował: Ryszard Kijanka

Internet kwantowy. (z krótkim wstępem do informatyki kwantowej) Jarosław Miszczak. Instytut Informatyki Teoretycznej i Stosowanej PAN

1. Cel ćwiczenia. 2. Podłączenia urządzeń zewnętrznych w sterowniku VersaMax Micro

Pytanie 1 Z jakich protokołów korzysta usługa WWW? (Wybierz prawidłowe odpowiedzi)

Zapoznanie z technikami i narzędziami programistycznymi służącymi do tworzenia programów współbieżnych i obsługi współbieżności przez system.

Kolorowanie wierzchołków Kolorowanie krawędzi Kolorowanie regionów i map. Wykład 8. Kolorowanie

Routery RTR-XXX/XXX - Router FT/FO (RS485-78)

Działanie komputera i sieci komputerowej.

Kodowanie i kompresja Tomasz Jurdziński Studia Wieczorowe Wykład Kody liniowe - kodowanie w oparciu o macierz parzystości

Ćwiczenie 1. Podstawowa terminologia lokalnych sieci komputerowych. Topologie sieci komputerowych. Ocena. Zadanie 1

a) 7 b) 19 c) 21 d) 34

Szeregowanie zadań. Wykład nr 3. dr Hanna Furmańczyk

Przesyłania danych przez protokół TCP/IP

ISP od strony technicznej. Fryderyk Raczyk

Sieci Kohonena Grupowanie

ARP Address Resolution Protocol (RFC 826)

LEKCJA TEMAT: Zasada działania komputera.

Czas w systemach rozproszonych. Krzysztof Banaś Systemy rozproszone 1

Uproszczony opis obsługi ruchu w węźle IP. Trasa routingu. Warunek:

Spis treúci. Księgarnia PWN: Wayne Lewis - Akademia sieci Cisco. CCNA semestr 3

Wykład 4. Interfejsy USB, FireWire

Sieci komputerowe - warstwa fizyczna

MODELE SIECIOWE 1. Drzewo rozpinające 2. Najkrótsza droga 3. Zagadnienie maksymalnego przepływu źródłem ujściem

Urządzenia sieciowe. Tutorial 1 Topologie sieci. Definicja sieci i rodzaje topologii

Ethernet. Ethernet odnosi się nie do jednej, lecz do wielu technologii sieci lokalnych LAN, z których wyróżnić należy cztery podstawowe kategorie:

Akademickie Centrum Informatyki PS. Wydział Informatyki PS

Analiza efektywności przetwarzania współbieżnego

Programowanie procesorów graficznych GPGPU. Krzysztof Banaś Obliczenia równoległe 1

Logiczny model komputera i działanie procesora. Część 1.

RUTERY. Dr inŝ. Małgorzata Langer

Architektura Bezpieczeństwa dla Systemu ROVERS. Artur Skrajnowski Opiekun: dr inż. Jarosław Domaszewicz Współpraca: prof. dr hab.

Topologie sieci komputerowych

Transkrypt:

Wydajność komunikacji grupowej w obliczeniach równoległych Krzysztof Banaś Obliczenia wysokiej wydajności 1

Sieci połączeń Topologie sieci statycznych: Sieć w pełni połączona Gwiazda Kraty: 1D, 2D, 3D Drzewa: zwykłe lub tłuste Hiperkostki: 1D, 2D, 3D itd.. Wymiar d, liczba procesorów 2^d Bitowy zapis położenia węzła Najkrótsza droga między 2 procesorami = ilość bitów, którymi różnią się kody położenia procesorów Krzysztof Banaś Obliczenia wysokiej wydajności 2

Sieci połączeń Parametry: I. Średnica maksymalna odległość dwóch węzłów II. Połączalność krawędziowa (arch connectivity) minimalna liczba krawędzi koniecznych do usunięcia dla podziału sieci na dwie sieci rozłączne miara m.in. odporności na uszkodzenia III. Szerokość połowienia (bisection width) minimalna liczba krawędzi koniecznych do usunięcia dla podziału sieci na dwie równe sieci rozłączne (razem z przepustowością pojedynczego kanału daje przepustowość przepołowienia (bisection bandwidth) miara m.in. odporności na przepełnienia IV.Koszt np. szacowany liczbą drutów. V. Inne np. liczba połączeń pojedynczego węzła, możliwości komunikacyjne łączy (half duplex, full duplex), itp. Krzysztof Banaś Obliczenia wysokiej wydajności 3

Sieci połączeń Porównanie sieci statycznych: I II III IV sieć w pełni połączona 1 p 1 (p^2)/4 p(p 1)/2 sieć gwiaździsta 2 1 1 p 1 szereg p 1 1 1 p 1 pierścień p/2 2 2 p krata 2D bez zawijania 2( p 1) 2 p 2(p p) torus 2D 2( p / 2) 4 2 p 2p drzewo binarne zupełne 2log(p/2+1/2) 1 1 p 1 hiperkostka log p log p p/2 p(log p)/2 Krzysztof Banaś Obliczenia wysokiej wydajności 4

Przypomnienie Czas przesłania pojedynczego komunikatu o rozmiarze m bajtów poprzez sieć składającą się z l odcinków o parametrach: ts czas inicjacji sieci th czas przełączenia w pojedynczym węźle tw czas przesłania 1 bajta pomiędzy sąsiednimi węzłami Routing SF (store and forward): ts + l * ( t h ) Routing CT (cut through, wormhole): ts + lt h Dla większości sieci można posługiwać się uproszczonym wzorem przybliżonym: t s Krzysztof Banaś Obliczenia wysokiej wydajności 5

Rozgłaszanie jeden do wszystkich Algorytm dla hiperkostki: T r_jdw ) log(p) Algorytmy dla innych topologii (routing CT) różnią sie tylko składnikiem zawierającym czas przełączania t h Dla liczby procesorów rzędu tysięcy składnik ten może być znaczący Redukcja wszyscy do jednego posiada ten sam schemat co rozgłaszanie Krzysztof Banaś Obliczenia wysokiej wydajności 6

Rozgłaszanie wszyscy do wszystkich (routing SF i CT) (inaczej zbieranie wszyscy do wszystkich, allgather): Algorytm dla pierścienia: T r_wdw_pierścień ) (p 1) Algorytm dla kraty 2D z zawinięciami (torusa): T r_wdw_torus = 2t s ( p 1) (p 1) Algorytm dla hiperkostki: T r_wdw_hiper = t s log p (p 1) Składnik mt w (p 1) jest dolnym oszacowaniem czasu komunikacji wynikającym z rozmiaru przesyłanych danych Krzysztof Banaś Obliczenia wysokiej wydajności 7

Redukcja wszyscy do wszystkich Dla każdej architektury można je zorganizować jako redukcję wszyscy do jednego, po którym następuje rozgłaszanie jeden dowszystkich Dla hiperkostki można opracować lepszy schemat, wykorzystujący rozgłaszanie wszyscy do wszystkich (jedyna różnica jest taka, że w każdym węźle sumuje się przesyłane wartości, a rozmiar komunikatu zawsze wynosi 1): T g_wdw_hiper + t w ) log p Krzysztof Banaś Obliczenia wysokiej wydajności 8

Rozpraszanie jeden do wszystkich Dla każdej architektury można je zorganizować wykorzystując schemat rozgłaszania wszyscy do wszystkich i odpowiednie manipulacje zawartością komunikatów Czas realizacji rozpraszania jeden do wszystkich jest taki sam jak czas rozgłaszania wszyscy do wszystkich Zbieranie wszyscy do jednego jest realizowane za pomocą identycznego schematu (z odwróceniem kierunku przesyłania komunikatów) i w identycznym czasie jak rozpraszanie jeden dowszystkich Krzysztof Banaś Obliczenia wysokiej wydajności 9

Pełna wymiana wszyscy do wszystkich Dla każdej architektury można je zorganizować wykorzystując schemat rozgłaszania wszyscy do wszystkich i odpowiednie manipulacje zawartością komunikatów Algorytm dla pierścienia (routing SF i CT): T w_wdw_pierścień + ½pmt w ) (p 1) Algorytm dla kraty 2D z zawinięciami (routing SF i CT): T w_wdw_krata_2d = (2t s + pmt w ) ( p 1) Algorytm dla hiperkostki (routing SF): T w_wdw_hiperkostka_1 + ½pmt w ) log(p) Krzysztof Banaś Obliczenia wysokiej wydajności 10

Pełna wymiana wszyscy do wszystkich Algorytm dla hiperkostki (routing CT): p 1 kroków W każdym kroku każdy procesor wymienia dane z jednym z pozostałych Trzeba tylko tak zorganizować wymianę, aby łącza komunikacyjne nie zatykały się T w_wdw_hiperkostka_2 ) (p 1) + ½ t h p log p Krzysztof Banaś Obliczenia wysokiej wydajności 11