Podstawy Techniki Mikroprocesorowej wykład 13: MIMD. Dr inż. Jacek Mazurkiewicz Katedra Informatyki Technicznej

Podobne dokumenty
3.Przeglądarchitektur

16. Taksonomia Flynn'a.

Architektura Komputerów

3.Przeglądarchitektur

Wykład 8 Systemy komputerowe ze współdzieloną pamięcią operacyjną, struktury i cechy funkcjonalne.

Architektura mikroprocesorów TEO 2009/2010

dr inż. Jarosław Forenc

Klasyfikacja systemów komputerowych. Architektura von Neumanna Architektura harwardzka Zmodyfikowana architektura harwardzka. dr inż.

Architektura komputerów

System mikroprocesorowy i peryferia. Dariusz Chaberski

Podstawy Informatyki Systemy sterowane przepływem argumentów

Nowoczesne technologie przetwarzania informacji

dr inż. Jarosław Forenc

1. ARCHITEKTURY SYSTEMÓW KOMPUTEROWYCH

Architektura von Neumanna

Architektura komputerów

Co to jest lista top500. Omów mikrotechnologię Core

Wykład 2 Podstawowe pojęcia systemów równoległych, modele równoległości, wydajność obliczeniowa, prawo Amdahla/Gustafsona

21 Model z pamięcią współdzieloną (model PRAM) - Parallel Random Access Machine

Komputery równoległe. Zbigniew Koza. Wrocław, 2012

PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK

COMPUTER ORGANIZATION AND DESIGN The Hardware/Software Interface. Wprowadzenie do systemów wieloprocesorowych

dr inż. Jarosław Forenc

Systemy rozproszone. Państwowa Wyższa Szkoła Zawodowa w Chełmie. ** Instytut Fizyki Uniwersytet Marii Curie-Skłodowskiej w Lublinie

Klasyfikacje systemów komputerowych, modele złożoności algorytmów obliczeniowych

Klasyfikacja systemów komputerowych. Architektura von Neumanna. dr inż. Jarosław Forenc

dr inż. Rafał Klaus Zajęcia finansowane z projektu "Rozwój i doskonalenie kształcenia i ich zastosowań w przemyśle" POKL

Zapoznanie z technikami i narzędziami programistycznymi służącymi do tworzenia programów współbieżnych i obsługi współbieżności przez system.

dr inż. Jarosław Forenc

dr inż. Jarosław Forenc

Wprowadzenie. Klastry komputerowe. Superkomputery. informatyka +

Systemy wieloprocesorowe i wielokomputerowe

Technologie Informacyjne Wykład 2

Klasyfikacja systemów komputerowych. Architektura von Neumanna i architektura harwardzka Budowa komputera: dr inż. Jarosław Forenc

Przetwarzanie równoległesprzęt. Rafał Walkowiak Wybór

Klasyfikacja systemów komputerowych. Architektura von Neumanna i architektura harwardzka Budowa komputera: dr inż. Jarosław Forenc

Miary efektywności zrównleglenia

Przetwarzanie równoległesprzęt

Architektury komputerów Architektury i wydajność. Tomasz Dziubich

SSE (Streaming SIMD Extensions)

Podstawy Informatyki DMA - Układ bezpośredniego dostępu do pamięci

dr inż. Jarosław Forenc

Obliczenia Wysokiej Wydajności

Klasyfikacja systemów komputerowych. Architektura von Neumanna i architektura harwardzka Budowa komputera: dr inż. Jarosław Forenc

PODSTAWY PRZETWARZANIA RÓWNOLEGŁEGO INFORMACJI

Systemy operacyjne. Systemy operacyjne. Systemy operacyjne. Zadania systemu operacyjnego. Abstrakcyjne składniki systemu. System komputerowy

Systemy operacyjne. Literatura: A. Silberschatz, J.L. Peterson, P.B. Galwin, Podstawy systemów operacyjnych, WNT, Warszawa 2006

Analiza ilościowa w przetwarzaniu równoległym

dr inż. Jarosław Forenc

Programowanie współbieżne i rozproszone

Klasyfikacja systemów komputerowych. Architektura harwardzka Zmodyfikowana architektura harwardzka. dr inż. Jarosław Forenc

Dr inż. hab. Siergiej Fialko, IF-PK,

dr inż. Jarosław Forenc

Algorytmy dla maszyny PRAM

dr inż. Jarosław Forenc

Wydajność komunikacji grupowej w obliczeniach równoległych. Krzysztof Banaś Obliczenia wysokiej wydajności 1

Architektura Systemów Komputerowych. Architektura potokowa Klasyfikacja architektur równoległych

Wykład I. Administrowanie szkolną siecią komputerową. dr Artur Bartoszewski

Performance Evaluation

Technika mikroprocesorowa

Wprowadzenie do architektury komputerów. Taksonomie architektur Podstawowe typy architektur komputerowych

Rozproszona pamiêæ dzielona - 1

dr inż. Jarosław Forenc

1. Sieć komputerowa - grupa komputerów lub innych urządzeń połączonych ze sobą w celu wymiany danych lub współdzielenia różnych zasobów.

Topologie sieciowe. mgr inż. Krzysztof Szałajko

Programowanie równoległe i rozproszone. Praca zbiorowa pod redakcją Andrzeja Karbowskiego i Ewy Niewiadomskiej-Szynkiewicz

Procesory wielordzeniowe (multiprocessor on a chip) Krzysztof Banaś, Obliczenia wysokiej wydajności.

Budowa karty sieciowej; Sterowniki kart sieciowych; Specyfikacja interfejsu sterownika sieciowego; Open data link interface (ODI); Packet driver

Wstęp do informatyki. Interfejsy, urządzenia we/wy i komunikacja. Linie magistrali

Architektura komputerów

Wydajność systemów a organizacja pamięci. Krzysztof Banaś, Obliczenia wysokiej wydajności. 1

Obliczenia Wysokiej Wydajności

Systemy wbudowane. Uproszczone metody kosyntezy. Wykład 11: Metody kosyntezy systemów wbudowanych

Lokalne sieci optyczne

Spis treści. 1 Wprowadzenie. 1.1 Podstawowe pojęcia. 1 Wprowadzenie Podstawowe pojęcia Sieci komunikacyjne... 3

Systemy operacyjne III

Operacje grupowego przesyłania komunikatów

Systemy operacyjne i sieci komputerowe Szymon Wilk Superkomputery 1

Architektura komputerów

Wprowadzenie. Dariusz Wawrzyniak. Miejsce, rola i zadania systemu operacyjnego w oprogramowaniu komputera

Lokalne sieci optyczne

Wprowadzenie. Dariusz Wawrzyniak. Miejsce, rola i zadania systemu operacyjnego w oprogramowaniu komputera

Wykład 2. Przegląd mikrokontrolerów 8-bit: -AVR -PIC

Systemy operacyjne. Wprowadzenie. Wykład prowadzą: Jerzy Brzeziński Dariusz Wawrzyniak

Procesory. Schemat budowy procesora

WYBRANE ZAGADNIENIA PRZETWARZANIA RÓWNOLEGŁEGO I ROZPROSZONEGO ORAZ KLASTRÓW KOMPUTEROWYCH

Wykład 7. Architektura mikroprocesorów powtórka

Programowanie współbieżne... (1) Andrzej Baran 2010/11

Programowanie współbieżne Wstęp do obliczeń równoległych. Rafał Skinderowicz

PR sprzęt (systemy z pamięcią współdzieloną) Rafał Walkowiak Wersja: jesień 2016

Analysis of PCE-based path optimization in multi-domain SDN/MPLS/BGP-LS network

Przetwarzanie równoległesprzęt

Plan wyk ladu. Architektura komputerów. Ograniczenie zwiazane. Odprowadzanie ciep la

Działanie komputera i sieci komputerowej.

Architektura Systemów Komputerowych. Bezpośredni dostęp do pamięci Realizacja zależności czasowych

Weryfikacja protokołu zgodności cachu COMA

OWS1 (systemy z pamięcią współdzieloną) Rafał Walkowiak Wersja: wiosna 2016

Ograniczenia efektywności systemu pamięci

Zegar - układ wysyłający regularne impulsy o stałej szerokości (J) i częstotliwości (f)

Wstęp do informatyki. System komputerowy. Magistrala systemowa. Architektura komputera. Cezary Bolek

Transkrypt:

Podstawy Techniki Mikroprocesorowej wykład 13: MIMD Dr inż. Jacek Mazurkiewicz Katedra Informatyki Technicznej e-mail: Jacek.Mazurkiewicz@pwr.edu.pl

Kompjuter eta jest i klasyfikacja jednostka centralna procesor pamięć operacyjna urządzenia wejścia-wyjścia magistrale von Neumann (!) SISD - Single Instruction Single Data SIMD - Single Instruction Multiple Data MISD - Multiple Instruction Single Data MIMD Multiple Instruction Multiple Data

MIMD - wstęp (1) Multiple Instruction Multiple Data (MIMD): Realizacja różnych instrukcji w jednym czasie Każdy procesor zaopatrzony w swe sterowanie Procesory mogą być dedykowane do jednego zadania lub zupełnie różnych Systemy muliprocesorowe, multikomputerowe

MIMD -wstęp (2)

MIMD - topologie (1) Topologia: Topologia systemu wieloprocesorowego wynika ze struktury połączeń jednostek Typowe metryki: Diameter Bandwidth Bisectional Bandwidth maksymalna odległość między dwoma procesorami w systemie przepustowość pojedynczego linka przemnożona przez liczbę połączeń przepustowość związana z komunikacją między fragmentami systemu

MIMD - topologie (2) 6 podstawowych kategorii topologicznych: Shared Bus Ring Tree Mesh Hypercube Completely Connected

MIMD - topologie (3) Shared Bus: Prostota konstrukcji M M M Procesory komunikują się poprzez magistrale Warunki transmisji dyktuje obsługa magistrali Łatwość doczepienia nowych procesorów jeśli zagwarantujemy właściwe sterowanie P P Shared Bus Global Memory P

MIMD - topologie (4) Ring: Dedykowane połączenia miedzy procesorami Równoczesna komunikacja jest w zasięgu Wędrówka danych przez pośredników Każdy procesor ma 2 kanały komunikacyjne P P P P P P

MIMD - topologie (5) Tree topology: Bezpośrednie połączenia między procesorami Liczba kanałów komunikacyjnych rośnie Potencjalna kompaktowość konstrukcji P P P P P P

MIMD topologie (6) Mesh topology: Każdy procesor ma sąsiadów uporządkowanych Zapętlenia nie muszą byś realizowane ani wertykalnie ani horyzontalnie P P P P P P P P P

MIMD topologie (7) Hypercube: Wielowymiarowość n procesorów Każdy ma log n połączeń

MIMD topologie (8) Completely Connected: Każdy procesor ma n-1 połączeń, jeden do wszystkich pozostałych Ukomplikowanie rośnie wraz z systemem Możliwości komunikacyjne!

MIMD topologie (9) TOPOLOGY DIAMETER BANDWIDTH BISECTION BANDWIDTH Shared l 1 * l 1 * l Ring n / 2 n * l 2 * l Tree 2 lg n (n 1) * l 1 * l Mesh * 2 n 2n 2 n 2 n / 2 * l Mesh ** n 2n * l 2 n * l Hypercube lg n (n/2) * lg n * l (n/2) * l Comp. Con. 1 (n/2)*(n-1) * l ( n/2 * n/2 )* l * bez zawinięcia ** z zawinięciem l = przepustowość magistrali n = liczba procesorów

MIMD topologie (10) Dynamiczne: przełączanie na żądanie

Parallelno czyli jak? SIMD MIMD SPMD/MPMD Early MPP System PVP (Parallel Vector Processor) SMP (Symmetric Multiprocessor) MPP (Massively Parallel Processor) DSM (Distributed Shared Memory) COW (Cluster of Workstation) Griding Computation Multi-Core CPU

4 typy: - Uniform memory access (UMA) - Nonuniform memory access (NUMA) - Cache coherent NUMA (CC-NUMA) - Cache only memory access (COMA) MIMD typy architektur (1) Symmetric multiprocessor (SMP): Parallel Vector Processor (PVP) System ma minimum 2 lub dużo więcej procesorów o porównywalnych możliwościach

MIMD typy architektur (2) Uniform memory access (UMA): Zunifikowany dostęp do dzielonych zasobów pamięci Każdy procesor może mieć swój cache który nie jest wprost dostępny innym procesorom Processor 1 Processor 2 Communications Mechanism Shared Memory Processor n

MIMD typy architektur (3) Nonuniform memory access (NUMA): Dostęp do wszystkich lokacji pamięci nie jest jednakowy Dostęp do niektórych lokacji pamięci jest szybszy niż do innych, aczkolwiek każdy fragment pamięci jest osiągalny Processor 1 Processor 2 Processor n Memory 1 Memory 2 Memory n Communications Mechanism

MIMD typy architektur (4) Cache Coherent NUMA (CC-NUMA): Podobnie jak NUMA każdy procesor ma cache Cache może gromadzić dane z innych nie tych lokalnych dla procesora miejsc pamięci bonus! Może być, że te same dane będą zgromadzone w kilku cache-ach Rozwiązanie: Cache Only Memory Access (COMA)

MIMD typy architektur (5) Cache Only Memory Access (COMA): Pamięć lokalna procesora jak cache Kiedy procesor potrzebuje danych, których w lokalnej pamięci nie ma są one tam ładowane z pamięci podstawowej

MIMD typy architektur (6) Multicomputer: MIMD nie wszystkie procesory są kontrolowane jednym systemem operacyjnym Grupy procesorów / każdy procesor zarządzany odrębnymi systemami Dwa typy: - Network or Cluster of Workstations (NOW or COW) - Massively Parallel Processor (MPP)

MIMD typy architektur (7) Network of Workstation (NOW) lub Cluster of Workstation (COW): Grupa pracuje spięta siecią LAN Jest scheduler, który rządzi i zarządza pracą

MIMD typy architektur (8) Massively Parallel Processor (MPP): Mnogość węzłów każdy ma procesor, pamięć, osprzęt do funkcjonowania autonomicznego Dzielona pamięć daje szansę komunikacji Przykład: IBM s Blue Gene Computer

Miary i parametry (1) Computation/Communication Ratio Computation Time Communication Time t t comp comm Speedup Factor S( n) Ziarnistość zadania Execution time ( one processor system) Execution time ( multiprocessor system) t t Miara R-to-C - duża: mało komunikacji, poważne bloki rachunkowe - mała: dużo komunikacji, bloki obliczeniowe małe FTC, skalowalność s p

Miary i parametry (2) Max SpeedUp Amdahl s Law: S( n) ft s ts (1 f ) t s / n n 1 ( n 1) f f: The fraction of the serial computation

Miary i parametry (3)

Miary i parametry (4) Efektywność