PlayStation3. Michał Zarychta



Podobne dokumenty
Przegląd architektury PlayStation 3

Obliczenia równoległe na klastrze opartym na procesorze CELL/B.E.

PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK

Od uczestników szkolenia wymagana jest umiejętność programowania w języku C oraz podstawowa znajomość obsługi systemu Linux.

i3: internet - infrastruktury - innowacje

Wykład 6. Mikrokontrolery z rdzeniem ARM

SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA

Architektura Systemów Komputerowych. Rozwój architektury komputerów klasy PC

PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK

Wysokowydajna implementacja kodów nadmiarowych typu "erasure codes" z wykorzystaniem architektur wielordzeniowych

16. Taksonomia Flynn'a.

Od uczestników szkolenia wymagana jest umiejętność programowania w języku C oraz podstawowa znajomość obsługi systemu Windows.

Programowanie procesorów graficznych GPGPU

TX-SR309. Amplituner kina domowego 5.1

Podstawowe zagadnienia

ERION KOMPUTE. Lenovo ThinkPad T440P i7-4810mq 16GB 14" FullHD 512GB [SSD] GT730M (1GB) W7Pro/W8.1Pro 3Y On-Site 20AWA1G3PB

RDZEŃ x86 x86 rodzina architektur (modeli programowych) procesorów firmy Intel, należących do kategorii CISC, stosowana w komputerach PC,

Podsystem graficzny. W skład podsystemu graficznego wchodzą: karta graficzna monitor

Algorytmy i Struktury Danych

>>> Techniki rozbudowy systemów wbudowanych >>> Biblioteki wspomagające rozbudowę systemów wbudowanych. Name: Mariusz Naumowicz Date: 29 maja 2019

CZĘŚĆ I ZAMÓWIENIA DOSTAWA SPRZĘTU INFORMATYCZNEGO DO PROJEKTU DOMOWY ASYSTENT OSÓB STARSZYCH I CHORYCH

Sprzęt komputerowy 2. Autor prezentacji: 1 prof. dr hab. Maria Hilczer

Załącznik nr 6 do SIWZ nr postępowania II MJ Zaoferowany. sprzęt L P. Parametry techniczne

Obliczenia równoległe i rozproszone. Praca zbiorowa pod redakcją Andrzeja Karbowskiego i Ewy Niewiadomskiej-Szynkiewicz

Czym jest Java? Rozumiana jako środowisko do uruchamiania programów Platforma software owa

Wymagane parametry techniczne laptopa

Architektura mikroprocesorów TEO 2009/2010

PAKIET nr 12 Instytut Fizyki Teoretycznej

SPRZT DLA JEDNOSTEK ORGANIZACYJNYCH

1. KOMPUTEROWA STACJA ROBOCZA - konfiguracja wzorcowa lub inny równoważny

Dane Techniczne TH ALPLAST ADS-S25

Załacznik nr 4 do SIWZ - OPIS PRZEDMIOTU ZAMÓWIENIA- załącznik do Formularza Oferty

SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA

Szczegółowy opis przedmiotu zamówienia Laptop typ I - 34 szt Laptop typ II 6 szt. Specyfikacja

SPECYFIKACJA TECHNICZNA (minimalne parametry techniczne)

Programowanie z wykorzystaniem technologii CUDA i OpenCL Wykład 1

Architektura komputerów

Opis przedmiotu zamówienia- postępowanie o udzielenia zamówienia do euro.

Dariusz Brzeziński. Politechnika Poznańska, Instytut Informatyki

Tworzenie programów równoległych. Krzysztof Banaś Obliczenia równoległe 1

Szczegółowy opis przedmiotu zamówienia Laptop typ I - 34 szt Laptop typ II 6 szt. Specyfikacja

OPIS PRZEDMIOTU ZAMÓWIENIA Zapytanie ofertowe na Dostawę sprzętu multimedialnego

Programowanie równoległe i rozproszone. Praca zbiorowa pod redakcją Andrzeja Karbowskiego i Ewy Niewiadomskiej-Szynkiewicz

Implementacje algorytmów oddziałujących cząstek na architekturach masywnie równoległych

Metody optymalizacji soft-procesorów NIOS

Załącznik Nr 1: Specyfikacja Techniczna opis przedmiotu zamówienia. CZĘŚĆ I Komputer stacjonarny - 32 szt.

Technika mikroprocesorowa. Linia rozwojowa procesorów firmy Intel w latach

Mikroprocesory rodziny INTEL 80x86

OPIS PRZEDMIOTU ZAMÓWIENIA

Wydajność programów sekwencyjnych. Krzysztof Banaś Obliczenia Wysokiej Wydajności 1

Budowa komputera. Magistrala. Procesor Pamięć Układy I/O

PAKIET nr 8 Instytut Astronomiczny

Podstawy Technik Informatycznych. Mariusz Stenchlik

Dane Techniczne TH ALPLAST ADS-S25

/wpisać: model, symbol, producent urządzenia/

2,4 razy. 3 razy. 2,3 razy EKSTREMALNA MEGAZADANIOWOŚĆ NAWET NAWET NAWET

PYTANIA BUDOWA KOMPUTERA kartkówki i quizy

Programowanie współbieżne i rozproszone

Tworzenie programów równoległych. Krzysztof Banaś Obliczenia równoległe 1

Programowanie Rozproszone i Równoległe

Min. 256 GB, dysk półprzewodnikowy SSD, złącze M.2.

6. Algorytmy ochrony przed zagłodzeniem dla systemów Linux i Windows NT.

1. Komputer przenośny nr 1 9 szt.

Zarządzanie pamięcią operacyjną

Kupuj! Tuner DVB-T MPEG 4. USB Multimedialne. 100 Hz MCI

Lp. Nazwa Parametry techniczne

Podstawy Informatyki. Michał Pazdanowski

Informatyka - studium realizacji dźwięku -

1.Wstęp. 2.Generowanie systemu w EDK

NR PRDUKTU: 1 ASUS K50IJ

Opis przedmiotu zamówienia. I. Zestaw wieża z kolumnami i odtwarzaczem CD - szt.11 CPV

Stosowanie tego urządzenia zwiększa możliwości stosowanego sprzętu jak i sofware.

Wykorzystanie architektury Intel MIC w obliczeniach typu stencil

Wprowadzenie do systemów operacyjnych

System obliczeniowy laboratorium oraz. mnożenia macierzy

Zaawansowane programowanie w języku C++ Zarządzanie pamięcią w C++

Przyspieszanie sprzętowe

O superkomputerach. Marek Grabowski

Wydajność systemów a organizacja pamięci, czyli dlaczego jednak nie jest aż tak źle. Krzysztof Banaś, Obliczenia wysokiej wydajności.

OPIS PRZEDMIOTU ZAMÓWIENIA SPECYFIKACJA SPRZĘTU KOMPUTEROWEGO

Tworzenie plików w formacie DjVu z wykorzystaniem oprogramowania DocumentExpress Enterprise Edition

ZAPYTANIE OFERTOWE. na dostawę sprzętu komputerowego o wartości poniżej euro

Porównanie wydajności CUDA i OpenCL na przykładzie równoległego algorytmu wyznaczania wartości funkcji celu dla problemu gniazdowego

Specyfikacja sprzętowa

Programowanie procesorów graficznych NVIDIA (rdzenie CUDA) Wykład nr 1

Systemy operacyjne. Systemy operacyjne. Systemy operacyjne. Zadania systemu operacyjnego. Abstrakcyjne składniki systemu. System komputerowy

Niniejszy załącznik zawiera opis techniczny oferowanego przedmiotu zamówienia.

Programowanie współbieżne Wykład 2. Iwona Kochańska

ROZEZNANIE CENOWE. Zapytanie ofertowe

Składowanie, archiwizacja i obliczenia modelowe dla monitorowania środowiska Morza Bałtyckiego

Wydajność systemów a organizacja pamięci. Krzysztof Banaś, Obliczenia wysokiej wydajności. 1

T2: Budowa komputera PC. dr inż. Stanisław Wszelak

Procesory. Schemat budowy procesora

ZAPYTANIE OFERTOWE. 1. Przedmiot zamówienia: 1.1. Stacjonarny zestaw komputerowy

Tworzenie programów równoległych cd. Krzysztof Banaś Obliczenia równoległe 1

Specyfikacja sprzętu komputerowego

Zadanie Nr 1. Ilość. Oferowany sprzęt: nazwa, model/typ. cena jedn. brutto. Laptop z oprogramowaniem o parametrach. wartość brutto

Zarządzanie pamięcią w systemie operacyjnym

Specyfikacja Zamawianego sprzętu. Drukarka typ 1. 10szt. Lp. Parametr Charakterystyka (minimalne wymagania)

CZĘŚĆ III ZAMÓWIENIA. Opis przedmiotu zamówienia sprzętu audiowizualnego

Transkrypt:

PlayStation3 Michał Zarychta 1

Plan prezentacji Hardware Procesor CELL Techniki programowania Modele programistyczne Ograniczenia Hello WORLD 2

PlayStation3 Lab 200 x PS3 atak na MD5 (RapidSSL) 3

Hardware Płyta główna 4

Hardware Pamięć 256 MB Rambus XDR taktowanie: 400 MHz (3,2 GHz efektywnie) przepustowość: 25,6 GB/s 256 MB GDDR3 taktowanie: 650 MHz (1,3 GHz efektywnie) przepustowość: 22,4 GB/s 5

Hardware RSX Hybryda G70/G71 (nvidia 7800GTX) 8 jednostek vertex shader 28 jednostek pixel shader 8 potoków operacji rastrowych (ROP) 256 MB GDDR3 128 bitowa szyna danych dla pamięci Architektura 90nm/65nm API: PSGL lub LibGCM 6

Hardware Muzyka Linear PCM, Dolby TrueHD, Dolby Digital Plus, dts-hd Master Audio, dts Digital Surround, SACD, DVD-Audio, dts 5.1 Music Disc, HDCD, CD, ACC, MP4, MP3, WMV, ATRAC, WAV HDMI, TOSLINK, AV Multi Cable Obraz MPEG-1, MPEG-2, MPEG-4, AVI, DivX, WMV, AVCHD Full High Definition 1920x1080p HDMI, DVI-D, Component, SCART, S-Video Pamięć masowa Blu-ray, DVD, CD HDD SATA Komunikacja Bluetooth, USB, WiFi, Gigabit Ethernet 7

CELL Broadband Engine 1 PPE (PowerPC Processor Element) 3,2 GHz 64 bit 2 wątki L1 cache: 32 kb danych + 32 kb instrukcje L2 cache: 512 kb 8 SPE (Synergistic Processor Element) 3,2 GHz 64 bit 1 SPE uśpione 1 SPE dedykowane do bezpieczeństwa 128 rejestrów dla SPE 2 instrukcje na takt zegara Wydajność 204,8 GFLOPS (Xbox 115,2 GFLOPS) 8

CELL Architektura 9

Software System operacyjny Game OS Linux Fedora Core 5 YellowDog 5.0 Gentoo PowerPC 64 edition Debian IBM CELL SDK Kompilator gcc lspe2 spu-gcc 10

Short Vector SIMD Wysoka wydajność na wektorach Bardzo niska wydajność na skalarach Tworzenie szkieletu Optymalizacja Przejście na wektory 11

Intra-Chip Communication DMA Wymiana danych pomiędzy pamięcią główną i pamięciami lokalnymi jednostek SPE Rozmiar wiadomości: 1,2,4,6,16 bajtów lub wielokrotność 16 bajtów (max 16kB) Brak szeregowania wiadomości DMA Transfer wiadomości nieblokujący Maksymalnie 16 odwołań w kolejce (dla kaŝdego z SPE) spe_get_ls() 12

Intra-Chip Communication Mailboxes Krótkie wiadomości 32 bity PPE do SPE, pomiędzy SPE Kolejki FIFIO Transfer wiadomości blokujący 13

CorePy projekt Indiana University (open source) język programowania Python libspe 1.x bezpośrednia komunikacja z SPU konsola SPU instrukcje dla SPU w czasie rzeczywistym (+ debugger) 14

Octopiler kompilator badawczy IBM 2 waŝne zmiany automatyczne SIMD automatyczne zarządzanie wykorzystaniem pamięci uŝywanej do obliczeń równoległych 15

RapidMind komercyjne narzędzie rozszerzenie umoŝliwiające korzystanie ze zwykłego C++ framework do uruchamiania procesów równoległych dynamiczna kontrola przepływów 16

PeakStream platforma do tworzenia palikacji 4 komponenty PeakStream APIs PeakStream VM PeakStream Profiler PeakStream Debugger podstawowy typ - tablice 17

MPI Microtask projekt badawczy IBM optymalizacja procesowania równoległego odpowiedzialność preprocesora generowanie grafu procesów klastrowanie zadań harmonogramowanie zadań odpowiedzialność środowiska uruchomieniowego synchronizacja Zmiana kontekstu buforowanie komunikacji mikro zadania = virtualne SPE 18

Cell Superscalar framework (Barcelona Supercomputer Center) fragment projektu Grid Superscalar kod pisany sekwencyjnie uruchomienie z wykorzystaniem grafu zaleŝności węzeł funkcje SPE krawędź przekazanie danych przetwarzanie równoległe niezaleŝne wierzchołki dla róŝnych SPE w tym samym czasie 19

The Sequoia Language projekt badawczy na Stanford University język programowania dla programów przenośnych wykorzystujących hierarchię pamięci implementacja zadań jako funkcji mapa wykonania zadanie związane z węzłem w drzewie pamięci wirtualne poziomy pamięci globalna wirtualna pamięć dzielona 20

Mercury Multi-Core Framework komercyjny produkt biblioteka MFC PPE manager odpowiedzialny za uruchomienie i kontrolę SPE pracownicy odpowiedzialni za przetwarzanie danych synchronizacja pracowników z wykorzystaniem semaforów dwustronna komunikacja (podobna do MPI) Data Reorganization Interface komunikacja DMA z wykorzystaniem put i get 21

IBM Accelerated Library Framework środowisko programistyczne mające na celu uproszczenie kodowania aplikacji równoległych ALF to część CELL SDK podział programistów programiści jądra programiści bibliotek programiści aplikacji dwa rodzaje zadań zadania kontrolne generowanie zadań z PPE do SPE zadania obliczeniowe uruchamiane równolegle na SPE blokujące bufory danych 22

Hello WORLD SPE 23

Hello WORLD PPE 24

Koniec Pytania? 25