Larrabee GPGPU. Zastosowanie, wydajność i porównanie z innymi układami

Larrabee GPGPU Zastosowanie, wydajność i porównanie z innymi układami

Larrabee a inne GPU Różnią się w trzech podstawowych aspektach:

Larrabee a inne GPU Różnią się w trzech podstawowych aspektach: Larrabee korzysta z zestawu instrukcji zgodnego z x86 i posiada rozszerzenia specyficzne dla swojej platformy

Larrabee a inne GPU Różnią się w trzech podstawowych aspektach: Larrabee korzysta z zestawu instrukcji zgodnego z x86 i posiada rozszerzenia specyficzne dla swojej platformy Larrabee zapewnia spójność pamięci podręcznej (cache) dla wszystkich swoich rdzeni.

Cache Coherency Cache coherency spójność pamięci podręcznej. Każdy klient, czyli w przypadku Larrabee rdzeń, posiada własny cache. Dzięki temu zachowana jest spójność danych podczas przetwarzania równoległego. Wszystkie układy posiadają swoją kopię pamięci.

Larrabee a inne GPU Różnią się w trzech podstawowych aspektach: Larrabee korzysta z zestawu instrukcji zgodnego z x86 i posiada rozszerzenia specyficzne dla swojej platformy Larrabee zapewnia spójność pamięci podręcznej (cache) dla wszystkich swoich rdzeni.

Larrabee a inne GPU Różnią się w trzech podstawowych aspektach: Larrabee korzysta z zestawu instrukcji zgodnego z x86 i posiada rozszerzenia specyficzne dla swojej platformy Larrabee zapewnia spójność pamięci podręcznej (cache) dla wszystkich swoich rdzeni Larrabee zawiera bardzo mało komponentów sprzętowo obsługujących specyficzne dla grafiki zadania

Larrabee a inne GPU Różnią się w trzech podstawowych aspektach: Larrabee korzysta z zestawu instrukcji zgodnego z x86 i posiada rozszerzenia specyficzne dla swojej platformy Larrabee zapewnia spójność pamięci podręcznej (cache) dla wszystkich swoich rdzeni Larrabee zawiera bardzo mało komponentów sprzętowo obsługujących specyficzne dla grafiki zadania Z-buffering, cliping, blending są rozwiązywane w zamian programowo z użyciem tile rendering.

Tile Rendering Tile Rendering to technika generowania dużych obrazów w małych częściach. Dzięki temu zajmowane jest mniej pamięci Rdzenie Larrabee mogą generować każdą płytkę równolegle

Możliwości Larrabee Dzięki swojej elastyczności chip Intela umożliwia wykonywanie w czasie rzeczywistym wielu operacji, których przeliczenie nie jest możliwe na innych GPU. Render target read Order-independent transparency Irregular shadow mapping Real-time raytracing

Order-Independent Transparency

Irregular Shadow Mapping

Real-Time Raytracing

Larrabee a inne CPU Bazują na projekcie P54C Pentium dla systemów wbudowanych. Są superskalarne, ale bez mechanizmu out-of-order execution. Dzięki temu zajmują mniej miejsca.

Superskalarność To technika umożliwiająca ukończenie kilku instrukcji w pojedynczym cyklu. Jest to możliwe dzięki zwielokrotnienie jednostek wykonawczych.

Larrabee a inne CPU Bazują na projekcie P54C Pentium dla systemów wbudowanych. Są superskalarne, ale bez mechanizmu out-of-order execution. Dzięki temu zajmują mniej miejsca.

Larrabee a inne CPU Bazują na projekcie P54C Pentium dla systemów wbudowanych. Są superskalarne, ale bez mechanizmu out-of-order execution. Dzięki temu zajmują mniej miejsca. Każdy rdzeń zawiera 512-bitową jednostkę SIMD, co daje 16-elementowe wektory floatów przetwarzane jednocześnie.

SIMD SIMD Single Instruction Multiple Data SSE to technologia, która umożliwia wykonanie jednej instrukcji na całym wektorze danych w tym samym czasie Długość wektora w x86 to 4 W Larrabee wynosi 16

Larrabee a inne CPU Bazują na projekcie P54C Pentium dla systemów wbudowanych. Są superskalarne, ale bez mechanizmu out-of-order execution. Dzięki temu zajmują mniej miejsca. Każdy rdzeń zawiera 512-bitową jednostkę SIMD, co daje 16-elementowe wektory floatów przetwarzane jednocześnie.

Larrabee a inne CPU Bazują na projekcie P54C Pentium dla systemów wbudowanych. Są superskalarne, ale bez mechanizmu out-of-order execution. Dzięki temu zajmują mniej miejsca Każdy rdzeń zawiera 512-bitową jednostkę SIMD, co daje 16-elementowe wektory floatów przetwarzane jednocześnie Posiada jednostkę teksturującą, która wykonuje filtrowanie trójliniowe i anizotropowe oraz dekompresję tekstur

Larrabee a inne CPU Bazują na projekcie P54C Pentium dla systemów wbudowanych. Są superskalarne, ale bez mechanizmu out-of-order execution. Dzięki temu zajmują mniej miejsca Każdy rdzeń zawiera 512-bitową jednostkę SIMD, co daje 16-elementowe wektory floatów przetwarzane jednocześnie Posiada jednostkę teksturującą, która wykonuje filtrowanie trójliniowe i anizotropowe oraz dekompresję tekstur Wykorzystuje 1024-bitową magistralę do komunikacji między rdzeniami i pamięcią

Larrabee a GMA GMA to układy o niskim koszcie produkcji i małym poborze mocy

Larrabee a GMA GMA to układy o niskim koszcie produkcji i małym poborze mocy Idealne do laptopów i mało wymagających zadań

Intel GMA

Larrabee a GMA GMA to układy o niskim koszcie produkcji i małym poborze mocy Idealne do laptopów i mało wymagających zadań

Larrabee a GMA GMA to układy o niskim koszcie produkcji i małym poborze mocy Idealne do laptopów i mało wymagających zadań Larrabee to GPU oddzielne od płyty głównej

Larrabee a GMA GMA to układy o niskim koszcie produkcji i małym poborze mocy Idealne do laptopów i mało wymagających zadań Larrabee to GPU oddzielne od płyty głównej Osobny od GMA zespół tworzący Larrabee

Larrabee a GMA GMA to układy o niskim koszcie produkcji i małym poborze mocy Idealne do laptopów i mało wymagających zadań Larrabee to GPU oddzielne od płyty głównej Osobny od GMA zespół tworzący Larrabee Odrębna grupa ludzi pisząca sterowniki i oprogramowanie

Wydajność Larrabee

Wydajność Larrabee 32 rdzenie x 16-elementowy wektor dla jednostki SSE x 2 FLOP (jednoczesne mnożenie i dodawanie) x 2GHz

Wydajność Larrabee 32 rdzenie x 16-elementowy wektor dla jednostki SSE x 2 FLOP (jednoczesne mnożenie i dodawanie) x 2GHz 2 TFLOPS