Larrabee GPGPU Zastosowanie, wydajność i porównanie z innymi układami
Larrabee a inne GPU Różnią się w trzech podstawowych aspektach:
Larrabee a inne GPU Różnią się w trzech podstawowych aspektach: Larrabee korzysta z zestawu instrukcji zgodnego z x86 i posiada rozszerzenia specyficzne dla swojej platformy
Larrabee a inne GPU Różnią się w trzech podstawowych aspektach: Larrabee korzysta z zestawu instrukcji zgodnego z x86 i posiada rozszerzenia specyficzne dla swojej platformy Larrabee zapewnia spójność pamięci podręcznej (cache) dla wszystkich swoich rdzeni.
Cache Coherency Cache coherency spójność pamięci podręcznej. Każdy klient, czyli w przypadku Larrabee rdzeń, posiada własny cache. Dzięki temu zachowana jest spójność danych podczas przetwarzania równoległego. Wszystkie układy posiadają swoją kopię pamięci.
Larrabee a inne GPU Różnią się w trzech podstawowych aspektach: Larrabee korzysta z zestawu instrukcji zgodnego z x86 i posiada rozszerzenia specyficzne dla swojej platformy Larrabee zapewnia spójność pamięci podręcznej (cache) dla wszystkich swoich rdzeni.
Larrabee a inne GPU Różnią się w trzech podstawowych aspektach: Larrabee korzysta z zestawu instrukcji zgodnego z x86 i posiada rozszerzenia specyficzne dla swojej platformy Larrabee zapewnia spójność pamięci podręcznej (cache) dla wszystkich swoich rdzeni Larrabee zawiera bardzo mało komponentów sprzętowo obsługujących specyficzne dla grafiki zadania
Larrabee a inne GPU Różnią się w trzech podstawowych aspektach: Larrabee korzysta z zestawu instrukcji zgodnego z x86 i posiada rozszerzenia specyficzne dla swojej platformy Larrabee zapewnia spójność pamięci podręcznej (cache) dla wszystkich swoich rdzeni Larrabee zawiera bardzo mało komponentów sprzętowo obsługujących specyficzne dla grafiki zadania Z-buffering, cliping, blending są rozwiązywane w zamian programowo z użyciem tile rendering.
Tile Rendering Tile Rendering to technika generowania dużych obrazów w małych częściach. Dzięki temu zajmowane jest mniej pamięci Rdzenie Larrabee mogą generować każdą płytkę równolegle
Możliwości Larrabee Dzięki swojej elastyczności chip Intela umożliwia wykonywanie w czasie rzeczywistym wielu operacji, których przeliczenie nie jest możliwe na innych GPU. Render target read Order-independent transparency Irregular shadow mapping Real-time raytracing
Order-Independent Transparency
Irregular Shadow Mapping
Real-Time Raytracing
Larrabee a inne CPU Bazują na projekcie P54C Pentium dla systemów wbudowanych. Są superskalarne, ale bez mechanizmu out-of-order execution. Dzięki temu zajmują mniej miejsca.
Superskalarność To technika umożliwiająca ukończenie kilku instrukcji w pojedynczym cyklu. Jest to możliwe dzięki zwielokrotnienie jednostek wykonawczych.
Larrabee a inne CPU Bazują na projekcie P54C Pentium dla systemów wbudowanych. Są superskalarne, ale bez mechanizmu out-of-order execution. Dzięki temu zajmują mniej miejsca.
Larrabee a inne CPU Bazują na projekcie P54C Pentium dla systemów wbudowanych. Są superskalarne, ale bez mechanizmu out-of-order execution. Dzięki temu zajmują mniej miejsca. Każdy rdzeń zawiera 512-bitową jednostkę SIMD, co daje 16-elementowe wektory floatów przetwarzane jednocześnie.
SIMD SIMD Single Instruction Multiple Data SSE to technologia, która umożliwia wykonanie jednej instrukcji na całym wektorze danych w tym samym czasie Długość wektora w x86 to 4 W Larrabee wynosi 16
Larrabee a inne CPU Bazują na projekcie P54C Pentium dla systemów wbudowanych. Są superskalarne, ale bez mechanizmu out-of-order execution. Dzięki temu zajmują mniej miejsca. Każdy rdzeń zawiera 512-bitową jednostkę SIMD, co daje 16-elementowe wektory floatów przetwarzane jednocześnie.
Larrabee a inne CPU Bazują na projekcie P54C Pentium dla systemów wbudowanych. Są superskalarne, ale bez mechanizmu out-of-order execution. Dzięki temu zajmują mniej miejsca Każdy rdzeń zawiera 512-bitową jednostkę SIMD, co daje 16-elementowe wektory floatów przetwarzane jednocześnie Posiada jednostkę teksturującą, która wykonuje filtrowanie trójliniowe i anizotropowe oraz dekompresję tekstur
Larrabee a inne CPU Bazują na projekcie P54C Pentium dla systemów wbudowanych. Są superskalarne, ale bez mechanizmu out-of-order execution. Dzięki temu zajmują mniej miejsca Każdy rdzeń zawiera 512-bitową jednostkę SIMD, co daje 16-elementowe wektory floatów przetwarzane jednocześnie Posiada jednostkę teksturującą, która wykonuje filtrowanie trójliniowe i anizotropowe oraz dekompresję tekstur Wykorzystuje 1024-bitową magistralę do komunikacji między rdzeniami i pamięcią
Larrabee a GMA GMA to układy o niskim koszcie produkcji i małym poborze mocy
Larrabee a GMA GMA to układy o niskim koszcie produkcji i małym poborze mocy Idealne do laptopów i mało wymagających zadań
Intel GMA
Larrabee a GMA GMA to układy o niskim koszcie produkcji i małym poborze mocy Idealne do laptopów i mało wymagających zadań
Larrabee a GMA GMA to układy o niskim koszcie produkcji i małym poborze mocy Idealne do laptopów i mało wymagających zadań Larrabee to GPU oddzielne od płyty głównej
Larrabee a GMA GMA to układy o niskim koszcie produkcji i małym poborze mocy Idealne do laptopów i mało wymagających zadań Larrabee to GPU oddzielne od płyty głównej Osobny od GMA zespół tworzący Larrabee
Larrabee a GMA GMA to układy o niskim koszcie produkcji i małym poborze mocy Idealne do laptopów i mało wymagających zadań Larrabee to GPU oddzielne od płyty głównej Osobny od GMA zespół tworzący Larrabee Odrębna grupa ludzi pisząca sterowniki i oprogramowanie
Wydajność Larrabee
Wydajność Larrabee 32 rdzenie x 16-elementowy wektor dla jednostki SSE x 2 FLOP (jednoczesne mnożenie i dodawanie) x 2GHz
Wydajność Larrabee 32 rdzenie x 16-elementowy wektor dla jednostki SSE x 2 FLOP (jednoczesne mnożenie i dodawanie) x 2GHz 2 TFLOPS