10.Architekturyspecjalizowane



Podobne dokumenty
10.Architekturyspecjalizowane

Adam Korzeniewski - p. 732 dr inż. Grzegorz Szwoch - p. 732 dr inż.

CYFROWE PRZETWARZANIE SYGNAŁÓW

Teoria przetwarzania A/C i C/A.

3. Przetwarzanie analogowo-cyfrowe i cyfrowo-analogowe... 43

Przykładowe pytania DSP 1

Współczesne techniki informacyjne

Generowanie sygnałów na DSP

Podstawy grafiki komputerowej

Grafika komputerowa i wizualizacja

Zastowowanie transformacji Fouriera w cyfrowym przetwarzaniu sygnałów

Transformata Fouriera

Budowa Mikrokomputera

Obraz jako funkcja Przekształcenia geometryczne

Technika audio część 2

Przetwornik analogowo-cyfrowy

Architektura systemu komputerowego. Działanie systemu komputerowego. Przerwania. Obsługa przerwań (Interrupt Handling)

Procesory sygnałowe Digital Signal Processors. Informatyka II stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny)

Kurs Zaawansowany S7. Spis treści. Dzień 1

Monitory Opracował: Andrzej Nowak

Adam Korzeniewski p Katedra Systemów Multimedialnych

Analiza obrazu. wykład 1. Marek Jan Kasprowicz Uniwersytet Rolniczy Marek Jan Kasprowicz Analiza obrazu komputerowego 2009 r.

KARTA MODUŁU KSZTAŁCENIA

FFT i dyskretny splot. Aplikacje w DSP

Podsystem graficzny. W skład podsystemu graficznego wchodzą: karta graficzna monitor

Podstawy Informatyki Systemy sterowane przepływem argumentów

Grafika Komputerowa Wykład 3. Wyświetlanie. mgr inż. Michał Chwesiuk 1/24

Przekształcenie Fouriera i splot

Wprowadzenie do architektury komputerów systemy liczbowe, operacje arytmetyczne i logiczne

Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) kierunkowy (podstawowy / kierunkowy / inny HES)

MIKROKONTROLERY I MIKROPROCESORY

GRAFIKA RASTROWA. WYKŁAD 1 Wprowadzenie do grafiki rastrowej. Jacek Wiślicki Katedra Informatyki Stosowanej

LABORATORIUM PROCESORY SYGNAŁOWE W AUTOMATYCE PRZEMYSŁOWEJ. Zasady arytmetyki stałoprzecinkowej oraz operacji arytmetycznych w formatach Q

2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20).

Adam Korzeniewski p Katedra Systemów Multimedialnych

Obraz cyfrowy. Radosław Mantiuk. Wydział Informatyki Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Architektura komputerów

Obliczenia Naukowe. Wykład 12: Zagadnienia na egzamin. Bartek Wilczyński

Julia 4D - raytracing

Akwizycja obrazów. Zagadnienia wstępne

Zygmunt Wróbel i Robert Koprowski. Praktyka przetwarzania obrazów w programie Matlab

Budowa komputera. Magistrala. Procesor Pamięć Układy I/O

Jednostka mnożąco-sumującą EMAC (Enhanced Multiply-ACcumulate unit)

PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK

Architektura Systemów Komputerowych. Jednostka ALU Przestrzeń adresowa Tryby adresowania

Przekształcenia widmowe Transformata Fouriera. Adam Wojciechowski

Architektura komputerów

Technikalia multimedialne. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

Sprawdzian test egzaminacyjny GRUPA I

Transformacja Fouriera i biblioteka CUFFT 3.0

Plan wykładu. Akcelerator 3D Potok graficzny

Ogólne informacje. cią pracy, wielkości wyświetlan. cią obrazu, wietlaną rozdzielczości. częstotliwo. wieŝania obrazu.

Mechatronika i inteligentne systemy produkcyjne. Modelowanie systemów mechatronicznych Platformy przetwarzania danych

Karty graficzne możemy podzielić na:

Adam Korzeniewski p Katedra Systemów Multimedialnych

Przetwarzanie sygnałów z zastosowaniem procesorów sygnałowych - opis przedmiotu

Przetworniki analogowo-cyfrowe

Systemy na Chipie. Robert Czerwiński

Podstawy Informatyki. Inżynieria Ciepła, I rok. Wykład 5 Liczby w komputerze

Układy arytmetyczne. Joanna Ledzińska III rok EiT AGH 2011

LEKCJA TEMAT: Zasada działania komputera.

Grafika Komputerowa Wykład 2. Przetwarzanie obrazów. mgr inż. Michał Chwesiuk 1/38

Sprzęt komputerowy 2. Autor prezentacji: 1 prof. dr hab. Maria Hilczer

Dane obrazowe. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

6. Algorytmy ochrony przed zagłodzeniem dla systemów Linux i Windows NT.

PROCESORY SYGNAŁOWE - LABORATORIUM. Ćwiczenie nr 04

Wprowadzenie do programowania na procesorze sygnałowym

Monitory LCD (ang. Liquid Crystal Display) (1)

Architektura komputerów

przedmiot kierunkowy (podstawowy / kierunkowy / inny HES) obieralny (obowiązkowy / nieobowiązkowy) polski semestr VI

PRZEWODNIK PO PRZEDMIOCIE

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

Arytmetyka stało i zmiennoprzecinkowa

Technologie Informacyjne

Przetwarzanie analogowo-cyfrowe sygnałów

Metody numeryczne Technika obliczeniowa i symulacyjna Sem. 2, EiT, 2014/2015

Przetwarzanie obrazu

Podstawy grafiki komputerowej. Teoria obrazu.

BIBLIOTEKA PROGRAMU R - BIOPS. Narzędzia Informatyczne w Badaniach Naukowych Katarzyna Bernat

Budowa komputera. Magistrala. Procesor Pamięć Układy I/O

9. Dyskretna transformata Fouriera algorytm FFT

AiR_CPS_1/3 Cyfrowe przetwarzanie sygnałów Digital Signal Processing

Spis treści. I. Skuteczne. Od autora... Obliczenia inżynierskie i naukowe... Ostrzeżenia...XVII

DYSKRETNA TRANSFORMACJA FOURIERA

Przekształcenia punktowe

Spis treúci. Księgarnia PWN: Krzysztof Wojtuszkiewicz - Urządzenia techniki komputerowej. Cz. 1. Przedmowa Wstęp... 11

KARTA PRZEDMIOTU. Techniki przetwarzania sygnałów, D1_3

Podstawy Informatyki

FPGA IMPLEMENTATION OF FAST FOURIER TRANSFORM ALGORITHM IMPLEMENTACJA ALGORYTMU SZYBKIEJ TRANSFORMATY FOURIERA W UKŁADZIE PROGRAMOWALNYM FPGA

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 1 AiR III

0. OpenGL ma układ współrzędnych taki, że oś y jest skierowana (względem monitora) a) w dół b) w górę c) w lewo d) w prawo e) w kierunku do

Kod IEEE754. IEEE754 (1985) - norma dotycząca zapisu binarnego liczb zmiennopozycyjnych (pojedynczej precyzji) Liczbę binarną o postaci

dr inż. Piotr Odya dr inż. Piotr Suchomski

Adam Korzeniewski p Katedra Systemów Multimedialnych

Implementacja sieci neuronowych na karcie graficznej. Waldemar Pawlaszek

INFORMATYKA WSTĘP DO GRAFIKI RASTROWEJ

Adam Korzeniewski p Katedra Systemów Multimedialnych

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 2 AiR III

Dane, informacja, programy. Kodowanie danych, kompresja stratna i bezstratna

Systemy operacyjne i sieci komputerowe Szymon Wilk Superkomputery 1

Transkrypt:

Materiały do wykładu 10.Architekturyspecjalizowane Marcin Peczarski Instytut Informatyki Uniwersytet Warszawski 27maja2014

Architektury do specyficznych zastosowań 10.1 DSP Digital Signal Processing cyfrowe przetwarzanie sygnałów Digital Signal Processor procesor sygnałowy GPU Graphics Processing Unit procesor graficzny

Dziedziny telekomunikacja radiolokacja sprzęt audio-wideo medycyna Przykładowe aplikacje kompresja i dekompresja sygnału mowy wykrywanie rodzaju obiektu latającego magnetyczny rezonans jądrowy tomografia komputerowa Zastosowania DSP 10.2

Twierdzenie o próbkowaniu Dlaczego to działa? 10.3 Jeżeli sygnał ciągły w czasie x(t) zawiera tylko składowe o częstotliwościachponiżejf 0 /2,tojestjednoznaczniereprezentowany przezswojewartościwdyskretnychchwilachczasux(n/f 0 ),gdzie ntoliczbacałkowita,af 0 toczęstotliwośćpróbkowania. x(t) x(n/f 0 ) t przed próbkowaniem n po próbkowaniu

Twierdzenie o próbkowaniu odzyskiwanie sygnału 10.4 Przy pewnych założeniach zachodzi x(t)= n= x(n/f 0 )S(tf 0 n), gdzie S(τ)= { sinπτ πτ, gdyτ 0; 1, gdyτ=0.

Zamiana wartości próbki na liczbę Rozdzielczość, liczba bitów reprezentacji n Kwantowanie 10.5 Proces nieodwracalny wartości zaokrąglane do najbliższej reprezentowalnej wartości Szum kwantowania SNR[dB]=20nlog2+10log 3 4 6n 1,25 Równomierne, liniowe Nierównomierne, nieliniowe: A-law, µ-law

Dlaczego to działa? 10.6 Wrażenie widzenia przez ludzkie oko prawie dowolnej barwy można wywołać przez sumowanie z wagami trzech kolorów podstawowych: czerwony 700,1 nm, zielony 546,1 nm, niebieski 435,8 nm. Metoda sumowania przestrzennego: oko ludzkie nie rozróżnia blisko leżących punktów. Metoda sumowania czasowego: oko ludzkie nie rozróżnia zmian o częstotliwości powyżej kilkunastu Hz.

Arytmetyka procesorów sygnałowych 10.7 Arytmetyka stałopozycyjna U2 b 0,b 1...b n 2 b n 1 b 0 + n 1 i=1 b i 2 i Reprezentuje wartości z przedziału[ 1, 1). Mnożenie liczb z przedziału( 1, 1) nie powoduje przepełnienia. Mnożenie 1 razy 1 powoduje przepełnienie. Dodawanie z nasyceniem

Typowe operacje DSP(1) 10.8 Filtr SOI(skończona odpowiedź impulsowa, ang. FIR finite impulse response) n y t = b i x t i i=0 Filtr NOI(nieskończona odpowiedź impulsowa, ang. IIR infinite impulse response) y t = m a i y t i + n b i x t i i=1 i=0

Typowe operacje DSP(2) 10.9 Splot z n = n x i y n i i=0 Dyskretne przekształcenie Fouriera(DFT) A m = N 1 n=0 a n w mn

Opearacja MAC 10.10 Typowe operacje DSP pelegają na mnożeniu z akumulacją wyniku a:=a+x i y j MAC multiply and accumulate a:=a+x[i] y[j] i:=(i+1)modn j:=(j 1)modn Wyniki pośrednie w rejestrach tymczasowych o zwiększonej precyzji

MAC(1) 10.11 Liczymya t = 3 i=0 x iy t i dlakolejnychindeksówt. Inicjujemya t :=0iindeksyi:=0,j:=tmod4. x 3 y t 2 x 2 x 1 y t 3 y t j i x 0 y t 1 PoczterechoperacjachMACdostajemya t = 3 i=0 x iy t i. Indeksy wskazują na pierwotne pozycje.

MAC(2) 10.12 Inicjujemya t+1 :=0iprzesuwamyindeksj:=(j+1)mod4. Zamieniamyniepotrzebnąjużpróbkęy t 3 nanowąy t+1. x 3 y t 2 x 2 y t+1 j i x 1 x 0 y t y t 1 PokolejnychczterechoperacjachMACa t+1 = 3 i=0 x iy t+1 i. Powtarzamypowyższykrokdlat+2,t+3,...

Szybkie przekształcenie Fouriera FFT 10.13 Sprzętowe wsparcie dla operacji występujących w algorytmie FFT Operacja motylkowa x:=x+ωy y:=x ωy Operacja odwracania bitów 01011100 00111010

Systemy czasu rzeczywistego Cechy procesorów sygnałowych 10.14 ściśle oganiczony czas przetwarzania jednej próbki sygnału szybka obsługa przerwań Równoległy dostęp do kodu instrukcji i argumentów architektura harwardzka Brak sprzętowego wsparcia dla wielozadaniowości Wykonywanie pętli bez przerywania potoku Wbudowane interfejsy szeregowe dla wprowadzania i wyprowadzania przetwarzanego ciągu danych

Wyświetlanie obrazów 10.15 CRT(ang. cathode ray tube) kineskop, lampa katodowa LCD(ang. liquid crystal display) wyświetlacz ciekłokrystaliczny DLP(ang. digital light processing), DMD(ang. digital micromirror device) Ekran plazmowy(ang. plasma display panel) LED(ang. light-emitting diode display) wyświetlacz z diodami elektroluminescencyjnymi OLED(ang. organic light-emitting diode displays) wyświetlacz z organicznymi diodami elektroluminescencyjnymi e-papier,nanorurki,...

Parametry monitorów 10.16 Rozdzielczość Częstotliwość odchylania pionowego liczba obrazów(półobrazów) na sekundę Sposób wyświetlania przeplot(ang. interlace) skanowanie progresywne(ang. progressive, noninterlaced scanning)

Głębia kolorów 10.17 Obraz czarno-biały 1bitnapiksel Paleta kolorów 16kolorów,4bity 256kolorów,8bitów Kolor bezpośrednio 8bitów czerwonyizielony3bity,niebieski2bity 15bitów 5bitównakolor 16bitów czerwonyiniebieski5bitów,zielony6bitów 24bity 8bitównakolor

Rozwój procesorów graficznych 10.18 Specjalizowane układy scalone generujące sygnały dla monitora na podstawie zawartości pamięci obrazu Sprzętowe wspomaganie animacji w grach komputerowych duszki Wsparcie dla operacji graficznych tłumaczenie wysokopoziomowego opisu na postać pikseli nadawanie faktury figurom geometrycznym transformacje układu współrzędnych operacje wektorowe i macierzowe Użycie procesorów graficznych do obliczeń niezwiązanych z grafiką Karty graficzne bez złącza do monitora! IntegrowanieGPUzCPU

Ogólna architektura 10.19 GPU pamięć CPU CPU GPU pamięć pamięć PCI Express DMA

Uproszczenia arytmetyki procesorów graficznych 10.20 Głównie operacje zmiennoprzecinkowe pojedynczej precyzji Brak wsparcia dla liczb zdenormalizowanych Dzielenie implementowane jako mnożenie przez odwrotność Tylko tryby zaokrąglania do najbliższej parzystej i obcięcie Ograniczone wsparcie dla NaN Pamięć tekstury indeksowana wartościami zmiennoprzecinkowymi, różne tryby interpolacji

Architektura procesorów graficznych(1) 10.21 Procesor ma wiele jednostek wykonawczych Zadaniedzielisięnawątki W danej chwili jedna jednostka wykonawcza wykonuje jeden wątek Wątki mogą być ułożone w jedno-, dwu- lub trójwymiarową tablicę Wszystkie wątki wykonują ten sam kod Wątek ma dostęp do identyfikatora, składającego się z indeksów w tablicy, dzięki czemu wątki mogą wykonywać różne obliczenia

Architektura procesorów graficznych(2) 10.22 Wątki wykonywane są symultanicznie w paczkach, aby ukryć opóźnienia w dostępie do pamięci graficznej Szybkie przełączanie paczek wątków Wątki w obrębie jednej paczki wykonują równocześnie tę samą instrukcję Jeśli warunek w kodzie powoduje, że pewna instrukcja ma być wykonana tylko przez niektóre wątki w paczce, to pozostałe wątki muszą czekać

Architektura procesorów graficznych(3) 10.23 Wątki dzielą się zasobami: rejestry i pamięć Wątki komunikują się przez pamięć Odczyty z pamięci mogą odbywać się równocześnie, jeśli dotyczą różnych banków albo wszystkie odwołują się do tego samego adresu Jawne zarządzanie hierarchią pamięci