Program wykładu. 1. Systemy rejestracji obrazów technologie CCD, CMOS

Podobne dokumenty
Wszechnica Poranna: Multimedia, grafika i technologie internetowe Techniki rejestracji, obróbki i wizualizacji obrazów ruchomych.

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

Kompresja sekwencji obrazów - algorytm MPEG-2

Kompresja sekwencji obrazów

Założenia i obszar zastosowań. JPEG - algorytm kodowania obrazu. Geneza algorytmu KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

Joint Photographic Experts Group

Akwizycja obrazów. Zagadnienia wstępne

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Kompresja dźwięku w standardzie MPEG-1

Kompresja video (MPEG)

KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

Zastosowanie kompresji w kryptografii Piotr Piotrowski

Wstęp do techniki wideo

Obraz jako funkcja Przekształcenia geometryczne

Kompresja obrazów w statycznych - algorytm JPEG

Rejestracja obrazu. Budowa kamery

dr inż. Piotr Odya dr inż. Piotr Suchomski

Nowoczesne metody emisji ucyfrowionego sygnału telewizyjnego

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG

Python: JPEG. Zadanie. 1. Wczytanie obrazka

Kodowanie i kompresja Streszczenie Studia Wieczorowe Wykład 10, 2007

Cyfrowe Przetwarzanie Obrazów. Karol Czapnik

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Wybrane metody kompresji obrazów

Sygnał a informacja. Nośnikiem informacji mogą być: liczby, słowa, dźwięki, obrazy, zapachy, prąd itp. czyli różnorakie sygnały.

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 2 AiR III

Kodowanie źródeł sygnały video. Sygnał video definicja i podstawowe parametry

Cyfrowe przetwarzanie i kompresja danych. dr inż.. Wojciech Zając

Transformata Fouriera

Przetwarzanie analogowo-cyfrowe sygnałów

NOWOCZESNE METODY EMISJI UCYFROWIONEGO SYGNAŁU TELEWIZYJNEGO

Systemy plezjochroniczne (PDH) synchroniczne (SDH), Transmisja w sieci elektroenergetycznej (PLC Power Line Communication)

Treści multimedialne - kodowanie, przetwarzanie, prezentacja

Szybkie skanowanie liniowe. Skanery Liniowe - - technologia inspekcji przemysłowej

Klasyfikacja metod kompresji

dr inż. Piotr Odya Wprowadzenie

TECHNIKI MULTIMEDIALNE

1 Detektor CCD. aparaty cyfrowe kamery VIDEO spektroskopia mikrofotografia astrofizyka inne

INFORMATYKA WSTĘP DO GRAFIKI RASTROWEJ

Grafika komputerowa. Oko posiada pręciki (100 mln) dla detekcji składowych luminancji i 3 rodzaje czopków (9 mln) do detekcji koloru Żółty

Przetwornik analogowo-cyfrowy

Klasyfikacja metod kompresji

Audio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

Grafika Komputerowa Wykład 2. Przetwarzanie obrazów. mgr inż. Michał Chwesiuk 1/38

Cechy karty dzwiękowej

Przykładowe zadanie praktyczne

Waldemar Izdebski - Wykłady z przedmiotu SIT / Mapa zasadnicza 30

wzór filtrów czerwonych wzór filtrów zielonych wzór filtrów niebieskich

Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński

0. OpenGL ma układ współrzędnych taki, że oś y jest skierowana (względem monitora) a) w dół b) w górę c) w lewo d) w prawo e) w kierunku do

Dane obrazowe. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

Teoria przetwarzania A/C i C/A.

Photoshop. Podstawy budowy obrazu komputerowego

Budowa i zasada działania skanera

ALA MA KOTA MEDIA - OBRAZ OBRAZ. Operacje na obrazie. Informacja ukryta w teksturach, hierarchii krawędzi. Obraz to kompozycja:

Tworzenie obrazu w aparatach cyfrowych

matrycę. W chwili wykonywania zdjęcia lustro obraca się tak, by światło padało na matrycę. Zaletą lustrzanek jest możliwość wymiany obiektywów.

GRAFIKA RASTROWA. WYKŁAD 1 Wprowadzenie do grafiki rastrowej. Jacek Wiślicki Katedra Informatyki Stosowanej

Przetwarzanie i transmisja danych multimedialnych. Wykład 10 Kompresja obrazów ruchomych MPEG. Przemysław Sękalski.

Do opisu kolorów używanych w grafice cyfrowej śluzą modele barw.

fazy tworzenia filmu preprodukcja szkice, rysunki, plany produkcji... produkcja nagrywanie scen postprodukcja montaż, korekcja, podkład dźwiękowy

Adam Korzeniewski p Katedra Systemów Multimedialnych

Kodowanie transformujace. Kompresja danych. Tomasz Jurdziński. Wykład 11: Transformaty i JPEG

Urządzenia do wprowadzania informacji graficznej. Skanery, Digitizery, Aparaty i Kamery cyfrowe

2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH

Budowa i zasada działania Skaner Skanery

Cechy formatu PNG Budowa bloku danych Bloki standardowe PNG Filtrowanie danych przed kompresją Wyświetlanie progresywne (Adam 7)

Standardy wideo: technologie cyfrowe

Krótki przegląd pierwszych standardów kompresji obrazów

Grafika Komputerowa Wykład 5. Potok Renderowania Oświetlenie. mgr inż. Michał Chwesiuk 1/38

Odtwarzanie i kompresja wideo

Kątowa rozdzielczość matrycy fotodetektorów

Odmiany aparatów cyfrowych

Percepcja obrazu Podstawy grafiki komputerowej

Adam Korzeniewski p Katedra Systemów Multimedialnych

Komputerowy montaż dźwięku i obrazu

Def. Kod jednoznacznie definiowalny Def. Kod przedrostkowy Def. Kod optymalny. Przykłady kodów. Kody optymalne

Oferta kamer IP Copyright Siemens AG 2010

Obraz cyfrowy. Radosław Mantiuk. Wydział Informatyki Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Konwersja dźwięku analogowego do postaci cyfrowej

Wprowadzenie do cyfrowego przetwarzania obrazów

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

FFT i dyskretny splot. Aplikacje w DSP

NVIP-5DN5001C-1P NOVUS

10. Kamera web cam. I. Kamera internetowa Ogólna zasada działania.

2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20).

Detektor CCD. aparaty cyfrowe kamery VIDEO spektroskopia mikrofotografia astrofizyka inne

Technologie Informacyjne

Do zamiany dokumentu z papierowego na jego obraz elektroniczny skaner potrzebuje sześciu podstawowych komponentów: źródła światła białego, systemu

O sygnałach cyfrowych

Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów

Akwizycja i przetwarzanie sygnałów cyfrowych

Grafika Komputerowa Wykład 1. Wstęp do grafiki komputerowej Obraz rastrowy i wektorowy. mgr inż. Michał Chwesiuk 1/22

Przedstawiamy Państwu tekst będący

Opis parametrów technicznych sprzętu telewizyjnego i audiowizualnego (zestaw prezentacyjny), aparatów fotograficznych

PL B1. WOJSKOWY INSTYTUT MEDYCYNY LOTNICZEJ, Warszawa, PL BUP 26/13

6. Algorytmy ochrony przed zagłodzeniem dla systemów Linux i Windows NT.

10 Międzynarodowa Organizacja Radia i Telewizji.

PL B1. Sposób i układ pomiaru całkowitego współczynnika odkształcenia THD sygnałów elektrycznych w systemach zasilających

Transkrypt:

Program wykładu 1. Systemy rejestracji obrazów technologie CCD, CMOS 2. Cyfrowe metody obróbki obrazów ruchomych, metody cyfrowego polepszania obrazów 3. Metody kompresji i zapisu obrazów cyfrowych (MPEG1 i MPEG2) informatyka + 2

Etapy przetwarzania sygnału wizyjnego Zanim obraz zostanie poddany cyfrowej obróbce, musi być przekształcony do postaci elektrycznej w przetworniku analizującym, a następnie poddany dyskretyzacji i kwantyzacji. we/wy cyfrowe Kompresja We analogowe A/C Próbkowanie Bufor ramek Skanowanie C/A Wy analogowe informatyka + 3

Procesy zachodzące w analizatorach obrazu Przetwarzanie optoelektryczne, polegające na proporcjonalnej do natężenia oświetlenia modyfikacji elektrycznych właściwości ciała stałego. Akumulacja wytworzonej informacji elektrycznej w miejscu jej powstania, do czasu jej odczytu. Adresowanie, czyli odczytanie wytworzonej informacji (modyfikacji) elektrycznej i opatrzenia jej adresem, umożliwiającym określenie kierunku (lub miejsca) padania odpowiadającego tej informacji strumienia świetlnego. informatyka + 4

Przetwarzanie optoelektryczne Efekt Fotoelektryczny - polega na uwalnianiu elektronów pozostających normalnie w stanie niewzbudzonym (w tzw. paśmie podstawowym) do pasma przewodzenia, w wyniku absorpcji przez ten elektron fotonu o określonej energii. Efekt fotoelektryczny zewnętrzny - energia fotonu jest na tyle duża, że elektron po wzbudzeniu opuszcza strukturę materiału. Efekt fotoelektryczny wewnętrzny - w wyniku efektu fotoelektrycznego wzbudzony elektron pozostaje wewnątrz struktury materiału. Materiał wykazujący zjawisko efektu fotoelektrycznego wewnętrznego, zwany dalej materiałem światłoczułym (fotoprzewodnikiem), jest zawsze półprzewodnikiem o właściwościach przewodzących bliższych izolatorom, tzn. o bardzo dużej rezystancji powierzchniowej i skrośnej. informatyka + 5

Akumulacja i adresowanie pikseli Akumulacja ładunku ma za zadanie podwyższenie czułości analizatora obrazów. Adresowanie polega na wytwarzaniu informacji o wartości i położeniu (adresie) fotoładunku zgromadzonym w określonym pikselu. Adresowanie może być dokonywane w sposób ciągły (analogowo) lub - jeżeli na powierzchni światłoczułej wytworzono skończoną liczbę elementów przetwarzająco-akumulujących - w sposób dyskretny. informatyka + 6

Adresowanie pikseli Adresowanie za pomocą rejestru przesuwającego, stosowane w analizatorach typu CTD. informatyka + 7

Koncepcja budowy analizatora Fotoładunki są generowane i akumulowane - podczas okresu akumulacji - w umieszczonych pionowo obok siebie analizatorach linii, nazywanych analizatorami kolumn. Rejestr adresujący każdego z analizatorów kolumn nie jest zakończony przetwornikiem q/u, lecz dołączony do przypisanego mu ogniwa rejestru przesuwającego CCD, zwanego rejestrem wyjściowym. obrazów typu CTD informatyka + 8

Zasada budowy analizatora obrazów typu CCD FT (z przesuwem półobrazu) Bezpośrednie zastosowanie w koncepcji analizatora rejestrów przesuwających jako analizatorów kolumn nie jest możliwe, ze względu na zbyt długi czas transferu fotoładunków, równy okresowi akumulacji. Zaplamienie analizowanych obrazów osiągnęłoby w takim przypadku nieakceptowalny poziom. informatyka + 9

APS (Active Pixel Sensors) Przetworniki Charge Coupled Devices (CCD) opracowano we wczesnych latach 70. XX wieku z przeznaczeniem do akwizycji obrazu z niskim poziomem szumów. Przetworniki typu CMOS Active Pixel Sensors opracowano w drugiej połowie lat 90. XX wieku w celu zmniejszenia kosztów produkcji sensorów i zmniejszenia poboru mocy. informatyka + 10

APS korzyści Niski pobór mocy(ok. 50 mw), 3.3V cyfrowe wyjście wideo Niższe koszty komponentów (redukcja ok. 5X) Łatwość integracji przetworników w układach scalonych kamera w jednym układzie scalonym wyjścia cyfrowe zoom elektroniczny / okna w oknach kompresja obrazu Redukcja zależności od japońskich części CCDs kontrolery informatyka + 11

Architektura CMOS APS W odróżnieniu od matryc CCD, w matrycach CMOS każdy piksel ma swój przetwornik ładunku na napięcie, każdy piksel ma swój adres i jego zawartość może być odczytana w dowolnej kolejności informatyka + 12

Trójprzetwornikowa analiza obrazu barwnego u s i FO1, FO2, FO3 kanałowe filtry optyczne, (i= R,G,B) wyjściowe sygnały obrazu barw podstawowych. informatyka + 13

Zasada konstrukcji analizatora obrazów barwnych a) zasada naświetlania analizatora, b) przykładowe wzajemne usytuowanie segmentów barwnych w dyskretnym filtrze trójchromatycznym DFT, c) i d) przykładowe struktury filtrów Bayera: c) z segmentami addytywnymi: R i B), d) z segmentami subtraktywnymi ( R) i ( B) informatyka + 14

Filtry mozaikowe Na jeden piksel czerwony lub niebieski przypadają dwa zielone. Odpowiada to warunkom widzenia człowieka, które najczulej reaguje na zmiany jasności w zielonej części widma. Aby uzyskać dane o kolorze danego punku musimy skorzystać z algorytmu interpolacji i danych z sąsiednich pikseli. informatyka + 15

System do cyfrowego przetwarzania obrazów ruchomych informatyka + 16

Taśmy: MiniDV, Digital 8. Kamery cyfrowe Parametry: - rozdzielczość 500 do 540 linii - dźwięk 2 kanały rozdzielczości 16 bitów z próbkowaniem 48 khz lub 4 kanały 12 bitów 32 khz - port IEEE 1394 FireWire informatyka + 17

Komputerowa edycja obrazu Upowszechnienie się w kamerach amatorskich cyfrowego standardu DV spowodowało znaczące zmiany w konstrukcji kart i programów edycyjnych. Standard DV umożliwia, przy stopniu kompresji 5:1, osiągnięcie dobrej jakości obrazu o rozdzielczości poziomej 500 linii. Karty komputerowe zostały wyposażone w interfejs IEEE 1394 umożliwiający dwukierunkową transmisję skompresowanego sygnału DV. Przy szybkich komputerach kodek DV może być realizowany programowo. Powszechne użycie DVD jako kolejnego po kasecie DV nośnika cyfrowego, spowodowało pojawienie się kart komputerowych stosujących kompresję MPEG-2. informatyka + 18

System 3CCD Podstawą technologii zawartej w przetwornikach obrazu 3CCD jest pryzmat, który rozszczepia światło na trzy podstawowe kolory RGB informatyka + 19

Skanowanie Odczyt zawartości bufora w trybie międzyliniowym lub kolejnoliniowym (skanowanie progresywne) Skanowanie międzyliniowe Skanowanie progresywne informatyka + 20

Przykład zastosowania skanowania progresywnego oraz międzyliniowego 4CIF - 704 x 596 2CIF - 704 x 288 informatyka + 21

Efekty specjalne Kluczowanie Chroma Key: nałożenie na zwykle niebieskie lub zielone tło nowego obrazu. informatyka + 2 22

Standardy MPEG MPEG-1 (1992) umożliwia przesyłanie obrazu audio-video z przepustowością 1,5 Mb/s przy rozdzielczości ekranu 352x240 lub 352x288. Standard ten pozwolił na stworzenie cyfrowego zapisu audio-video Video CD, którego jakość była porównywalna do standardu VHS. MPEG-2 (1994) umożliwia przesyłanie obrazów o znacznie większych rozdzielczościach, aż do 1920 x 1152 punktów, i przepustowości między 3 a 100 Mb/s. Standard ten otwarł drogę do opracowania i wdrożenia cyfrowych standardów emisji programów telewizyjnych. MPEG-4 (1999) przystosowany został głównie do kompresji danych strumieniowych (np. wideokonferencje), oferuje najwyższy stopień kompresji z całej rodziny standardów MPEG. informatyka + 23

Kompresja MPEG-1 MPEG-1 Szybkość bitowa: 1,5Mb/s Rozdzielczość: SFI (Source Intermediate Format) 352p x 240l x 30FPS 352p x 288l x 25FPS nośnik magnetyczny nośnik optyczny sieć komputerowa informatyka + 24

Przestrzeń kolorów RGB i YC b C r Tryb YC b C r przechowuje informacje o kolorze jako luminacja (jasność - Brightness) chrominancja (barwa - Hue) Tryb YC b C r jest używany przy kompresji MPEG ponieważ umożliwia osiągnięcie lepszego współczynnika kompresji niż tryb RGB Y = 0.299(R G) + G + 0.114(B G) C b = 0.564(B Y); C r = 0.713(R Y) informatyka + 25

Przestrzeń kolorów RGB i YC b C r Składowe luminancji Y i chrominancji C R C B obrazu kolorowego. informatyka + 26

MPEG-1 struktura próbek w obrazie Dla standardu MPEG-1 przyjęto strukturę próbkowania 4:2:0 (na 4 próbki luminancji przypadają dwie próbki chrominancji w jednej linii, oraz 0 próbek chrominancji w kolejnej linii). Wartość próbek chrominancji wyznacza się poprzez interpolację dla położenia pośrodku kwadratu złożonego z próbek luminancji. informatyka + 27

MPEG-1 struktura próbek w obrazie Makroblok to elementarna porcja obrazu kodowana przez koder MPEG. Jest to zestaw czterech bloków luminancji Y, jednego bloku chrominancji C r i jednego bloku chrominancji C b. informatyka + 28

MPEG-1 struktura próbek w obrazie Przekrój (slice) to pośrednia struktura złożona z pewnej liczby makrobloków występujących kolejno w porządku rastrowym. Może zaczynać się i kończyć w dowolnym miejscu wiersza obrazu i rozciągać się na wiele wierszy. informatyka + 29

DCT Transformara kosinusowa (DCT) operuje na znormalizowanych blokach 8x8 pikseli przekształca dane do postaci umożliwiającej zastosowanie efektywnych metod kompresji IDCT DCT IDCT Przekształcenie Przekształcenie macierzy Odwracalność amplitud macierzy z(i,j) transformacji Z(k,l) w w blok DCT macierz Z(k,l) pikseli współczynników z(i,j) transformat informatyka + 30 30

Fizyczna interpretacja współczynników macierzy DCT informatyka + 31

Kwantyzacja Kwantyzacja polega na przeskalowaniu współczynników DCT poprzez podzielnie ich przez właściwy współczynnik znajdujący się w tabeli kwantyzacji, a następnie zaokrągleniu wyniku do najbliższej liczby całkowitej. Proces kwantyzacji można opisać równaniem: k ( x ) = round( F( Q( x, y ) x, y ) ) gdzie: F(x,y) współczynniki transformacji, Q(x,y) tablica kwantyzacji, round(x) funkcja zaokrąglająca x do najbliższej liczby całkowitej. informatyka + 32

Kodowanie Huffmana Dla każdego znaku utwórz drzewa złożone tylko z korzenia i ułóż w malejącym porządku ich częstości występowania. Dopóki istnieją przynajmniej dwa drzewa: z drzew t1 i t2 o najmniejszych częstościach występowania p1 i p2 utwórz drzewo zawierające w korzeniu częstość p12 = p1+p2, przypisz 0 każdej lewej, a 1 każdej prawej gałęzi drzewa. Utwórz słowo kodu dla każdego znaku przechodząc od korzenia do liścia. Przykład: Z={A,B,C,D,E,F}, P={0.35, 0.17, 0.17, 0.16, 0.10, 0.05} informatyka + 33

MPEG-1 obrazy typu I Kodowane są podobnie jak obrazy nieruchome w standardzie JPEG. 1. I etap: obraz dzielony jest na rozłączne makrobloki (4 bloki próbek sygnału luminancji i 2 chrominancji). 2. II etap: niezależne przekształcanie każdego bloku przy wykorzystaniu DCT. 3. III etap: kwantowanie - podzielenie każdego współczynnika z macierzy DCT przez odpowiedni współczynnik z tablicy kwantyzacji i zaokrąglenie wyniku do liczby całkowitej (utrata części informacji). 4. IV etap: kodowanie kodem Huffmana skwantowanych współczynników macierzy DCT. O stopniu kompresji tego etapu decyduje liczba poziomów kwantyzacji współczynników macierzy DCT- im mniejsza liczba poziomów, tym większa kompresja. informatyka + 34

MPEG-1 Obrazy typu P Definiowanie elementów ruchomych: dla każdego makrobloku obrazu bieżącego wyszukuje się najbardziej podobny blok 16x16 pikseli w poprzednim obrazie typu I lub P. Dopasowuje się je tylko do składowej luminancji. Zakłada się jedynie liniowe przesunięcie bloku pikseli, nie uwzględnia się obrotu ani zmiany wymiaru bloku. Położenie znalezionego bloku określa się za pomocą wektora przesunięcia tego bloku w stosunku do makrobloku w obrazie typu P- tzw. wektora ruchu. informatyka + 35

MPEG-1 Obrazy typu B Obrazy typu B kodowane są podobnie jak obrazy typu P Kodowana jest różnica między bieżącym makroblokiem a jego predykcją. predykcja poszukiwanie najbardziej podobnych bloków w dwu obrazach odniesienia: wcześniejszym i późniejszym wyznaczenie dwóch wektorów ruchu wyznaczenie bloku prognozowanego poprzez interpolację ze znalezionych bloków: wcześniejszego i późniejszego informatyka + 36

MPEG 1 obrazy typu B informatyka + 37

MPEG-1 GOP Sekwencja obrazów video w standardzie MPEG dzielona jest na grupy obrazów GOP (Group Of Pictures) informatyka + 38

MPEG1 kolejność transmisji ramek I B B B P B B B P B B B I informatyka + 39

MPEG-2 MPEG-2 Szybkość bitowa: 10Mb/s 40Mb/s Przeznaczony do rozpowszechniania telewizji programowej przetwarzanie obrazów z wybieraniem międzyliniowym SDTV telewizja standardowej rozdzielczości HDTV telewizja wysokiej rozdzielczości większa rozdzielczość próbkowania zmieniona i rozszerzona struktura próbkowania chrominancji skalowalność jakościowa przestrzenne kodowanie obrazu informatyka + 40

MPEG-2 struktura próbkowania Struktury próbkowania w standardzie MPEG-2 informatyka + 41

MPEG-2 struktura makrobloku Struktury makrobloków dla różnych struktur próbkowania 4:4:4 4:2:2 4:2:0 informatyka + 42

MPEG-2 struktura makrobloku Wybieranie międzyliniowe ramka sygnału składa się z dwóch pól Struktura makrobloku luminancji podczas kodowania DCT ramki Struktura makrobloku luminancji podczas kodowania DCT pola informatyka + 43

MPEG-2 profile i poziomy informatyka + 44

informatyka + 46