dr inż. Piotr Suchomski dr inż. Piotr Odya Zastosowania grafiki komputerowej Interfejsy użytkownika; Graficzna prezentacja danych; Kartografia; Obrazy medyczne; Kreślenie i projektowanie wspomagane komputerowo (programy CAD/CAM); Systemy multimedialne; Animacje i wideo. 1
Światło widzialne wycinek szerokiego widma fal elektromagnetycznych Fizjologia narządu wzroku oko jest bardziej wrażliwe na zmiany luminancji niż chrominancji; pręciki (100 mln) dla detekcji składowych luminancji 3 rodzaje czopków (9 mln) do detekcji koloru bezwładność wzroku ludzkiego czas przetworzenia pojedynczego obrazu, powstałego na siatkówce wynosi ok. 0,15-0,30 s; zdolność całkująca wzroku ludzkiego liczba dostrzeganych szczegółów zależna od odległości oka od obserwowanego obiektu; przyjmuje się rozdzielczość kątową równą 1 minucie (1/60 stopnia) 2
Fizjologia narządu wzroku oko jest najbardziej wrażliwe na długości fal odpowiadające kolorowi zielonemu 100 0 400 500 600 700 Metoda addytywna zachodzi m.in. w aparatach fotograficznych, kamerach, monitorach w wyniku kombinacji 3 kolorów podstawowych czerwonego, zielonego i niebieskiego 3
Metoda subtraktywna pozwala na uzyskanie kolorów przy wydruku Czerwony Żółty Purpurowy ZielonyCyjan Niebieski Modele barw RGB (monitory, addytywna metoda tworzenia barw); CMY (drukarki, plotery itp., subtraktywna metoda tworzenia barw); YUV (telewizja kolorowa); HSV (odcień barwy, nasycenie, wartość, artystyczny model barw, tinty, cienie, tony); Istnieje możliwość konwersji między różnymi modelami barw. źródło: www.cs.cornell.edu 4
Prezentacja obrazu Monitor - punkty o składowych RGB Drukarka - nakładanie kolejnych warstw farby według metody subtraktywnej; Obrazy czarno-białe - wydruk techniką mikrowzorów, półtony. Podział grafiki wektorowa; matematyczny opis rysunku; małe wymagania pamięciowe (i obliczeniowe); rasteryzacja konwersja do postaci rastrowej; rastrowa; tablica punktów; duże wymagania pamięciowe; wektoryzacja konwersja do postaci wektorowej; 5
Obrazy wektorowe (vector graphic) opis w postaci zbioru prostych obiektów ( prymitywów ) proste, krzywe, figury płaskie, itp. mały rozmiar opisu, zależny od ilości obiektów łatwość skalowania i przekształcania konieczność matematycznego odtworzenia przy wyświetlaniu na urządzeniu wyjściowym obecnie niezbyt popularne dla grafiki 2D najpopularniejsze w dziedzinie 3D Obrazy wektorowe przykładowe formaty: EPS, WMF, CDR (Corel) oraz SVG (Scalable Vector Grpahics) zdefiniowany przez W3C format zalecany do wykorzystania na stronach WWW bazuje na XML-u pochodna PostScriptu SWF (Flash) stworzony do wektorowej animacji 6
Obrazy rastrowe (bitmap graphic) reprezentacja obrazu w pamięci w postaci zbioru punktów ekranu (pikseli) o określonym kolorze duży rozmiar opisu, zalecana kompresja łatwość odtwarzania na urządzeniu wyjściowym (ustawianie kolorów pikseli) zniekształcenia przy skalowaniu przykładowe formaty: BMP, GIF, JPEG, PNG, TIFF Skalowanie 7
Formaty obrazu cyfrowego obraz cyfrowy jest reprezentowany przez dwuwymiarową tablicę próbek, gdzie każda próbka nazywana jest pikselem precyzja określa, ile informacji przypada na jedną próbkę i jest wyrażana jako liczba bitów na próbkę [bit/próbka] obrazy binarne - są reprezentowane przez 1 bit/próbkę, np. w przypadku biało-czarnych fotografii grafika komputerowa (o niskiej precyzji) - jest reprezentowana przez 4 bity/próbkę obrazy ze stopniami szarości - są reprezentowane przez 8 bitów/próbkę obrazy kolorowe - są reprezentowane przez 16, 24 lub więcej bitów/próbkę (RGB) Formaty obrazu cyfrowego - YUV luminancja Y, dwa różnicowe sygnały chrominancji U i V konwersja z formatu RGB na YUV wg standardu CCIR 601 właściwości różnicowych sygnałów chrominancji U i V: nie przenoszą informacji o luminancji sygnału, są równe zeru dla barwy białej, z dwóch sygnałów U i V oraz sygnału luminancji Y można uzyskać trzeci sygnał różnicowy G-Y oraz trzy sygnały RGB, amplitudy maksymalne sygnałów różnicowych B-Y oraz R-Y są większe niż G-Y, mogą przybierać zarówno dodatnie jak i ujemne wartości często przechodzi się na format Y C B C R wartości składowych chrominancji C B i C R są zawsze w przedziale [0,1] 8
Parametry obrazu a wielkość pliku RGB lub YUV 4:4:4 800 [pikseli] x 600 [pikseli] x 3 [skład.] x 8 [bitów] = = 11.520.000 [bitów] YUV 4:2:0 trzeba rozpatrywać bloki 2x2 piksela 4 [piksele] x 8 [bitów] + 8 [bitów] + 8 [bitów] = = 48 [bitów] (na cztery piksele) 800 [pikseli] x 600 [pikseli] x 48 [bitów] : 4 = = 5.760.000 [bitów] YUV 4:4:4 YUV 4:2:0 Klasyfikacja metod kompresji Metody bezstratne Zakodowany strumień danych po dekompresji jest identyczny z oryginalnymi danymi przed kompresją, Metody stratne W wyniku kompresji część danych (mniej istotnych) jest bezpowrotnie tracona, dane po dekompresji nieznacznie różnią się od oryginalnych danych przed kompresją. 9
Kompresji bezstratna RLE - ang. Run-Length Encoding - kodowanie długości serii; aaaaaaabbbaaaaaaaa aaaaaabbaabbaaaaaa aaaaabbbaaabbbaaaa Bez kompresji: 3 x 18 bajtów = 54 bajty Sposób kodowania: a7b3a8-6 bajtów a6b2a2b2a6-10 bajtów a5b3a3b3a4-10 bajtów Stopień kompresji: 2:1 Kompresja stratna Wielkość generowanych zniekształceń miarą jakości alg. kompresji; Na ogół uzyskiwane większe stopnie kompresji; Wykorzystywanie właściwości percepcji wzrokowej człowieka -> kompresja perceptualna; Algorytmy wykorzystujące zaawansowane metody transformacji i kwantyzacji danych; Na ogół bardziej elastyczne sterowanie stopniem kompresji (jakością); 10
Formaty obrazu bitmapy (*.bmp) wykorzystują model/format RGB typowo bez kompresji ew. RLE, teoretycznie nawet JPEG czy PNG nagłówek (BITMAPINFO) informacje o rozmiarze, precyzji kolorów typowa precyzja: 1, 4, 8, 24 bity na piksel RLE możliwa do zastosowania tylko przy 4 i 8 bitach na piksel zastosowanie: np. zrzuty ekranu do dalszego przetwarzania bądź kompresji, ikonki 11
Formaty obrazu GIF (*.gif) opracowany przez firmę CompuServe dwie wersje "GIF87a" i "GIF89a" wykorzystuje paletę 256 kolorów obsługiwana przezroczystość (89a) informacje o kolorach w palecie (a także rozmiar i wsp. proporcji) przesyłane są razem z obrazkiem możliwość załączenia kompresji słownikowej LZW (bezstratnej) możliwość tworzenia animacji możliwość wykorzystania trybu interlaced podział danych na cztery grupy kolejne transmitowanie poszczególnych grup zastosowanie: elementy graficzne, przyciski Formaty obrazu GIF (*.gif) 12
Problemy z kolorami liczba kolorów: 5061 paleta 256 kolorów (w praktyce 252 kolory) Problemy z kolorami liczba kolorów: 5061 paleta 256 kolorów (w praktyce 23 kolory) 13
Problemy z kolorami liczba kolorów: 5061 paleta 256 kolorów (w praktyce 44 kolory) Problemy z kolorami 14
Formaty obrazu JPEG (*.jpg) Joint Photographic Experts Group najpopularniejszy format kompresji obrazów (przede wszystkim zdjęć) opracowany na przełomie lat 80-tych i 90-tych typowo kompresja stratna transformata DCT (bloki 8x8 pikseli) zerowanie składowych odpowiadających za wyższe częstotliwości (kwantyzacja) kodowanie Huffmana działanie w systemie Y Cb Cr (najczęściej 4:2:2) Kompresja JPEG - algorytm DCT kwantyzacja kodowanie ciągów kodowanie entropijne macierze kwantyzacji macierze kodowania operacja DCT jest bezstratna kwantyzacja współczynników transformaty kosinusowej zmniejsza liczbę bitów, ale jednocześnie obniża jakość obrazu skwantowane wsp. transformaty są kodowane analogicznie do RLE kodowanie entropijne - najczęściej Huffmana 15
Kodowanie transformacyjne przekształcenie przestrzennej reprezentacji obrazu w dziedzinę częstotliwości w procesach przetwarzania obrazów stosuje się dyskretną transformację kosinusową DCT (ang. Discrete Cosine Transform) DCT IDCT Kompresja JPEG - algorytm Obraz dzielony jest na bloki 8x8 uproszcza operacje umożliwia zrównoleglenie obliczeń 16
Kompresja JPEG porządkowanie wg sekwencji zygzakowatej zapewnia, że współczynniki DCT o niższej częstotliwości (większe prawdopodobieństwo, iż wartości są niezerowe) są grupowane przed współczynnikami DCT o większej częstotliwości (większe prawdopodobieństwo, iż wartości są zerowe). Kompresja JPEG - kwantyzacja dla każdego bloku stosowane są te same współczynniki kwantyzacji, w standardzie JPEG zdefiniowane są 4 tablice kwantyzacji żadna nie jest obowiązkowa można stosować własne współczynniki kwantyzacji dla składowych chrominancji (UV) mają większą wartość niż współczynniki dla składowej luminacji po kwantyzacji większość tych współczynników zostanie wyzerowana i usunięta, skalując współczynniki kwantyzacji można sterować współczynnikiem kompresji. 17
Kompresja JPEG oryginał jest nierozróżnialny od obrazu po dekompresji dla strumienia binarnego o wartościach 1,2-2,0 b/piksel bardzo dobra lub dobra jakość jest uzyskiwana dla wartości 0,5-1,5 b/piksel wsp. kompresji powyżej 40 wiążą się ze znaczącym pogorszeniem jakości zastąpienie domyślnych macierzy kwantyzacji i kodów Huffmana dostosowanymi do statystyki kodowanego obrazu może poprawić PSNR o ok. 1-2dB Formaty obrazu JPEG (*.jpg) możliwość kodowania progresywnego kodowanie skalowalne jakościowo najpierw przesyłana składowa stała i współ. niskoczęstotliwościowe, następnie współ. odpowiedzialne za wyższe częstotliwości możliwość kodowania hierarchicznego kodowanie skalowalne przestrzennie stopniowe zwiększanie rozdzielczości przesyłanego obrazka możliwość użycia trybu bezstratnego możliwość zapisu dodatkowych informacji profil kolorów EXIF 18
Formaty obrazu JPEG (*.jpg) Formaty obrazu JPEG (*.jpg) 19
Formaty obrazu PNG (*.png) Portable Network Graphics opracowany w połowie lat 90-tych format w pełni bezstratny kompresja DEFLATE (słownikowa, analogiczna do ZIPa) nagłówek w postaci 8-bajtowej sygnatury obsługa obrazów w 256 odcieniach szarości, 24 bitowych (RGB), w paletach RGB obsługa przezroczystości kanał alpha w przypadku obrazów 24-bitowych zastosowanie: zastąpienie formatu GIF (wyższa jakość, większe współczynniki kompresji) Zastosowania formatów rysunki, tła, przyciski, grafika -> GIF lub PNG GIF 5135B JPG 6992B 20
Zastosowania formatów rysunki, tła, przyciski, grafika -> GIF lub PNG GIF 5135B PNG 3892B Zastosowania formatów zdjęcia -> JPEG GIF 84419B JPG 48062B 21
Zastosowanie formatów PNG 417488B GIF 115142B JPG 65218B Formaty obrazu JPEG2000 (*.jp2) opublikowany w 2000 roku wykorzystanie transformacji falkowej mniej widoczne artefakty możliwość dopasowania jakości do potrzeb (odpowiednik kodowania hierarchicznego) w tym definiowanie obszaru zainteresowania mała popularność 4-7 razy wolniejsza kompresja niż w tradycyjnym JPEG-u 22
Formaty obrazu JPEG2000 (*.jp2) JPEG 2000 rozmiar: ok. 9300 B JPEG Formaty obrazu Tagged Image File Format (*.tiff) opracowany pod koniec lat 80-tych przez Aldus Corporation i Microsoft założenie: niezależność od sprzętu, ujednolicenie formatu skanów obsługa szerokiej gamy modeli kolorów: B/W, odcienie szarości, palety kolorów, RGB, CMYK precyzja: do 48 bitów na piksel obsługa różnych formatów kompresji: RLE, LZW, JPEG, FAX group 3 i 4 czasem problemy z kompatybilnością możliwość tworzenia własnych podformatów zastosowanie: skany, zapis wyników badań obrazowych w medycynie, w niektórych aparatach fotograficznych do zapisu danych z przetwornika; polecany do zapisu obrazów bitowych na etapie pośrednim, jeżeli obraz będzie dalej przetwarzany. 23
Dla zainteresowanych Marek Domański, Obraz cyfrowy, WKiŁ, Warszawa 2010. John C. Russ, The Image Processing Handbook, CRC Press, 2007. Nigel Chapman, Janny Chapman, Digital Multimedia, Wiley, 2009. 24