Pracownia komputerowa Dariusz Wardecki, wyk. IX
Powtórzenie Ile bajtów zawiera tekst (ASCII)? Pracownia komputerowa!! jest najciekawsza!
Kod ASCII
Reprezentacje znaków Strony kodowe Standardy ISO-8859 ISO-8859-1 Standardy Reprezentacje znaków ISO-8859 Standardy ISO-8859 Standardy ISO-8859 Strony kodowe Reprezentacje znaków Strony kodowe ISO-8859-1 Znaki wykorzystywane w jízykach zachodnioeuropejskich. ISO-8859-1 Znaki Brak znaków wykorzystywane akcentowanych w jízykach zachodnioeuropejskich. jízyka polskiego. Brak Znaki znaków wykorzystywane akcentowanych w jízykach z zachodnioeuropejskich. polskiego. ISO-8859-2 Brak znaków akcentowanych z jízyka polskiego. ISO-8859-2 Znaki wykorzystywane w jízykach úrodkowoeuropejskich. Znaki wykorzystywane w jízykach úrodkowoeuropejskich. ISO-8859-2 Kody 128... 255 przypisane innym znakom, niø w ISO-8859-1. Kody 128... 255 przypisane innym znakom, niø w ISO-8859-1. Znaki wykorzystywane w jízykach úrodkowoeuropejskich. ISO-8859-15 ISO-8859-15 Kody 128... 255 przypisane innym znakom, niø w ISO-8859-1. Rewizja ISO-8859-1 wprowadzajπca znak waluty euro. Rewizja ISO-8859-1 wprowadzajπca znak waluty euro. ISO-8859-15 Zasada Rewizja 1 1 ISO-8859-1 znak znak 11bajt bajt wprowadzajπca powoduje powoduje problemy problemy znak waluty z przenoszeniem z przenoszeniem euro. tekstów tekstów miídzy systemami wykorzystywanymi w róønych krajach. miídzy systemami wykorzystywanymi w róønych krajach. Zasada 1 znak 1 bajt powoduje problemy z przenoszeniem tekstów miídzy systemami wykorzystywanymi w róønych krajach. Rafa J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 9stycznia 9stycznia 2012 2012 34/ 76 34/ 76 Rafa J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 9 stycznia 2012 34/ 76
Standard Unicode Standard Unicode Standard Unicode Reprezentacje znaków Reprezentacje znakówunicode Unicode Reprezentacje znaków Unicode ISO/IEC 10646:2003, Universal Character Character Set Set Set (UCS) (UCS) (UCS) 1 Koniec zasady 1 1 1znak znak znak 1 1bajt. bajt. 2 2 Znaki reprezentowane przez kody wielobajtowe. Znaki reprezentowane przez przez kody kody wielobajtowe. 3 3 Rozszerzenie Rozszerzenie ASCII ASCII (znaki (znaki ASCII ASCII odpowiadajπ odpowiadajπ kodom kodom 0 0.... 127). 127). 4 4 Brak Brak zgodnoúci zgodnoúci z ISO-8859 ISO-8859 i i stronami stronami kodowymi kodowymi IBM IBM oraz oraz Microsoft. Microsoft. 3 Rozszerzenie ASCII (znaki ASCII odpowiadajπ kodom 0... 127). 4 Brak zgodnoúci z ISO-8859 i stronami kodowymi IBM oraz Microsoft. UTF-8 (8-bit Unicode Transformation Format) UTF-8 (8-bit Unicode Transformation Format) Jednobajtowe reprezentacje znaków ASCII. Jednobajtowe reprezentacje znaków ASCII. Dwubajtowe reprezentacje znaków z jízyków europejskich. Dwubajtowe reprezentacje znaków z jízyków europejskich. Najbardziej popularny format Unicode. Najbardziej popularny format Unicode. DziÍki Unicode moøliwe jest tworzenie uniwersalnych dokumentów tekstowych (tzn. tekstów wyúwietlanych wszídzie tak samo). Rafa J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 9stycznia2012 35/ 76 Rafa J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 9stycznia2012 35/ 76
Kodowanie UTF-8 Bity Największa wartość Bajt 1 Bajt 2 Bajt 3 Bajt 4 7 U+007F 0xxxxxxx 11 U+07FF 110xxxxx 10xxxxxx 16 U+FFFF 1110xxxx 10xxxxxx 10xxxxxx 21 U+1FFFFF 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
Kodowanie UTF-8 Przykład: Znak Kod Bin Hex @ U+0040 100 0000 0100 0000 40 Ą U+0104 001 0000 0100 1100 0100 1000 0100 c4 84 龜 U+2EF1 0010 1110 1111 0001 1110 0010 1011 1011! 1011 0001 e2 bb b1 𐌄 U+10304 0 0001 0000 0011 0000 0100 1111 0000 1001 0000! 1000 1100 1000 0100 f0 90 8c 84
Pliki tekstowe Pliki tekstowe Plik tekstowy (ang. text file) Pliki tekstowe Pliki tekstowe i metatekstowe Pliki tekstowe i metatekstowe Zawiera dane zakodowane w postaci kodów znaków, które powinny byê Plik interpretowane tekstowy (ang. zgodnie text z file) ustalonym zbiorem znaków. 1 Zawiera Tzw. dane znaki zakodowane sterujπce (ang. w postaci control kodów characters) znaków, odpowiadajπ które powinny byê interpretowane specjalnymzgodnie kodom okreúlajπcym z ustalonym sposób zbioremformatowania znaków. wydruku (np. znaki ASCII o kodach 0 31). 1 Tzw. znaki sterujπce (ang. control characters) odpowiadajπ 2 Pliki specjalnym tekstowe kodom nie zawierajπ okreúlajπcym informacji sposób o tym formatowania jaki zbiór znaków wydruku jest odpowiedni (np. znaki ASCII do interpretacji o kodach ich 0 zawartoúci 31). (program drukujπcy tekst lub uøytkownik powinien to okreúliê). 2 Pliki tekstowe nie zawierajπ informacji o tym jaki zbiór znaków jest odpowiedni do interpretacji ich zawartoúci (program drukujπcy tekst Pliki tekstowe majπ ograniczone zastosowania lub uøytkownik powinien to okreúliê). 1 Mogπ zawieraê tylko tekst (brak grafiki, tabel, odnoúników itp.). 2 Pliki Nie tekstowe zawierajπ majπinformacji ograniczone o kroju zastosowania i wielkoúci czcionki, kolorach itp. 1 Mogπ zawieraê tylko tekst (brak grafiki, tabel, odnoúników itp.). Rafa J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 9 stycznia 2012 64/ 76 2 Nie zawierajπ informacji o kroju i wielkoúci czcionki, kolorach itp. Rafa J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 9 stycznia 2012 64/ 76
Pliki metatekstowe Pliki Pliki metatekstowe metatekstowe Pliki tekstowe i metatekstowe Pliki tekstowe i metatekstowe Plik Plik metatekstowe metatekstowe Zawiera Zawiera dane dane w postaci postaci tekstu tekstu (tzn. (tzn. kodów kodów znaków znaków jak jak dla dla zwyk ego zwyk ego pliku pliku tekstowego), tekstowego), z których których czíúê czíúê moøe moøe byê byê interpretowana interpretowana jako jako znaczniki znaczniki (ang. (ang. tag) tag) okreúlajπce okreúlajπce m. m. in. in. Oczekiwany wyglπd dokumentu dokumentu (np. (np. krój krójiiwielkoúê wielkoúêczcionki czcionkiitp.). itp.). Jego powiπzania z innymi dokumentami (np. (np. odnoúniki). odnoúniki). Zbiór znaków, zgodnie z którym majπ majπbyê byêinterpretowane kody kody znaków w dokumencie. Regu y tworzenia i interpretacji znaczników okreúlajπ metajízyki HTML (ang. HyperText Markup Language) XML (ang. Extensible Markup Language) SGML (ang. Standard Generalized Markup Language) Rafa J. J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 99stycznia stycznia 2012 2012 65/ 65/ 76 76
Postscript Uniwersalny język opisu strony opracowany przez Adobe Pliki postscriptowe najczęściej mają rozszerzenie.ps lub.eps Dokumenty ps można tworzyć m.in. w programach Latex lub Gnuplot Przykład %!! /Helvetica findfont 72 scalefont setfont! 72 72 moveto! (Hello, world!) show! showpage
Grafika rastrowa Grafika rastrowa Standardowe i wektorowa formaty plików i wektorowa Grafika rastrowa wektorowa Grafika rastrowa i wektorowa Grafika rastrowa (ang. raster graphics) Grafika rastrowa (ang. raster graphics) Obraz Grafikajest rastrowa reprezentowany (ang. rasterprzez graphics) (ogólnie) prostokπtnπ siatkí punktów o Obraz jest reprezentowany przez (ogólnie) prostokπtnπ siatkí punktów o róønych kolorach, czyli tzw. pikseli (ang. pixel, picture element). Oczka tej róønych Obraz jest kolorach, reprezentowany czyli tzw. przez pikseli (ogólnie) (ang. pixel, prostokπtnπ picture siatkí element). punktów Oczka o tej siatki siatki róønych nie niekolorach, muszπ muszπ mieê mieê czyli jednakowej tzw. jednakowej pikseli szerokoúci (ang. szerokoúci pixel, i wysokoúci. picture i wysokoúci. element). Oczka tej siatki nie muszπ mieê jednakowej szerokoúci i wysokoúci. Mapa bitowa, bitmapa (ang. (ang. bitmap) bitmap) Mapa bitowa, bitmapa (ang. bitmap) Struktura danych reprezentujπca obraz obraz postaci w postaci gotowej gotowej do do Struktura danych reprezentujπca obraz w postaci gotowej do wydrukowania (lub wyúwietlenia). Kolor Kolor kaødego piksela piksela reprezentuje wydrukowania (lub wyúwietlenia). Kolor kaødego piksela reprezentuje okreúlona liczba bitów danych. okreúlona liczba bitów danych. Grafika wektorowa (ang. vector vector graphics) Grafika wektorowa (ang. vector graphics) Obraz jest reprezentowany zpomocπ instrukcji, instrukcji, które majπ majπ byê byê wykonane Obraz jest reprezentowany z instrukcji, któremajπ byê wykonane wykonane celu utworzenia go go (np. narysuj linií linií prostπ, prostπ, narysuj narysuj ko o ko o itp.). w celu utworzenia go (np. narysuj linií prostπ, narysuj ko o itp.). itp.). Poszczególne punkty identyfikuje sií podajπc ichwspó rzídne (wektory). Poszczególne punkty identyfikuje sií sií podajπc ichwspó rzídne (wektory). (wektory). Rafa J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 9 stycznia 2012 66/ 76
Kolory w grafice Kolory w grafice rastrowej Kolory w grafice rastrowej rastrowej RGB (ang. red, green, blue) RGB (ang. red, green, blue) Kolor piksela okreúla sií podajπc natíøenie kaødej z trzech podstawowych barw Kolorúwiat a piksela (czerwony, okreúla sií podajπc zielony, natíøenie niebieski). kaødej Zwykle z trzech jeden piksel podstawowych jest reprezentowany barw úwiat a (czerwony, przez 3 lub zielony, 4 bajty niebieski). danych. Zwykle Reprezentacja jeden piksel odpowiednia jest dla monitorów reprezentowany i wyúwietlaczy przez 3 lub LCD, 4 bajty OLED danych. itp. Reprezentacja odpowiednia dla monitorów i wyúwietlaczy LCD, OLED itp. CMYK (ang. cyan, magenta, yellow, black) CMYK (ang. cyan, magenta, yellow, black) Kolor piksela okreúla sií podajπc natíøenie kaødego z czterech kolorów Kolor piksela okreúla sií podajπc natíøenie kaødego z czterech kolorów farb (turkusowy, purpura, øó ty, czarny). Reprezentacja bardziej farb (turkusowy, purpura, øó ty, czarny). Reprezentacja bardziej odpowiednia do drukowania na papierze. odpowiednia do drukowania na papierze. Rafa J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 9stycznia2012 67/ 76 Rafa J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 9stycznia2012 67/ 76
Rafa J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 9 stycznia 2012 68/ 76 Formaty plików grafiki rastrowej Formaty plików dla grafiki rastrowej BMP (ang. bitmap) Istniejπ co najmniej 2 formaty plików graficznych o takiej nazwie. PBM (ang. Portable Bitmap) Uøywany w systemach wykorzystujπcych úrodowisko X Windows. TIFF (ang. Tagged Image File Format), ISO 12639 GIF (ang. Graphics Interchange Format), kompresja LZW 8 bitów na piksel, 24-bitowa przetrzeò barw (palety referencyjne). Od 1994 w szarej strefie z powodu patentu na algorytm kompresji (Unisys). PNG (ang. Portable Network Graphics), ISO/IEC 15948:2004, kompresja bezstratna JPEG (ang. Joint Photographic Experts Group), ISO/IEC 10918, kompresja stratna
Grafika wektorowa Grafika wektorowa i dokumenty drukowane Grafika wektorowa i dokumenty drukowane Nie tylko grafika, takøe dokumenty tekstowe itp. (praktycznie wszystkie Nie rodzaje tylko dokumentów). grafika, takøe dokumenty tekstowe itp. (praktycznie wszystkie rodzaje dokumentów). PostScript (PS) jízyk programowania wykorzystywany jako jízyk PostScript opisu stron (PS) (ang. jízyk page programowania description language) wykorzystywany dla ploterów, jako drukarek jízyk opisu stron (ang. page description language) dla ploterów, drukarek itp. (1982). itp. (1982). EPS (ang. Encapsulated PostScript) kodwjízyku PostScript z EPS (ang. Encapsulated PostScript) kodwjízyku PostScript z do πczonym podglπdem w niskiej rozdzielczoúci. do πczonym podglπdem w niskiej rozdzielczoúci. PDF (ang. Portable Document Format), ISO/IEC 32000-1:2008 PDF (ang. Portable Document Format), ISO/IEC 32000-1:2008 opis strony z dodatkami, jak odnoúniki (ang. link) itp., opis strony z dodatkami, jak odnoúniki (ang. link) itp., ( przetworzony PostScript). ( przetworzony PostScript). SVG (ang. Scalable Vector Graphics) SVG (ang. Scalable Vector Graphics) DjVu (bardzo dobra kompresja zeskanowanych dokumentów). DjVu (bardzo dobra kompresja zeskanowanych dokumentów). Rafa J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 9stycznia2012 69/ 76 Rafa J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 9stycznia2012 69/ 76
Dokumenty z możliwością wprowadzania zmian Dokumenty z moøliwoúciπ wprowadzania zmian ZawartoúÊ ZawartoúÊ pliku pliku reprezentuje reprezentuje dokument dokument Sformatowany Sformatowany tekst. tekst. Ewentualnie Ewentualnie grafika, grafika, tabele tabele itp. itp. Zawiera Zawiera informacje informacje o sposobie sposobie wyúwietlania wyúwietlania lub lub drukowania. drukowania. Moøe Moøe byê byê skompresowany. skompresowany. W przesz oúci przesz oúci istnia o istnia o wiele wiele konkurencyjnych konkurencyjnych zamkniítych zamkniítych formatów formatów 1 Brak przenoúnoúci dokumentów dokuczliwy dla uøytkowników. 1 Brak przenoúnoúci dokumentów dokuczliwy dla uøytkowników. 2 2 Niezgodnoúci Niezgodnoúci miídzy miídzy róønymi róønymi wersjami wersjami tego tego samego samego programu programu (!). (!). 3 3 Nieformalnym Nieformalnym standardem standardem sta y sta y sií sií formaty formaty z MS MS OÖce OÖce 97: 97: DOC DOC dokumenty dokumenty tekstowe. tekstowe. XLS XLS arkusze arkusze kalkulacyjne. kalkulacyjne. PPT PPT prezentacje. prezentacje. Rafa J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 9stycznia2012 70/ 76 Rafa J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 9stycznia2012 70/ 76
Open Document Format Open Document Format Open Document Format Open Document Format ISO/IEC 26300:2006 ISO/IEC 26300:2006 Open Document Format for OÖce Applications (OpenDocument) v1.0. Open ISO/IEC Document 26300:2006 Format for OÖce Applications (OpenDocument) v1.0. Open Document Format for OÖce Applications (OpenDocument) v1.0. Zestaw otwartych formatów plików, opartych na XML (z kompresjπ), dla Zestaw róønychotwartych rodzajówformatów dokumentów: plików, opartych na XML (z kompresjπ), dla Zestaw otwartych rodzajów formatów dokumentów: plików, opartych na XML (z kompresjπ), dla róønychodt rodzajów dokumenty dokumentów: tekstowe. ODT dokumenty tekstowe. ODT ODS dokumenty arkusze kalkulacyjne. tekstowe. ODS arkusze kalkulacyjne. ODS ODP arkusze prezentacje. kalkulacyjne. ODP prezentacje. ODP ODG prezentacje. rysunki (grafika wektorowa). ODG rysunki (grafika wektorowa). ODG ODF rysunki wzory (grafika matematyczne. wektorowa). ODF wzory matematyczne. ODF wzory matematyczne. WiÍkszoúÊ dostípnych na rynku pakietów biurowych wspiera ODF. WiÍkszoúÊ dostípnych na rynku pakietów biurowych wspiera ODF. WiÍkszoúÊ dostípnych na rynku pakietów biurowych wspiera ODF. DostÍpna jest wtyczka dla Microsoft OÖce. DostÍpna DostÍpna jest jest wtyczka wtyczka dla dla Microsoft Microsoft OÖce. OÖce. Rafa J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 9stycznia2012 71/ 76 Rafa J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 9stycznia2012 71/ 76 Rafa J. Wysocki (rwys@fuw.edu.pl) Pracownia komputerowa 9stycznia2012 71/ 76