Systemy kodowania. Jolanta Bachan

Podobne dokumenty
Pracownia Komputerowa wyk ad VII

Architektura systemów komputerowych Laboratorium 5 Kodowanie liczb i tekstów

PODSTAWY INFORMATYKI. Informatyka? - definicja

Kodowanie informacji. Przygotował: Ryszard Kijanka

Wprowadzenie do informatyki i użytkowania komputerów. Kodowanie informacji System komputerowy

Języki i metodyka programowania. Reprezentacja danych w systemach komputerowych

INFORMATYKA. Zajęcia organizacyjne. Arytmetyka komputerowa.

Techniki multimedialne

Pracownia komputerowa. Dariusz Wardecki, wyk. VIII

Pracownia komputerowa. Dariusz Wardecki, wyk. IV

Systemy liczenia. 333= 3*100+3*10+3*1

kodowanie informacji Autor prezentacji: 1 prof. dr hab. Maria Hilczer

Komunikacja człowiek-komputer

HTML nie opisuje układu strony!!!

Dane, informacja, programy. Kodowanie danych, kompresja stratna i bezstratna

Podstawy informatyki. Reprezentacja danych w systemach cyfrowych

Dr inż. Grażyna KRUPIŃSKA. D-10 pokój 227 WYKŁAD 2 WSTĘP DO INFORMATYKI

Technologie informacyjne

Arytmetyka komputera

dr inż. Jarosław Forenc

Python. Wprowadzenie. Jolanta Bachan

Wstęp do Informatyki

Historia kodowania i format plików XML. Jolanta Bachan

12. Wprowadzenie Sygnały techniki cyfrowej Systemy liczbowe. Matematyka: Elektronika:

Podstawy Informatyki. Inżynieria Ciepła, I rok. Wykład 5 Liczby w komputerze

Dla człowieka naturalnym sposobem liczenia jest korzystanie z systemu dziesiętnego, dla komputera natomiast korzystanie z zapisu dwójkowego

Reprezentacja symboli w komputerze. Znaki alfabetu i łańcuchy znakowe. Programowanie Proceduralne 1

Technologie informacyjne - wykład 1 -

Technologie Informacyjne

Wprowadzenie do architektury komputerów systemy liczbowe, operacje arytmetyczne i logiczne

DZIESIĘTNY SYSTEM LICZBOWY

Jednostki informacji - bit. Kodowanie znaków: ASCII, ISO 8859, Unicode liczb: NKB (BCN), U2, BCD. Liczby zmiennoprzecinkowe standard IEEE 754

Pracownia Komputerowa wykład IV

Dane, informacja, programy. Kodowanie danych, kompresja stratna i bezstratna

Kodowanie liczb. Kodowanie znaków. Reprezentacja liczb w systemach komputerowych Reprezentacja stałoprzecinkowa. dr inŝ.

Pascal typy danych. Typy pascalowe. Zmienna i typ. Podział typów danych:

Reprezentacja symboli w komputerze.

Pracownia Komputerowa wyk ad IV

ARCHITEKTURA SYSTEMÓW KOMPUTEROWYCH

Krótka wycieczka do wnętrza komputera

Architektura komputerów

Technologie cyfrowe. Artur Kalinowski. Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15 Artur.Kalinowski@fuw.edu.

O oszczędnym dziennikarzu, czyli czym jest

Podstawy programowania w C++

Podstawy działania układów cyfrowych...2 Systemy liczbowe...2 Kodowanie informacji...3 Informacja cyfrowa...4 Bramki logiczne...

Modulacja i kodowanie. Labolatorium. Kodowanie źródłowe Kod Huffman a

SYSTEMY LICZBOWE. SYSTEMY POZYCYJNE: dziesiętny (arabski): 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 rzymski: I, II, III, V, C, M

Pracownia Komputerowa wykład V

Podstawy Programowania ELEMENTY PROGRAMU i TYPY DANYCH

Pracownia Komputerowa wykład VI

Programowanie w C++ Wykład 2. Katarzyna Grzelak. 4 marca K.Grzelak (Wykład 1) Programowanie w C++ 1 / 44

Jednostki informacji cyfrowej. Kodowanie znaków. Kodowanie liczb. dr inż. Jarosław Forenc

Programowanie Strukturalne i Obiektowe Słownik podstawowych pojęć 1 z 5 Opracował Jan T. Biernat

Dodatek Technologie internetowe 1. UTF-8 wg 2. Adresy URL

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Materiały dodatkowe Krótka charakterystyka protokołu MODBUS

Podstawy Informatyki. Metalurgia, I rok. Wykład 3 Liczby w komputerze

Temat 1. Zliczanie kropek numeracja dwójkowa

Komputer i urządzenia z nim współpracujące.

Podstawy programowania w Pythonie

PI 02-01/12. W jednym bajcie można można zakodować 256 różnych znaków.

wagi cyfry pozycje

dr inż. Jarosław Forenc

Cyfrowy zapis informacji. 5 grudnia 2013 Wojciech Kucewicz 2

Podstawy Informatyki

Informatyka 1. Wykład nr 3 ( ) Politechnika Białostocka. - Wydział Elektryczny. dr inŝ. Jarosław Forenc

Cel wykładu. Cel wykładu. Cel wykładu, cd. Cel wykładu, cd. Cel wykładu, cd. Z. Postawa, "Podstawy Informatyki II" Strona: 1 z 6

WOJEWÓDZKI KONKURS INFORMATYCZNY DLA UCZNIÓW DOTYCHCZASOWYCH GIMNAZJÓW ETAP WOJEWÓDZKI BIAŁYSTOK, 16 MARCA 2018

Pracownia Komputerowa wyk ad VI

dr inż. Jarosław Forenc

algorytm przepis rozwiązania przedstawionego zadania komputer urządzenie, za pomocą którego wykonywane są algorytmy

Jednostki informacji cyfrowej. Kodowanie znaków. Kodowanie liczb. Reprezentacja liczb w systemach komputerowych. Reprezentacja stałoprzecinkowa

Programowanie w języku Python. Grażyna Koba

Pracownia komputerowa. Dariusz Wardecki, wyk. V

Pracownia komputerowa. Dariusz Wardecki, wyk. IX

Cyfrowy zapis informacji

Sposób reprezentacji informacji w systemie. Reprezentacja informacji. Dzięki kodowaniu informacji.

2018 Marcin Kukliński. Niesforne bity i bajty

Pracownia Komputerowa wyk ad V

Algorytmy i struktury danych

4 Standardy reprezentacji znaków. 5 Przechowywanie danych w pamięci. 6 Literatura

1. PC to skrót od: a. Personal Computer b. Personal Calculator c. Perfect Creature

TECHNOLOGIE INFORMACYJNE

Liczby rzeczywiste są reprezentowane w komputerze przez liczby zmiennopozycyjne. Liczbę k można przedstawid w postaci:

INŻYNIERIA BEZPIECZEŃSTWA LABORATORIUM NR 2 ALGORYTM XOR ŁAMANIE ALGORYTMU XOR

dr inż. Jarosław Forenc

Reprezentacja symboli w komputerze.


Informatyka 1. Wykład nr 3 ( ) Politechnika Białostocka. - Wydział Elektryczny. dr inŝ. Jarosław Forenc

L6.1 Systemy liczenia stosowane w informatyce

Wyświetlacz alfanumeryczny LCD zbudowany na sterowniku HD44780

Podstawy informatyki. Izabela Szczęch. Politechnika Poznańska

Programowanie w C++ Wykład 2. Katarzyna Grzelak. 5 marca K.Grzelak (Wykład 1) Programowanie w C++ 1 / 41

Jednostki miar stosowane w sieciach komputerowych. mgr inż. Krzysztof Szałajko

Odczyt zegara ze sterownika do panelu serii TIU z możliwością korekty ustawień zegara w sterowniku

1. System pozycyjny zapisu liczb

BachoTEX Janusz S. Bień. UNICODE 4.0 Podstawowe pojęcia i terminy slajdy/jsb-gust04-s.

Sprzęt komputera - zespół układów wykonujących programy wprowadzone do pamięci komputera (ang. hardware) Oprogramowanie komputera - zespół programów

Akademia Techniczno-Humanistyczna w Bielsku-Białej

TECHNOLOGIE INFORMACYJNE

Transkrypt:

Systemy kodowania Jolanta Bachan 2016-10-13

Bajt Bajt najmniejsza adresowalna jednostka informacji pamięci komputerowej, składająca się z bitów. Zwykle przyjmuje się, że jeden bajt to 8 bitów, choć to nie wynika z powyższej definicji. W związku z tym w praktyce jeden bajt może zawierać dowolną liczbę bitów. Aby uniknąć niejednoznaczności, jednostka składająca się z ośmiu bitów zwana jest również oktetem. Wikipedia

ASCII ASCII [aski] (ang. American Standard Code for Information Interchange) 7-bitowy kod przyporządkowujący liczby z zakresu 0-127: literom (alfabetu angielskiego), cyfrom, znakom przestankowym i innym symbolom oraz poleceniom sterującym. Na przykład litera "a" jest kodowana liczbą 97, a znak spacji jest kodowany liczbą 32. Ponieważ kod ASCII jest 7-bitowy, a większość komputerów operuje na 8-bitowych bajtach, dodatkowy bit można wykorzystać na powiększenie zbioru kodowanych znaków do 256 symboli. Wikipedia

ASCII 0-127 0-7F 128 znaków 7-bitowy kod 1111111 = 127

1 bajt 0-255 0-FF 256 znaków 8-bitowy kod 11111111 = 255

128-255 Latin-1

UTF-16 2 bajty początkowo 2^16 = 65536, teraz 1.112.064 znaków 0-10FFFF UTF-16 (ang. 16-bit Unicode Transformation Format) w informatyce jeden ze sposobów kodowania znaków standardu Unicode. Sposób ten wymaga użycia szesnastobitowych słów (ang. word), przy czym dla znaków na pozycjach poniżej 65536 (przedział 0000-FFFF) używane jest jedno słowo, którego wartość odpowiada pozycji znaku w standardzie. Dla znaków z wyższych pozycji używa się dwóch słów. Wikipedia

Unicode Planes The Unicode code space is divided into seventeen planes of 2^16 (65,536) code points each, though some code points have not yet been assigned character values, some are reserved for private use, and some are permanently reserved as non-characters. The code points in each plane have the hexadecimal values xx0000 to xxffff, where xx is a hex value from 00 to 10, signifying which plane the values belong to. https://en.wikipedia.org/wiki/plane_(unicode) Wikipedia

UTF-8 UTF-8 system kodowania Unicode, wykorzystujący od 8 do 32 bitów do zakodowania pojedynczego znaku, w pełni kompatybilny z ASCII. Jest najczęściej wykorzystywany do przechowywania napisów w plikach i komunikacji sieciowej. Wikipedia

UTF-8 - STANDARD 1 bajt 0-7F 0-127 2 bajty 0080-07FF 3 bajty 0800-FFFF 128-2047 2048-65535 inne kodowane jako 4 bajty..

Kodowanie na stronach www Utwórz plik HTML, wpisz tekst z polskimi znakami, zmień kodowanie pliku oraz kodowania przeglądarki internetowej Kodowanie IPA: http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm Ćwiczenie z θɪŋ Inserting IPA symbols in web document

Unicode in Python Zainstaluj pakiet PyICU http://www.lfd.uci.edu/~gohlke/pythonlibs/#pyicu import unicodedata

Unicode in Python >>> unicodedata.unidata_version '5.2.0' >>> unicodedata.category(u'a') # 'L'etter, # 'u'ppercase 'Lu' >>> x = unichr(0x1383) >>> print x ᎃ

Unicode in Python ftp://ftp.unicode.org/public/unidata/unicodedata.txt u = unichr(233) + unichr(0x0bf2) + unichr(3972) + unichr(6000) + unichr(13231) for i, c in enumerate(u): print i, '%40x' % ord(c), unicodedata.category(c), print unicodedata.name(c) print unicodedata.numeric(u[1]) 0 e9 Ll LATIN SMALL LETTER E WITH ACUTE 1 bf2 No TAMIL NUMBER ONE THOUSAND 2 f84 Mn TIBETAN MARK HALANTA 3 1770 Lo TAGBANWA LETTER SA 4 33af So SQUARE RAD OVER S SQUARED http://www.fileformat.info/info/unicode/category/index.htm

Unicode in Python >>> a = unichr(0x2160) >>> print a Ⅰ >>> unicodedata.name(unichr(0x2160)) 'ROMAN NUMERAL ONE' >>> b = unichr(0x0049) >>> print b I >>> unicodedata.name(b) 'LATIN CAPITAL LETTER I'

Unicode in Python >>> unicodedata.name(u'}') 'RIGHT CURLY BRACKET' >>> unicodedata.name(u'a') 'LATIN CAPITAL LETTER A'

Unicode in Python >>> unicodedata.lookup('georgian CAPITAL LETTER TAR') u'\u10b2' >>> x = unichr(0x10b2) >>> print x Ⴒ

Unicode in Python >>> x = unichr(0x006e) + unichr(0x0334) >>> print x na

Unicode in Python set path=%path%;c:\python27 # -*- coding: UTF-8 -*- print('witaj świecie! ') u = unichr(0x015b) print u x = 'Witaj '+ unichr(0x015b) + 'wiecie!' + unichr(0x00e1) print x

Jak działa UTF-8 Co słychać? Co saychaa? Co sĺychaa? ł to U+0142 >>> unicodedata.name(unichr(0x0142)) 'LATIN SMALL LETTER L WITH STROKE' UTF-8 ma 2 bajty C5 82 Skąd wiem, że C5 82 to U+0142? C = 1100, 5 = 0101, 8 = 1000, 2 = 0010 ciąg bitów 11000101 10000010 110 na początku mówi, że są 2 bajty wyrzuć to i 10 na początku drugiego bajta Pozostaje 00101000010... a to jest 0142 w hex!!

Unicode in Python >>> x = unichr(0x0142) >>> print x ł >>> x u'\u0142' >>> x.encode('utf-8') '\xc5\x82' >>> print x ł

Do przeczytania http://docs.python.org/2/howto/unicode.html