BachoTEX Janusz S. Bień. UNICODE 4.0 Podstawowe pojęcia i terminy slajdy/jsb-gust04-s.

Podobne dokumenty
Spis treści 0. Uwagi końcowe

Kodowanie informacji. Przygotował: Ryszard Kijanka

Pracownia Komputerowa wyk ad VII

Standard Unicode 4.0. Wybrane pojęcia i terminy

Komunikacja człowiek-komputer

Podstawy informatyki. Reprezentacja danych w systemach cyfrowych

Systemy kodowania. Jolanta Bachan

kodowanie informacji Autor prezentacji: 1 prof. dr hab. Maria Hilczer

Pracownia komputerowa. Dariusz Wardecki, wyk. VIII

Techniki multimedialne

Systemy liczenia. 333= 3*100+3*10+3*1

Ministerstwo Spraw Zagranicznych. Identyfikacja wizualna

dr inż. Jarosław Forenc

Kodowanie liczb. Kodowanie znaków. Reprezentacja liczb w systemach komputerowych Reprezentacja stałoprzecinkowa. dr inŝ.

Racjonalna klawiatura dla typografa i programisty

Pracownia komputerowa. Dariusz Wardecki, wyk. IV

Jednostki informacji - bit. Kodowanie znaków: ASCII, ISO 8859, Unicode liczb: NKB (BCN), U2, BCD. Liczby zmiennoprzecinkowe standard IEEE 754

Arytmetyka komputera

Wprowadzenie do informatyki i użytkowania komputerów. Kodowanie informacji System komputerowy

Pracownia komputerowa. Dariusz Wardecki, wyk. V

konstrukcja logo konstrukcja logo - forma wyjściowa konstrukcja logo - przekształcenie konstrukcja logo - forma ostateczna logo - wersja kolorowa

Grafika inżynierska i rysunek geodezyjny

Ministerstwo Spraw Zagranicznych. Identyfikacja wizualna

CENTRUM ZESPOŁÓW ANALITYCZNO STRATEGICZNYCH Od Szkolenia i doradztwo Projekty/programy dotyczące grup defaworyzowanych Partnerstwo z Polskim

Wstęp do Informatyki

Katalog identyfikacji wizualnej JUBILEUSZOWEGO ZNAKU PZPN. Copyright PZPN All rights reserved DZIAŁ SPONSORINGU I MARKETINGU



Pracownia Komputerowa wykład IV

O pojęciu wyrazu morfologicznego

Kodowanie znaków narodowych

Pracownia komputerowa


Wstęp do Informatyki

12. Wprowadzenie Sygnały techniki cyfrowej Systemy liczbowe. Matematyka: Elektronika:

100-LECIE UNIWERSYTETÓW W POZNANIU

Pracownia Komputerowa wyk ad IV

Modulacja i kodowanie. Labolatorium. Kodowanie źródłowe Kod Huffman a

Języki programowania zasady ich tworzenia

Jak zapisać wersje elektroniczną pracy dyplomowej? - INSTRUKCJA (krok po kroku)

Spis treści. Funkcje opracowane dla języków Europy Środkowej

1. Znaki dostępne na etapie projektowania formuł matematycznych w programie opracowywania kursu, zadania. a. Litery łacioskie małe, duże.

Podstawowe elementy tekstów elektronicznych

dr inż. Jarosław Forenc

Informatyczne podstawy projektowania Kod przedmiotu

Test z przedmiotu zajęcia komputerowe

Dane, informacja, programy. Kodowanie danych, kompresja stratna i bezstratna

Pascal typy danych. Typy pascalowe. Zmienna i typ. Podział typów danych:

Znaki marki Fundacja ARP

Programowanie strukturalne. Opis ogólny programu w Turbo Pascalu

Klawiatura komputerowa.

Wprowadzenie do XML. Joanna Jędrzejowicz. Instytut Informatyki

- Wszelka informacja przetwarzana przez system komputerowy jest ciągiem zer i jedynek. Niczym więcej.

dr inż. Jarosław Forenc

Architektura systemów komputerowych Laboratorium 5 Kodowanie liczb i tekstów

Pracownia Komputerowa wykład V

L6.1 Systemy liczenia stosowane w informatyce

Temat: Liczby definicje, oznaczenia, własności. A n n a R a j f u r a, M a t e m a t y k a s e m e s t r 1, W S Z i M w S o c h a c z e w i e 1

Rejestracja znaków narodowych w.pl. Andrzej Bartosiewicz Tomasz Zygmuntowicz Agnieszka Zalewska Dorota Tusień

Standard Unicode w typografii

Pracownia Komputerowa wyk ad V

dr inż. Paweł Myszkowski

Uwagi dotyczące techniki pisania pracy

Typy danych, zmienne i tablice. Tomasz Borzyszkowski

dr inż. Andrzej KIJ 1

DZIESIĘTNY SYSTEM LICZBOWY

Technologie informacyjne

Adam Twardoch Unicode i OpenType jako nowe metody cyfrowej reprezentacji i prezentacji tekstu

WYRAŻENIA ALGEBRAICZNE

Informatyka 1. Wykład nr 3 ( ) Politechnika Białostocka. - Wydział Elektryczny. dr inŝ. Jarosław Forenc

Spis treści. 2.1 Paleta kolorów 2.2 Typografia

Podstawy informatyki. Izabela Szczęch. Politechnika Poznańska

Jednostki informacji cyfrowej. Kodowanie znaków. Kodowanie liczb. dr inż. Jarosław Forenc

Systemy pisma Typologia

Podstawy programowania w Pythonie

Znaki marki Znak firmowy ARP S.A.

Dane, informacja, programy. Kodowanie danych, kompresja stratna i bezstratna

Standaryzacja Logo i Brand Design

Podstawy informatyki (2)

Reprezentacja symboli w komputerze. Znaki alfabetu i łańcuchy znakowe. Programowanie Proceduralne 1

Algorytmy i struktury danych. wykład 2

Technologie Informacyjne

Ochrona danych osobowych. Pozycyjne systemy liczbowe. Jednostki informacji. Kodowanie znaków ASCII, ISO 8859, Unicode. Kodowanie liczb NKB, U2, BCD

Internationalized Domain Names. Autorzy: Krzysztof Olesik & Paweł Krześniak

Algorytmy zachłanne. dr inż. Urszula Gałązka

Języki formalne i automaty Ćwiczenia 6

Stan wysoki (H) i stan niski (L)

Wzorce projektowe i refaktoryzacja

Etap I V Gminnego Konkursu Informatycznego.

Pismo systemowy zespół znaków przyjętych przez grupę ludzi i mający to samo znaczenie dla wszystkich jej członków, służący do widzialnego i trwałego

Internacjonalizacja i lokalizowanie aplikacji internetowych wg

Internacjonalizacja i lokalizowanie aplikacji internetowych wg

KSIĘGA ZNAKU I SYSTEM IDENTYFIKACJI WIZUALNEJ

Wstęp do Informatyki. dr inż. Paweł Pełczyński

Matematyczne Podstawy Informatyki

Algorytmy i schematy blokowe

Księga znaku Dni Otwartych Funduszy Europejskich

POLITECHNIKA OPOLSKA

Ewidencja oznakowania w oparciu o system wideorejestracji.

Transkrypt:

Spis treści -1 BachoTEX 2004 Kodowanie tekstów w komputerze Kodowanie tekstów w komputerze Unicode 4.0 Unicode Consortium (www.unicode.org) Terminologia Unicode Unicode 4.0 Alfabety i symbole Alfabety i symbole Zunifikowane znaki hanowskie Koreańskie znaki sylabiczne Koreańskie znaki sylabiczne Znaki i glify Znaki i glify Dygresja Grafemika Grafem w Unikodzie Podział znaków piśmiennych Znaki dostosowawcze Dekompozycja dostosowawcza Dekompozycja kanoniczna Dekompozycja kanoniczna Kompozyty i singletony

Spis treści 0 Dekompozycja normalizacyjna Dekompozycja adaptacyjna Własności znaków Własności znaków Własności znaków Własności znaków Własności znaków Unifikacja i skrypty Założenia projektowe (Design principles) Założenia projektowe (Design principles)

BachoTEX 2004 1 Janusz S. Bień UNICODE 4.0 Podstawowe pojęcia i terminy 30.04.2004 http://www.mimuw.edu.pl/~jsbien/ slajdy/jsb-gust04-s.pdf

Kodowanie tekstów w komputerze 2 Rodzaje kodowania: akustyczne wizualne symboliczne technologiczne

Kodowanie tekstów w komputerze 3 Kodowanie symboliczne: czysty tekst (plain text) tekst adiustowany (marked-up text)

Kodowanie tekstów w komputerze 4 Czysty tekst kodowany symbolicznie: ciąg znaków piśmiennych znaki piśmienne (characters) reprezentowane przez liczby naturalne

Unicode 4.0 5

Unicode 4.0 6 The Unicode Standard Version 4.0 1504 strony plus CD-ROM Addison-Wesley 27.08.2003

Unicode Consortium (www.unicode.org) 7

Terminologia Unicode 8 Znaki (piśmienne) (abstract) character

Terminologia Unicode 9 repertuar znaków piśmiennych abstract character repertoire

Terminologia Unicode 10 współrzędna kodowa znaku character code point

Unicode 4.0 11 96 246 znaków: alfabety i symbole ok. 14 000 zunifikowane znaki hanowskie ok. 20 000 dodatkowe znaki hanowskie ok. 50 000 koreańskie znaki sylabiczne ok. 11 000

Alfabety i symbole 12 CYRILLIC CAPITAL LETTER KOMI ZJE

Alfabety i symbole 13 EIGHT PETALLED OUTLINED BLACK FLORETTE

Zunifikowane znaki hanowskie 14 Unified Han Ideographs dynastia hanowska dynastia Han od 206 r. p.n.e. pismo hanowskie: Chiny wersja tradycyjna Chiny wersja uproszczona Japonia Korea

Zunifikowane znaki hanowskie 15

Koreańskie znaki sylabiczne 16 Pismo koreańskie (hangul) alfabetyczne ale znaki są wpisywane w prostokąt!

Koreańskie znaki sylabiczne 17

Znaki i glify 18 LATIN SMALL LETTER A WITH OGONEK ą ą ą ą ą ą ą ą ą ą ą ą ą ą ą 261 (heksadecymalnie 0105)

Znaki i glify 19 Glify (glyphs) ą ą ą ą ą ą ą ą ą ą ą ą ą ą ą Znak piśmienny (abstract character) 261 (heksadecymalnie 0105) LATIN SMALL LETTER A WITH OGONEK

Znaki i glify 20 Znak czy glif? A (alfabet łaciński) A (alfabet grecki) A (cyrylica)

Dygresja 21 geometria a grafemika

Grafemika 22 Jan Niecisław Baudouin de Courtenay Istniejące stale w naszej psychice wyobrażenie niepodzielnej litery nazywamy grafemą. 1915

Grafem w Unikodzie 23 http://www.unicode.org/glossary/ Grapheme. [... ] (2) What a user thinks of as a character. 2004

Podział znaków piśmiennych 24 znaki właściwe normal characters znaki dostosowawcze compatibility characters

Znaki dostosowawcze 25 konwertowalność test przekodowania okrężnego round-trip test dekompozycja dostosowawcza compatibility decomposition

Dekompozycja dostosowawcza 26 dekompozycja kanoniczna canonical decomposition dekompozycja adaptacyjna [proper] compatibility decomposition

Dekompozycja kanoniczna 27 OHM SIGN 2126 GREEK CAPITAL LETTER OMEGA 03A9

Dekompozycja kanoniczna 28 dostosowawcza dekompozycja kanoniczna [???] canonical decomposition normalizacyjna dekompozycja kanoniczna [???] canonical decomposition

Kompozyty i singletony 29 kompozyty znaki rozkładalne (NIE: złożone) precomposed characters composites singletony znaki nierozkładalne nondecomposable characters

Dekompozycja normalizacyjna 30 LATIN CAPITAL LETTER A WITH OGONEK 0104 LATIN CAPITAL LETTER A 0041 COMBINING OGONEK 0328

Dekompozycja adaptacyjna 31 SUPERSCRIPT ONE 00B9 DIGIT ONE 0031

Własności znaków 32 D2b Character semantics: The semantics of a character are determined by its identity, normative properties, and behavior.

Własności znaków 33 Własności znaków normatywne informacyjne

Własności znaków 34 Normatywne własności znaków nieznak noncharacter odstęp whitespace blok block [... ]

Własności znaków 35 Bloki Unicode u Arabic presentation forms arabskie warianty prezentacyjne (Word: Formularze prezentacji arabskiej!) Spacing Modifier Letters gabarytowe [?!] modyfikatory literowe [?!] (Windows XP: Litery modyfikujące odstępy!)

Własności znaków 36 kaszta case przekształcenia kasztowe case mapping kaszta górna (majuskuły) kaszta dolna (minuskuły) kaszta tytułowa title case redukowanie kaszt case folding

Własności znaków 37 Znak czy glif? A (alfabet łaciński) a A (alfabet grecki) α A (cyrylica) a

Własności znaków 38 Znak czy glif? A (alfabet łaciński) a LATIN CAPITAL LETTER A 0041 A (alfabet grecki) α GREEK CAPITAL LETTER ALPHA 0391 A (cyrylica) a CYRILLIC CAPITAL LETTER A 0410

Unifikacja i skrypty 39 systemy pisma pisma skrypty scripts unifikacja wschodnioazjatycka CJK unification

Założenia projektowe (Design principles) 40 Czysty tekst (nie adiustowany). Znaki piśmienne, nie glify. Unifikacja. Dynamiczne składanie znaków Uniwersalność.

Założenia projektowe (Design principles) 41 Efektywność. Semantyka znaków. Logiczna (nie graficzna) kolejność. Równoważne reprezentacje. Konwertowalność