Formaty czasopism i książek elektronicznych Dr hab. Marek Nahotko Transfer informacji w społeczeństwie 1
Zalety publikacji tradycyjnych Powszechnie znana i akceptowana konwencja; Dobra jakość tekstu; Dostosowanie do zdolności umysłowych człowieka; Łatwo przenoszalne (w przestrzeni); Publikacje elektroniczne, jeśli mają być konkurencją, muszą oferować jakąś wartość dodaną. 2
Zalety publikacji elektronicznych Wiele zalet związanych z formatem: Możliwości wyszukiwania (np. pełnotekstowego); Stosowanie multimediów; Prezentacje interaktywne i symulacje; Związki z innymi tekstami (odsyłacze, linki). 3
Formaty publikacji elektronicznych CZASOPISMA ELEKTRONICZNE 4
Pierwsze formaty ASCII (American Standard Code for Information Interchange) Reprezentacja 128 znaków (symboli); Nieadekwatna reprezentacja symboli chemicznych i matematycznych; Poważne trudności z reprezentacją języków innych niż angielski; Bardzo prymitywna grafika. 5
ASCII pierwsze e-czasopisma 6
ASCII 7
ASCII 8
Pierwsze formaty Bitmapa Obraz graficzny zapisywany jako wzór pojedynczych pikseli; Duża objętość pliku, kiepska jakość obrazu; Połączenie ASCII i bitmapy: możliwość wyszukiwania pełnotekstowego z wyglądem przypominającym druk; Włączanie bitmap (np. wykresów, równań itp.) do innych formatów (np. tekstowego, html). 9
Bitmapa 10
TeX i LaTeX Oba formaty pozwalają na kodowanie tekstów; TeX opisuje sposób wyświetlania tekstów; LaTeX przedstawia strukturę logiczną tekstów jest nadbudówką nad TeX, automatyzującą skład tekstu; LaTeX używany bywa z dodatkowymi tzw. klasami (stylami) ułatwiającymi konkretne zastosowania (np. tworzenie tekstów chemicznych) np. klasa RevTeX z grupy Physical Review; Format WYSIWYM (What You See Is What You Mean) autor tworzy strukturę logiczną (rozdziały, przypisy itp.), a tekst na stronie układa TeX. Dokument LaTeX zawiera kod źródłowy, który w wyniku kompilacji tworzy plik DVI (Device Independent), który można konwertować np. do PostScriptu. 11
LaTeX kod źródłowy 12
LaTeX - dokument 13
PostScript Format opisuje ostateczny wygląd strony; Akceptowany przez większość drukarek laserowych; Małe możliwości zmian przez użytkownika; Fonty muszą być dołączone do dokumentu (są odrębnym elementem). 14
PostScript w przeglądarce Ghostscript 15
CJTCS dziś - formaty 16
PDF Wersja PostScript z nowymi cechami: Linki hipertekstowe wewnątrz i między dokumentami; Przypisy i zakładki; Przeglądanie miniaturek stron; Fonty włączone do dokumentu Indeksowanie i wyszukiwanie pełnotekstowe; Efektywna kompresja (mniejsze pliki). 17
PDF Możliwość utrzymania wyglądu strony; Darmowe przeglądarki (podobnie jak dla PS); Coraz większe możliwości konwersji; Strona czasopisma w HTML, artykuły w PDF; ISO 32000-1: 2008. 18
Inne formaty opisu strony Replica - oprogramowanie opracowane we wczesnych latach 90. przez firmę Farallon Communications (od 2000 r. własność firmy Proxim), które służyło do przetwarzania dokumentów do formatu publikacji elektronicznej, podobnie jak PDF; Common Ground - format dokumentu elektronicznego opracowany w latach 90. przez kanadyjską firmę Hummingbird z Toronto, służył do tworzenia międzyplatformowych publikacji elektronicznych w środowisku Windows i Mac OS, z użyciem specjalnego sterownika, działającego analogicznie jak sterownik drukarki; Envoy - program opracowany w pierwszej połowie lat 90. przez firmę Tumbleweed Software, służący do generowania publikacji elektronicznych. Działał jak wirtualna drukarka, podobnie jak konkurencyjne do niego sterowniki PDF i Replica. Envoy został spopularyzowany przede wszystkim przez edytor WordPerfect dla Windows, razem z którym był przez pewien czas dostarczany. Jego rozwój został wstrzymany, a WordPerfect używa formatu PDF. 19
SGML (Standard Generalised Markup Language) Pozwala na opis logicznej struktury tekstu, nie sposobu wyświetlania; Definicja struktury w DTD (Document Type Definition) DTD dla czasopism: ISO 12083 Article DTD, ISO 12083 Serial DTD; Tworzenie własnych DTD przez wydawców; SGML zbyt skomplikowany; przejście do innych formatów (HTML). 20
SGML 21
SGML interfejs GUIDON z OCLC 22
Połączenie HTML i PDF - IDEAL 23
IDEAL 24
IDEAL 25
MUSE html + pdf 26
XML Pochodzi z SGML; Definiuje strukturę dokumentu; Tworzenie własnych DTD i Schematów XML: NewsML standard dla newsów w agencjach prasowych, MathML równania matematyczne, ChemML (lub CML) 27
Pliki w XML 28
Pliki w XML 29
NewsML 30
MathML 31
MathML 32
DjVu Dokumenty elektroniczne o wysokiej kompresji; Oparta na segmentacji obrazu rozdział na warstwy i oddzielna kompresja; Cechy: Bardzo małe pliki; Doskonała jakość; Format rastrowy (łatwość przenoszenia między platformami); Szybkie przeglądanie, powiększanie, przesuwanie obrazu, osadzanie w HTML; Przeszukiwanie: specjalna warstwa na wersję tekstową. 33
DjVu rozmiary plików 34
DjVu - warstwy 35
DjVu - obraz 36
DjVu - warstwy 37
Multimedia 38
Multimedia 39
Multimedia quiz dla lekarzy 40
Inne zastosowania multimediów 41
Multimedia 42
Interactive tables 43
DANE o artykułach w Excel (PLoS) 44
Graficzne wizualizacje danych 45
Graficzne wizualizacje danych Obracanie obiektów Modyfikacja orientacji Różne reprezentacje Ułatwiają badania ale jednocześnie... Uzależnione od platformy, wymagają plugin ów lub dodatkowych informacji
Multimedia: grafika 47
Multimedia: nagrania dźwiękowe 48
Formaty publikacji elektronicznych KSIĄŻKI ELEKTRONICZNE 49
Formaty plików Wielość stosowanych, niekompatybilnych formatów plików: Formaty opisu strony (PS, PDF, DjVu) Formaty opisu struktury (HTML, XML, EPUB, Mobipocket dwa ostatnie w XHTML+CSS) Formaty natywne (Amazon AZW) Formaty otwarte (PDF, EPUB) Częsty brak kompatybilności i współdziałania. Obecnie tzw. multiformat: Klient płacąc za tytuł, otrzymuje go w każdym dostępnym dla niego w danej chwili formacie. 50
Formaty plików Czytnik Producent Odtwarzane formaty Kindle3 Amazon AZW, PDF, TXT, MOBI, PRC Nook Barnes&Noble EPUB, PDF, PDB, JPG PRS-600 Sony EPUB, PDF, TXT, RTF, DOC, LRX, LRF iriver Story Iriver EPUB, PDF, TXT, DOC, PPT, XLS, HWP PocketBook 302 PocketBook EPUB, PDF, FB2, TXT, RTF, HTML, PRC, CHM, DJVU, DOC Kobo ereader Kobo EPUB, PDF BeBook Neo Endless ideas EPUB, PDF, TXT, HTML, RTF, MOBI, CHM, PDB Alex Reader Spring Design EPUB, PDF, TXT, HTML Novel Pandigital EPUB, PDF 51
Formaty plików
Formaty plików 53
Obecnie najczęściej stosowane epub Jest to format w którym ostateczny wygląd książki uzależniony jest od urządzenia oraz indywidualnych preferencji użytkownika. Użytkownik może decydować o marginesach a także rozmiarze wyświetlanej czcionki, dzięki zastosowaniu standardu formatowania opartego o XHTML oraz kaskadowych arkuszy styli CSS. Mobi Format ten stosowany jest głównie w czytnikach Kindle firmy Amazon. Format ten daje mniejsze możliwości formatowanie treści niż epub, jego podstawą jest również XHTML i CSS. PDF Format ten wyróżnia się na tle innych sztywnym podziałem książki na strony, co niekorzystnie wpływa na mniejsze wyświetlacze gdzie pojawia się problem skalowania wielkości treści. 54
epub epub (electronic publication) to otwarty standard, oparty na języku XML, służący do publikowania elektronicznych książek, tworzony przez non-profit IDPF (Intern. Digital Publishing Forum). Jest to bezpośredni następca rozwijanego wcześniej formatu Open ebook. Tworzone w nim książki nie mają podziału na strony, choć istnieje możliwość wyświetlania na marginesie numeru strony pochodzącego z książki drukowanej. Format ten jest stosowany w czytnikach książek elektronicznych, smartfonach i tabletach. Format epub jest wygodny w użytkowaniu można skalować obraz, zmieniać wielkość i rodzaj czcionki, dostosowując je do swoich wymagań. Tekst wypełnia ekran czytnika (brak stronicowania), a przy zmianie czcionki zachowuje swoje właściwości, wysoki kontrast i komfort czytania. Aby móc odczytywać pliki w formacie epub należy pobrać odpowiednie oprogramowanie np. Adobe Digital Editions. 55
MOBI Ogólnie przyjęte określenie formatu pliku tekstowego odczytywanego m.in. przez program Mobipocket Reader. Pliki zapisane w zależności od potrzeb użytkownika i rodzaju czytniku mogą posiadać rozszerzenie.mobi,.prc (Product Representation Compact), a także.pdb. Format Mobi zyskuje coraz większe uznanie i akceptację wraz z rosnącą popularnością urządzeń mobilnych (Kindle). Plików nie można drukować. Aplikacje na Windows i Apple. Format Mobipocket jest zastępowany przez nowy format KF8 Amazona. Oparty na HTML5 i CSS. 56
PDF PDF jest bardzo popularnym formatem. Istneje wiele programów do tworzenia PDF od produktów Adobe zaczynając, poprzez MS Word na wirtualnych drukarkach, pozwalających drukować do0 PDF z prawie każdej aplikacji kończąc. Głównym problemem z PDF jest brak możliwości dopasowania tekstu do rozmiarów małych ekranów. Urządzenia do e-booków typu Kindle i Nook, a także telefony i tablety jak iphone, ipad oraz Kindle Fire, mają ekrany mniejsze niż typowy komputer a nawet niż typowa książka. W rezultacie, po załadowaniu na urządzenie pliku w formacie PDF zazwyczaj trzeba go dostosować do rozmiarów ekranu. Z tego powodu większość formatów e- booków, takich jak epub i Kindle dostosowuje tekst do wielkości ekranu w locie. PDF ma opinię formatu trudnego w użytkowaniu. Wiele urządzeń podczas próby ładowania pliku w tym formacie automatycznie konwertuje go na inny. 57
Zabezpieczenia DRM - (z j. ang. digital rights management, Zarządzanie prawami cyfrowymi) metoda polegająca na zabezpieczeniu pliku przed możliwością kopiowania i ograniczająca możliwość odczytania pliku do konkretnych modeli urządzeń. Ze względu na pewne kontrowersje związane z ograniczeniami użytkowymi (np. niemożliwość wykonania dopuszczalnej wyłącznie do własnego użytku kopii bezpieczeństwa pliku), format jest coraz częściej zastępowany o wiele wygodniejszym watermarkiem. Jednocześnie ze względu na pewien stopień skomplikowania formatu, zdarzały się błędy, bądź luki w działaniu (które były upubliczniane przez użytkowników), których łatanie powodowało dalsze ograniczenia. Watermark (znak wodny) rozwiązanie o wiele wygodniejsze, ze względu, na to że w momencie zakupu książki elektronicznej, plik jest tylko wysyłany na specjalny serwer treści, który znakuje go danymi osoby kupującej, umożliwiającymi identyfikację osoby z konkretnym plikiem. Poza tym format nie ma ograniczeń DRM, czyli można go skopiować na zasadzie wyłącznej kopii bezpieczeństwa (oczywiście bez rozprzestrzeniania takiego pliku, bo widać od kogo pochodzi); nie ma również ograniczeń sprzętowych do odtwarzania pliku z takim zabezpieczeniem. Ma to zasadniczy aspekt psychologiczny użytkownik przysłowiowo dwa razy zastanowi się zanim udostępni e-book np. znajomemu. 58
Mobi, epub (dostosowujące się) 59
KF8, epub3 (stały układ strony) 60
Formaty dostosowujące się Zalety: Duże możliwości rozpowszechniania akceptowane przez większość platform i urządzeń. Użytkownik ma kontrole nad sposobem wyświetlania tekstu. Zwykle mniejszy rozmiar pliku, więc niższe koszty. Zwykle tańszy w produkcji. Łatwiejszy do aktualizacji. Wady: Umożliwia tylko prosty układ strony bez wielu kolumn, absolutnego pozycjonowania treści. Mała kontrola nad bękartami i wdowami. Czytelnik kontroluje wielkość tekstu, krój czcionki, odstępy między wierszami i marginesy, więc ilość widocznego tekstu może być różna na różnych urządzeniach i ustawieniach. Ograniczone możliwości włączania fontów. 61
Stały układ strony Zalety: Pełna kontrola nad wyglądem strony, czyli np.: Układ wielokolumnowy Pozycjonowanie tekstu względem ilustracji Kolorowe tło Ilustracje całkowicie wypełniające stronę Wyświetlanie dwóch stron Bezproblemowe włączanie fontów. Wady: Ograniczone możliwości dystrybucji. ebooki nie nadają się na wszystkie urządzenia lub aplikacje ze wzgl. na specyficzne style Duże rozmiary plików, co może zwiększać opłaty za download. Problemy z czytelnością na niektórych urządzeniach ze względu na rozmiar. Zwykle droższe w produkcji i aktualizacji. 62
Narzędzia 63
Przykładowa Rich Internet Publication: OCHRE (aplikacja java) 64
OCHRE: publikacje 65
OCHRE: katalog tabliczek 66