MBC technologia - instrukcja 3 1 3. MBC pdf2djvu konwersja PDF do DJVu Procedura konwersji publikacji w formacie PDF do formatu DJVu Założenia. A. Do zastosowania tej metody kwalifikują się wydawnictwa współczesne składane z użyciem czcionki wektorowej, wydrukowane do formatu PDF z aplikacji macierzystych (np. InDesign, Quark, PageMaker). Można ja także stosować do innych publikacji przygotowanych w wersji elektronicznej w dowolnych programach (Corel, Photoshop, AutoCad, MS Word itp.) i wydrukowanych do PDF wirtualną drukarką PDF. B. Jeśli źródłowy PDF ma odpowiednio wysokie parametry jakość wyjściowego DJVu będzie doskonała, a rozmiar niewielki. Wydruki z PDF do DJVu wykonujemy zawsze w rozdzielczości 600 DPI (warstwa treści) i 200 dpi warstwa tła (czyli grafika) nawet jeśli fragmenty źródłowego PDF mają niższe parametry. C. Dla zapewnienia dobrej jakości źródłowe PDF te powinny spełniać następujące minimum: 1. Wariant optymalny - PDF ver 1.4 lub 1.5 lub 1.6 - Czcionki dowolne osadzone - kompresja grafiki kolorowej: 200 dpi - kompresja grafiki grayscale: 200 dpi - kompresja grafiki bitonalnej: 200 dpi - inne parametry dowolne - mile widziana optymalizacja Adobe Acrobatem - średnio taka strona przy pełnym kolorze w formacie A3 liczy ok. 700 kb, a przy A4 - ok. 350 kb 2. Wariant minimalny - PDF ver 1.4 lub 1.5 lub 1.6 - Czcionki dowolne - osadzone - kompresja grafiki kolorowej: 100 dpi - kompresja grafiki grayscale: 100 dpi - kompresja grafiki bitonalnej: 100 dpi - inne parametry dowolne - mile widziana optymalizacja Adobe Acrobatem - średnio taka strona przy pełnym kolorze w formacie A3 liczy ok. 400 kb, a przy A4 - ok. 200 kb Konwersja publikacji z kompresją grafiki poniżej 100 dpi jest także możliwa, lecz ryzykowana, gdyż niemal na pewno wyjściowe pliki (a szczególnie fotografie będą złej jakości). Jeśli redakcja nie jest w stanie ustalić parametrów PDF wyjściem intuicyjnym jest powiększenie PDF do 200-300% i wizualna ocena czy ilustracje nie tracą na jakości. D. Zakładamy, że publikacje składane w programach DTP na potrzeby drukarni będą przed redakcję odpowiednio zmontowane (ustawiona kolejność stron wraz z okladką). W doraźnych przypadkach pracownicy MBC wykonają montaż lub poinstruują jak taki montaż wykonać. E. W ograniczonym zakresie procedurę można stosować do publikacji PDF, która zawiera wyłącznie zakotwiczoną (zaimportowaną) grafikę rastrową. Zapisywanie skanowów wprost do PDF jest z punktu widzenia ich konwersji do DJVu niewskazane. Przy tego typu skanach lepszym rozwiązaniem jest dostarczenie ich w formacie TIF (w ostateczności JPG). Dla PDf z zakotwiczoną grafiką rastrową procedura konwersji będzie poprawna, lecz wyjściowe pliki będą stosunkowo duże (zależnie od stopnia kompresji, średnio 0,5-1,5 MB strona). PROCEDURA Przygotowanie 1. Przed konwersją należy zgromadzić pliki na dysku (podejrzeć zawartość) i nadać im odpowiednie nazwy. Sugerujemy aby stosować następująca notację: tytul_rok_numer (czasopisma) lub nazwisko_imie_tytul_miesjce_wyd_rok (inne wydawnictwa). W nawach plików (nie należy używać spacji, wielkich/małych liter, ani polskich znaków diakrytycznych). W przypadku błędów i potrzeby masowej zmiany nazw sugeruję użycie programu: Total Commander. 2. Jeśli dokument składa się z kilku części należy utworzyć folder [ tytul_rok_numer ] i skopiować tam wszystkie części numerując je odpowiednio. W niektórych przypadkach okładki moga być w innym formacie niż PDF, np. TIF, JPG lub CDR. Co pewien czas taki materiał winien być montowany specjalistycznym oprogramowaniem np. komercyjny Adobe Acrobat lub darmowymi aplikacjami: PDF Tools (http://www.sheelapps.com/pdftools.html) lub PDFTK (http://www.paehl.de/pdf/?gui_for_pdftk). Dwa ostatnie programy oferują wiele interesujących opcji, w tym naprawa PDF stąd warto nauczyć się nimi posługiwać. 3. Po zmianie nazw należy przejrzeć materiał na okoliczność kompletności i parametrów. Czy pliki nie przekraczają granicy zdrowego rozsądku (do 10-20 MB dla A4 lub do 30-40 MB dla A3). Można wprawdzie gromadzić i obrabiać większe PDFy, ale ich obróbka trwa długo i szybko zapełnia przestrzeń archiwalna MBC. Podczas oceny PDF warto też zwrócić uwagę na format PDF niektóre podejrzanie duże PDFy mogą mieć przesterowany format (większość dokumentów PDF powinna mieć wysokość między 8 (format A4) a 15 (format A3) cali - ang. inch. Jeśli do konwersji wykorzystujemy oprogramowanie windows należy odnotować rozmiary każdej strony w calach (z dokl do 2 liczb po przecinku: np. 8,25). Podczas sprawdzania należy też zwrócić uwagę, czy strony mają właściwe marginesy (niektórzy wydawcy zapominają obciać tzw. marginesy drukarskie) gdy taki problem się zdarzy należy PDF wykadrować przy pomocy Adobe Acrobata. Warto też zwrócić uwagę czy na stronach nie drukują sie krzaczki lub czy nie brakuje ilustracji itp. takich problemów raczej nie da się naprawić pozostaje albo opublikować z wadami, albo zwrócić sie do wydawcy po poprawna wersję. Kolejny problem to druk na rozkładówce jeśli niektórzy wydawcy przygotowali PDF na rozkładówce w MBC raczej nie zmieniam takich PDFow jakkolwiek jest to czynność wykonalna warto jednak postarać się wyekstrachowac z tego okładkę (bez rozkładówki na potrzeby miniaturki szerzej na ten temat w instrukcji nr 1 punkt o kadrowaniu. 4. Sprawdzone i poprawne PDF można przekazać do konwersji.
MBC technologia - instrukcja 3 2 5. Konwersję PDF do formatu DJVu umożliwiają dwa programy: Komercyjny DJVU Virtual Printer (dodatek do DE) działa jak wirtualna drukarka. Podczas konwersji należy podać rozmiary PDF (por. pkt 3) i określić rozdzielczość zawsze 600 dpi (rys. 1) inne parametry domyślne. Po zatwierdzeniu opcji należy chwilę poczekać, pojawi się okno konwertera (rys. 2). Z ważnych opcji należy wybrać dwie: rozdzielczość 600 dpi i odznaczyć create searchetable text. Po zatwierdzeniu rozpocząć dekodowanie. Wyczerpujaca instrukcja VP na stronach GB Soft: http://www.djvu.pl/brochures.php. W MBC staramy się w ograniczonym zakresie wykorzystywać VP, gdyż konwersja trwa zwykle bardzo długo od 5 min do 1 godz. Bezpłatny program z djvudigital z pakietu djvulibre (linux) który oferuje podobne możliwości. System ten jest zainstalowany na serwerach MBC. Aby go wykorzystać należy okresowo wgrywać większe partie materiału na serwer fidkar do katalogu: /home/mbc/pdf_do_konwersji i informować administratora e-mailem. Trwają prace aby w pełni zautomatyzować posługiwanie się tym narzędziem: strona dostępu: http://djvu.mbc.malopolska.pl/. 6. Czynności końcowe: adnotacja, info. dla wydruku (DE lub Solo lub djvused) o Pliki tworzone za pomocą VP (windows) mają wersję 26 i mogą być edytowane tylko w DE o Pliki tworzone djvulibre (linux) mają wersję 24 można edytować edytorem Solo (lub z linii komend: djvused) miniaturka jpg, szerokość 200 pikseli przynajmniej 100 dpi (dowolny program graficzny) o Istnieje prosty sposób tworzenia miniaturek JPG za pomocą xnview. Należy jednak prócz xnview zainstalować ghostscripta. Proces ten można dalece zautomatyzować odpowiednim skryptem. W xnview nalezy zaznaczyć odpowiednie PDFy, wybierz konwertuj wiele plików pozostałe ustawienia zob. (zob. rys. 3). Uwaga Przy tej czynności należy być cierpliwym i uruchomić konwersję dopiero wtedy, gdy xnview zinterpretuje wszystkie PDF (z lewej strony u dołu zniknie pasek postępu) w katalogach z duża liczba PDF może to trwać nawet kilka minut. 7. OCR Jakkolwiek jest możliwe tworzenie OCR już podczas kodowania z PDF do DJVu znawcy zalecają aby z niej nie korzystać gdyż działa wybiórczo i jest ułomna. Stąd zaleca się aby OCR wykonywać oddzielnie. Aktualnie poprawny polski OCR można wykonać tylko za pomocą DE. Trwają prace nad wdrożeniem OCR na serwerze linux. 8. Archiwizacja MBC. Z uzyskanych tą droga materiałów archiwizujemy: PDF (finalny) oraz djvu (rozdzielony) + miniaturka Błędy: konwersja z PDF do DJVu przebiega na ogół sprawnie mogą sie sporadycznie pojawić pojedyncze strony o nieproporcjonalnie dyzych rozmiarach zatem przed publikacja należy sprawdzić strukturę dokumentu, czy nie ma tam feralnych stron (w MBC nieprzekraczalna granica dla dużych formatów to 1,1 MB kb) jeśli podczas sprawdzania stwierdzimy że są takie strony, ntrony je poprawiać w specjalistyczny sposób. Najczęściej poprawa polega na edycji eksporcie ftrony do TIF (ew. odpowiedni retusz) i generowanie pojedynczej strony od nowa innym algorytmem, a następnie jej podmiana.
MBC technologia - instrukcja 3 3 Rys. 1, DJVu Virtual Printer Rys. 2 DJVu Virtual Printer okno ustawień kodowania
MBC technologia - instrukcja 3 4 Rys. 3 xnview tworzenie miniaturki okładki (z PDF do JPG) Karta ogólne: Karta przekształcenia:
MBC technologia - instrukcja 3 5 Rys. 4, PDFTK (wersja z GUI) Rys. 5, PDFTools (wymaga MS.Net Framework)