Uwagi o tworzeniu korpusów (wersja z 4 lipca 2012 )
|
|
- Nina Biernacka
- 10 lat temu
- Przeglądów:
Transkrypt
1 Krzysztof Szafran Instytut Informatyki UW Uwagi o tworzeniu korpusów (wersja z 4 lipca 2012 ) 1. Wprowadzenie Tekst niniejszy stanowi zbiór uwag i notatek, których celem jest ułatwienie początkującemu użytkownikowi poliqarpa i rozmaitych narzędzi z nim związanych przygotowywanie korpusów. Tekst w żadnym wypadku nie stanowi samodzielnej dokumentacji wymienionych w nim programów i narzędzi i w wielu miejscach odsyła do tej dokumentacji. Ostatnia część tekstu zawiera również pewne uwagi dotyczące instalacji poliqarpa oraz marasca. 2. Budujemy korpus na przykładzie Słownika polszczyzny XVI wieku 2.1. Przygotowanie pdf-u Poszczególne tomy Słownika przygotowywane są zwykle w postaci plików pdf ale często rozmaite fragmenty tomu zawarte są w oddzielnych plikach. Wszystkie fragmenty dokumentu zawarte w oddzielnych plikach pdf muszą zostać połączone w jeden plik z zachowaniem właściwej kolejności stron. Można do tego użyć programu o nazwie pdftk 1. Przykładowe wywołanie pokazane jest niżej. pdftk SpXVI_35t_kpbc.pdf SpXVI_35t_wkl1_kpbc.pdf SpXVI_35t_wkl2_kpbc.pdf cat output SpXVI_35t.pdf Trzy pierwsze argumenty programu są nazwami plików zawierających kolejno tekst 35. tomu słownika oraz tekst dwóch wklejek dołączonych do każdego tomu. Kolejny argument ( cat ) oznacza polecenie połączenia tych plików. Ostatni jest nazwą pliku wynikowego, do którego ma zostać zapisany cały dokument Konwersja do formatu DjVu Kolejnym etapem jest przygotowanie kopii dokumentu w formacie DjVu. Punktem wyjścia jest plik w formacie pdf. Do konwersji dokumentu z formatu pdf do formatu DjVu można użyć programu o nazwie pdf2djvu 2. pdf2djvu -d filter-text=unligature -i index.djvu SpXVI_35t.pdf Uwagi: 1. Użycie parametru -i powoduje powstanie tak zwanego rozdzielonego dokumentu DjVu (por. man pdf2djvu). Plik indeksowy tego dokumentu powinien nazywać się index.djvu. 1 Por. np.: 2 Por. np.: 1
2 2. pdf2djvu domyślnie robi normalizację NFKC tekstu (patrz man pdf2djvu oraz unicode.org/reports/tr15/), która w szczególności zamienia długie s na zwykłe s. Aby tego uniknąć, należy użyć opcji: filter-text=unligature. Źródła programu unligature są dostępne pod adresem: jwilk/unligature. Jego instalacja polega na wywołaniu programu make. Zawarty w dystrybucji plik makefile odwołuje się do pliku: /usr/share/unicode/unicodedata. txt. Należy zadbać o to, aby plik był dostępny i aby umieszczona w pliku makefile informacja o jego lokalizacji była zgodna ze stanem faktycznym. W wielu dystrybucjach Linuksa (Debian, Ubuntu) plik UnicodeData.txt znajduje się w pakiecie o nazwie unicode-data. W trakcie instalacji programu unligature następuje odwołanie do programu lex. W niektórych popularnych wersjach Linuksa (np. Ubuntu) dostępny on jest w pakiecie flex Przygotowanie hocr z plików DjVu Jednym ze sposobów uzyskania plików w formacie hocr jest wykorzystanie plików DjVu 3. W tym celu używamy programu djvu2hocr z pakietu ocrodjvu 4 : djvu2hocr --word-segmentation=uax29 SpXVI_35t.djvu > SpXVI_35t_hocr.xml Uwagi: 1. W starszych wersjach programu djvu2hocr występował błąd, który powodował obrócenie do góry nogami pliku hocr. W konsekwencji, jeśli zaznaczenia wskazujące znalezione formy miały działać prawidłowo, konieczne było użycie opcji flip przy wzbogacaniu korpusu. Fakt ten może stwarzać pewne niedogodności w przypadku dodawania do istniejącego korpusu nowych dokumentów albo w przypadku tworzenia korpusu z istniejących wcześniej i tworzonych aktualnie plików hocr. Niestety program do wzbogacania korpusu nie daje możliwości zastosowania opcji flip w sposób selektywny, tylko dla wybranych dokumentów. 2. Pominięcie opcji " word-segmentation=uax29" oznacza użycie domyślnego sposobu segmentacji (por. man djvu2hocr), co może powodować przyklejanie do form tekstowych różnych znaków, np. cudzysłowów Nadawanie struktury dokumentom W przypadku dokumentów wielostronicowych możliwe jest umowne dzielenie dokumentu na części, w skład których wchodzą określone strony. W trakcie przeszukiwania korpusu możliwe jest ograniczenie poszukiwań do wybranych części. Dokonanie takiego podziału możliwe jest za pomocą programu annotate-hocr 5. Wymaga on opisania struktury przetwarzanych dokumentów w pliku tekstowym, w odpowiednim formacie. Przykładowo, struktura tomu 35 Słownika polszczyzny xvi wieku może być opisana następująco: 1 front,1,4 list,5,9 vacat,10,10 3 Inna możliwość opisana jest w dalszej części niniejszego tekstu. 4 Por. np.: jwilk/ocrodjvu/overview 5 Por. np.: 2
3 body,11,481 vacat,482,482 inset,483,494 Liczba w pierwszym wierszu specyfikuje, który z kolei dokument tekstowy opisują dalsze wiersze. Każdy kolejny wiersz opisuje jedną sekcję dokumentu: front (tytularia itp.), intro (wstępy zawarte w I tomie), list (listy haseł na początku poszczególnych tomów), body (hasła), errata (erraty i uzupełnienia), back (końcowe strony tomu), inset (wkładki z wykazem źródeł i skrótów). Opis każdej z sekcji składa się z co najmniej trzech części zakończonych przecinakami albo znakiem końca wiersza. Pierwsza część to napis definiujący nazwę sekcji, dwie dalsze to para liczb całkowitych określająca zakres stron tworzących sekcję. Pozostałe części opisu stanowią komentarz. W pliku z opisem dopuszczalne są również całe wiersze komentarza muszą rozpoczynać się znakiem #. W powyższym przykładzie dokument dzielony jest na rozłączne części obejmujące sąsiednie strony. W ogólności możliwe jest nadanie dokumentowi struktury drzewiastej. Ilustruje to poniższy przykład. 1 front, 1,140, (4) intro, 5,140 list, 141,146 body, 147,452, (449) = 306 errata, 450,452 back, 453,454, spis treści inset, 455,457 back, 458,459 Tutaj segment o nazwie intro zawarty jest (jest podsegmentem) w segmencie front. Podobnie errata jest fragmentem body. Nie istnieje ustalony zestaw nazw segmentów, które mogą pojawić się w opisie. Jedynymi ograniczeniem są struktura, która musi być drzewem, oraz konieczność umieszczenia w opisie ojca przed synem. Użycie programu annotate-hocr pokazane jest niżej../annotate-hocr -h usage: annotate-hocr [-h] [--dry-run] [--in-place] <hocr-file> [<hocr-file>...] Uwaga: Wbrew temu, co widać wyżej, jeden z parametrów kontrolujących wyjście, czyli dry-run albo in-place, jest obowiązkowy. Poniżej widać przykład nadania struktury jednemu dokumentowi../annotate-hocr --in-place + volume 1 SpXVI_35t_hocr.xml < struktura35.txt Możliwe jest również nadanie struktury wielu dokumentom w jednym przebiegu programu../annotate-hocr --in-place */*.xml < struktura.txt W takim przypadku plik struktura.txt musi zawierać ciąg opisów struktury kolejnych dokumentów. Przykładowy fragment takiego pliku dla Słowinka polszczyzny XVI wieku pokazany jest niżej. 3
4 1 front, 1,140, (4) intro, 5,140 list, 141,146 body, 147,452, (449) = 306 errata, 450,452 back, 453,454, spis treści inset, 455,457 back, 458,459 2 front, 1,6 list, 7,13 body, 15,540, (535) = 526 errata, 536,540 back, 541,542,v errata, 543,547 3 front, 1,4 list, 5,11 body, 13,741, = 729 back, 742,742 Opisuje on trzy kolejne tomy słownika. Oczywiście należy zadbać o to, aby kolejność opisu poszczególnych dokumentów była zgodna z kolejnością przetwarzania plików przez program oraz o to, aby faktyczna liczba stron w dokumencie była zgodna z numerami stron w opisie Konwersja do formatu xces Konwersji na format xces należy poddać każdy z dokumentów tworzących korpus. W przypadku dzieł wielotomowych, takich jak słowniki, naturalnym podziałem na dokumenty jest podział na tomy. Do konwersji używamy programu hocr2xces 6 (należy upewnić się, że używamy aktualnej wersji w starszych wersjach występował błąd polegający na sklejaniu słów na granicach wierszy). Program ten wykonuje konwersję dokumentu zapisanego w formacie hocr czytanego ze standardowego wejścia, do IPI PAN-owskiego wariantu formatu xces. Wynik konwersji wypisywany jest na standardowe wyjście. Przykładowe wywołanie dla jednego dokumentu pokazane jest niżej. hocr2xces < SpXVI_35t_hocr.xml > SpXVI_35_xces.xml Uwaga: Program nie zakłada żadnych ustalonych postaci rozszerzeń nazw plików. W sensie technicznym wszystkie one są XML-em. Wskazane jest takie ustalanie tych nazw, aby określały jednoznacznie zawartość pliku. Ułatwia to uniknięcie ewentualnych pomyłek. Użycie skrótów hocr i xces jako rozszerzeń jest możliwe, ale powoduje, że pliki te nie zawsze są automatycznie poprawnie rozpoznawane jako xml przez system operacyjny i niektóre aplikacje. 6 Por. np. 4
5 2.6. Budujemy korpus bpng Do budowy korpusu używamy programu bpng 7. Zgodnie z informacją podaną w manualu, poza samymi dokumentami w odpowiedniej wersji formatu xces, konieczne jest przygotowanie dla każdego dokumentu pliku nagłówkowego oraz jednego wspólnego pliku konfiguracyjnego dla tworzonego korpusu Plik konfiguracyjny dla korpusu Plik konfiguracyjny powinien mieć nazwę nazwa_korpusu.bp.conf, gdzie nazwa_korpusu jest wybraną przez nas nazwą. Plik ten specyfikuje nazwy plików z dokumentami i odpowiadających im plików nagłówkowych oraz, przez odwołanie się do zawartości tych plików nagłówkowych, specyfikuje metadane korpusu. Również metadane, podobnie jak elementy struktury, mogą być wykorzystywane w zapytaniach służących do przeszukiwania korpusu. Przykładowy plik konfiguracyjny dla 35. tomu Słownika polszczyzny XVI wieku o nazwie (na przykład) spxvi35.bp.conf może wyglądać jak niżej. [locale] locale = pl_pl [filenames] header = header.xml morphosyntax = morph.xml [meta] name = volume path = /meta/volume [meta] name = year path = /meta/year [meta] name = range path = /meta/range [meta] name = origin path = /meta/origin Jak widać plik ten składa się z sekcji, których nazwy ujęte są w nawiasy kwadratowe 8. W sekcji [filenames] podane są nazwy plików z dokumentami (tutaj morph.xml) oraz ich nagłówkami (tu header.xml). W przypadku korpusu składającego się z wielu dokumentów, każdy z nich powinien być zawarty w plikach o takich samych nazwach natomiast do przetwarzania programem bpng powinny one zostać umieszczone w odpowiedniej strukturze katalogowej każdy dokument (czyli opisujące go dwa pliki) w oddzielnym podkatalogu. Kolejne cztery sekcje o nazwie [meta] definiują metadane przewidziane dla wszystkich dokumentów w danym korpusie. Każda z tych sekcji definiuje jeden rodzaj informacji ujętej w metadanych. 7 Por. np. 8 Bardziej szczegółowy opis budowy tego pliku znajduje się na stronie manuala programu bpng. 5
6 Pierwszy wiersz sekcji, rozpoczynający się od napisu name definiuje rodzaj metadanej. Tak więc w tym przypadku metadane składają się z pozycji: volume, year, range, origin. Oczywiście liczba pozycji w metadanych, a co za tym idzie liczba odpowiadających im sekcji może być dowolna, podobnie jak nazwy nadane tym pozycjom 9. Kolejny wiersz rozpoczynający się od słowa path pokazuje, gdzie w pliku nagłówkowym można znaleźć wartość opisywanej metadanej. W tych sekcjach dopuszczalne są jeszcze pewne dodatkowe wiersze, ułatwiające kontrolę postaci danych (por. strona manuala programu bpng) Pliki nagłówkowe Pliki nagłówkowe nie maja ściśle określonego formatu ale pod względem formalnym powinny stanowić poprawnie zbudowany plik XML-owy 10. Sposób wykorzystania ich zawartości opisany jest w pliku konfiguracyjnym jak już powiedzieliśmy wyżej, wyrażenia path definiują dostęp do wartości dla poszczególnych elementów metadanych. Przykładowa zawartość pliku header.xml dla 35. tomu słownika, odpowiadająca pokazanemu wyżej plikowi konfiguracyjnemu widoczna jest niżej. <meta> <volume>35</volume> <year>2011</year> <range>from Q to ROWNY</range> <origin>pdf</origin> </meta> Tworzenie korpusu program bpng Samo wywołanie programu bpng może mieć postać pokazaną niżej. bpng nazwa_korpusu <katalog_z _danymi> Parametr <katalog_z_danymi> powinien wskazywać odpowiednią strukturę katalogów zawierającą podkatalogi oddzielny dla każdego dokumentu z plikami opisującymi dokument i jego nagłówek. Poniżej przykładowe wywołania z konkretnymi parametrami. bpng spxviw../spxviw-xces/t* bpng spxvi35 spxvi35.data/ Niektóre inne postaci wywołania (np. katalog bieżący zamiast <katalog_z_danymi>) mogą powodować problemy Szacunkowa liczba tokenów w korpusie Oszacowanie liczby tokenów w korpusie można uzyskać dzieląc wielkość pliku: <nazwa>.poliqarp.corpus.image przez Przeglądarka marasca traktuje metadane w specyficzny sposób. Ich postać, dla pewnych korpusów znanych przeglądarce, jest ściśle określona i kontrolowana. Dla korpusów, których nazw przeglądarka nie zna, ich postać jest dowolna. 10 Oznacza to w szczególności, że niektóre znaki, np. & nie mogą być używane w metadanych w sposób dowolny. 6
7 Indeksy bpindexer Dodatkowym elementem korpusu mogą być indeksy, które nie są obowiązkowe i nie są bezpośrednio widoczne dla użytkownika z poziomu klienta używanego do przeglądania korpusu, ale wyrażnie przyspieszają wykonywanie zapytań. Do ich tworzenia służy program o nazwie bpindexer, który domyślnie tworzy trzy indeksy (por. man bpindexer). Dla korpusu Słownik polszczyzny XVI wieku pożyteczny jest tylko indeks form ortograficznych. Można go stworzyć używając opcji -i o. bpindexer -i o <nazwa_korpusu> 2.7. Wzbogacanie korpusu Wzbogacenie korpusu jest operacją, która pozwoli przeglądarce marasca na pokazanie wyniku zapytania w postaci zaznaczenia znalezionego tokenu na obrazie strony pokazanej w formacie DjVu. Aby korpus wzbogacić, należy użyć programu augment-djvu-corpus 11../augment-djvu-corpus -h usage: augment-djvu-corpus [option...] <base-name> <hocr-file...> Augment Poliqarp binary corpus with information about segment coordinates. positional arguments: base corpus basename files hocr files optional arguments: -h, --help show this help message and exit --flip flip hocr vertically (to work around buggy djvu2hocr) --append append data to the existing corpus Przykładowe wywołania pokazane są niżej. augment-djvu-corpus spxvi35 SpXVI_35t.xml augment-djvu-corpus --flip spxviw../spxviw-hocr/t*/text.hocr Uwagi: 1. Do wzbogacenia należy użyć plików hocr (nie xces!) 2. Jeśli w gotowym korpusie zaznaczenie, zamiast we właściwym miejscu, będzie pojawiać się symetrycznie względem środka strony, oznacza to, że należało użyć opcji flip (por. wyżej, opis przygotowywania plików hocr). 3. W przypadku wielu dokumentów w korpusie należy zadbać o właściwą kolejność przetwarzania, zgodną z kolejnością wstawiania dokumentów do korpusu. Następnie należy zmodyfikować zawartość pliku <basename>djvu.filenames tak, aby pokazywał faktyczne dokumenty djvu. Plik ten powinien zawierać adresy URL rozpoczynające się od http: (niestety nie może to być adres typu file://). Uwaga: Jednym z możliwych rozwiązań w przypadku konieczności zorganizowania dostępu do djvu, jeśli komputer nie ma zewnętrznego adresu internetowego natomiast ma poprawnie zainstalowaną marascę, którą widać np. pod adresem jest umieszczenie w katalogu ma- 11 Por. np.: 7
8 rasca/marasca/media/extra linku symbolicznego do katalogu z plikiem djvu. Wtedy w pliku filenames należy umieścić informację: (tutaj sam plik nazywa się index.djvu ) Opisy Do tworzenia opisów widocznych na stronie wyszukiwarki używany jest mechanizm stosowany w django 12. W katalogu /marasca/marasca/templates/ znajdują się pliki zawierające wzorce (templates) opisujące wspólne fragmenty strony, natomiast w podkatalogu /marasca/marasca/ ptemplates/coprpora/ umieszczone są wzorce dotyczące poszczególnych korpusów. W dystrybucji marasca w tym miejscu znajdują się opisy pewnej liczby korpusów znanych przeglądarce, co może ułatwić przygotowanie opisu nowego korpusu. Na przykład plik zawierający pierwszą część opisu (będzie ona widoczna w oknie przeglądarki przed polem przewidzianym do wpisywania zapytań do korpusu) opisu słownika Lindego (plik o nazwie slownik-lindego.html, gdzie fragment slownik-lindego odpowiada identyfikatorowi korpusu występującemu w plikach konfiguracyjnych marasca, może wyglądać jak niżej. {% load i18n %} {% blocktrans %}<p> <a href= >A preliminary electronic version</a> of the second edition of Linde s dictionary </p> {% endblocktrans %} {% blocktrans %}<p> Scans were made with Fujitsu fi-6130 scanner and Kofax VRS software by Joanna A. Bilińska. OCR was prepared with FineReader 10 (selected language Polish, default values of other recognition parameters) and saved as PDF/A files with MRC lossy compression. The scans has been converted to DjVu format by Jakub Wilk, he also converted the OCR results to the suitable corpus format. </p> {% endblocktrans %} {% blocktrans %}<p> The corpus consists of ca. 7 million segments. This version of the corpus is available since August 6, </p> {% endblocktrans %} Druga część opisu (widoczna w oknie przeglądarki poniżej pola przewidzianego do wpisywania zapytań) zawarta w pliku o nazwie slownik-lindego_sufiks.html może mieć następującą postać. {% load i18n %} {% blocktrans %}<p> 12 Por. np. 8
9 It is recommended to switch on graphical concordances option in <a href= /settings/ >Settings</a>. {% endblocktrans %} {% blocktrans %}<p> Search can be limited to a specific volume with the <code>within</code> clause, e.g. <code>within vol6</code> or <code>within vol6part2</code>. The clause can be also used to limit the search to the following sections: <code>body</code> (entries and their corrections), <code>errata</code> (just the corrections), <code>intro</code> (introductory texts), <code>info</code> (other informations), <code>varia</code> (dedications, subscriber lists), <code>front</code> (frontmatter), <code>back</code> (backmatter). </p> {% endblocktrans %} {% blocktrans %}<p> Please send questions and comments to <a href= mailto:jsbien@mimuw.edu.pl >jsbien@mimuw.edu.pl</a>. </p> {% endblocktrans %} Po przygotowaniu nowego albo zmianie opisu istniejącego korpusu należy uruchomić skrypt update-i18n, który zwykle znajduje się w katalogu marasca/marasca/. Zaktualizuje on, między innymi, plik locale/pl/lc_messages/django.po, który powinien zawierać polskie tłumaczenia komunikatów (czyli fragmentów opisu ujętych w znaczniki {% blocktrans %}, {% endlocktrans %} w plikach pokazanych wyżej). W przypadku dodawania nowego opisu, w pliku znajdować się będą komunikaty, którym nie przypisano polskich odpowiedników natomiast w przypadku modyfikacji opisu istniejącego polskie wersje nie będą odpowiadać treści wersji angielskiej. W obu przypadkach plik należy poddać edycji. Można do tego użyć dedykowanego edytora poedit (por. ale możliwe jest też użycie dowolnego edytora tekstowego. Następnie należy wykonać polecenie:./manage compilemessages Aby wyniki były widoczne na stronie wyszukiwarki należy przeładować serwer WWW. Uwagi: 1. Z formalnego punktu widzenia do tworzenia opisów należy używać standardu XHTML. 2. Warto zauważyć, że jako cudzysłowy, w które ujęte są wartości atrybutów użyte zostały znaki apostrofu. 3. Przy przygotowywaniu opisów oraz ich tłumaczeń należy zwrócić szczególną uwagę na to, aby w tekście wszystkie cudzysłowy były prawidłowo pozamykane oraz aby znacznikom <a href=... > zawsze odpowiadały znaczniki zamykające </a>. 9
10 3. Korpusy font sensitive na przykładzie Słownika Lindego Korpusy tego typu pokazują informację o fontach, którymi złożone są w dokumencie formy, stanowiące wynik zapytania. Tego typu informacja może być użyteczna w przypadku dokumentów historycznych, które często w całości albo we fragmentach były składane czcionką gotycką Skrypt font_sensitive.py M.Zająca Podstawowym narzędziem wykorzystywanym do tworzenia tego typu korpusów jest program font_sensitive.py przygotowany przez Marcina Zająca 13. Zgodnie z informacją zawartą w README program przekształca pliki hocr w korpus, który może być oglądany programem poliqarp. Traktuje on informację o fontach jako kategorię gramatyczną co pozwala użytkownikowi na wykorzystanie jej przy przeszukiwaniu korpusu. Sposób wywołania widać niżej../font_sensitive.py corpus_name list_of_filenames_to_convert Mankamentem programu jest brak parametryzacji pliku konfiguracyjnego korpusu oraz plików nagłówkowych poszczególnych dokumentów ich treść wpisana jest na stałe w teść programu. Stwarza to pewne niedogodności zwłaszcza przy tworzeniu korpusów składających się z wielu dokumentów, dla których zawartość plików nagłówkowych powinna być zróżnicowana. W trakcie działania programu najpierw pliki hocr zawierające dane przekształcane są do formatu xces, dołączane są pliki nagłówkowe, tworzony jest plik konfiguracyjny korpusu a dopiero potem tworzony jest korpus. Drobna ingerencja w treść programu polegająca na usunięciu wywołania programu bpng pozwala na dwuetapowe przygotowanie korpusu. W pierwszym kroku, przy użyciu lekko zmodyfikowanego programu, z plików hocr tworzone są dane w postaci plików xces i plików nagłówkowych. W kroku drugim, po dokonaniu odpowiednich korekt w nagłówkach i pliku konfiguracyjnym, wywoływany jest program bpng i tworzony korpus Przygotowanie plików hocr z plików pdf Danymi dla programu M. Zająca są pliki w formacie hocr. Jednym ze sposobów przygotowania takich plików jest użycie programu pdfa@hocr 14. Przykładowe wywołanie (dla jednego z tomów drugiego wydania słownika Lindego) może wyglądać jak niżej. pdfa2hocr.py -v -i -p -u pl_pl -r 5107x6605 6iiFR11.pdf Linde2-6ii.html Bardzo istotnym parametrem wywołania tego programu jest parametr -r, w opisie użycia oznaczony jako resolution. -r RESOLUTION, --resolution=resolution resolution of page in pixels Należy pamiętać, że jest to parametr wejściowy określający wielkość strony dokumentu w pixelach. Użycie nieprawidłowej wartości może powodować, że zaznaczenia wyszukanych w korpusie form nie będą trafiać we właściwe miejsca w odpowiednich plikach djvu. Informację 13 Skrypt dostępny jest w repozytorium: 14 Program ten, którego autorem jest T. Olejniczak dostępny jest w repozytorium 10
11 o wielkości strony dokumentu w pliku djvu udostępnia np. przeglądarka DjView (menu kontekstowe, pozycja information). Niestety parametr -r jest aktualny dla wszystkich stron w przetwarzanym dokumencie a dla niektórych druków strony mogą mieć dość znacznie zróżnicowane wymiary. Taka sytuacja ma miejsce np. dla pierwszego wydania słownika Lindego udostępnianego przez KPBC. W takim przypadku konieczne jest przyjęcie najbardziej typowej albo uśrednionej wielkości strony Nadawanie struktury Jak zostało powiedziane wcześniej, do nadawania struktury dokumentom hocr używamy skryptu annotate-hocr. Skrypt ten wymaga aby plik miał odpowiednią strukturę formalną. W praktyce sprowadza się to do odpowiedniej postaci nagłówka takiego pliku. Powinien on rozpoczynać się znacznikiem: <html xmlns=" Znacznik ten mówi, że plik zapisany jest w formacie xhtml. Natomiast pliki generowane przez pdfa2hocr z formalnego punktu widzenia zapisane są w formacie html (mają nagłówki rozpoczynające się od <html>. W związku z tym konieczne jest wprowadzenie odpowiednich zmian w plikach hocr. Można do tego wykorzystać polecenie: sed -i -e s,<html>,<html xmlns=" <plik-hocr> Uwaga: Przy nadawaniu struktury wielu dokumentom umieszczonym w jednym katalogu należy zwrócić baczną uwagę na kolejność w jakiej skrypt pobiera pliki do przetwarzania musi ona być zgodna z kolejnością opisów font_sensitive przygotowanie danych dla bpng Jak wspomniano już wcześniej skrypt font_sensitive ma wpisaną na stałe postać pliku konfiguracyjnego korpusu oraz treść plików nagłówkowych przetwarzanych dokumentów. Dla uproszczenia następnego kroku, czyli ręcznego edytowania tych plików, warto zmodyfikować treść skryptu tak, aby edycja pliku konfiguracyjnego nie była konieczna a edycja nagłówków wymagała jak najmniejszych zmian 15. Przykładowe wywołanie skryptu przystosowanego do tworzenia korpusu słownika Lindego pokazane jest niżej. /font_sensitive_forlinde.py LindeAll hocry-anotowane/*.xml Wynikiem takiego wywołania będzie stworzenie w katalogu LindeAll podkatalogu o nazwie LindeAll.data zawierającego plik konfiguracyjny dla korpusu oraz podkatalogi, z których każdy zawiera plik z danymi w formacie xces i nagłówek dla niego Edycja danych i stworzenie korpusu Kolejnym krokiem jest poddanie edycji plików nagłówkowych oraz wykonanie korpusu i jego wzbogacenie. Kroki te wyglądają analogicznie, jak opisane w poprzedniej części tekstu. 15 Przy okazji zmodyfikowano nieco strukturę katalogów, w której skrypt umieszcza dokumenty wynikowe. 11
12 3.6. Uzyskany wynik Niestety uzyskany w ten sposób korpus nie zawiera informacji o nadanej dokumentom strukturze. Bliższa analiza treści skryptu font_sensitive pokazuje, że ignoruje on znaczniki wprowadzone w trakcie nadawania struktury, co oznacza, że przynajmniej na razie, nie jest możliwe wykonywanie korpusów zawierających informację o fontach i jednocześnie informację o strukturze dokumentu. 4. Instalacja podstawowych programów 4.1. Poliqarp 4.2. Instalacja z pakietów Najprostszym sposobem instalacji poliqarpa jest wykorzystanie pakietów przygotowanych dla systemu operacyjnego Linux w wersji Debian i pokrewnych, w formacie deb 16. Poszczególne pakiety zawierają (numery mogą się zmieniać, w zależności od wersji): poliqarp-base_1.3.11_i386.deb: 1. bp tworzy korpus binarny (format XCES), 2. bpindexer buduje indeksy dla korpusu binarnego, 3. bpng tworzy korpus binarny (formaty IPIPAN XCES, NKJP TEI) 4. bpupgrade konwertuje korpusy binarne, 5. poliqarpc klient uruchamiany z wiersza poleceń, 6. poliqarpd serwer polqarpa. Każdy z tych programów ma własny opis w manualu(1). Istnieje też strona manuala opisująca składnię zapytań poliqarp-query-syntax(7). Ponadto podczas instalacji pakietu, w katalogu /usr/share/doc/poliqarp-base umieszczane są ważne pliki przykładowe, miedzy innymi konfiguracyjne, oraz plik README.gz zawierający zwięzły opis instalacji poliqarpa ze źródeł oraz opis użytkowy podstawowych programów. poliqarp-gui_1.2.11_i386.deb zawiera: 1. poliqarp interfejs graficzny do poliqarpa. Ma on również (skromną) stronę w manualu Konfiguracja Po zainstalowaniu pakietów żadne pliki konfiguracyjne nie są tworzone automatycznie. Również serwer poliqarpd nie startuje automatycznie wymaga ręcznego uruchomienia, np tak: poliqarp -d -c /home/kszafran/.poliqarp/poliqarpd.conf gdzie plik poliqarpd.conf jest plikiem konfiguracyjnym dla serwera. Uwaga: Przykładowy plik konfiguracyjny dostarczany z pakietem zawiera opcję max-match-size, której nazwę należy ewentualnie zmienić na max-match-length Test poprawności działania Do przetestowania poprawności instalacji oraz do oswojenia się z poliqarpem można wykorzystać materiały dostępne na stronie Korpus JP: 16 Por. 12
13 Niestety dostępne tam wersje binarne korpusów zostały przygotowane w tak zwanej wersji 1 i wymagaj konwersji za pomocą programu bpupgrade Instalacja ze źródeł Osoby zainteresowane albo zmuszone do wykonania instalacji poliqarpa ze źródeł znajdą opis postępowania we wspomnianym wyżej pliku README 4.4. marasca Źródła programu marasca należy pobrać z odpowiedniego repozytorium. Najwygodniej można to zrealizować przez stworzenie jego kopii: hg clone Przy pobieraniu plików z repozytorium marasca należy upewnić się, że właściwie ustawiony jest parametr branch powinien on mieć wartość wbl. Czy jest tak w istocie, można sprawdzić w pliku branch w katalogu.hg klonu repozytorium. Kopia repozytorium zawiera kilka katalogów. Przeglądarka marasca znajduje się w katalogu o nazwie marasca Instalacja Instalacja sprowadza się do: 1. Wykonania skryptu setup znajdującego się w katalogu marsca. 2. Wyedytowania powstałego w wyniku wykonania poprzedniego kroku pliku $hostname.py znajdującego się w podkatalogu settings na wzór znajdującego się tam pliku wbl.py. Po wykonaniu powyższych czynności należy upewnić się, że w pliku (/marasca/settings/ init.py) właściwie ustawiony jest dostęp do plików z opisami korpusów, np. tak, jak niżej (ścieżki powinny być ścieżkami bezwzględnymi do odpowiedniego katalogu/katalogów): LOCALE_PATHS = ( /home/www/project/common_files/locale, /var/local/translations/locale ) oraz, że uprawnienia do plików.mo są poprawne 17. Poza katalogiem marasca z repozytorium do poprawnego działania aplikacji niezbędny jest katalog locks, zwykle umieszczony na tym samym poziomie, co marasca. Jego dokładna lokalizacja określona jest w pliku konfiguracyjnym $hostname.py (na końcu pliku). Uwaga: Problemy przy uruchamianiu przeglądarki mogą być spowodowane brakiem albo niewłaściwymi prawami dostępu do plików logów albo katalogu locks. 5. Konfiguracja korpusów W zależności od tego, jakiego klienta chcemy używać do oglądania korpusów, konieczne jest umieszczenie odpowiednich informacji we właściwych plikach konfiguracyjnych. 17 W razie potrzeby należy wykonać najpierw polecenie./manage compilemessages. 13
14 5.1. Plik konfiguracyjny serwera poliqarp Niestety nie jest możliwe takie skonfigurowanie serwera poliqarpd aby można było oglądać korpusy korzystając zarówno z klienta graficznego, jak też z marasca. W takiej sytuacji konieczne jest wykorzystanie dwóch kopii serwera, z których każda używa innego numeru portu do komunikacji z klientem Klient graficzny Klient graficzny uruchamiany poleceniem poliqarp korzysta z pliku konfiguracyjnego o nazwie.poliqarp.cfg. W tym pliku możliwe jest ustawienie numeru portu, przez który będzie się on komunikował z serwerem poliqarpd. Analogicznie w pliku konfiguracyjnym serwera poliqarpa należy ustawić identyczny numer portu marasca W pliku konfiguracyjnym serwera poliqarpd (poliqarpd.conf), który ma współpracować z marasca konieczne jest dodanie odpowiedniej informacji o lokalizacji korpusu. Może ona mieć postać widoczną niżej. corpus = slownik-lindego: /srv/poliqarp/corpora/lindese Uwaga: 1. Wpisanie takiej informacji do pliku konfiguracyjnego serwera komunikującego się z klientem graficznym spowoduje zakłócenie jego pracy. 2. Po dodaniu opisu korpusu do pliku konfiguracyjnego należy ponownie uruchomić serwer poliqarpa. Następnie w pliku $hostname.py, o którym była mowa wyżej, w tablicy zwracanej przez funkcję _get_corpora() dodajemy opis nowego korpusu: DjVuCorpus(path= /srv/poliqarp/corpora/lindese id= slownik-lindego, title=_(u Linde SE ), abbreviation= LindeSE, has_interps=true ) Uwaga: 1. Nazwa DjVuCorpus nie może zostać zmieniona. 2. Należy się upewnić, że w opisach korpusów w pliku $hostname.py znajduje się wiersz abbreviation = Konfiguracja Apache a Na to aby aplikacja marasca została w pełni zintegrowana z serwerem Apache należy wykonać następujące operacje. 1. Zainstalować pakiet (libapache2-mod-wsgi) dostarczajacy wsgi (w katalogu /etc/apache/ mods-enabled/ pojawiają się linki wsgi.conf i wsgi.load do /mods-available/, gdzie są opisy dostępnych modułów). 14
15 2. Umieścić w katalogu /apache2/sites-available/ odpowiednio zmodyfikowany plik polqarp. <VirtualHost *:80> ServerName poliqarp.kanji.klf.uw.edu.pl Alias /robots.txt /dev/null Alias /favicon.ico /dev/null Alias /css/ /home/kszafran/new/marasca/marasca/media/css/ Alias /js/ /home/kszafran/new/marasca/marasca/media/js/ Alias /extra/ /home/kszafran/new/marasca/marasca/media/extra/ AliasMatch ^/google(.*) /home/kszafran/new/marasca/marasca/media/google/$1 WSGIDaemonProcess marasca WSGIProcessGroup marasca WSGIScriptAlias / /home/kszafran/new/marasca/django.wsgi CustomLog ${APACHE_LOG_DIR}/poliqarp-access.log vhost_combined </VirtualHost> Uwaga: W pewnych sytuacjach konieczne moż być dokonanie dodatkowego wpisu w pliku /etc/hosts. 3. Umieścić w podkatalogu /sites-enabled/ link do pliku poliqarp 4. Umieścić w katalogu marasca (dokładna lokalizacja podana jest w pliku poliqarp) odpowiednio zmodyfikowany pliku django.wsgi, np. taki: import os import sys os.environ[ DJANGO_SETTINGS_MODULE ] = settings sys.path.append( /home/kszafran/new/marasca/marasca/ ) import django.core.handlers.wsgi application = django.core.handlers.wsgi.wsgihandler() 5. Zrestartować serwer Apache. 15
Skrypty korpusowe instrukcja (wersja z 3 lipca 2012 ) redakcja K. Szafran
Tomasz Olejniczak Skrypty korpusowe instrukcja (wersja z 3 lipca 2012 ) redakcja K. Szafran 1. Wprowadzenie Tekst niniejszy jest nieznacznie zmodyfikowaną wersją dokumentu zatytułowanego instrukcja.txt
Praca z programami SAS poza lokalną siecią komputerową UZ. Zestawienie tunelu SSH oraz konfiguracja serwera proxy w przeglądarce WWW
Instytut Sterowania i Systemów Informatycznych Uniwersytet Zielonogórski Praca z programami SAS poza lokalną siecią komputerową UZ. Zestawienie tunelu SSH oraz konfiguracja serwera proxy w przeglądarce
VinCent Administrator
VinCent Administrator Moduł Zarządzania podatnikami Krótka instrukcja obsługi ver. 1.01 Zielona Góra, grudzień 2005 1. Przeznaczenie programu Program VinCent Administrator przeznaczony jest dla administratorów
MasterEdytor. Podprogram pomocniczy do programu mpfotoalbum 1.2 INSTRUKCJA
MasterEdytor Podprogram pomocniczy do programu mpfotoalbum 1.2 INSTRUKCJA 1. Przeznaczenie Program MasterEdytor przeznaczony jest do skonfigurowania wszystkich parametrów pracy programu mpfotoalbum. 2.
Zawartość. Wstęp. Moduł Rozbiórki. Wstęp Instalacja Konfiguracja Uruchomienie i praca z raportem... 6
Zawartość Wstęp... 1 Instalacja... 2 Konfiguracja... 2 Uruchomienie i praca z raportem... 6 Wstęp Rozwiązanie przygotowane z myślą o użytkownikach którzy potrzebują narzędzie do podziału, rozkładu, rozbiórki
2 Podstawy tworzenia stron internetowych
2 Podstawy tworzenia stron internetowych 2.1. HTML5 i struktura dokumentu Podstawą działania wszystkich stron internetowych jest język HTML (Hypertext Markup Language) hipertekstowy język znaczników. Dokument
ZPKSoft WDoradca. 1. Wstęp 2. Architektura 3. Instalacja 4. Konfiguracja 5. Jak to działa 6. Licencja
ZPKSoft WDoradca 1. Wstęp 2. Architektura 3. Instalacja 4. Konfiguracja 5. Jak to działa 6. Licencja 1. Wstęp ZPKSoft WDoradca jest technologią dostępu przeglądarkowego do zasobów systemu ZPKSoft Doradca.
REFERAT O PRACY DYPLOMOWEJ
REFERAT O PRACY DYPLOMOWEJ Temat pracy: Projekt i budowa systemu zarządzania treścią opartego na własnej bibliotece MVC Autor: Kamil Kowalski W dzisiejszych czasach posiadanie strony internetowej to norma,
Aplikacje WWW - laboratorium
Aplikacje WWW - laboratorium PHP. Celem ćwiczenia jest przygotowanie prostej aplikacji internetowej wykorzystującej technologię PHP. Aplikacja pokazuje takie aspekty, obsługa formularzy oraz zmiennych
W oknie konfiguratora Importu/Exportu należy wprowadzić odpowiednie ustawienia poprzez zaznaczenie pól kursorem myszki przy poszczególnych opcjach.
Instrukcja korzystania z modułu Export/Import z poziomu programu Carwert Zawartość dokumentu: Dokument zawiera skróconą instrukcje obsługi modułu EXPORT/IMPORT w programie Carwert. Pierwsza część tego
LINUX. Instalacja oprogramowania
LINUX Instalacja oprogramowania Ubuntu to jedna z najpopularniejszych dystrybucji Linuksa charakteryzująca się dużą stabilnością i prostotą konfiguracji. Z tego względu instalacje aplikacji na Linuksie
Instrukcja obsługi DHL KONWERTER 1.6
Instrukcja obsługi DHL KONWERTER 1.6 Opis: Niniejsza instrukcja opisuje wymogi użytkowania aplikacji oraz zawiera informacje na temat jej obsługi. DHL Konwerter powstał w celu ułatwienia oraz usprawnienia
Rys. 1. Widok uruchomienia polecenia apt-get install build-essential. Rys. 2. Widok uruchomienia polecenia apt-get install apache2
1. Instalacja serwera WWW Aby zainstalować serwer WWW w systemie Linux, należy wykorzystać menedżer pakietów apt-get. Polecenia które należy wpisać w terminalu użytkownika root 1 : apt-get install build-essential
Aplikacje internetowe - laboratorium
Aplikacje internetowe - laboratorium PHP Celem ćwiczenia jest przygotowanie prostej aplikacji internetowej opartej o język PHP. Aplikacja ilustruje takie mechanizmy jak: obsługa formularzy oraz obsługa
KOMPUTEROWY SYSTEM WSPOMAGANIA OBSŁUGI JEDNOSTEK SŁUŻBY ZDROWIA KS-SOMED
KOMPUTEROWY SYSTEM WSPOMAGANIA OBSŁUGI JEDNOSTEK SŁUŻBY ZDROWIA KS-SOMED Podręcznik użytkownika Katowice 2010 Producent programu: KAMSOFT S.A. ul. 1 Maja 133 40-235 Katowice Telefon: (0-32) 209-07-05 Fax:
Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9
Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9 Uruchamianie edytora OpenOffice.ux.pl Writer 9 Dostosowywanie środowiska pracy 11 Menu Widok 14 Ustawienia dokumentu 16 Rozdział 2. OpenOffice
Instrukcja instalacji środowiska testowego na TestingCup wersja 1.0
Instrukcja instalacji środowiska testowego na TestingCup 2017 wersja 1.0 Spis treści: 1. Wstęp Błąd! Nie zdefiniowano zakładki. 2. Konfiguracja sprzętowa 2 3. Instalacja bazy danych MySQL 5.7 2 4. Import
Backend Administratora
Backend Administratora mgr Tomasz Xięski, Instytut Informatyki, Uniwersytet Śląski Katowice, 2011 W tym celu korzystając z konsoli wydajemy polecenie: symfony generate:app backend Wówczas zostanie stworzona
Jak posługiwać się edytorem treści
Jak posługiwać się edytorem treści Edytor CKE jest bardzo prostym narzędziem pomagającym osobom niezaznajomionym z językiem HTML w tworzeniu interaktywnych treści stron internetowych. Razem z praktyka
emszmal 3: Automatyczne księgowanie przelewów w sklepie internetowym Magento (plugin dostępny w wersji ecommerce)
emszmal 3: Automatyczne księgowanie przelewów w sklepie internetowym Magento (plugin dostępny w wersji ecommerce) Zastosowanie Rozszerzenie to przeznaczone jest dla właścicieli sklepów internetowych opartych
INSTRUKCJA UŻYTKOWNIKA Instalacja KS - EDE w systemie KS - ZSA ISO 9001:2008 Dokument: Wydanie: 1 Waga: 90
Instrukcja użytkownika Instalacja KS - EDE w systemie KS ZSA I. Wstęp W związku ze zmianami wynikającymi z wprowadzeniem Jednolitych Plików Kontrolnych w ramach systemu KS ZSA dodano możliwość korzystania
Jak przygotować pliki gotowe do publikacji w sieci za pomocą DigitLabu?
Jak przygotować pliki gotowe do publikacji w sieci za pomocą DigitLabu? Po zainstalowaniu DigitLabu na komputerze otrzymujemy pakiet programów niezbędnych do przygotowania cyfrowych wersji obiektów tekstowych.
Instrukcja obsługi Multiconverter 2.0
Instrukcja obsługi Multiconverter 2.0 Opis: Niniejsza instrukcja opisuje wymogi użytkowania aplikacji oraz zawiera informacje na temat jej obsługi. DHL Multiconverter powstał w celu ułatwienia oraz usprawnienia
Budowa i oprogramowanie komputerowych systemów sterowania. Laboratorium 4. Metody wymiany danych w systemach automatyki DDE
Budowa i oprogramowanie komputerowych systemów sterowania Laboratorium 4 Metody wymiany danych w systemach automatyki DDE 1 Wprowadzenie do DDE DDE (ang. Dynamic Data Exchange) - protokół wprowadzony w
Instrukcja integratora - obsługa dużych plików w epuap2
Instrukcja integratora - obsługa dużych plików w epuap2 Wersja: 1.1 Strona 1 z 18 Spis treści SPIS TREŚCI... 2 WPROWADZENIE ORAZ INFORMACJE OGÓLNE... 3 1.1 WSTĘP... 3 1.2 WARUNKI KONIECZNE DO SPEŁNIENIA
Zarządzanie Infrastrukturą IT. Jak ręcznie utworzyć instancję EAUDYTORINSTANCE na SQL Serwerze 2000. www.e-audytor.com
Zarządzanie Infrastrukturą IT Jak ręcznie utworzyć instancję EAUDYTORINSTANCE na SQL Serwerze 2000 Data modyfikacji: 2007-04-17, 15:46 opracował: Maciej Romanowski v 2.2 powered by Romanowski 2007-03-15
Synchronizator plików (SSC) - dokumentacja
SZARP http://www.szarp.org Synchronizator plików (SSC) - dokumentacja Wersja pliku: $Id: ssc.sgml 4420 2007-09-18 11:19:02Z schylek$ > 1. Witamy w programie SSC Synchronizator plików (SZARP Sync Client,
Użytkowanie PortableGit w systemie Windows. 1. Najważniejsze informacje
Użytkowanie PortableGit w systemie Windows. 1. Najważniejsze informacje Git w wersji przenośnej umożliwia korzystanie z repozytoriów na każdym systemie z rodziny Windows, który nie posiada zainstalowanego
Kadry Optivum, Płace Optivum
Kadry Optivum, Płace Optivum Jak seryjnie przygotować wykazy absencji pracowników? W celu przygotowania pism zawierających wykazy nieobecności pracowników skorzystamy z mechanizmu Nowe wydruki seryjne.
MentorGraphics ModelSim
MentorGraphics ModelSim 1. Konfiguracja programu Wszelkie zmiany parametrów systemu symulacji dokonywane są w menu Tools -> Edit Preferences... Wyniki ustawień należy zapisać w skrypcie startowym systemu
Rozdział ten zawiera informacje o sposobie konfiguracji i działania Modułu OPC.
1 Moduł OPC Moduł OPC pozwala na komunikację z serwerami OPC pracującymi w oparciu o model DA (Data Access). Dzięki niemu można odczytać stan obiektów OPC (zmiennych zdefiniowanych w programie PLC), a
Qmail radość listonosza. Autorzy: Bartosz Krupowski, Marcin Landoch IVFDS
Qmail radość listonosza Autorzy: Bartosz Krupowski, Marcin Landoch IVFDS 1 STRESZCZENIE Artykuł jest przedstawieniem podstawowej konfiguracji jednego z najpopularniejszych agentów MTA (Mail Transfer Agent)
KOMPUTEROWY SYSTEM WSPOMAGANIA OBSŁUGI JEDNOSTEK SŁUŻBY ZDROWIA KS-SOMED
KOMPUTEROWY SYSTEM WSPOMAGANIA OBSŁUGI JEDNOSTEK SŁUŻBY ZDROWIA KS-SOMED Podręcznik użytkownika Katowice 2012 Producent programu: KAMSOFT S.A. ul. 1 Maja 133 40-235 Katowice Telefon: (0-32) 209-07-05 Fax:
Wdrożenie modułu płatności eservice. dla systemu Gekosale 1.4
Wdrożenie modułu płatności eservice dla systemu Gekosale 1.4 - dokumentacja techniczna Wer. 01 Warszawa, styczeń 2014 1 Spis treści: 1 Wstęp... 3 1.1 Przeznaczenie dokumentu... 3 1.2 Przygotowanie do integracji...
Instrukcja dotycząca konwersji dokumentów LaTeX do plików w formacie RTF
Instrukcja dotycząca konwersji dokumentów LaTeX do plików w formacie RTF 1. Wstęp Treści zawarte w tym dokumencie mogą być przydatne w przypadku konieczności dokonania konwersji dokumentów tworzonych z
Instalacja pakietu SAS 9.3 Audit, Performance and Measurement na platformie Windows
Instalacja pakietu SAS 9.3 Audit, Performance and Measurement na platformie Windows, SAS Institute Polska sierpień 2013 Pakiet SAS 9.3 Audit, Performance and Measurement (APM) jest to zestaw narzędzi stworzonych
Uruchomienie nowego kontekstu aplikacji
Uruchomienie nowego kontekstu aplikacji Niniejsza instrukcja (przygotowana dla systemów Debian) dotyczy uruchomienia nowej aplikacji w sytuacji, gdy mamy już jedną działającą. Działanie takie trzeba wykonać
Konfiguracja konta pocztowego w Thunderbird
Konfiguracja konta pocztowego w Thunderbird Sygnity SA 2013 Wszystkie prawa zastrzeżone. Znaki firmowe oraz towarowe użyte w opracowaniu są prawną własnością ich właścicieli. Autor dokumentacji: Magdalena
KS-ZSA. Korporacyjne grupy towarowe
KS-ZSA Korporacyjne grupy towarowe 1. Ustawienia po stronie KS-ZSA Aby rozpocząć pracę z korporacyjnymi grupami towarowymi system KS-ZSA należy odpowiednio skonfigurować KS-ZSA: Uprawnienia: - 61.Admin
System Obsługi Zleceń
System Obsługi Zleceń Podręcznik Administratora Atinea Sp. z o.o., ul. Chmielna 5/7, 00-021 Warszawa NIP 521-35-01-160, REGON 141568323, KRS 0000315398 Kapitał zakładowy: 51.000,00zł www.atinea.pl wersja
Trochę o plikach wsadowych (Windows)
Trochę o plikach wsadowych (Windows) Zmienne środowiskowe Zmienną środowiskową można ustawić na stałe w systemie (Panel sterowania->system- >Zaawansowane ustawienia systemu->zmienne środowiskowe) lub też
Konfiguracja współpracy urządzeń mobilnych (bonowników).
Konfiguracja współpracy urządzeń mobilnych (bonowników). Współpracę Bistro z bonownikami można realizować na dwa sposoby: poprzez udostępnienie folderu w Windows albo za pomocą serwera ftp. 1. Współpraca
XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery
http://xqtav.sourceforge.net XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery dr hab. Jerzy Tyszkiewicz dr Andrzej Kierzek mgr Jacek Sroka Grzegorz Kaczor praca mgr pod
Wdrożenie modułu płatności eservice. dla systemu Magento 1.4 1.9
Wdrożenie modułu płatności eservice dla systemu Magento 1.4 1.9 - dokumentacja techniczna Wer. 01 Warszawa, styczeń 2014 1 Spis treści: 1 Wstęp... 3 1.1 Przeznaczenie dokumentu... 3 1.2 Przygotowanie do
Archiwizacja baz MSSQL /BKP_SQL/ opis oprogramowania
Archiwizacja baz MSSQL /BKP_SQL/ opis oprogramowania Kraków 2010 Przeznaczenie programu. Program BKP_SQL powstał z myślą ułatwienia procesy archiwizacji baz danych MSSQL. Program umożliwia seryjne wykonanie
1. INSTALACJA SERWERA
1. INSTALACJA SERWERA Dostarczony serwer wizualizacji składa się z: 1.1. RASPBERRY PI w plastikowej obudowie; 1.2. Karty pamięci; 1.3. Zasilacza 5 V DC; 1,5 A; 1.4. Konwertera USB RS485; 1.5. Kabla
KS-ZSA. Mechanizm aktualizacji kartotek lokalnych w aptece na podstawie zmian w kartotece CKT. Data aktualizacji: 2013-08-29
KS-ZSA Mechanizm aktualizacji kartotek lokalnych w aptece na podstawie zmian w kartotece CKT Data aktualizacji: 2013-08-29 1. Opis funkcjonalności Funkcjonalność umożliwia obsługiwanie zmian urzędowych
Praca z programami SAS poza lokalną siecią komputerową UZ. Zestawienie tunelu SSH oraz konfiguracja serwera proxy w przeglądarce WWW
Instytut Sterowania i Systemów Informatycznych Uniwersytet Zielonogórski Praca z programami SAS poza lokalną siecią komputerową UZ. Zestawienie tunelu SSH oraz konfiguracja serwera proxy w przeglądarce
Instalacja rozwiązania... 2. Uruchomienie rozwiązania w systemie Sage... 3. Konfiguracja dodatku... 4. Ustawienia dodatkowe rozwiązania...
Rozwiązanie przygotowane do wymiany danych pomiędzy programem Sage Handel a serwisem www.allegro.pl za pośrednictwem oprogramowania Firmy PhotoSoft EasyUploader. Rozwiązanie pozwala na przesyłanie towarów
Krótka instrukcja instalacji Adobe Acrobat Reader
Krótka instrukcja instalacji Adobe Acrobat Reader Program Adobe Acrobat Reader jest niezbędny do otwarcia dokumentu e-faktury tp. Jeżeli nie posiadają go Państwo w swoim komputerze, należy go zainstalować.
Laboratorium 7 Blog: dodawanie i edycja wpisów
Laboratorium 7 Blog: dodawanie i edycja wpisów Dodawanie nowych wpisów Tworzenie formularza Za obsługę formularzy odpowiada klasa Zend_Form. Dla każdego formularza w projekcie tworzymy klasę dziedziczącą
APLIKACJA SHAREPOINT
APLIKACJA SHAREPOINT Spis treści 1. Co to jest SharePoint?... 2 2. Tworzenie nowej witryny SharePoint (obszar roboczy)... 2 3. Gdzie znaleźć utworzone witryny SharePoint?... 3 4. Personalizacja obszaru
Import limitów urlopowych / nowy rok
Import limitów urlopowych / nowy rok 1. Wstęp Limity urlopowe pracowników w BeeOffice można zbiorczo dodawać lub aktualizować przy pomocy importu danych z pliku Excel. Jednym z typowych scenariuszy do
emszmal 3: Automatyczne księgowanie przelewów w sklepie internetowym Magento 2 (plugin dostępny w wersji ecommerce)
emszmal 3: Automatyczne księgowanie przelewów w sklepie internetowym Magento 2 (plugin dostępny w wersji ecommerce) Zastosowanie Rozszerzenie to dedykowane jest sklepom internetowych zbudowanym w oparciu
Jako lokalizację, w której będzie kontynuowana praca w przyszłym roku szkolnym, warto wybrać tę, w której zgromadzonych jest więcej danych.
UONET+ Co zrobić, gdy w związku z reformą oświaty witryny UONET+ dwóch jednostek należy zastąpić jedną witryną UONET+? Reforma oświaty zakłada stopniowe wygaszanie gimnazjów. Od decyzji organu prowadzącego
Data wydania: 2013-06-12. Projekt współfinansowany przez Unię Europejską ze środków Europejskiego Funduszu Społecznego
Wersja 1.0 Projekt współfinansowany przez Unię Europejską ze środków Europejskiego Funduszu Społecznego w ramach Programu Operacyjnego Kapitał Ludzki Tytuł dokumentu: Dokumentacja dla administratora strony
INSTRUKCJA UŻYTKOWNIKA Podpis cyfrowy ISO 9001:2008 Dokument: 2016.0.0.0 Wydanie: 2016-01. Podpis cyfrowy. Spis treści... 1
Spis treści Spis treści... 1 Wstęp... 2 Przygotowanie certyfikatów wewnętrznych... 2 2.1. Przygotowanie karty pracownika... 2 2.2. Dodawanie certyfikatu nadrzędnego... 3 2.3. Dodawanie certyfikatu pracownika...
I. Informacje ogólne. Jednym z takich systemów jest Mambo.
MAMBO (CMS) I. Informacje ogólne CMS, Content Management System ("system zarządzania treścią") jest to jedna lub zestaw aplikacji internetowych pozwalających na łatwe utworzenie oraz późniejszą aktualizację
emszmal 3: Automatyczne księgowanie przelewów w sklepie internetowym Magento 2 (plugin dostępny w wersji ecommerce)
emszmal 3: Automatyczne księgowanie przelewów w sklepie internetowym Magento 2 (plugin dostępny w wersji ecommerce) Zastosowanie Rozszerzenie to dedykowane jest sklepom internetowym zbudowanym w oparciu
Instrukcja użytkownika Platforma transakcyjna mforex Trader dla systemu Linux
Instrukcja użytkownika Platforma transakcyjna mforex Trader dla systemu Linux Kontakt: e-mail: kontakt@mforex.pl infolinia: 22 697 4774 www.mforex.pl 1 1 O platformie Platforma mforex Trader to część systemu
Poradnik zetula.pl. Jak założyć konto na zetula.pl. i zabezpieczyć dane na swoim komputerze?
Poradnik zetula.pl Jak założyć konto na zetula.pl i zabezpieczyć dane na swoim komputerze? 1.Wejdź na stronę www.zetula.pl 2.Kliknij na odnośniku Utwórz nowe konto 3.Wypełnij formularz rejestracyjny. Pola
Zaawansowane aplikacje internetowe - laboratorium
Zaawansowane aplikacje internetowe - laboratorium Web Services (część 3). Do wykonania ćwiczeń potrzebne jest zintegrowane środowisko programistyczne Microsoft Visual Studio 2005. Ponadto wymagany jest
emszmal 3: Automatyczne księgowanie przelewów w sklepie internetowym PrestaShop (plugin dostępny w wersji ecommerce)
emszmal 3: Automatyczne księgowanie przelewów w sklepie internetowym PrestaShop (plugin dostępny w wersji ecommerce) Zastosowanie Rozszerzenie to dedykowane jest sklepom internetowych zbudowanym w oparciu
Program współpracuje z : Windows XP, Powerdraft 2004, v8, XM, Microstation 2004, v8, XM.
Spis treści 1. Informacje ogólne. Wstęp. Wymagania programu. 2. Sposób uruchomienia programu. Uruchomienie poprzez menu microstation. Uruchomienie z menu start. 3. Działanie programu. Zakładka import.
CitiDirect Online Banking - portal CitiDirect EB
CitiDirect Online Banking - portal CitiDirect EB Dodatkowa informacja dotycząca konfiguracji zabezpieczeń oprogramowania Java Pomoc Techniczna CitiDirect CitiService Pomoc Techniczna CitiDirect Tel. 0
5.1. MINIPOS MINIPOS. INSTALACJA ORAZ URUCHOMIENIE USŁUGI
5.1. MINIPOS POSMobile to wersja zdalnego bonownika przeznaczona do prowadzenia sprzedaży na urządzeniach z systemem Android. Do działania potrzebuje urządzenia z systemem Android w wersji co najmniej
Wikispaces materiały szkoleniowe
Wikispaces materiały szkoleniowe Wstęp Wikispaces jest ogólnie dostępnym narzędziem do tworzenia własnych stron internetowych. Zastosowanie stron internetowych tworzonych przy pomocy wikispaces to na przykład:
Instrukcja importu deklaracji pacjentów. do dreryka
Instrukcja importu deklaracji pacjentów do dreryka Jeżeli posiadasz plik sprawozdań do NFZ w formacie XML/PDX lub POZ, czytaj: Rozdział 1. - Import deklaracji z formatów XML/PDX oraz POZ Jeżeli używasz
Instalacja programu Warsztat 3 w sieci
Instalacja programu Warsztat 3 w sieci (proszę uważnie przeczytać do końca) Spis treści 1 Przed instalacją...2 2 Przeprowadzanie po raz pierwszy instalacji sieciowej...3 2.1 Dane umieszczone na jednej
Sposoby tworzenia projektu zawierającego aplet w środowisku NetBeans. Metody zabezpieczenia komputera użytkownika przed działaniem apletu.
Sposoby tworzenia projektu zawierającego aplet w środowisku NetBeans. Metody zabezpieczenia komputera użytkownika przed działaniem apletu. Dr inż. Zofia Kruczkiewicz Dwa sposoby tworzenia apletów Dwa sposoby
I. Interfejs użytkownika.
Ćwiczenia z użytkowania systemu MFG/PRO 1 I. Interfejs użytkownika. MFG/PRO w wersji eb2 umożliwia wybór użytkownikowi jednego z trzech dostępnych interfejsów graficznych: a) tekstowego (wybór z menu:
Podstawy technologii WWW
Podstawy technologii WWW Ćwiczenie 8 PHP, czyli poczatki nowej, dynamicznej znajomosci Na dzisiejszych zajęciach rozpoczniemy programowanie po stronie serwera w języku PHP. Po otrzymaniu żądania serwer
wfirma (Moduł Magento) v Strona 1 z 12
wfirma (Moduł Magento) v.1.20.0 Strona 1 z 12 Spis treści Zgodny z Magento... 3 Instalacja.... 3 Problem z instalacją... 3 Odinstalowanie modułu:... 4 Konfiguracja.... 5 Ustawienia dokumentów... 6 Ustawienia
Silent setup SAS Enterprise Guide (v 3.x)
SAS Institute TECHNICAL SUPPORT Silent setup SAS Enterprise Guide (v 3.x) Silent Setup ( cicha instalacja oprogramowania) pozwala na instalację Enterprise Guide (lub całości oprogramowania SAS) na wielu
Programy LeftHand - Obsługa plików JPK. Luty 2017
Programy LeftHand - Obsługa plików JPK Luty 2017 Spis treści 1. Wstęp... 2 2. Pierwsze uruchomienie funkcji JPK... 2 3. Generowanie plików JPK... 9 4. Wysyłanie plików JPK... 10 5. Pobieranie i drukowanie
Compas 2026 Personel Instrukcja obsługi do wersji 1.05
Compas 2026 Personel Instrukcja obsługi do wersji 1.05 1 Oprogramowanie obsługi uprawnień SKD 2 Oprogramowanie obsługi uprawnień SKD 3 Oprogramowanie obsługi uprawnień SKD Spis treści Integracja...5 1.Compas
Instrukcja EQU Kantech
Instrukcja EQU Kantech Pobranie konfiguracji Konfiguracje Kantecha do IFTER EQU pobieramy za pomocą opcji we właściwościach integracji Kantech wskazując lokalizacje katalogu..\data\kantech. Po wskazaniu
Wysyłka wniosko w ZUS - EKS. Instrukcja użytkownika aplikacji Wysyłka wniosków ZUS EKS
Wysyłka wniosko w ZUS - EKS Instrukcja użytkownika aplikacji Wysyłka wniosków ZUS EKS Spis treści Wysyłka elektronicznych wniosków ZUS EKS do portalu PUE ZUS... 2 Instalacja aplikacji... 2 Aktualizacja
Plan. Raport. Tworzenie raportu z kreatora (1/3)
3 Budowa prostych raportów opartych o bazę danych Plan Co to jest raport? Tworzenie za pomocą kreatora Tworzenie opartego o polecenie SQL Edycja atrybutów Atrybuty regionu Atrybuty Atrybuty kolumn 2 Raport
Telesprzedaż by CTI Instrukcja
Telesprzedaż by CTI Instrukcja 1 Spis treści 1. Opis programu...4 2. Konfiguracja...5 2.1. Połączenie z serwerem MS SQL...6 2.2. Połączenie z serwerem MS SQL systemu Call Center...7 2.3. Nawiązanie połączenia
emszmal 3: Automatyczne księgowanie przelewów w sklepie internetowym Magento (plugin dostępny w wersji ecommerce)
emszmal 3: Automatyczne księgowanie przelewów w sklepie internetowym Magento (plugin dostępny w wersji ecommerce) Zastosowanie Rozszerzenie to dedykowane jest sklepom internetowych zbudowanym w oparciu
Tytuły Wykonawcze. Opis systemu tworzenia dokumentacji TW-1
Tytuły Wykonawcze Opis systemu tworzenia dokumentacji TW-1 Program pozwala na tworzenie tytułów wykonawczych według Rozporządzenia Ministra Finansów z dnia 16 maja 2014 r. 1.Główne cechy systemu -ewidencja
Aplikacje WWW - laboratorium
Aplikacje WWW - laboratorium PHP + bazy danych Celem ćwiczenia jest przygotowanie prostej aplikacji internetowej wykorzystującej technologię PHP. Aplikacja pokazuje takie aspekty, współpraca PHP z bazami
Konfiguracja programu MS Outlook 2007 dla poczty w hostingu Sprint Data Center
Konfiguracja programu MS Outlook 2007 dla poczty w hostingu Sprint Data Center Spis treści Konfiguracja Microsoft Outlook 2007... 3 Konfiguracja dla POP3... 7 Konfiguracja dla IMAP... 11 Sprawdzenie poprawności
Przypisy i przypisy końcowe
- 1 - Przypisy i przypisy końcowe Przypisami nazywamy pewne teksty służące do podawania wyjaśnień, komentarzy, odsyłaczy do tekstu, do bibliografii itp. Edytor WORD rozróżnia dwa rodzaje przypisów: przypisy
SYSTEMY OPERACYJNE ĆWICZENIE POLECENIA SYSTEMU MSDOS
SYSTEMY OPERACYJNE ĆWICZENIE POLECENIA SYSTEMU MSDOS 1. Podstawowe informacje Aby uruchomić Wiersz poleceń należy wybrać menu Start, a następnie Uruchom gdzie należy wpisać cmd i zatwierdzić je klawiszem
Podręcznik użytkownika Wprowadzający aplikacji Wykaz2
Podręcznik użytkownika Wprowadzający aplikacji Wykaz2 TiMSI Sp z o o ul Czapli 63, 02-781 Warszawa tel : +48 22 644 86 76, fax: +48 22 644 78 52 NIP: 951-19-39-800 Sąd Rejonowy dla mst Warszawy w Warszawie,
Konfiguracja oprogramowania w systemach MS Windows dla kont z ograniczonymi uprawnieniami
Konfiguracja oprogramowania w systemach MS Windows dla kont z ograniczonymi uprawnieniami Dotyczy programów opartych na bazie BDE: Menedżer Pojazdów PL+ Ewidencja Wyposażenia PL+ Spis treści: 1. Wstęp...
Tworzenie prostej etykiety i synchronizacja etykiet z wagą. AXIS Sp. z o.o. Kod produktu:
Tworzenie prostej etykiety i synchronizacja etykiet z wagą Współpraca wagi z etykieciarką wymaga zaprojektowania formy (szablonu) etykiety na komputerze i zapisania jej w pamięci etykieciarki. Następnie
Instrukcja użytkownika Porównywarki cen Liquid
Instrukcja użytkownika Porównywarki cen Liquid Wersja Spis treści 1 Wstęp... 3 2 Opis obszaru... 4 Towary... 5 Relacje... 6 Edytuj... 7 2.3.1 Konfiguracja... 7 2.3.2 Kategorie... 7 2.3.3 Ustawienia...
System. Instalacja bazy danych MySQL. Autor : Piotr Zielonka tel Piotrków Tryb., sierpień 2018r.
System FOKUS Instalacja bazy danych MySQL Autor : Piotr Zielonka tel. 601 99-73-79 pomoc@zielonka.info.pl Piotrków Tryb., sierpień 2018r. W wersji 2018.7.0 systemu FoKus wprowadzono funkcje umożliwiające
Współpraca z platformą Emp@tia. dokumentacja techniczna
Współpraca z platformą Emp@tia dokumentacja techniczna INFO-R Spółka Jawna - 2013 43-430 Pogórze, ul. Baziowa 29, tel. (33) 479 93 29, (33) 479 93 89 fax (33) 853 04 06 e-mail: admin@ops.strefa.pl Strona1
SZYBKI START. Tworzenie nowego połączenia w celu zaszyfrowania/odszyfrowania danych lub tekstu 2. Szyfrowanie/odszyfrowanie danych 4
SZYBKI START Tworzenie nowego połączenia w celu zaszyfrowania/odszyfrowania danych lub tekstu 2 Szyfrowanie/odszyfrowanie danych 4 Szyfrowanie/odszyfrowanie tekstu 6 Tworzenie nowego połączenia w celu
Instalacja sieciowa Autodesk AutoCAD oraz wertykali
Instalacja sieciowa Autodesk AutoCAD oraz wertykali Łukasz Kuras Licencja sieciowa w przypadku produktów Autodesk rozdzielana jest za pomocą odpowiedniego oprogramowania zwanego Menedżerem licencji sieciowej.
Wstawianie filmu i odtwarzanie go automatycznie
Wstawianie filmu (pliku wideo) w programie PowerPoint 2003 i wyświetlanie go na pełnym ekranie Ten artykuł dotyczy odtwarzania filmów (nazywanych także plikami wideo) i opisuje sposób wykonywania następujących
Edytor materiału nauczania
Edytor materiału nauczania I. Uruchomienie modułu zarządzania rozkładami planów nauczania... 2 II. Opuszczanie elektronicznej biblioteki rozkładów... 5 III. Wyszukiwanie rozkładu materiałów... 6 IV. Modyfikowanie
Instrukcja dotycząca konwersji dokumentów LaTeX do plików w formacie RTF
Instrukcja dotycząca konwersji dokumentów LaTeX do plików w formacie RTF 1. Wstęp Treści zawarte w tym dokumencie mogą być przydatne w przypadku konieczności dokonania konwersji dokumentów tworzonych z