Janusz S. Bień, Joanna Bilińska, Mateusz Sarnecki Wydział Neofilologii Uniwersytet Warszawski Leksykografia polska, ukraińska, bułgarska: słowniki tradycyjne i elektroniczne Warszawa, 13.11.2014 r.
Słowniki na serwerze Katedry Lingwistyki Formalnej Adres: http://korpusy.klf.uw.edu.pl/pl/ Słownik warszawski (J. Karłowicz, A. Kryński, W. Niedźwiedzki, Słownik języka polskiego, Warszawa 1900 1927). Słownik polszczyzny XVI wieku (wydawany od 1966 r.). S. B. Linde, Słownik języka polskiego (2. wydanie), Lwów 1854 1861. B. Chlebowski, F. Sulimierski, W. Walewski (red.), Słownik Geograficzny Królestwa Polskiego i innych krajów słowiańskich, Warszawa 1880 1902.
Słowniki na serwerze KLF cd. Słowniki udostępniane graficznie z dodawanymi elementami typu: warstwa tekstowa (tzw. brudny OCR), podziały na sekcje, możliwość korzystania z wyrażeń regularnych w wyszukiwarce, konkordancje graficzne, indeksy, spis treści (outline) w przypadku Słownika Lindego
http://korpusy.klf.uw.edu.pl/pl/ Kolejne możliwe udogodnienia to np. anotacja skanów oraz
DjVu Teksty udostępniane w formacie DjVu szybki dostęp, możliwość dużego powiększania obrazu, stopniowe ładowanie pliku, możliwość tworzenia linków (URL), wielowarstwowość plików Konieczne jest zainstalowanie specjalnego programu (np. djview for Poliqarp) lub wtyczki do przeglądarki
Konkordancje graficzne
Wyszukiwanie zaawansowane Warto takie teksty tagować, np. dodając objaśnienia do skrótów.
Spis treści (outline) (przeglądarka DjView4)
Dalsze przyrostowe udostępnianie tekstu przechodzenie od tzw. brudnego OCR-u do tekstów Ground-Truth, tagowanie tekstu, dodawanie anotacji skanów, budowa indeksów
Możliwe anotacje skanów pokazywanie erraty lub poprawek redakcyjnych, tworzenie chmurek z wyjaśnieniami do tekstu, zaznaczanie tekstu (na skanie) kolorami, łącza do odwołań, źródeł, innych słowników, spisy treści, indeksy
Możliwy tagset [attr] lang = und pl de ru... script = latn latf cyrl... series = medium bold shape = upright italic wconf = 0 1 2 3 4 5 6 7 8 9 [pos] ign = lang script series shape wconf
Przykładowe indeksy Indeks żywej paginy jak w słowniku Knapskiego (http://www.mimuw.edu.pl/polszczyzna/knapski/ Knapski_DjVu/) Indeks haseł np. indeks a tergo do Słownika Lindego (http://bc.klf.uw.edu.pl/379/) Inne indeksy dla słownika Lindego np. nazw geograficznych, słów obcojęzycznych, skrótów redakcyjnych, innych skrótów
Indeks a tergo do słownika Lindego
Słownik Lindego w Bayerische StaatsBibliothek http://reader.digitale-sammlungen.de/de/fs1/object/ display/bsb10524311_00001.html
Słownik Lindego w Bayerische StaatsBibliothek cd. pliki JPG i PDF, wyszukiwanie słów, podpowiadanie słów w czasie szukania, OCR z błędami, konkordancje graficzne, można pobrać PDF bez OCR, brak możliwości zapisywania linków do konkretnych trafień
Literatura Bień, Janusz S. (2014), Elektroniczny indeks do słownika Lindego, V Glosa do leksykografii, 18-19 września 2014 r., Warszawa, http://bc.klf.uw.edu.pl/379/. Bień, Janusz S. (2014) The IMPACT project Polish Ground-Truth texts as a DjVu corpus, "Cognitive Studies Études Cognitives" (14), s. 75-84, http://bc.klf.uw.edu.pl/381/. Bień, Janusz S., Bilińska, Joanna A., Sarnecki, Mateusz (2014), An incremental approach to retrodigitization, ENeL-WG2 meeting, Bolzano, http://bc.klf.uw.edu.pl/378/.