System gromadzenia, indeksowania i opisu słownikowego norm i rekomendacji Praca magisterska Jakub Reczycki Opiekun : dr inż. Jacek Rumiński Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska
Cel pracy Stworzenie narzędzia wspomagającego tłumaczenie dokumentów. Uwzględnienie specyfiki tłumaczenia norm. Centralna dostępność aplikacji dla wielu użytkowników. Wygodny interfejs.
Istniejące rozwiązania Komputerowe tłumaczenie rzadko w pełni zautomatyzowane. Najpowszechniej stosowane są programy do Tłumaczenia Wspomaganego Komputerowo (Computer Assisted Translation - CAT).
Implementacje CAT Elektroniczne słowniki I bazy terminologii Leksykalne bazy danych WordNet FrameNet Konkordancery Bazy tłumaczeń OmegaT WordFast
Elektroniczne słowniki i bazy terminologii
Leksykalne bazy danych - WordNet
Leksykalne bazy danych - Framenet
Konkordancery
Bazy tłumaczeń - WordFast
Specyfika pracy tłumacza dokumentów normatywnych Dokumenty tego typu często stanowią prawo. Konieczne jest zachowanie precyzji sformułowań źródła w wersji przetłumaczonej. Z każdym dokumentem związana jest pewna przestrzeń pojęć.
Specyfika pracy tłumacza dokumentów normatywnych Potrzebne informacje na etapie tłumaczenia pojęć: o wszystkich definicjach danego pojęcia w języku źródłowym i kontekście ich stosowania; o zwrotach w języku docelowym określających te definicje; o normach, w których pierwotnie zdefiniowano dane znaczenie słowa ; o relacjach semantycznych pomiędzy pojęciami zdefiniowanymi w dany sposób;
Wymaganie funkcjonalne Niezbędne trzy składowe programu: Baza dokumentów Przechowuje dane o dokumentach Przechowuje źródła dokumentów Baza pojęć i tłumaczeń Przechowuje pojęcia wraz z definicjami powiązane z dokumentami Przechowuje relacje semantyczne pomiędzy pojęciami System propozycji tłumaczeń Wynajduje w dokumentach pojęcia wcześniej wprowadzone do bazy Prezentuje informacje możliwych tłumaczeniach znalezionych pojęć oraz kontekstach ich stosowania
Wymagania niefunkcjonalne Sposób dostępu użytkownika klient - serwer Możliwość pracy wielu użytkowników Udostępnianie źródeł dokumentów tylko uprawnionym użytkownikom Zabezpieczenia przed dostępem do systemu i jego danych niepowołanych osób Minimalizacja wymagań sprzętowych użytkowników Ergonomia interfejsu użytkownika
Struktura danych
Struktura systemu Trójwarstwową struktura systemu warstwa danych Java EE + MySql warstwa aplikacji Java EE warstwa klienta - Google Web Toolkit (Java kompilowana na JavaScript)
Implementacja
Implementacja Projekt całkowicie zrealizowany w powszechnie dostępnych darmowych technologiach Część serwerowa możliwa do uruchomienia w dowolnym środowisku obsługującym język java Częśc kliencka możliwa do uruchomienia w dowolnych przeglądarkach obsługujących poprawnie język JavaScript
Testowanie Sprawdzenie poprawnego działania wszystkich modułów (serwer, baza danych, zabezpieczenia dostępu) Sprawdzenie poprawnego działania funkcji wewnętrznych (testy i logi) Sprawdzenie wynikowego systemu poszczególne funkcjonalności użyteczność
Rezultaty testów Testy działania oraz funkcjonalności przebiegły sprawnie oraz pozwoliły usunąć kilka usterek Testy użyteczności oraz ergonomii wykazały: Pełną realizację założonych funkcjonalności Niedostateczną wygodę interfejsu przy niektórych operacjach (szczególnie przy wprowadzaniu dużych ilości danych)
Podsumowanie Stworzone zostało narzędzie skierowane do konkretnego typu użytkownika tłumacza dokumentów normatywnych. Udostępnia ono centralnie wielu użytkownikom możliwość wspólnego tworzenia pewnej zasobu wiedzy oraz zautomatyzowanego jego przeglądania. Część kliencka aplikacji łączy zalety aplikacji dostępnej przez przeglądarkę z wygodą obsługi większą niż w tradycyjnych aplikacjach tego typu.
Dalsze drogi rozwoju Usprawnienie interfejsu - zwiększenie wygody pracy, szczególnie przy masowych operacjach (np: indeksowanie. zawartości dokumentu). Poszerzenie ilości obsługiwanych formatów danych. Ze względu na sposób udostępniania projekt może być na bieżąco dostosowywany do sugestii użytkowników bez konieczności instalowania przez nich jakichkolwiek aktualizacji.
Dziękuje za uwagę