CLARIN-PL w praktyce badawczej
|
|
- Filip Bukowski
- 8 lat temu
- Przeglądów:
Transkrypt
1 CLARIN-PL w praktyce badawczej Podsumowanie cyklu wykładów i warsztatów Streszczenie: CLARIN- PL jest infrastrukturą naukową technologii językowych, która udostępnia narzędzia badawcze do analizy zapisów tekstu i mowy. Sensem istnienia infrastruktury badawczej jest pomocy niesiona użytkownikom i jej użyteczność jako narzędzia badawczego. Dlatego ocena infrastruktury badawczej powinna być oparta również na jakości prac badawczych leżących u podstaw jej konstrukcji (np. algorytmów poszczególnych narzędzi językowych), ale przede wszystkim na zakresie realnego wsparcia udzielanego użytkownikom- naukowcom. Mając powyższe obserwacje na uwadze, konstruując CLARIN- PL staramy się utrzymywać bliskie kontakty z użytkownikami i kształtować infrastrukturę zgodnie z ich potrzebami. Aby skrócić czas oczekiwania na efekty budowy CLARIN- PL z jednej strony przyspieszyliśmy część prac (np. Centrum Technologii Językowych CLARIN- PL, pl.eu, otrzymało wymagane certyfikaty już w lipcu 2015, a więc na pół roku przed planowanym terminem), a z drugiej strony staramy się udostępniać użytkownikom poszczególne części infrastruktury i narzędzia, jak tylko są już gotowe, chociażby w postaci zaawansowanych prototypów. Od kwietnia do maja 2015 zorganizowaliśmy trzy edycje kilkudniowych naukowych warsztatów szkoleniowych, podczas których łącznie ponad 140 naukowców z różnych dziedzin humanistyki i nauk społecznych mogło zapoznać się i wypróbować infrastrukturę CLARIN- PL w jej ówczesnym kształcie. W ramach niniejszego dokumentu chcielibyśmy krótko zaprezentować udostępniony kształt infrastruktury CLARIN- PL, jaki został zaprezentowany podczas warsztatów. Ponadto zebraliśmy uwagi zebrane od uczestników za pomocą anonimowych ankiet. Na ich podstawie sformułowaliśmy wnioski dotyczące oceny osiągniętego stanu budowy CLARIN- PL i wymagań odnośnie dalszej jej rozbudowy.
2 Spis treści: 1 Wprowadzenie Część szczegółowa Narzędzia korpusowe Centrum Technologii Językowych CLARIN- PL: gromadzenie, deponowanie, anotowanie i udostępnianie korpusów Narzędzia do automatycznej analizy odniesień w tekstach Zaawansowane narzędzie do analizy korpusu w oparciu o reguły Korpusy mowy i narzędzia do ich przetwarzania ChronoPress (Chronologiczny Korpus Polskich Teksów Prasowych) i jego wykorzystanie w badaniach Narzędzia słownikowe Słowosieć leksykalna sieć semantyczna języka polskiego i jej zastosowanie w analizie znaczeń Dwujęzyczna Słowosieć - możliwości wykorzystania w pracy tłumacza Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny połączeń wyrazowych Korpusy referencyjne i równoległe w warsztacie tłumacza Narzędzia do badań nad tekstem Morfeusz 2 analizator i generator fleksyjny dla języka polskiego. Tworzenie słowników dziedzinowych dla analizatora Morfeusz Słownik walencyjny języka polskiego Parsowanie składniowe i jego zastosowania Parsowanie składniowe LFG i jego zastosowania Parsowanie semantyczne i jego zastosowania System do klasyfikacji tekstu i analizy stylometrycznej Rejestr konwersacyjny polszczyzny, czyli dyskurs w czasie rzeczywistym na podstawie danych Spokes Podsumowanie... 47
3 1 Wprowadzenie CLARIN- PL to polska część wielkiej europejskiej infrastruktury technologii językowych CLARIN ERIC, której głównym celem jest udostępnianie zasobów (korpusów tekstów, słowników, gramatyk) i narzędzi językowych (automatycznych analizatorów tekstu) otwierających nowe możliwości w pracy naukowców reprezentujących nauki społeczne i humanistyczne. Polska część infrastruktury, zgodnie z przyjętym planem, znajduje się jeszcze w fazie prototypu, jednak wiele jej elementów jest gotowych do użytku i już teraz może służyć użytkownikom. Narodziła się więc potrzeba zaprezentowania opracowanej do tej pory technologii językowej: wskazania jej możliwości i ograniczeń oraz przybliżenia społeczności naukowej wiedzy o powstającej infrastrukturze. CLARIN- PL to infrastruktura ukierunkowana na użytkowników. Jej istotą jest odpowiadać na potrzeby badań w naukach humanistycznych i społecznych. Zależy nam więc, aby użytkownicy brali czynny udział we współtworzeniu CLARIN- PL. Zgłaszane przez nich propozycje scenariuszy badawczych, ich uwagi i sugestie są ważnym drogowskazem w prowadzonych pracach. Oprócz tzw. kluczowych użytkowników, we współpracy z którymi opracowujemy narzędzia napisane na potrzeby konkretnych badań, chcielibyśmy usłyszeć także głos szerszego grona odbiorców, zainteresowanych sięgnięciem po gotowe już usługi i zasoby. Zdajemy sobie także sprawę, że jakość i użyteczność infrastruktury zorientowanej na praktyczne zastosowania przejawia się w działaniu. Z tego względu, niezależnie od trwających intensywnych prac nad rozbudową całości CLARIN- PL, podjęliśmy wyzwanie poddania najbardziej zaawansowanych elementów infrastruktury praktycznej weryfikacji. Powyższe okoliczności zaowocowały serią wykładów i warsztatów CLARIN- PL w praktyce badawczej, przeprowadzonych wiosną tego roku, adresowanych do badaczy nauk humanistycznych i społecznych oraz do tłumaczy. Pierwsze warsztaty odbyły się w kwietniu, na zaproszenie Centrum Humanistyki Cyfrowej Badań Literackich. Liczba zgłoszeń daleko przerosła możliwości organizacyjne (ponad 4 osoby na miejsce), dlatego w przyspieszonym trybie zorganizowaliśmy kolejne warsztaty na Politechnice Wrocławskiej (w maju) oraz na Uniwersytecie Pedagogicznym w Krakowie w ramach czerwcowej Letniej Szkoły Humanistyki Cyfrowej, które również cieszyły się bardzo dużym zainteresowaniem. Warsztaty były otwarte dla wszystkich chętnych pracowników naukowych. Wcześniejsza wiedza z zakresu technologii językowej nie była wymagana, co umożliwiło dotarcie również do tych badaczy, którzy do tej pory, z różnych względów, nie korzystali z możliwości, jakie dają osiągnięcia w tej dziedzinie. Łącznie w dotychczasowych warsztatach wzięło udział ponad 140 osób, przedstawicieli różnych dziedzin nauki, m.in. medioznawstwa, komunikologii, bibliotekoznawstwa, psychologii, socjologii, translatoryki, leksykografii, lingwistyki komputerowej, dydaktyki
4 języków obcych, językoznawstwa historycznego i wielu innych. Wśród uczestników byli zarówno studenci i doktoranci, jak i badacze z najwyższymi stopniami i tytułami akademickimi, zasłużeni dla polskiej nauki. Celem warsztatów było pokazanie możliwości zastosowania narzędzi i zasobów CLARIN- PL w badaniach opartych na gromadzeniu i analizie dużych ilości tekstowych materiałów źródłowych. Intensywny, trzydniowy program obejmował trzy zasadnicze grupy narzędzi: korpusowe, słownikowe oraz do badań nad tekstem. Nacisk położony został na praktyczny wymiar pracy z infrastrukturą. Przy pomocy omawianych narzędzi uczestnicy samodzielnie wykonywali różnego rodzaju zadania, zapoznając się z możliwościami, funkcjonalnością i specyfiką omawianych narzędzi. Ogółem podczas wszystkich trzech sesji warsztatowych użytkownicy zapoznali się z 30 narzędziami, zasobami, systemami i aplikacjami, umożliwiającymi całe spektrum zastosowań. Ważnym elementem przeprowadzonych szkoleń był aspekt ewaluacyjny. Przebieg warsztatów pozwolił zorientować się w mocnych i słabych stronach prezentowanych usług, jak również w oczekiwaniach uczestników. Użytkownicy mogli przekazać swoje uwagi w bezpośrednich rozmowach z prowadzącymi oraz udzielając odpowiedzi w rozesłanej ankiecie. Zebrane opinie zawierają m.in. szczegółowe wskazówki, o jakie funkcje należałoby rozwinąć poszczególne narzędzia, w jaki sposób zmienić interfejs, w jakim kierunku rozwijać dostępne narzędzia i zasoby. Uczestnicy warsztatów wskazali na konkretne możliwości zastosowań w obszarze swoich badań, podkreślali przydatność narzędzi oraz inspiracje badawcze wyniesione ze szkolenia. Ze względu na ograniczone ramy czasowe nie udało się uniknąć koniecznych skrótów i selekcji dostępnej już oferty usług CLARIN- PL. Co więcej, cały czas oddajemy do użytku kolejne narzędzia i zasoby. Istnieje więc wyraźna potrzeba organizacji następnych cykli warsztatowych, także takich, które będą zawężone do wybranej dziedziny nauki, czy zróżnicowanych pod względem stopnia zaawansowania użytkowników. Zainteresowanie, jakim cieszyły się warsztaty, jak również pozytywny odbiór w społeczności badawczej są dla nas źródłem ogromnej satysfakcji. Cieszymy się, że już na obecnym, prototypowym jeszcze etapie, CLARIN- PL może spełniać swoją funkcję. Warto podkreślić, że zarówno pierwsze jak i trzecie warsztaty zostały zorganizowane z inicjatywy użytkowników w ich jednostkach naukowych. Nawiązane kontakty i złożone propozycje współpracy pozwalają żywić przekonanie, że powstająca infrastruktura CLARIN- PL rzeczywiście istnieć będzie dla użytkowników i dzięki nim.
5 2 Część szczegółowa 2.1 Narzędzia korpusowe Centrum Technologii Językowych CLARIN- PL: gromadzenie, deponowanie, anotowanie i udostępnianie korpusów dr inż. Tomasz Walkowiak, dr inż. Maciej Piasecki, dr Marcin Oleksy, mgr inż. Jan Kocoń Centrum Technologii Językowych CLARIN- PL, uruchomione na Politechnice Wrocławskiej, jest węzłem ogólnoeuropejskiej infrastruktury CLARIN ERIC, skierowanej do badaczy nauk humanistycznych i społecznych. Centrum jest dostępne pod adresem: eu.pl. Jego kluczowym elementem jest repozytorium zasobów i narzędzi językowych, uzupełniane przez usługi sieciowe oraz prototypowe aplikacje badawcze. Ważnym zadaniem Centrum jest przechowywanie i udostępnianie korpusów oraz dostarczenie narzędzi umożliwiających wygodne prace korpusowe. Celem wykładu był przegląd usług udostępnianych użytkownikom przez CLARIN- PL oraz pokazanie, w jaki sposób mogą oni wykorzystać Centrum do deponowania i archiwizacji własnych zasobów językowych (np. korpusów, słowników). Słuchacze zapoznali się z podstawowymi zagadnieniami dotyczącymi przechowywania w Centrum własnych korpusów: ustalaniem odpowiedniej licencji, wyborem właściwego formatu, standardami opisu meta- danymi, możliwościami przetwarzania i znakowania korpusów w systemie Inforex, użyciem narzędzi do gromadzenia korpusów bezpośrednio ze źródeł internetowych. Omówiony został także system logowania w ogólnopolskiej federacji uwierzytelniania, gwarantującej bezpieczeństwo przechowywania danych i umożliwiającej logowanie na podstawie własnego konta z jednostki macierzystej (jeżeli przystąpiła ona do federacji). W ramach zajęć warsztatowych uczestnicy samodzielnie zdeponowali mały korpus testowy, wgrali go do systemu Inforex i poddali wstępnemu przetwarzaniu. Anotowali i przeszukiwali korpus (za pomocą systemu NoSketch), wykonali statystyczną analizę anotacji i utworzyli podstawowe listy frekwencyjne. Opinie uczestników: Tak, to narzędzie będzie dla mnie na pewno bardzo przydatne ze względu na specyfikę tekstów nad którymi pracuję. Brakuje miejsca, gdzie byłyby zgromadzone w zadowalającym zakresie, więc stworzenie własnego korpusu z pomocą przyjaznego narzędzia będzie bardzo przydatne. Na potrzeby mojej pracy doktorskiej, gromadzę bazę słownictwa i struktur wyrażających grzeczność w języku polskim. Baza powstaje poprzez ekscerpcję materiału podręcznikowego. Zgromadzenie jej w korpusie mogłoby ułatwić analizę materiału oraz umożliwić korzystanie ze zgromadzonych zasobów lektorom czy też osobom uczącym się języka. DSpace może ułatwić tworzenie przede wszystkim małych korpusów (ze względu na czas pracy vs. efekt) i nie wymaga obróbki danych w różnych programach na kolejnych etapach tagowania.
6 Zdaje się, że w tej chwili narzędzie nie wspiera plików MOBI i DJVU. To bolesne zwłaszcza w tym drugim przypadku, ponieważ biblioteki cyfrowe przed laty zdecydowały się na ten format - ku zgrozie dzisiejszych użytkowników. Pracuję głównie na danych jakościowych, tj. na zapisach rozmów z respondentami swoich badań. Transkrypcje wywiadów muszą być poufne i nie chcę udostępniać ich innym osobom. Oprogramowanie komercyjne przeznaczone do takiej pracy jest bardzo kosztowne, a darmowe alternatywy - niezadowalające. Dlatego z ochotą korzystałbym w swojej pracy z Inforeksa i DSpace, gdyby: 1. Pozwalały ukrywać zbiory i certyfikowały ich poufność. 2. Pozwalały edytować skład zbiorów - dodawać i usuwać dokumenty, nie tracąc dotychczas wykonanej pracy. 3. Posiadały funkcjonalności pozwalające oddzielać pytania badającego od odpowiedzi. Mocne strony: możliwość wprowadzania tekstów w różnych formatach. Słabe strony: mało czytelny interfejs. Bez wcześniejszego przeszkolenia, trudno byłoby mi samodzielnie odkryć wszystkie funkcje programu. Kompatybilność poszczególnych narzędzi i dostęp z przeglądarki to największe atuty (pragmatycznie). Środowisko pracy również ułatwia sprawę. Jest darmowy, stabilny i sprawia wrażenie funkcjonalnego. Brakuje tylko elementów, o których pisałem wcześniej. Irytuje nieco pojawiająca się często odpowiedź, że żeby zrobić "a", należy napisać maila do administracji. Rozumiem, że to wczesna faza projektu, ale to wciąż uciążliwe. Jak najbardziej będzie przydatne - bardzo ucieszyło mnie, że powstało dobre, polskie narzędzie do gromadzenia i przetwarzania korpusów tekstu. Na pewno będę z niego korzystać, by stworzyć chociażby korpus tekstów dawnych na własne potrzeby. Pracowałam do tej pory na korpusach, ale wszystko liczyłam ręcznie, więc sądzę, że narzędzie komputerowe usprawniłoby mi pracę w przyszłości. Mocne strony: praktyczne i łatwe w zastosowaniu funkcje narzędzia (listy frekwencyjne, konkordancje), CorpoGrabber, podpowiadacz wyboru licencji. Słabe strony: rozbudowana funkcjonalność trudna do ogarnięcia dla początkującego użytkownika największym plusem jest moim zdaniem możliwość samodzielnego utworzenia korpusu z plików tekstowych, największym minusem - to, że jego użycie jest dość skomplikowane (trzeba pracować z dspace i Inforexem, umieć poruszać się po obu portalach i logować się do obu) Tak, ponieważ można byłoby badać ogromny korpus pod kątem statystyki, (co jest moim wyzawniem), zamiast podawać wyłacznie przykłady. Chodzi tutaj głównie o narzędzia wspomagające zgromadzenie danych tekstowych z reklam telewizyjnych radiowych [dżwięk- >tekst], ale również prasa czy internet [obraz->tekst].
7 Wnioski: Użytkownicy uznali narzędzia za bardzo przydatne, co podkreślali w ankietach. Techniki korpusowe wykorzystywane są obecnie w wielu dziedzinach z zakresu nauk społecznych czy humanistycznych, a osoby uczestniczące w warsztatach wskazywały na wcześniejsze braki dotyczące polskich narzędzi do gromadzenia i przetwarzania korpusów. Ta luka w odczuciu użytkowników została wypełniona przez narzędzia CLARIN- PL. Przedstawione narzędzia na wszystkich warsztatach zebrały bardzo dobre opinie. Docelowi użytkownicy zwracali uwagę na dużą przydatność zarówno repozytorium, jak i systemu do anotowania korpusów i zarządzania nimi. Co ważne, autorzy narzędzi otrzymali informację zwrotną na temat dalszych kierunków rozwoju systemu. Do najważniejszych uwag należały te dotyczące obsługi poufnych zbiorów, nieuwzględnianych formatów oraz dodatkowych funkcjonalności, do których miałby bezpośredni dostęp użytkownik, takich jak np. dodawanie własnych zestawów anotacji. Uwagi te wprowadzono do planów rozwojowych systemu. Użytkownicy zwracali uwagę na takie mocne strony zaprezentowanych narzędzi, jak: możliwość samodzielnego tworzenia korpusów tekstowych przy wsparciu różnych formatów zapisu, kompatybilność poszczególnych narzędzi i dostęp z przeglądarki, praktyczne funkcje narzędzi. Ich rozbudowana funkcjonalność, jak wskazywali uczestnicy, wymaga odpowiedniego przygotowania, co w znacznym stopniu mogą zapewnić warsztaty i materiały szkoleniowe. Z drugiej jednak strony konieczne są prace nad uproszczeniem obsługi, w tym nad udoskonaleniem interfejsu.
8 Grafika: Strona główna repozytorium CLARIN- PL opartego na zmodyfikowanym systemie DSpace Narzędzia do automatycznej analizy odniesień w tekstach Prowadzący: dr inż. Michał Marcińczuk, mgr inż. Jan Kocoń W ramach CLARIN- PL powstają narzędzia automatycznie rozpoznające w tekstach nazwy własne i wyrażenia temporalne. Wykład poświęcony był prezentacji tych narzędzi oraz kwestiom ich wykorzystania w automatycznym znakowaniu korpusów. Program do rozpoznawania nazw własnych o nazwie Liner2, to obecnie jedno z najlepszych tego typu narzędzi dla języka polskiego. Prowadzący pokazali, w jaki sposób przeglądać i poprawiać automatyczną anotację, jak zapisywać wyniki analizy, jak tworzyć słowniki najczęstszych wystąpień nazw własnych i wyrażeń temporalne. Podczas warsztatów uczestnicy wykorzystali zdobytą wiedzę do samodzielnej analizy korpusu testowego przy pomocy rozbudowanego systemu Inforex, który został zintegrowany z repozytorium Centrum.
9 Opinie uczestników: Analizuję teksty pod względem gramatycznym i leksykalnym - narzędzie pomaga szybko wyszukać zadane zespoły wyrazowe/formy Możliwość anotacji zasobów mogłabym wykorzystać tworząc własny korpus - bazę danych, zawierającą akty mowy wyrażające grzeczność. Opis składniowy powyższych aktów jest integralną częścią mojej pracy. Zautomatyzowanie tego procesu byłoby jego dużą zaletą. Mocne strony: możliwość edycji danych, poprawy automatycznej anotacji. Słabe strony: brak możliwości wycofania zmian, bardzo nieintuicyjny interfejs. Plusy: wydaje się, że bardzo dobrze rozpoznaje określenia czasu i miejsca Minusy: ograniczona wielkość zasobów, na których pracuje Inforex (max. rozmiar pliku to ci. 2,5 MB). Nie wskazuje poprawnie wszystkich anotacji Powinna być możliwość pracy na tekstach dawnych oraz definiowania własnego sposobu anotacji (tagsetu). Liner2 nie wykrył, że sejm.gov.pl to strona internetowa. Wystarczy wyszukać wyrazów zawierające kropki, ew. skompilować listę popularnych rozszerzeń Liner2 nie wykrył, że to data Słaba strona: mało przyjazny interface (surowy) mocne: filtry anotacji dobre przy wyszukiwaniu odpowiednich wartości frekwencyjnych, słabe: bez odpowiedniej wiedzy niezrozumiały język Wccl Match, modele analizy danych tekstowych Słabą stroną jest ograniczony zakres możliwości, jeśli chodzi o kategorie, które narzędzie potrafi wyszukiwać. Ponadto dość często się myli. Jednak sam pomysł jest dobry i jeśli zminimalizować odsetek błędu, narzędzie może być bardzo przydatne. Wnioski: Krytyczna analiza wyników działania narzędzia do rozpoznawania odniesień w tekstach przez uczestników warsztatów wskazuje na zainteresowanie tego typu narzędziami i ich potencjalne zastosowanie we własnych badaniach. Głównym zarzutem, zgłoszonym przez kilku uczestników warsztatów, jest złożoność i nieintuicyjność interfejsu użytkownika. Wynika to z faktu, że do tej pory nacisk był głównie kładziony na warstwę działania narzędzia (skuteczność rozpoznawania odniesień), a nie na warstwę prezentacji (interfejs użytkownika). W dotychczasowych pracach system był wykorzystywany przez użytkowników doświadczonych, którzy przepracowali dziesiątki godzin w systemie Inforex. Uczestnicy warsztatów pozytywnie ocenili możliwość ręcznej korekty
10 wyników automatycznego rozpoznawania odniesień. Jednocześnie wskazali na brak funkcji eksportu całego korpusu tekstów po wykonaniu takiej korekty. Grafika: Strona demonstracyjna narzędzia Liner2 do rozpoznawania odniesień
11 Moduł systemu Inforex do ręcznej weryfikacji automatycznie rozpoznanych odniesień Zaawansowane narzędzie do analizy korpusu w oparciu o reguły Prowadzący: dr inż. Michał Marcińczuk Język WCCL Match służy do formalnego opisu konstrukcji językowych i pozwala samodzielnie tworzyć reguły znakowania korpusów. Podczas wykładu zostały zaprezentowane dwa zastosowania języka WCCL Match: środowisko do pisania i testowania reguł na oznaczonym korpusie (moduł Wccl Match Tester w systemie Inforex) oraz widok do wyszukiwania określonych fragmentów tekstu w korpusie zaimportowanym z DSpace (moduł Wccl Match w systemie Inforex). W ramach warsztatów uczestnicy mieli możliwość napisać proste reguły znakowania, a następnie wypróbować je na korpusie testowym. Opinie uczestników: (brak w ankietach) Wnioski: Język WCCL Match posiada dużą siłę ekspresji, która wiążę się z wysokim stopniem złożoności reguł. Podczas warsztatów okazało się, że poziom złożoności formalizmu okazał się trudny do pokonania dla wielu uczestników ze względu na ograniczenia czasowe oraz duże audytorium. Pojedyncze osoby wykazały zainteresowanie potencjalnym użyciem narzędzia, ale jednocześnie
12 wskazały brakujące funkcje, które byłyby im niezbędne do praktycznego wykorzystania go we własnych badaniach (np. możliwość eksportu znalezionych fragmentów z systemu Inforex). Grafika: Strona Wccl Match w systemie Inforex
13 Strona Wccl Match Tester w systemie Inforex Korpusy mowy i narzędzia do ich przetwarzania Prowadzący: dr hab. Krzysztof Marasek i mgr inż. Danijel Korzinek W ramach CLARIN- PL opracowano szereg narzędzi wspomagających prace z nagraniami mowy polskiej. Obejmują one możliwość transkrypcji fonetycznej tekstu, detekcji mowy w sygnale audio, wyszukiwania specyficznych zjawisk akustycznych (np. muzyki) oraz podziału nagranych wypowiedzi na wypowiedziane przez poszczególnych mówców. Istnieje także możliwość czasowego dopasowania transkrypcji do nagrania, co umożliwia dokładną analizę fonetyczną. W ramach warsztatów uczestnicy zapoznali się z opracowanymi narzędziami i sposobami ich użycia. Opinie uczestników: Być w może w przyszłości można by zaimplementować funckję transkrypcji tekstu czytanego z rozróżnieniem sposobu wymowy różnych głosek (póki co audio jest transkrybowane na standardowy polski alfabet). Zaletą jest duża prostota interfejsu. mocne strony: dopasowywanie transkrypcji do nagrania, funkcja transliteracji nagrani; fakt, że narzędzie jest bezpłatne; słabe strony: na razie wciąż zdarzają się błędy w transliteracji (choć jest ich mniej, niż się spodziewałam)
14 Słabe strony to z pewnością ograniczone możliwości pozyskiwania materiałów (chodzi o konieczność uzyskania zgody na nagrania i tym samym wprowadzenie do konwersacji elementu kontroli, oddalenie działań spontanicznych), mocnych jest wiele, choćby możliwość śledzenia stylu wypowiedzi ustnych, tempa, leksyki, parajęzyka Wnioski: Pokazywane narzędzia nie są zbyt powszechne i nie były znane większości uczestników. Początkowo się nie spodziewano zbyt wielkiego odzewu, ale już na pierwszych warsztatach kilka osób wykazało potencjalne zainteresowanie prezentowanymi rozwiązaniami. Wiele osób posiada dźwiękowe zbiory danych, których obróbka wymaga dużego nakładu pracy i rozwiązania automatyczne lub półautomatyczne są bardzo mile widziane, ponieważ mogą przyspieszyć oraz znacznie ułatwić prowadzone na nich badania. Na warsztatach zauważono pewne trudności z korzystaniem z interfejsu, ale to raczej dlatego, że praca z dźwiękiem jest nową dziedziną dla wielu osób i dostępne narzędzia mogą być nieintuicyjne dla osób spotykających się z nimi pierwszy raz. Dzięki warsztatom lepiej poznaliśmy umiejętności i sposób pracy przyszłych użytkowników i wdrożyliśmy różne udogodnienia. Najważniejszym efektem było jednak nawiązanie bezpośredniego kontaktu z osobami posiadającymi konkretne potrzeby, które można rozwiązać wykorzystując narzędzia opracowane w ramach CLARIN- PL. Dzięki informacjom zebranym od uczestników warsztatów niektóre narzędzia zostaną specjalnie dostosowane do konkretnych wymagań, co zaowocuje rozwiązaniami dla konkretnych, realnych potrzeb użytkowników.
15 Grafika: Wygląd witryny do obsługi narzędzi: Integracja usługi w programie Praat:
16 2.1.5 ChronoPress (Chronologiczny Korpus Polskich Teksów Prasowych) i jego wykorzystanie w badaniach Prowadzący: prof. dr hab. Adam Pawłowski Przedmiotem wykładu było podejście sekwencyjne w analizie danych tekstowych. Słuchaczom przedstawiono pojęcia teoretyczne: analiza sekwencyjna, szereg czasowy i jego składowe (trend, oscylacje periodyczne i losowe) oraz niektóre parametry opisowe (średnia, autokorelacja, korelacja wzajemna). W części praktycznej krótko najpierw omówiono publicznie dostępne narzędzia analizy trendów leksykalnych (m.in. Google Trends), następnie szczegółowo zaprezentowano Chronologiczny Korpus Polskich Tekstów Prasowych ChronoPress. Słuchacze mogli zapoznać się z różnymi możliwościami wykorzystania korpusu ChronoPress oraz zaproponować własne scenariusze zastosowań. Korpus ChronoPress jest unikalnym zasobem lingwistycznym, pełniącym trzy funkcje: źródła danych dla badań stricte językoznawczych; zasobu wiedzy dla badań z zakresu humanistyki i nauk społecznych z ekonomią; zabezpieczenia i udostępnienia zasobów nieobecnych w powszechnym obiegu. Co do funkcji pierwszej korpus zawiera próbki języka z okresu w liczbie ok na rok. Długość próby wynosi ok. 300 wyrazów tekstowych tworzących w miarę możliwości zamknięty fragment tematyczny. Próbki są dokładnie oznaczone pod względem chronologicznym, podana jest informacja o źródle (tytuł periodyku), dane autora spisane z autopsji (często spotyka się inicjały lub brak danych). W badaniach językoznawczych korpus jest istotny jako źródło wiedzy o zmianach językowych na poziomie leksyki, morfologii i składni. Dzięki zaimplementownym narzędziom (m.in. program do tworzenia konkordancji) i oznaczeniom chronologicznym można porównywać i wizualizować profile leksemów, badać rozkład i ewolucję form gramatycznych (typowe pytanie: czy obserwujemy odchodzenie od form syntetycznych stopnia wyższego przymiotników typu skuteczny do form analitycznych typu bardziej skuteczny). Funkcja narzędzia heurystycznego i eksploracyjnego jest główną wartością korpusu i odróżnia go od innych zasobów polskojęzycznych. Analizy chronologiczne leksemów są bowiem tak naprawdę analizami świata przedstawionego. Ukazują istnienie, ewolucję i dynamikę zjawisk z zakresu polityki, gospodarki i kultury. Zjawiska rozpoznawane mają swoją dynamikę, która ukazywana jest dzięki zmieniającym się frekwencjom leksemów. Przedstawiono trzy kategorie takich zjawisk: podlegające stabilnej i długotrwałej łagodnej ewolucji (efekt powolnych procesów społecznych), katastroficzne (gwałtowna zmiana częstości leksemu wywołana zdarzeniem jednorazowym o dużym wpływie na społeczeństwo), oscylacje cykliczne (zjawiska osadzone w rytmach natury, na przykład prace rolnicze, oraz kultury na przykład ceremonie związane z rocznicami, świętami itd.). Funkcja archiwizacyjna ma związek z małą dostępnością publikacji prasowych z tamtego okresu. Jedynie część z nich znalazła się w zasobach bibliotek cyfrowych, na przykład Przekrój lub Tygodnik Powszechny, natomiast większość prasy, szczególnie tej bardzo reżimowej, pozostaje w postaci papierowej lub zmikrofilmowanej i nie ma na razie perspektyw zmiany tego stanu rzeczy).
17 Opinie uczestników: (brak w ankietach) Wnioski: Recepcja problematyki badań sekwencyjnych tekstów była bardzo dobra. Dla młodego pokolenia okres PRL, szczególnie jego pierwszej fazy, jest niemal prehistorią. Niemal, ponieważ okres ten stale oddziałuje na współczesność, od które oddzielają go trzy pokolenia i wciąż jeszcze żywa jest pamięć bliskich pokoleń. Badania tego okresu mają więc sens nie tylko dlatego, że odnoszą się do pewnego zamkniętego okresu historycznego, ale także dlatego, że jest na nie społeczne zapotrzebowanie. Badania takie należy jednak prowadzić (lub umożliwiać ich prowadzenie) w środowisku cyfrowym, do jakiego nowe pokolenia są przyzwyczajone i jakie dobrze rozumieją. Korpus ChronoPress spełnia te warunki: jest innowacyjny w senie koncepcji, metod i narzędzi, jest wartościowy ze względu na zasoby. Najpilniejszym zadaniem jest teraz pozyskanie danych z lat , dzięki którym serwis stanie się faktycznie zwierciadłem prasy PRL (planowane na fazę Clarin 2). Równolegle prowadzone są prace nad rozwijaniem serwisu i wzbogacaniem go o nowe funkcjonalności oraz dane edukacyjne.
18 Grafika: Fot.1 Stan niektóry materiałów przenoszonych (we fragmentach) do pełnej postaci cyfrowej.
19 Fot.2 Przykład szeregu czasowego w obecnej wersji portalu ChronoPress (leksem praca, normalne oscylacje i trend są zaburzone nierównym wypełnieniem kolejnych roczników próbkami).
20 Fot.3 Przykład szeregu czasowego w obecnej wersji portalu ChronoPress (leksem Polska, normalne oscylacje są zaburzone nierównym wypełnieniem kolejnych roczników próbkami) 2.2 Narzędzia słownikowe Słowosieć leksykalna sieć semantyczna języka polskiego i jej zastosowanie w analizie znaczeń Prowadzący: dr Marek Maziarz, mgr inż. Paweł Kędzia, dr inż. Maciej Piasecki Słowosieć 3.0 to leksykalna sieć semantyczna języka polskiego i największy jak dotąd tego typu słownik (wordnet) na świecie, mający liczne i rozmaite zastosowania. Słuchacze zapoznali się ze sposobem opisu znaczeń leksykalnych w Słowosieci. Zaprezentowany został system WordnetLoom, który służy do przeglądania i edycji Słowosieci, oraz narzędzia działające w oparciu o Słowosieć, umożliwiające wyznaczanie miar podobieństwa znaczeniowego i automatyczne ujednoznacznianie znaczeń słów występujących w tekście. Uczestnicy warsztatów zainstalowali aplikację WordnetLoom i za jej pomocą przeglądali Słowosieć. Na korpusie testowym zastosowali narzędzia ujednoznaczniające, przeprowadzili analizę statystyczną rozpoznanych znaczeń i stworzyli ich słownik frekwencyjny. W uzupełnieniu zaprezentowany został system WoSeDon do ujednoznaczniania znaczeń leksykalnych w tekście poprzez rzutowanie wyrazów z tekstu na elementy Słowosieci (tzw.
21 jednostki leksykalne). WoSeDon pozwala na analizę częstości występowania poszczególnych znaczeń w korpusie tekstów. Narzędzie do ujednoznaczniania jest też dostępne jako usługa sieciowa. Opinie uczestników: Mam nadzieję, że będzie przydatne do określania podobieństwa wyrazów. Chciałbym także w oparciu o Słowosieć zbudować słownik walidujący jakość wektorów zbudowanych przez words2vec (Paryż - Francja + Włochy =?) Jestem pod wrażeniem profesjonalności i metodyczności z jaką jest tworzona Polska Słowosieć. zajmuję się też trochę analizą wydźwięku i ucieszyła mnie wiadomość o anotacji Słowosieci nazwami emocji Będę korzystała ze słowosieci przy ustalaniu ram semantycznych dla czasowników Powinna być obsługa siatki synsetów historycznych. To szybki sposób wyszukania wyrażeń powiązanych rozmaitymi relacjami semantycznymi. Idealnie byłoby, gdyby Słowosieć mogła być nakładką do edytora tekstu lub przeglądarki internetowej i pozwalałaby w czasie rzeczywistym rozpoznawać znaczenia słów. Ale zdaję sobie sprawę, że to jest trudne technicznie do zrobienia Ponieważ interesuje mnie słowotwórstwo gniazdowe, uwzględniłabym w Słowosieci opis gniazdowy zaproponowany w Słowniku gniazd słowotwórczych. Ponadto włączyłabym leksykę branżową (jak chociażby wykaz leków stosowanych w Polsce jednostek) i zróżnicowaną chronologicznie, ale w ujęciu synchronicznym. Mocna strona: bogaty zasób, cenne dane. Słaba strona: mało intuicyjny interfejs. Konstrukcja na zasadzie sieci powiązań to naprawdę niesamowite ułatwienie. mocne: testy podstawieniowe dla relacji semantycznych, możliwość wydobywania słów kluczowych, terminologii, słabe: przewaga reprezentacji relacji hiponimii Trudno mówić o stronach słabych. Mogą z niej korzystać i uczniowie szukający relacji semantycznych dla potrzeb tworzenia teksów (możliwość łatwego przemieszczania się między jednostkami wyraźnie stawia Słowosieć ponad jakimikolwiek słownikami), i tłumacze, i studenci, i naukowcy Słowosieć jest świetnym narzędziem, które mogę wykorzystywać nie tyle w samych badaniach, co w praktyce pedagogicznej. Wykorzystanie jej zasobów uatrakcyjnia naukę języka, skłania uczniów do samodzielnego poszukiwania znaczeń słów.
22 Nieco zniechęcająca do korzystania z programu jest jego oprawa graficzna. Zdaję sobie sprawę z tego, że są pilniejsze potrzeby w pracy nad Słowosiecią, jednak obecnie wszyscy użytkownicy sieci przyzwyczajeni są do atrakcyjnych, intuicyjnych interfejsów. Toporna grafika natomiast daje wrażenie, jakby program nie był jeszcze gotowy do użycia lub był mocno przestarzały. Wnioski: Słowosieć - w opinii uczestników warsztatów - jest bardzo przydatnym zasobem. Do pozytywnych stron osoby wypełniające ankietę zaliczają: wielkość słownika, spójną metodologię tworzenia sieci, opis szczegółowymi relacjami znaczeń wyrazów, informacje o nastawieniu emocjonalnym wyrazów (ang. sentiment). W wielu wypowiedziach pojawia się myśl, że opis za pomocą relacji jest inspirujący, uatrakcyjnia naukę języka, ułatwia korzystanie ze słownika, co jest dla nas szczególnie cenne, bo przecież Słowosieć właśnie tym jest - siecią relacji pomiędzy znaczeniami. Do minusów Słowosieci - w opinii uczestników warsztatów - zaliczyć można: przewagę relacji hiponimii ponad innymi relacjami, brak słownictwa branżowego, brak opisu za pomocą gniazd słowotwórczych. Słowosieć zawiera już wiele innych relacji niż hiperonimia w tym dużo relacji słowotwórczych, ale powyższe uwagi te są cenną inspiracją do dalszego rozwoju Słowosieci, np. w zakresie większej gęstości powiązań relacyjnych. Dwie osoby negatywnie oceniają interfejs graficzny Słowosieci. To z pewnością jest jedna z rzeczy, które warto by zmienić, jednak wspomnieć należy, że jest to obecnie najbardziej zaawansowany obecnie edytor wordnetu na świecie oparty na unikatowym pomyśle na wizualizację skomplikowanej sieci relacji. O potencjalnej przydatności Słowosieci świadczy duża liczba różnych propozycji rozbudowania naszego słownika o nowe funkcjonalności lub stworzenia aplikacji uzupełniających Słowosieć. Są to: wyliczanie podobieństwa znaczeniowego wyrazów na podstawie bliskości w sieci; stworzenie nakładki na edytor tekstów lub przeglądarkę internetową, dzięki której można by na bieżąco śledzić znaczenia wyrazów w tekście (co wymagałoby użycia mechanizmu ujednoznaczniania znaczeń); rozbudowanie Słowosieci w stronę słownictwa historycznego. Niestety, wszystkie te pomysły znacząco wykraczają poza nasze plany z wniosku grantowego.
23 Grafika: Ekran wizualnego przeglądania struktury Słowosieci w ramach aplikacji WordnetLoom; umożliwia zarówno dowolne rozwijanie gałęzi grafu (poprzed trójkątne przyciski) jak i edycję struktury grafu.
24 Analiza statystyczna znaczeń leksykalnych wykrytych w tekście w ramach systemu WoSeDon. Znaczenia są reprezentowane jako elementy struktury Słowosieci i są opisane definicjami generowanymi automatycznie na podstawie komentarzy w Słowosieci (gloss) oraz relacji leksykalno- semantycznych.
25 Analiza szeregu czasowego wystąpień jednego ze znaczeń słowa kryzys, dokładnie kryzys 1 (w sensie ekonomicznych) w ramach korpusu tekstów sejmowych. Analiza została zaprezentowana przy użyciu eksperymentalnego narzędzia opartego na technologii opracowanej dla korpusu ChronoPress Dwujęzyczna Słowosieć - możliwości wykorzystania w pracy tłumacza Prowadzący: dr Ewa Rudnicka Znaczenia leksykalne w Słowosieci zostały połączone z odpowiadającymi im znaczeniami w sieci języka angielskiego - Princeton Wordnet. Powstała w ten sposób wielka dwujęzyczna sieć leksykalno- semantyczna, która jest największym publicznie dostępnym słownikiem polsko- angielskim. W ramach wykładu omówione zostały różnice w sposobie opisu między obiema sieciami oraz przedstawiono system relacji międzyjęzykowych, wspierających pracę tłumacza. Podczas warsztatów uczestnicy zajęli się analizą konkretnych problemów tłumaczeniowych i spróbowali rozwiązać je przy użyciu relacji międzyjęzykowych. Opinie uczestników: tak, przedstawienie w dydaktyce translacji modelu poszukiwania precyzyjnych ekwiwalentów tłumaczeniowych, określenie relacji semantycznych między konceptami bazowymi w danej dziedzinowe
26 Przydatne, zwłaszcza w przeprowadzania porównań przekładów. Użyteczne w dydaktyce. Przydałyby się zasoby leksykalne innych języków. tłumaczenie na angielski czasami jest dziwne - pracowałam na mapowanej Słowosieci i natrafiałam na takie przykłądy, jak przetłumaczony z angielskiego "khaki" na polski "sraczkowaty" ;) mocne: wielkość, program do przeglądania słabe: jak wpsomniałam, niektóre fragmenty mapowania na angielski mogłyby być lepiej zrobione Wnioski: Ogólne wrażenia użytkowników był pozytywne. Podkreślali oni wielkość i wyjątkową strukturę prezentowanego zasobu, jego przydatność w dydaktyce i pracy tłumacza. Użytkownicy zapoznali się z systemem relacji międzyjęzykowych łączącym synsety Słowosieci z ich odpowiednikami w WordNecie Princetońskim i jego zapisem w aplikacji WordnetLoom. Nie mieli (z małymi wyjątkami) problemów z obsługą interfejsu. Poznali możliwości praktycznego wykorzystania dwujęzycznego zasobu w pracy tłumacza, rozwiązując konkretne problemy tłumaczeniowe. Warsztaty pokazały, jak potrzebne jest uzupełnienie istniejącego rzutowania o brakującą, niezrzutowaną część WordNetu Princetońskiego. Do tej pory, zgodnie z przyjętym we wniosku planem pracy, koncentrowaliśmy się na pełnym rzutowaniu polskich drzew hiponimicznych. W części angielskiej nadal jest sporo niezrzutowanych rzeczowników (ok. 44 tys.). Ze względu na użytkowników (m.in. tłumaczy) takie uzupełnienie byłoby bardzo przydatne. W dalszej perspektywie bardzo cenna byłaby także możliwość stworzenia dodatkowej, precyzyjniejszej sieci powiązań międzyjęzykowych na poziomie jednostek leksykalnych o mocy odpowiedników tłumaczeniowych. W ten sposób powstałby nieocenionym dwujęzyczny zasób leksykalny dla tłumaczy.
27 Grafika: Widok fragmentu struktury dwujęzycznych powiązań pomiędzy Słowosiecią i Princeton WordNet w ramach aplikacji WordnetLoom Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny połączeń wyrazowych Prowadzący: dr inż. Maciej Piasecki, dr Marek Maziarz, mgr inż. Michał Wendelberger, W ramach CLARIN- PL opracowane zostało narzędzie, które rozpoznaje w tekstach kolokacje potencjalne wielowyrazowe jednostki leksykalne (zestawienia, terminy i związki frazeologiczne). Umożliwia ono (pół)automatyczne tworzenie (na podstawie dostarczonych korpusów tekstu) słowników takich jednostek, opisanych pod względem leksykalno- składniowym i semantycznym. Uczestnicy warsztatów nauczyli się wydobywać z korpusu testowego kolokacje i za pomocą dostępnego systemu stworzyli własny słownik połączeń wyrazowych. System wspomaga zarządzanie zespołem lingwistycznym oraz podejmowanie decyzji odnośnie leksykalności
28 poszczególnych kolokacji w oparciu o unikatową metodę drzewa decyzjnego opartego na zbiorze oczekiwanych własności wielowyrazowych jednostek leksykalnych. Opinie uczestników: Może być przydatne w badaniach porównawczych z językiem polskim, ale planuję spróbować wykorzystać je dla innego języka. Bardzo przydatne, może znacznie ułatwić tłumaczenie i pomóc tłumaczowi we wzbogaceniu tekstu, a w przypadku tłumaczeń specjalistycznych - przyspieszyć proces tłumaczenia i zapobiec pomyłkom tak, bardzo przydatne, możliwość wyszukiwania wielowyrazowych jednostek leksykalnych, inspiracja do wykorzystania w korpusie dziedzinowym bardzo chciałabym, żeby ośrodkiem kolokacji mogły być 2 lub więcej wyrazów - badam przyimki złożone i interesują mnie najczęstsze połączenia z nimi. Kiedy wpisałam np. przyimek "na rzecz" do programu, nie uzyskałam satysfakcjonujących mnie wyników. Może dałoby się dodać jednostki uznawane za wielowyrazowe w innych elektronicznych zasobach bądź w słownikach? mocne: klasyfikacja wielowyrazowych jednostek leksykalnych, bardzo dobra funkcjonalność narzędzia mocne - wielość testów statystycznych! Nareszcie można korzystać z przeróżnych współczynników, na to czekałam. słabe strony - tak jak pisałam, niemożność wyboru dwuwyrazowego ośrodka kolokacji Świetne narzędzie do wyszukiwania potencjalnej frazeologii. 1) Format, w jakim zapisane są formy kolokacji w CSV powinien być w JSON-ie - wtedy byłoby to znacznie łatwiejsze do przetworzenia. 2) z MeWeXa nie dało się przejść do Wordneta, bo skrypt nie został uznany za bezpieczny (z HTTPS szedł w HTTP) 3) po imporcie korpusu do MeWeXa powinien być on domyślnie wybrany - jeśli go zaimportowałem, to w domyślę chcę na nim pracować. 4) raz paczka w MeWeXie ma jakiś numer hex-em*, a potem nagle ma numer "49" (w moim przypadku). Dlaczego nie np. "72"? 5) Wybieranie korpusu przez klik w dziwny link (znowu zapisany hex-em...) - jakie to jest nieczytelne... Skąd mogę wiedzieć na jakim korpusie aktualnie pracuję? Jedynie przez spojrzenie w pasek adresu i porównaniu go z każdym z identyfikatorów korpusów... * w ogóle te numery hex-em są tak nieczytelne... Ja rozumiem, że to są jakieś identyfikatory, ale użytkownik łatwiej przyswaja numer dziesiętny niż taki kilkudziesięcioznakowy kod w systemie szesnastkowym Wnioski: Uczestnicy warsztatów byli bardzo zainteresowani możliwościami, które daje nasza aplikacja webowa: tworzenia list kolokacji (przydatnych np. w warsztacie tłumacza, w badaniach korpusów
29 dziedzinowych), wyszukiwania potencjalnych jednostek leksykalnych (na potrzeby frazeologii), możliwość dopasowania miar statystycznych do potrzeb użytkownika, dobra funkcjonalność narzędzia. Zainteresowanie wzbudziła też nasza metoda oceny leksykalności połączeń wyrazowych. Do minusów aplikacji zaliczyć można niemożność wyszukiwania kolokacji na bazie dwuwyrazowych połączeń (badaczka przyimków złożonych). Bardzo ważna jest uwaga jednego z uczestników dotycząca nieczytelnej identyfikacji plików ze słownikami kolokacji. Grafika: Ekran do przeglądania zadań wydobywania kolokacji z korpusów tekstów (w przypadku dużych korpusów realizacja zadania może zająć kilka godzin). Funkcja eksportowania wydobytych kolokacji do pliku.
30 Przeglądanie wydobytych kolokacji wraz z informacją o częstości ich występowania Korpusy referencyjne i równoległe w warsztacie tłumacza Prowadzący: dr Piotr Pęzik Korpusy równoległe i referencyjne stanowią ważny element warsztatu tłumacza, a ich nieustanny rozwój stwarza coraz lepsze możliwości zastosowań. W ramach wykładu przedstawione zostały: nowe narzędzia do przeszukiwania Narodowego Korpusu Języka Polskiego oraz powstały w ramach CLARIN- PL polsko- angielski korpus równoległy Paralela. Podczas warsztatów uczestnicy zapoznali się z działaniem wyszukiwarki SlopeQ dla NKJP oraz dowiedzieli się, jak stosować korpusy NKJP i Paralela do weryfikacji ekwiwalencji frazeologicznej. Zaprezentowano również opracowany w projekcie CLARIN klasyfikator tematyczny tekstów polskich i angielskich WiKNN jako narzędzie do eksploracji korpusów referencyjnych. Opinie uczestników: Może być przydatne w dydaktyce przekładu i w badaniach opisowych nad przekładem. Może służyć jako jedno z najważniejszych narzędzi, zapewnić dostęp do wiarygodnego źródła, którego przeszukiwanie jest szybkie i wygodne bardzo przydatne w badaniach tekstów tłumaczeń pod kątem interferencji języka oryginału oraz w dydaktyce tłumaczenia
31 Występują problemy z wyrównaniem segmentów dwujęzycznych. Mocna strona: oprawa graficzna i łatwość obsługi, czytelność, interface przyjazny dla użytkownika nieobeznanego z tego typu narzędziami. Może z niego skorzystać każdy mocne: możliwość sprawdzania poprawności leksykalno-frazeologicznej tłumaczeń, słabe: dla początkującego użytkownika potrzeba więcej podstawowych instrukcji obsługi poszczególnych funkcji Mocną stroną jest możliwość weryfikacji poprawności tłumaczeń. Wnioski: Uczestnicy warsztatów pozytywnie ocenili przydatność prezentowanych narzędzi i zasobów w praktyce i dydaktyce tłumaczenia. W większości komentarzy podkreślono łatwość użycia narzędzia Paralela, choć znalazły się także uwagi o potrzebie opracowania podręcznika użytkownika, który zostanie przygotowany w ostatniej fazie projektu. Szczególną uwagę uczestników zajmujących się systematyzacją zbiorów tekstów wzbudził dostępny w ramach usługi sieciowej klasyfikator tematyczny WiKNN ( pl.eu/tools/classifier/). Grafika: Wyszukiwanie w korpusach polsko- angielskich za pomocą systemu Paralela
32 2.3 Narzędzia do badań nad tekstem Morfeusz 2 analizator i generator fleksyjny dla języka polskiego. Tworzenie słowników dziedzinowych dla analizatora Morfeusz 2 Prowadzący: dr Marcin Woliński i dr Anna Andrzejczuk Analiza fleksyjna (morfologiczna) w przypadku języka o bogatej odmianie jest ważnym etapem wstępnego przetwarzania tekstu, niezbędnym większości technik inżynierii lingwistycznej. Trudno sobie wyobrazić przeszukiwanie korpusu języka polskiego bez wcześniejszej analizy fleksyjnej tekstów. Na wykładzie przedstawiony został Morfeusz 2 opracowany w ramach CLARIN- PL analizator i generator fleksyjny dla języka polskiego. Zaprezentowana została także dostępna infrastruktura do tworzenia słowników dziedzinowych. W ramach warsztatów uczestnicy zapoznali się z narzędziem Kuźnia, wspomagającym zespołowe tworzenie słowników fleksyjnych, i przy jego pomocy samodzielnie stworzyli własny słownik. Opinie uczestników: Jeśli tylko można użyć narzędzia do inneg języka, to na pewno będzie dla mnie bardzo przydatne, ponieważ często zdarza mi się tworzyć słowniki dziedzinowe w dość "partyzanckich" warunkach. Tworzenie słowników dziedzinowych na razie mi się nie przyda, chociaż nie wykluczam jego użycia w przyszłości. Sam Morfeusz wydaje mi się jednak bardzo przydatny, ponieważ w moich badaniach często muszę wykonywać analizę morfologiczną. dodawanie wielu lemmatów jednocześnie byłoby przydatne, wraz z opisywaniem ich grupami. Można wykorzystać do budowy słowników innych odmian j.p. lub innych języków. Słaba strona: nie tak jasna i czytelna obsługa mocne: ujednoznacznianie fleksyjne leksemów, klarowna "matryca" kategoryzacji jednostek językowych, słabe: dla początkującego użytkownika z powodu braku wiedzy dziedzinowej (morfologia j. polskiego) trudność w uchwyceniu całościowej funkcjonalności narzędzia Niezbyt intuicyjny interfejs. Trudne przełączanie się między słownikami (powinna być jasno zdefiniowana pozycja w menu). Poza tym świetne narzędzie. W Kuźni formy i cechy morfologiczne poszczególnych części mowy są niezbyt intuicyjnie wyróżnione, co na początku może sprawiać problem; nie jestem pewna, czy niedzielenie leksemów na węższe znaczenia to dobry pomysł - być może przekonałabym się do niego przy korzystaniu z narzędzia. Po warsztatach niejasny jest dla mnie podział poszczególnych słowników, np. to, kto widzi utworzony przeze mnie słownik, a kto go nie widzi.
33 Ujednolica pracę poszczególnych badaczy i daje możliwość kompilowanie różnych słowników. Wnioski: Słownik i analizator morfologiczny to narzędzia podstawowe dla wszelkich zastosowań. Użytkownicy końcowi rzadko stają przed potrzebą wprowadzania zmian w słowniku. Stąd też reakcja użytkowników jest bardziej stonowana niż w przypadku innych aplikacji i narzędzi. Warto jednak zauważyć, że wielu użytkowników dostrzega zalety możliwości konstrukcji własnych rozszerzeń słownika. W wielu zastosowaniach możliwość dodania specyficznych słów do słownika będzie bardzo cenna. Podkreślana przez użytkowników niejasność interfejsu jest dość typowa dla programów badawczych, które są rozwijane w oderwaniu od użytkowników spoza zespołu wytwarzającego dany program. W ramach dalszego rozwoju CLARIN- PL planujemy uwzględnienie uwag użytkowników i poprawę użyteczności wielu aplikacji i systemów. Grafika: Analizator morfologiczny Morfeusz w wersji samodzielnej aplikacji
34 2.3.2 Słownik walencyjny języka polskiego Prowadząca: dr hab. Elżbieta Hajnicz Wykład poświęcony był elektronicznemu słownikowi walencyjnemu Walenty, który opisuje tysiące polskich leksemów (głównie czasowników) ze względu na wymagane przez nie elementy struktur składniowo- semantycznych. Omówione zostały zjawiska walencyjno- składniowe uwzględnione w Walentym, takie jak przypadek strukturalny, koordynacja, kontrola składniowa oraz sposób ich reprezentacji. Opinie uczestników: nie spotkałam się z innym słownikiem walencyjnym i wydaje mi się to bardzo ciekawe. Słownik będzie podstawą do badań nad ramami semantycznymi czasownika. tak, do badań nad łączliwością, potencjalnie można wyszukiwać przykłady do analizy kontrastywnej łączliwości w j. polskim i innym języku słowiańskim Nie do końca jasna obsługa mocne: możliwość pozyskiwania danych frekwencyjnych oraz ekscerpcji frazeologizmów, słabe: dla początkującego użytkownika, nie będącego polonistą, a jedynie rodzimym użytkownikiem j. polskiego potrzeba więcej orientacji w temacie do całościowego uchwycenia funkcjonalności narzędzia mocna strona: jest opisana nie tylko walencja czasowników, ale też innych części mowy. Bardzo dobrze, że dodano rzeczowniki i przymiotniki. Jest prosty, intuicyjny dla językoznawcy, ale nie dla kogoś, kto nie przeszedł kursu gramatyki opisowej. Byłoby dużym ułatwieniem, gdyby stosowane skróty miały łatwe powiązanie (opcjonalnie oczywiście) z ich rozwinięciami, a nawet przykładami. wydaje mi się, że słabą stroną jest wąski zakres (mało leksemów) Wnioski: Opinie uczestników wskazują na duże zainteresowanie tematyką walencji i możliwość jej bezpośredniego zastosowania w różnych dziedzinach nauk humanistycznych. Jednak istotną barierę stanowi złożoność problematyki. Chociaż już na obecnym etapie prac włożono wiele wysiłku w celu ułatwienia posługiwania się słownikiem, jednak nacisk został położony na jego konstrukcję, a nie dostęp. Dostępne ułatwienia to m.in. wybór wartości poszczególnych kategorii z list, podsuwanie podpowiedzi, kontrola poprawności elementów wpisywanych ręcznie (np.
35 lematów argumentów zleksykalizowanych) itp. Jednak bez znajomości terminologii lingwistycznej słownik jest trudno czytelny (choć pomagają przykłady). Dlatego w dalszym rozwoju słownika, a zwłaszcza narzędzia do jego udostępniania, zostanie położony nacisk na bardziej intuicyjny zapis zależności walencyjnych, uproszczenie przykładów, parafrazy itd. Grafika: Fragment opisu lematu rozumieć na ekranie aplikacji do edycji słownika Walenty Parsowanie składniowe i jego zastosowania Prowadzący: dr Alina Wróblewska Parsowanie składniowe, czyli automatyczna analiza składniowa zdań, jest jednym z kluczowych elementów automatycznego przetwarzania języka naturalnego. Wykład był poświęcony parsowaniu zależnościowemu i składnikowemu, możliwościom i ograniczeniom obu tych metod oraz zastosowaniu parserów składniowych w aplikacjach NLP i w badaniu zjawisk składniowych w tekstach. Podczas warsztatów uczestnicy mogli przetestować roboczą wersję parsera składnikowego Świgra oraz parser zależnościowy dla języka polskiego dostępny w serwisie
Program warsztatów CLARIN-PL
W ramach Letniej Szkoły Humanistyki Cyfrowej odbędzie się III cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Narzędzia cyfrowe do analizy języka w naukach humanistycznych i społecznych 17-19
Bardziej szczegółowoCLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy
Cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy 13 15 kwietnia 2015 roku Warszawa, Pałac Staszica, ul. Nowy Świat 72, sala 144
Bardziej szczegółowoII cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych
II cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych 18-20 maja 2015 roku Politechnika Wrocławska, Centrum Kongresowe,
Bardziej szczegółowoCLARIN rozproszony system technologii językowych dla różnych języków europejskich
CLARIN rozproszony system technologii językowych dla różnych języków europejskich Maciej Piasecki Politechnika Wrocławska Instytut Informatyki G4.19 Research Group maciej.piasecki@pwr.wroc.pl Projekt CLARIN
Bardziej szczegółowoLingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot
Bardziej szczegółowoNarzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra
Bardziej szczegółowoZarządzanie i anotowanie korpusów tekstowych w systemie Inforex
Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
Bardziej szczegółowoKorpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Witold Kieraś Łukasz Kobyliński Maciej Ogrodniczuk Instytut Podstaw Informatyki PAN III Konferencja DARIAH-PL Poznań 9.11.2016
Bardziej szczegółowoNarzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
Bardziej szczegółowoMODUŁ KSZTAŁCENIA: Praktyczna nauka języka angielskiego: moduł 1
Uniwersytet Śląski w Katowicach str. 1 1. nazwa kierunku FILOLOGIA ANGIELSKA. poziom kształcenia drugi. profil kształcenia ogólnoakademicki 4. forma prowadzenia stacjonarne studiów MODUŁ KSZTAŁCENIA: Praktyczna
Bardziej szczegółowoPraca magisterska Jakub Reczycki. Opiekun : dr inż. Jacek Rumiński. Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska
System gromadzenia, indeksowania i opisu słownikowego norm i rekomendacji Praca magisterska Jakub Reczycki Opiekun : dr inż. Jacek Rumiński Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska
Bardziej szczegółowoOpen Access w technologii językowej dla języka polskiego
Open Access w technologii językowej dla języka polskiego Marek Maziarz, Maciej Piasecki Grupa Naukowa Technologii Językowych G4.19 Zakład Sztucznej Inteligencji, Instytut Informatyki, W-8, Politechnika
Bardziej szczegółowoNarzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
Bardziej szczegółowoREFERAT PRACY DYPLOMOWEJ Temat pracy: Projekt i realizacja serwisu ogłoszeń z inteligentną wyszukiwarką
REFERAT PRACY DYPLOMOWEJ Temat pracy: Projekt i realizacja serwisu ogłoszeń z inteligentną wyszukiwarką Autor: Paweł Konieczny Promotor: dr Jadwigi Bakonyi Kategorie: aplikacja www Słowa kluczowe: Serwis
Bardziej szczegółowoMorfeusz 2 analizator i generator fleksyjny dla języka polskiego
Morfeusz 2 analizator i generator fleksyjny dla języka polskiego Marcin Woliński i Anna Andrzejczuk Zespół Inżynierii Lingwistycznej Instytut Podstaw Informatyki Polskiej Akademii Nauk Warsztaty CLARIN-PL,
Bardziej szczegółowoArchitektury i protokoły dla budowania systemów wiedzy - zadania PCSS w projekcie SYNAT
Architektury i protokoły dla budowania systemów wiedzy - zadania PCSS w projekcie SYNAT A. Dudczak, C. Mazurek, T. Parkoła, J. Pukacki, M. Stroiński, M. Werla, J. Węglarz Poznańskie Centrum Superkomputerowo-Sieciowe
Bardziej szczegółowoProjektowanie Graficznych Interfejsów Użytkownika Robert Szmurło
Projektowanie Graficznych Interfejsów Użytkownika Robert Szmurło LATO 2007 Projektowanie Graficznych Interfejsów Użytkownika 1 UCD - User Centered Design 1) User Centered Design Projekt Skoncentrowany
Bardziej szczegółowoNowe spojrzenie na prawo
LEX 2 Nowe spojrzenie na prawo Od 25 lat informujemy o prawie i tworzymy narzędzia przekazujące tę wiedzę. Szybko. Intuicyjnie. Nowocześnie. Stawiamy sobie za cel sprostanie wymaganiom naszych Klientów.
Bardziej szczegółowoInforex - zarządzanie korpusami i ich anotacja
Inforex - zarządzanie korpusami i ich anotacja Marcin Oleksy marcin.oleksy@pwr.edu.pl Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii
Bardziej szczegółowoTester oprogramowania 2014/15 Tematy prac dyplomowych
Tester oprogramowania 2014/15 Tematy prac dyplomowych 1. Projekt i wykonanie automatycznych testów funkcjonalnych wg filozofii BDD za pomocą dowolnego narzędzia Jak w praktyce stosować Behaviour Driven
Bardziej szczegółowoNauczanie na odległość
P o l i t e c h n i k a W a r s z a w s k a Nauczanie na odległość a standaryzacja materiałów edukacyjnych Krzysztof Kaczmarski Nauczanie na odległość T Nauczanie ustawiczne T Studia przez Internet? T
Bardziej szczegółowoWłodzimierz Gruszczyński * Maciej Ogrodniczuk ** Marcin Woliński ** *IJP PAN **IPI PAN
Włodzimierz Gruszczyński * Maciej Ogrodniczuk ** Marcin Woliński ** *IJP PAN **IPI PAN Wystąpienie przygotowane w ramach projektu Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do roku 1772)
Bardziej szczegółowoSYSTEM OCENIANIA Z JĘZYKÓW OBCYCH.
SYSTEM OCENIANIA Z JĘZYKÓW OBCYCH. I. KONTROLI PODLEGAJĄ ZARÓWNO SPRAWNOŚCI PRODUKTYWNE ( MÓWIENIE I PISANIE ), JAK I RECEPTYWNE ( ROZUMIENIE I PISANIE TEKSTU CZYTANEGO I SŁUCHANEGO. 1 a. Mówienie. Ocena
Bardziej szczegółowoNOWE TECHNOLOGIE JAKO NARZĘDZIE MOTYWACJI W NAUCZANIU JĘZYKÓW OBCYCH
NOWE TECHNOLOGIE JAKO NARZĘDZIE MOTYWACJI W NAUCZANIU JĘZYKÓW OBCYCH Marcelina Masłowska Studentka Akademii Techniczno Humanistycznej w Bielsku- Białej na kierunku filologia specjalność angielska, studia
Bardziej szczegółowoSPIS TREŚCI. Do Czytelnika... 7
SPIS TREŚCI Do Czytelnika.................................................. 7 Rozdział I. Wprowadzenie do analizy statystycznej.............. 11 1.1. Informacje ogólne..........................................
Bardziej szczegółowoWymagania edukacyjne z języka angielskiego dla uczniów gimnazjum klasy I - III
Wymagania edukacyjne z języka angielskiego dla uczniów gimnazjum klasy I - III Odpowiedzi ustne, prace klasowe i sprawdziany są oceniane punktowo, a punkty są przeliczane następująco zgodnie z Szkolnym
Bardziej szczegółowoLokalizacja Oprogramowania
mgr inż. Anton Smoliński anton.smolinski@zut.edu.pl Lokalizacja Oprogramowania 16/12/2016 Wykład 6 Internacjonalizacja, Testowanie, Tłumaczenie Maszynowe Agenda Internacjonalizacja Testowanie lokalizacji
Bardziej szczegółowoINFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA.
SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:
Bardziej szczegółowoWebowy generator wykresów wykorzystujący program gnuplot
Uniwersytet Mikołaja Kopernika Wydział Fizyki, Astronomii i Informatyki Stosowanej Marcin Nowak nr albumu: 254118 Praca inżynierska na kierunku informatyka stosowana Webowy generator wykresów wykorzystujący
Bardziej szczegółowoMODUŁ KSZTAŁCENIA: Praktyczna nauka języka angielskiego: moduł 1
Uniwersytet Śląski w Katowicach str. Program kształcenia, załącznik nr. nazwa kierunku FILOLOGIA ANGIELSKA. poziom kształcenia pierwszy 3. profil kształcenia ogólnoakademicki 4. forma prowadzenia stacjonarne
Bardziej szczegółowoInforex - zarządzanie korpusami i ich anotacja. Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii Językowych G4.
Inforex - zarządzanie korpusami i ich anotacja Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy Jan Wieczorek Jan Kocoń marcin.oleksy@pwr.edu.pl jan.wieczorek@pwr.edu.pl jan.kocon@pwr.edu.pl
Bardziej szczegółowoSzwedzki dla imigrantów
Szwedzki dla imigrantów Cel kształcenia Celem kształcenia w ramach kursu Szwedzki dla imigrantów (sfi) jest zapewnienie osobom dorosłym, które nie posiadają podstawowej znajomości języka szwedzkiego, możliwości
Bardziej szczegółowoUżyteczność polskich portali turystycznych Wakacje w Internecie - aneks
Użyteczność polskich portali turystycznych Wakacje w Internecie - aneks Bartosz Bałaziński Monika Telega Hubert Turaj Kjersti Corneliussen Raport pod patronatem Polskiej Izby Turystyki Kraków, Kwiecień
Bardziej szczegółowoSzkolenie biblioteczne w formie e-learningu
Anna Gruca anna.gruca@bg.agh.edu.pl Biblioteka Główna Akademii Górniczo-Hutniczej Szkolenie biblioteczne w formie e-learningu w Bibliotece Głównej Akademii Górniczo-Hutniczej Szkolenie biblioteczne w formie
Bardziej szczegółowoKierunki rozwoju w nauczaniu języków obcych. dr Joanna Kic-Drgas
Kierunki rozwoju w nauczaniu języków obcych dr Joanna Kic-Drgas Cel Prezentacja kierunków rozwoju w nauczaniu języków obcych Pytania Dlaczego uczymy się języków obcych? Jak nowoczesne technologie wpływają
Bardziej szczegółowoRAPORT Z FGI. Innowacyjny program nauczania matematyki z wykorzystaniem TIK w gimnazjach. Opracowała dr Paulina Sobiczewska
RAPORT Z FGI Innowacyjny program nauczania matematyki z wykorzystaniem TIK w gimnazjach Opracowała dr Paulina Sobiczewska 30.06.2014 CELE BADANIA Poznanie opinii nauczycieli matematyki w gimnazjum na temat
Bardziej szczegółowoMiędzyplatformowy interfejs systemu FOLANessus wykonany przy użyciu biblioteki Qt4
Uniwersytet Mikołaja Kopernika w Toruniu Wydział Matematyki i Informatyki Wydział Fizyki, Astronomii i Informatyki Stosowanej Agnieszka Holka Nr albumu: 187396 Praca magisterska na kierunku Informatyka
Bardziej szczegółowoI. Raport wykonywalności projektu
Spis treści: " I. " Raport wykonywalności projektu..." str. 2 " II. " Glosariusz projektu... " str. 4 " III. " Diagramy relacji encja-związek..." str. 6 " IV. " Diagramy przepływu danych..." str. 7 " V.
Bardziej szczegółowoSPINACZ.edu.pl platforma współpracy nauki z biznesem w zakresie innowacyjnych rozwiązań informatycznych
SPINACZ.edu.pl platforma współpracy nauki z biznesem w zakresie innowacyjnych rozwiązań informatycznych Poznańska Impreza Wolnego Oprogramowania Poznań, 3 grudnia 2011 Rafał Brzychcy rafal.brzychcy@fwioo.pl
Bardziej szczegółowoInformacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów
Eksploracja danych Piotr Lipiński Informacje ogólne Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów UWAGA: prezentacja to nie
Bardziej szczegółowoKomputer nie myśli. On tylko wykonuje nasze polecenia. Nauczmy się więc wydawać mu rozkazy
Programowanie w C++ 1.Czym jest programowanie Pisanie programów to wcale nie czarna magia, tylko bardzo logiczna rozmowa z komputerem. Oczywiście w jednym ze specjalnie stworzonych do tego celu języków.
Bardziej szczegółowoSpis treści tomu pierwszego
Spis treści tomu pierwszego WSTĘP.... 11 DŹWIĘK JAKO ZJAWISKO FIZYCZNE...15 CHARAKTERYSTYKA AKUSTYCZNA I AUDYTYWNA DŹWIĘKÓW MOWY.. 17 SŁUCH...20 WYŻSZE PIĘTRA UKŁADU SŁUCHOWEGO...22 EMISJE OTOAKUSTYCZNE...25
Bardziej szczegółowoZałącznik nr 1. Specyfikacja. Do tworzenia Mapy Kompetencji
Załącznik nr 1 Specyfikacja Do tworzenia Mapy Kompetencji 1. Cel projektu Celem projektu jest utworzenie Mapy kompetencji. Ma ona zawierać informacje o kompetencjach, celach kształcenia, umożliwiać ich
Bardziej szczegółowoSZCZEGÓŁOWE KRYTERIA OCENIANIA Z JĘZYKA NIEMIECKIEGO I ANGIELSKIEGO. Klasy IV-VIII. Szkoła Podstawowa w Zdunach
SZCZEGÓŁOWE KRYTERIA OCENIANIA Z JĘZYKA NIEMIECKIEGO I ANGIELSKIEGO Klasy IV-VIII Szkoła Podstawowa w Zdunach I. Umiejętności uczniów podlegające sprawdzaniu i ocenianiu Podczas trwania całego procesu
Bardziej szczegółowoE-learning w pracy nauczyciela bibliotekarza warsztaty metodyczne w Pedagogicznej Bibliotece Wojewódzkiej im. KEN w Lublinie
E-learning w pracy nauczyciela bibliotekarza warsztaty metodyczne w Pedagogicznej Bibliotece Wojewódzkiej im. KEN w Lublinie Impulsem do zajęcia się zagadnieniem e-learningu była dla nas konferencja E-learning
Bardziej szczegółowoPlan. Wprowadzenie. Co to jest APEX? Wprowadzenie. Administracja obszarem roboczym
1 Wprowadzenie do środowiska Oracle APEX, obszary robocze, użytkownicy Wprowadzenie Plan Administracja obszarem roboczym 2 Wprowadzenie Co to jest APEX? Co to jest APEX? Architektura Środowisko Oracle
Bardziej szczegółowoWYDZIAŁ EKONOMII KARTA OPISU MODUŁU KSZTAŁCENIA
WYDZIAŁ EKONOMII KARTA OPISU MODUŁU KSZTAŁCENIA Nazwa modułu Informatyka ekonomiczna Nazwa modułu w języku angielskim Kod modułu Kody nie zostały jeszcze przypisane Kierunek studiów Kierunek prawno-ekonomiczny
Bardziej szczegółowoAPD. Archiwum Prac Dyplomowych w USOS. Mariusz.Czerniak@umk.pl
APD Archiwum Prac Dyplomowych w USOS Mariusz.Czerniak@umk.pl Plan prezentacji Wprowadzenie do aplikacji Zastosowania i scenariusze działań Plany na najbliższą przyszłość Geneza i przeznaczenie APD należy
Bardziej szczegółowoAUTOMATYKA INFORMATYKA
AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław Kowalczuk Inteligentne wydobywanie informacji z internetowych serwisów
Bardziej szczegółowoRozwój polskich bibliotek cyfrowych. Tomasz Parkoła Poznańskie Centrum Superkomputerowo-Sieciowe
Rozwój polskich bibliotek cyfrowych Tomasz Parkoła Poznańskie Centrum Superkomputerowo-Sieciowe Plan prezentacji Wprowadzenie Historia rozwoju bibliotek cyfrowych w Polsce Aktualny stan bibliotek cyfrowych
Bardziej szczegółowoOdkrywanie CAQDAS : wybrane bezpłatne programy komputerowe wspomagające analizę danych jakościowych / Jakub Niedbalski. Łódź, 2013.
Odkrywanie CAQDAS : wybrane bezpłatne programy komputerowe wspomagające analizę danych jakościowych / Jakub Niedbalski. Łódź, 2013 Spis treści Wprowadzenie 11 1. Audacity - program do edycji i obróbki
Bardziej szczegółowo!!!!!!!!!!! PORTFOLIO: Analiza zachowań użytkowników serwisów internetowych. Autorzy: Marek Zachara
PORTFOLIO: Analiza zachowań użytkowników serwisów internetowych Autorzy: Marek Zachara Opis merytoryczny Cel naukowy (jaki problem wnioskodawca podejmuje się rozwiązać, co jest jego istotą, co uzasadnia
Bardziej szczegółowoSYLABUS DOTYCZY CYKLU KSZTAŁCENIA Bieżący sylabus w semestrze zimowym roku 2016/17
Załącznik nr 4 do Uchwały Senatu nr 430/01/2015 SYLABUS DOTYCZY CYKLU KSZTAŁCENIA 2016-2018 Bieżący sylabus w semestrze zimowym roku 2016/17 1.1. PODSTAWOWE INFORMACJE O PRZEDMIOCIE/MODULE Nazwa przedmiotu/
Bardziej szczegółowoJak założyć konto? Co znajdziesz na FWF? Strona Narzędzia Jak dokonać płatności? Lista autorów... 12
Użytkowniku, chcesz w szybki i przystępny sposób poznać możliwości serwisu FWF? Zapoznaj się instrukcją, z której dowiesz się, jak korzystać z funkcjonalności, które przyczynią się udoskonalenia procesów
Bardziej szczegółowoEWALUACJA KROK PO KROKU
EWALUACJA KROK PO KROKU EWALUACJA KROK PO KROKU I. Czym jest EWALUACJA? II. Przebieg EWALUACJI. III. Metody zbierania danych. IV. Przykładowy układ treści raportu. V. Przykład projektu EWALUACJI. Ewaluacja
Bardziej szczegółowoPRZEDMIOTOWY SYSTEM OCENIANIA W ZSO W BIELAWIE
PRZEDMIOTOWY SYSTEM OCENIANIA W ZSO W BIELAWIE Od roku szkolnego: 2015/2016 Przedmiot/ty: język angielski, język niemiecki dla liceum Nauczyciel/le: Swietłana Błażejczyk, Jakub Maćkowski, Sandra Sawa,
Bardziej szczegółowoDSL w środowisku Eclipse. Grzegorz Białek Architekt techniczny, Sygnity S.A.
DSL w środowisku Eclipse Grzegorz Białek Architekt techniczny, Sygnity S.A. Agenda Wstęp do tematu (10 min) Sens tworzenia języków biznesowych UML jako język biznesu? Zintegrowane środowisko deweloperskie
Bardziej szczegółowoZintegrowany system usług dla nauki etap II (ZSUN II)
Zintegrowany system usług dla nauki etap II (ZSUN II) Ośrodek Przetwarzania Informacji Państwowy Instytut Badawczy Jarosław Protasiewicz jaroslaw.protasiewicz@opi.org.pl Warszawa, 5 czerwca 2017 r. Geneza
Bardziej szczegółowoSZCZEGÓŁOWE KRYTERIA OCENIANIA Z JĘZYKA NIEMIECKIEGO I ANGIELSKIEGO. Klasy IV-VIII. Szkoła Podstawowa w Zdunach
SZCZEGÓŁOWE KRYTERIA OCENIANIA Z JĘZYKA NIEMIECKIEGO I ANGIELSKIEGO Klasy IV-VIII Szkoła Podstawowa w Zdunach I. Umiejętności uczniów podlegające sprawdzaniu i ocenianiu Podczas trwania całego procesu
Bardziej szczegółowoPraca Magisterska. Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń. internetowego dla języka polskiego
Praca Magisterska Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń Lingwistycznych zbudowanego przez robota internetowego dla języka polskiego Marcin A. Gadamer Promotor: dr Adrian
Bardziej szczegółowoEFEKTY UCZENIA SIĘ JĘZYKOZNAWSTWO. Filologia włoska - I stopień PODSTAWY JĘZYKOZNAWSTWA
EFEKTY UCZENIA SIĘ JĘZYKOZNAWSTWO Filologia włoska - I stopień PODSTAWY JĘZYKOZNAWSTWA ma podstawową wiedzę o miejscu i znaczeniu językoznawstwa w systemie nauk humanistycznych oraz o specyfice przedmiotowej
Bardziej szczegółowoSZKOLENIE. Jak zarządzać projektem z wykorzystaniem MS Project. tel: ; fax: ;
SZKOLENIE Jak zarządzać projektem z wykorzystaniem MS Project tel: +48 22 100-48-96; fax: +48 22 300-52-79; e-mail: biuro@akademiaasap.pl TRENERZY DORADCY TRENERZY i KONSULTANCI NASZA MISJA DOSTARCZENIE
Bardziej szczegółowoLingwistyka Kryminalistyczna w Collegium Maius Projekt konkursowy
Lingwistyka Kryminalistyczna w Collegium Maius Projekt konkursowy dr hab. Magdalena Graf mgr Alicja Labijak Paweł Kaczmarczyk Mateusz Prętki Agnieszka Krzesińska Michalina Rochna 1 Celem naszego projektu
Bardziej szczegółowotel.: (+48) mail.
Platforma badawcza CATI-System powstała w celu kompleksowej obsługi klientów w zakresie badań statystycznych. Pozwala ona na sprawną realizację badań telefonicznych (CATI), badań internetowych (CAWI) oraz
Bardziej szczegółowoUMIEJĘTNOŚCI JĘZYKOWE
Raport z Ogólnopolskiego Sprawdzianu Kompetencji Trzecioklasisty OPERON 2016 w Szkole Podstawowej nr 6 im. Henryka Sienkiewicza w Pruszkowie Ogólnopolski Sprawdzian Kompetencji Trzecioklasisty odbył się
Bardziej szczegółowoWYNIKI ANKIETY Serwis internetowy Biblioteki PWSZ w Nysie
WYNIKI ANKIETY Serwis internetowy Biblioteki PWSZ w Nysie Cel badania: uzyskanie opinii na temat nowego serwisu internetowego Biblioteki PWSZ w Nysie. Struktura badania: anonimowa ankieta Metodologia:
Bardziej szczegółowoEFEKTY UCZENIA SIĘ JĘZYKOZNAWSTWO
EFEKTY UCZENIA SIĘ JĘZYKOZNAWSTWO Filologia hiszpańska- I stopień WSTĘP DO NAUKI O JĘZYKU ma podstawową wiedzę o miejscu i znaczeniu językoznawstwa w systemie nauk humanistycznych oraz o specyfice przedmiotowej
Bardziej szczegółowoMODUŁ KSZTAŁCENIA: Praktyczna nauka języka angielskiego: moduł 3
Uniwersytet Śląski w Katowicach str. 1 Program kształcenia, załącznik nr 1. nazwa kierunku FILOLOGIA ANGIELSKA. poziom kształcenia pierwszy. profil kształcenia ogólnoakademicki 4. forma prowadzenia stacjonarne
Bardziej szczegółowoKRYTERIA OCENIANIA KLASA I KLASA II KLASA III
KRYTERIA OCENIANIA II ETAP EDUKACYJNY - JĘZYK ANGIELSKI KLASA I KLASA II KLASA III DOPUSZCZAJĄCY: rozumie proste polecenia nauczyciela, poparte gestem; rozumie proste zwroty grzecznościowe i proste pytania;
Bardziej szczegółowoPraktyka testowania dla początkujących testerów
Praktyka testowania dla początkujących testerów Warsztaty stanowią 100% praktykę testowania i skupiają się zwłaszcza na tych aspektach, które przydatne są w codziennej pracy testera. Przeznaczone są dla
Bardziej szczegółowoPROGRAM ZAJĘĆ REALIZOWANYCH W RAMACH PROJEKTU
PROGRAM ZAJĘĆ REALIZOWANYCH W RAMACH PROJEKTU N@uczyciel przygotowanie nauczycieli z ZSP do stosowania e-elarningu w nauczaniu i samokształceniu Szkolenie współfinansowane ze środków Unii Europejskiej
Bardziej szczegółowoPRZEDMIOTOWY SYSTEM OCENIANIA W ZSO W BIELAWIE
PRZEDMIOTOWY SYSTEM OCENIANIA W ZSO W BIELAWIE Rok szkolny: 2016/2017 Przedmiot/ty: język angielski dla liceum Nauczyciel/le: Oliwia Mróz, Swietłana Błażejczyk, Jakub Maćkowski Obszary PSO wynikające z
Bardziej szczegółowoWymagania na poszczególne oceny z języka niemieckiego dla uczniów Technikum Zawodowego poziom IV.O i IV.1, zakres podstawowy.
Wymagania na poszczególne oceny z języka niemieckiego dla uczniów Technikum Zawodowego poziom IV.O i IV.1, zakres podstawowy. SŁUCHANEGO/ CZYTANEGO - uczeń rozumie wszystkie polecenia, instrukcje i wypowiedzi
Bardziej szczegółowoBydgoskie Centrum Archiwizacji Cyfrowej sp. z o.o.
STRONA GŁÓWNA ` Usługa earchiwizacja.pl przeznaczona jest zarówno dla osób indywidualnych, jak i firm. Wykorzystuje zasadę przetwarzania danych w chmurze. Pozwala to na dostęp do własnej bazy dokumentów
Bardziej szczegółowowww.plansoft.org plansoft.org Zmiany w Plansoft.org Panel wyszukiwania PLANOWANIE ZAJĘĆ, REZERWOWANIE SAL I ZASOBÓW
Zmiany w Plansoft.org Panel wyszukiwania... 1 Uruchamianie panelu wyszukiwania... 2 Wyszukiwanie poleceń menu... 2 Wyszukiwanie rozkładów zajęć wykładowców... 3 Wyszukiwanie rozkładów zajęć grup i użycia
Bardziej szczegółowoMODUŁ KSZTAŁCENIA: Praktyczna nauka języka angielskiego: moduł 4
Uniwersytet Śląski w Katowicach str. 1 1. nazwa kierunku FILOLOGIA ANGIELSKA. poziom kształcenia pierwszy. profil kształcenia ogólnoakademicki 4. forma prowadzenia stacjonarne studiów MODUŁ KSZTAŁCENIA:
Bardziej szczegółowoinnowacji pedagogicznej Programowanie w szkole
Sprawozdanie ewaluacji innowacji pedagogicznej Programowanie w szkole Autor innowacji: mgr Katarzyna Wszeborowska mgr Katarzyna Pilichowska Miejsce innowacji: Szkoła Podstawowa nr 1 Termin realizacji:
Bardziej szczegółowoDokumenty elektroniczne CD-ROM
Dokumenty elektroniczne CD-ROM Sygnatura: Płk 116 Opracowany materiał zawiera 260 ćwiczeń z wyrazami oraz 70 fabularyzowanych ćwiczeń ze zdaniami. Jedna sesja ćwiczeń przewidziana jest na 20 minut pracy,
Bardziej szczegółowoRELACYJNE BAZY DANYCH
RELACYJNE BAZY DANYCH Aleksander Łuczyk Bielsko-Biała, 15 kwiecień 2015 r. Ludzie używają baz danych każdego dnia. Książka telefoniczna, zbiór wizytówek przypiętych nad biurkiem, encyklopedia czy chociażby
Bardziej szczegółowoSystem kadrowo-płacowy KOMAX 2.0
System kadrowo-płacowy KOMAX 2.0 ( Wybrane aspekty innowacji funkcjonalnych ) Nowoczesny interfejs systemu Interfejs systemu KOMAX 2.0 opracowano z zamysłem maksymalnego uproszczenia obsługi wszystkich
Bardziej szczegółowoEFEKTY UCZENIA SIĘ JĘZYKOZNAWSTWO
EFEKTY UCZENIA SIĘ JĘZYKOZNAWSTWO Filologia portugalska- I stopień PODSTAWY JĘZYKOZNAWSTWA Student ma podstawową wiedzę o miejscu, znaczeniu i powiązaniach językoznawstwa z innymi dyscyplinami naukowymi
Bardziej szczegółowoAnaliza wyników egzaminu gimnazjalnego 2016 r. Test humanistyczny język polski
Analiza wyników egzaminu gimnazjalnego 2016 r. Test humanistyczny język polski Arkusz standardowy zawierał 22 zadania, w tym 20 zadań zamkniętych i 2 zadania otwarte. Wśród zadań zamkniętych pojawiły się
Bardziej szczegółowoDwie szkoły oceny 360 stopni. Sprawdź różnicę pomiędzy klasycznym a nowoczesnym podejściem
Sprawdź różnicę pomiędzy klasycznym a nowoczesnym podejściem Czy stosowanie tradycyjnego podejścia do metody 360 stopni jest jedynym rozwiązaniem? Poznaj dwa podejścia do przeprowadzania procesu oceny
Bardziej szczegółowoUniwersytet Śląski w Katowicach str. 1 Wydział Filologiczny
Uniwersytet Śląski w Katowicach str. 1 Program kształcenia, załącznik nr nazwa kierunku FILOLOGIA ANGIELSKA 1. poziom kształcenia drugi. profil kształcenia ogólnoakademicki. forma prowadzenia niestacjonarne
Bardziej szczegółowoAgencja Interaktywna
Agencja Interaktywna System do skutecznego e-mail marketingu Agencja Interaktywna Fabryka Pikseli 1 System mailingowy 1. Opis systemu. System został stworzony z myślą o podmiotach zamierzających prowadzić
Bardziej szczegółowoNarzędzie informatyczne do modelowania, zarządzania i dokumentowania procesów systemu zarządzania jakością
Narzędzie informatyczne do modelowania, zarządzania i dokumentowania procesów systemu zarządzania jakością ProMoS Każde działanie można ująć w formie procesu i odpowiednio doskonalić. (W.E. Deming) ProMoS
Bardziej szczegółowoSPOŁECZNOŚCI INTERNETOWE
SPOŁECZNOŚCI INTERNETOWE Wykorzystanie nowoczesnych technologii w badaniach konsumenckich Inquiry sp. z o.o. O INQUIRY Od ponad 10 lat prowadzimy badania konsumenckie dla klientów z branży FMCG, sieci
Bardziej szczegółowoAnaliza i projektowanie oprogramowania. Analiza i projektowanie oprogramowania 1/32
Analiza i projektowanie oprogramowania Analiza i projektowanie oprogramowania 1/32 Analiza i projektowanie oprogramowania 2/32 Cel analizy Celem fazy określania wymagań jest udzielenie odpowiedzi na pytanie:
Bardziej szczegółowoZamawiający dysponuje szerokim spektrum rozwiązań infrastrukturalnych. Wykonawca uzyska dostęp do infrastruktury w niezbędnym zakresie.
Prosimy o precyzyjne wyjaśnienie, co Zamawiający rozumie pod pojęciem bezterminowej i pełnej licencji, wraz z prawem do dysponowania dokumentacją i wprowadzaniem zmian? Na jakich polach eksploatacji ma
Bardziej szczegółowoWymagania edukacyjne niezbędne do uzyskania poszczególnych śródrocznych i rocznych ocen klasyfikacyjnych Język obcy I (kontynuacja)
Język obcy I (kontynuacja) Osiągnięcia Ocena - dopuszczający (poziom rozszerzający) uczeń rozumie autentyczne przekazy słowne, odbierane za pośrednictwem mediów (np. audycje radiowe, telewizyjne, prasa,
Bardziej szczegółowoCLARIN-PL wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych
wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Technologii Językowej
Bardziej szczegółowoKRYTERIA OCENIANIA Z JĘZYKA ANGIELSKIEGO W KLASACH IV - VI
KRYTERIA OCENIANIA Z JĘZYKA ANGIELSKIEGO W KLASACH IV - VI Ocena celująca: uczeń swobodnie operuje strukturami gramatycznymi określonymi w rozkładzie materiału z łatwością buduje spójne zdania proste i
Bardziej szczegółowoX SPOTKANIE EKSPERCKIE. System ocen pracowniczych metodą 360 stopni
X SPOTKANIE EKSPERCKIE System ocen pracowniczych metodą 360 stopni Warszawa, 16.09.2011 Ocena wieloźródłowa od koncepcji do rezultatów badania dr Anna Bugalska Najlepsze praktyki Instytutu Rozwoju Biznesu
Bardziej szczegółowoKryteria Oceniania z języka niemieckiego w Gimnazjum Klasa I. Ocena niedostateczna
Kryteria Oceniania z języka niemieckiego w Gimnazjum Klasa I Ocena niedostateczna - uczeń nie rozumie nawet krótkich, prostych wypowiedzi nauczyciela dotyczących tematyki programowej. - uczeń nie potrafi
Bardziej szczegółowoProjekt dotyczy stworzenia zintegrowanego, modularnego systemu informatycznego wspomagającego zarządzanie pracownikami i projektami w firmie
Projekt dotyczy stworzenia zintegrowanego, modularnego systemu informatycznego wspomagającego zarządzanie pracownikami i projektami w firmie informatycznej. Zadaniem systemu jest rejestracja i przechowywanie
Bardziej szczegółowoDokument Detaliczny Projektu
Dokument Detaliczny Projektu Dla Biblioteki miejskiej Wersja 1.0 Streszczenie Niniejszy dokument detaliczny projektu(ddp) przedstawia szczegóły pracy zespołu projektowego, nad stworzeniem aplikacji bazodanowej
Bardziej szczegółowoFormularz rzeczowo-cenowy PAKIET 1
Formularz rzeczowo-cenowy PAKIET 1 Lp. Nazwa systemu Opis zadania do wykonania Cena netto 1. Integracja 1. Aktualizacja danych nt. studentów i absolwentów z bazy dziekanatów z częstotliwością nie mniejszą
Bardziej szczegółowoPRZEDMIOTOWY SYSTEM OCENIANIA JĘZYK NIEMIECKI. Kryteria oceniania w klasach II - III Gimnazjum (dla początkujących)
PRZEDMIOTOWY SYSTEM OCENIANIA JĘZYK NIEMIECKI Kryteria oceniania w klasach II - III Gimnazjum (dla początkujących) 1. Co podlega ocenianiu osiągnięć edukacyjnych uczniów odpowiedzi ustne kartkówki prace
Bardziej szczegółowoKompetencje akademickie Wprowadzenie do komunikacji naukowej
WYKŁAD OGÓLNOUNIWERSYTECKI DLA DOKTORANTÓW 2015/2016 Kompetencje akademickie Wprowadzenie do komunikacji naukowej Rok akademicki: 2015/2016 Semestr zimowy: 30 h Limit miejsc: 100 Prowadzący: dr Emanuel
Bardziej szczegółowoSYSTEM OCENIANIA Z JĘZYKA ROSYJSKIEGO
SYSTEM OCENIANIA Z JĘZYKA ROSYJSKIEGO I. KONTROLI PODLEGAJĄ ZARÓWNO SPRA2WNOŚCI PRODUKTYWNE (MÓWIENIE I PISANIE), JAK I RECEPTYWNE (ROZUMIENIE I PISANIE TEKSTU CZYTANEGO I SŁUCHANEGO). 1a. Mówienie. Umiejętności
Bardziej szczegółowo