Ekstrakcja terminologii z korpusów dziedzinowych
|
|
- Lidia Bukowska
- 8 lat temu
- Przeglądów:
Transkrypt
1 Ekstrakcja terminologii z korpusów dziedzinowych Małgorzata Marciniak, Agnieszka Mykowiecka, Piotr Rychlik Instytut Podstaw Informatyki PAN mm@ipipan.waw.pl, agn@ipipan.waw.pl, rychlik@ipipan.waw.pl IV cykl wykładów i warsztatów CLARIN-PL, Łódź 4 lutego 2017
2 Zadanie Cel ekstrakcji terminologii: wydobycie specyficznej terminologii z tekstów dotyczących wybranej dziedziny. Zastosowania: tworzenie słowników dziedzinowych; tworzenie zasobów do tłumaczenia tekstów; anotacja dokumentów i wspomaganie wyszukiwania odpowiedzi na pytania; przydatne przy streszczaniu dokumentów; wstępny krok przy opracowywaniu ontologii dziedziny;...
3 Przykład
4 Realizacja zadania Zgromadzenie tekstów dziedzinowych. Wstępna analiza lingwistyczna tagowanie (przypisanie formy podstawowej, części mowy oraz charakterystyki morfologicznej). Identyfikacja fraz kandydatów na terminy. Szeregowanie fraz. Selekcja fraz.
5 Program Termo.PL Opracowany w ramach projektu Clarin.Pl Java Runtime Environment w wersji 7 lub nowszej; Wymaga Morfeusza 2 do wygenerowania formy podstawowej z uproszczonej formy; Wymaga otagowanego i ujednoznacznionego korpusu danych w jednym z formatów: NKJP; XCES; zapis uproszczony: token # lemat # tag. na wyjściu: lista uporządkowanych terminów (w uproszczonych formach lub zrekonstruowanych formach podstawowych wraz z formami znalezionych fraz). Przydatne adresy internetowe
6 Termo.PL
7 Termo.PL
8 Termo.PL sortowanie po długości terminów
9 Tadeusz Różewicz Uczeń czarnoksiężnika Po co otwarłem oczy Zalewa mnie świat kształtów i barw fala za falą kształt za kształtem barwa za barwą wydany na łup jadowitych zieleni zimnych błękitów intensywnych żółtych słońc jaskrawych czerwonych homarów jestem nienasycony.
10 Co rozumiemy pod pojęciem terminu? Definicja słownikowa Wyraz albo połączenie wyrazowe o specjalnym, konwencjonalnie ustalonym znaczeniu naukowym lub technicznym; (Doroszewski) Definicja robocza Fraza rzeczownikowa, która w tekstach dziedzinowych występuje dostatecznie często by przypuszczać, że opisuje pojęcie istotne dla dziedziny. Częstość tej frazy w tekstach spoza dziedziny jest niższa.
11 Struktura gramatyczna terminów w języku polskim rzeczownik, akronim lub skrót rzeczownika: podatek, angiografia, PKB, USG ust.(awa), rzeczownik z przymiotnikiem (który wystąpił po lub rzadziej przed rzeczownikiem): stosunki gospodarcze, granulocyty obojętnochłonne; sekwencja rzeczownika z rzeczownikiem w dopełniaczu: udar n,nom mózgu n,gen ; kodeks n,nom pracy n,gen ; kombinacja powyższych dwóch struktur: europejski adj rynek n,nom usług n,gen finansowych adj, wodonercze niewielkiego stopnia dolnego układu podwójnego nerki prawej;
12 Struktura gramatyczna terminów w języku polskim fraza rzeczownikowa modyfikowana frazą przyimkową: wierzytelność podatnika wobec skarbu państwa, podatek dochodowy od osoby fizycznej; poziom hormonów we krwi; można uwzględnienić koordynację: bezsporna i wymagalna wierzytelność podatnika wobec skarbu państwa, zapalenie mózgu i rdzenia, oddział alergologii, endokrynologii i pediatrii ogólnej.
13 Wykluczenie niektórych słów/fraz Terminy nie powinny składać się ze: słów wskazujących na określenie czasu, jak np: miesiąc, dzień; nazwy dni i miesięcy, np: styczeń, poniedziałek; przymiotników wymagających kontekstu do interpretacji np: inny, niektóry, jakiś, pewien. Należy wykluczyć przyimki złożone: [w kierunku] zapalenia nerek > kierunek zapalenia nerek; [pod postacią] podatku VAT > postać podatku VAT; [pod kątem] diagnostyki obrazowej > kąt diagnostyki obrazowej; [pod kątem] prostym > kąt prosty.
14 Wykluczenie niektórych słów
15 Wykluczenie niektórych fraz
16 Gramatyka NPP : $NAP NAP GEN ; NAP[agreement] : AP N AP ; NAP GEN[case = gen] : NAP; AP : ADJ ADJA DASH ADJ PPAS; N[pos = subst, ger]; ADJ[pos = adj]; ADJA[pos = adja]; PPAS[pos = ppas]; DASH[form = - ];
17 Termo.PL
18 Szeregowanie terminów Dla każdej frazy kandydackiej p liczona jest wartość C-value: l(p) (freq(p) 1 r(lp) lp LP freq(lp)), C value(p) = if r(lp) > 0, l(p) freq(p), if r(lp) = 0 p rozważana fraza, LP zbiór fraz zawierających p, r(lp) liczba różnych fraz w LP, l(p) = log 2 (length(p)), jeśli p ma długość 1 to przyjmujemy stałą np: l(p) = 0.1; referencja bibliograficzna Frantzi, K., Ananiadou, S., Mima, H.: Automatic recognition of multi-word terms: the C-value/NC-value method. Int. Journal on Digital Libraries 3 (2000)
19 Identyfikacja fraz pojedyncza mnoga nom przewlekły nieżyt żołądka przewlekłe nieżyty żołądka gen przewlekłego nieżytu żołądka przewlekłych nieżytów żołądka dat przewlekłemu nieżytowi żołądka przewlekłym nieżytom żołądka acc przewlekły nieżyt żołądka przewlekłe nieżyty żołądka inst przewlekłym nieżytem żołądka przewlekłymi nieżytami żołądka loc przewlekłym nieżycie żołądka przewlekłych nieżytach żołądka Wykorzystujemy uproszczoną formę podstawową: przewlekły nieżyt żołądka > przewlekły nieżyt żołądek; ostra niewydolność nerek > ostry niewydolność nerka.
20 Problemy z uproszczoną formą podstawową Taką sama uproszczoną formę podstawową mają: frazy w liczbie mnogiej i pojedynczej np. zapalenie ucha i zapalenie uszu, uproszczona: zapalenie ucho; przymiotniki w różnych stopniach (mały, mniejszy) np. miednica mała (częściej mała miednica opisuje rozmiar) podczas gdy miednica mniejsza (określenie anatomiczne), uproszczona: miednica mały; pozytywne i zanegowane imiesłowy przymiotnikowe. powiększony/niepowiększony mają formę podstawową powiększyć inf ; gerundia i imiesłowy maja bezokoliczniki jako formy podstawowe: usunięcie ger kamienia subst:gen operacja, usunięty ppas kamień subst:nom opis kamienia, forma uproszczona: usunąć inf kamień subst.
21 Konteksty planowa operacja przepukliny pachwinowej lewostronnej operacja przepukliny pachwinowej lewostronnej planowa operacja przepukliny pachwinowej operacja przepukliny pachwinowej przepuklina pachwinowa lewostronna lewostronna przepuklina pachwinowa przepuklina pachwinowa prawostronna przepuklina pachwinowa obustronna prawostronna przepuklina pachwinowa uwięźnięta przepuklina pachwinowa prawostronna
22 Liczenie kontekstów Metody liczenia kontekstów (ograniczamy do jednego słowa): 1 liczba różnych kontekstów liczona po obu stronach razem; 2 suma różnych kontekstów po obu stronach; 3 maksimum z kontekstów liczonych z lewej i prawj strony osobno. Konteksty dla frazy: przepuklina pachwinowa: 1 operacja lewostronny, operacja [pusty], [pusty] lewostronny, lewostronny [pusty], [pusty] prawostronny, [pusty] obustronny, prawostronny [pusty], uwięźnięty prawostronny ; 2 operacja, lewostronny, prawostronny, obustronny, uwięźnięty ; 3 operacja, lewostronny, prawostronny, uwięźnięty (lewych o jeden więcej).
23 Problem uciętych fraz Przykłady frazy o silnym powiązaniu słów: w medycynie: pęcherzyk żółciowy, jama brzuszna, staw kolanowy; w ekonomii: papiery wartościowe, fundusz inwestycyjny; w angielskim: contact lens. Gramatycznie poprawne zagnieżdżone frazy: [zapalenie pęcherzyka] żółciowego; [USG jamy] brzusznej; [operacja lewego stawu] kolanowego; [giełda papierów] wartościowych; [uczestnik funduszu] inwestycyjnego; [soft contact] lens.
24 NPMI Normalised Pointwise Mutual Information NPMI (x, y) = ( ln ) / p(x, y) ln p(x, y) p(x)p(y) Where: x y jest bigramem składajacym się z lematów tokenów x i y, p(x,y) jest prawdopodobiństwem bigramu x y w korpusie, p(x), p(y) jest prawdopodobieństwem unigramów x i y w korpusie. referencja bibliograficzna Gerlof Bouma, 2009, Normalized (pointwise) mutual information in collocation extraction., w: Proceedings of the Biennial GSCL Conference 2009, strony
25 Przykład infekcja górnych dróg oddechowych Noun j Adj i Noun i Adj i infekcja górnych dróg oddechowych infekcja górny droga oddechowy bigram NPMI infekcja górny 0.66 górny droga 0.79 droga oddechowy 0.95
26 Porównanie dwóch metod Poprawne gramatycznie podfrazy Podfrazy z wykorzystaniem NPMI infekcja górny droga oddechowy infekcja górny droga oddechowy infekcja górnych dróg oddechowych infekcja górnych dróg oddechowych infekcja górnych dróg infekcja infekcja górne drogi oddechowe górne drogi oddechowe górne drogi drogi oddechowe drogi oddechowe drogi drogi
27 Preferowanie podziału na dwie frazy rzeczownikowe prawidłowa adj mikroflora noun górnych adj dróg noun oddechowych adj > prawidłowa mikroflora oraz górne drogi oddechowe częste adj infekcje noun górnych adj dróg noun oddechowych adj > częste modyfikuje całą frazę infekcje górnych dróg oddechowych Modyfikacja: szukamy najsłabszej pozycji pozwalającej podzielić frazę na dwie podfrazy rzeczownikowe; jeśli różnica pomnięcy nasłabszym miejscem podziału a tym dzielącym na dwie frazy rzeczownikowe jest mniejsza od ustalonego progu to preferujemy podział na dwie frazy rzeczownikowe.
28 Wybór metod podziału fraz
29 Analiza kontrastywna terminologii Cel Na podstawie porównania wyników ekstrakcji terminologii dla dwóch korpusów mają być wskazane frazy: bardziej specyficzne dla innej dziedziny (porównanie z terminologią wydobytą z innego korpusu dziedzinowego) terminy ogólne np. własny sposób, lewa strona, trudne zadanie (porównanie z korpusem języka ogólnego).
30 Metody porównań Zaimplementowane metody wykorzystują: Log-Likelihood (LL logarytm wiarygodności): na ile różni się częstość konkretnego terminu w dwóch porównywanych korpusach; Term Frequency Inverse Term Frequency (TFITF): łączy częstość występowania w korpusie dziedzinowym z odwrotną częstością występowania w korpusie ogólnym (liczoną jako stosunek wielkości korpusu do częstości badanego terminu); Contrastive Selection of Multi-Word Terms(CSmw): dla terminów wielowyrazowych, uwzględnia zarówno częstość występowania pełnych terminów, ale też częstość występowania słów stanowiących element główny badanej frazy.
31 Porównanie ekonomii z NKJP
32 Porównanie ekonomii z NKJP
33 Jak zrobić plik porównawczy Upewnić się, że w zakładce Option -> Search odkliknięte jest porównywanie korpusów; Wyszukać terminy w korpusie służącym do porównań; W zakładce Option -> Save wybrać klawisz środkowy wskazujący pola służące do porównywania korpusów); Zamknąć okienko opcji; Wybrać klawisz Save (program proponuje nazwę). Plik do porównań jest wskazywany następnie w zakładce Search; klawisz Select przy wyborze Contrastive terms
34 wybór opcji do porównywania terminologii
35 Możliwość jawnego podania fraz do odfiltrowania
TermoPL dopasowany do XML-owego wyjścia Korpusomatu
TermoPL dopasowany do XML-owego wyjścia Korpusomatu Małgorzata Marciniak, Agnieszka Mykowiecka, Piotr Rychlik Instytut Podstaw Informatyki PAN mm@ipipan.waw.pl, agn@ipipan.waw.pl, rychlik@ipipan.waw.pl
Ekstrakcja terminologii dziedzinowej program TermoPL
Ekstrakcja terminologii dziedzinowej program TermoPL Małgorzata Marciniak, Agnieszka Mykowiecka, Piotr Rychlik Instytut Podstaw Informatyki PAN mm@ipipan.waw.pl, agn@ipipan.waw.pl, rychlik@ipipan.waw.pl
Ekstrakcja terminologii z tekstów w języku polskim program TermoPL
Ekstrakcja terminologii z tekstów w języku polskim program TermoPL Małgorzata Marciniak, Agnieszka Mykowiecka, Piotr Rychlik Seminarium IPI PAN, 11 stycznia 2016 Zadanie Cel ekstrakcji terminologii: wydobycie
Małgorzata Marciniak, Agnieszka Mykowiecka, Piotr Rychlik Instytut Podstaw Informatyki PAN, Warszawa Malgorzata.Marciniak@ipipan.waw.pl, Agnieszka.Mykowiecka@ipipan.waw.pl, Piotr.Rychlik@ipipan.waw.pl
Narzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra
Narzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Witold Kieraś Łukasz Kobyliński Maciej Ogrodniczuk Instytut Podstaw Informatyki PAN III Konferencja DARIAH-PL Poznań 9.11.2016
Analiza danych tekstowych
Analiza danych tekstowych Łączenie informacji lingwistycznych i danych ilościowych Agnieszka Mykowiecka Instytut Podstaw Informatyki PAN Polsko-Japońska Akademia Technik Komputerowych http://zil.ipipan.waw.pl/agnieszkamykowiecka
Autoreferat. 2. Posiadane dyplomy i stopnie naukowe z podaniem nazwy, miejsca i roku ich uzyskania oraz tytułu rozprawy doktorskiej
Autoreferat 1. Imię i nazwisko Małgorzata Marciniak 2. Posiadane dyplomy i stopnie naukowe z podaniem nazwy, miejsca i roku ich uzyskania oraz tytułu rozprawy doktorskiej 1987: Dyplom studiów wyższych
Zaawansowane narzędzie do analizy korpusu w oparciu o reguły
CLARIN-PL Zaawansowane narzędzie do analizy korpusu w oparciu o reguły Michał Marcińczuk Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl 2015-04-13
Morfeusz 2 analizator i generator fleksyjny dla języka polskiego
Morfeusz 2 analizator i generator fleksyjny dla języka polskiego Marcin Woliński i Anna Andrzejczuk Zespół Inżynierii Lingwistycznej Instytut Podstaw Informatyki Polskiej Akademii Nauk Warsztaty CLARIN-PL,
Wstęp do Językoznawstwa
Wstęp do Językoznawstwa Prof. Nicole Nau UAM, IJ, Językoznawstwo Komputerowe Dziesiąte zajęcie 08.12.2015 Składnia: Co bada? Jak bada? Konstrukcja składniowa a) ciąg (zespół) form wyrazowych związanych
Wykład V. Rzut okiem na języki programowania. Studia Podyplomowe INFORMATYKA Podstawy Informatyki
Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład V Rzut okiem na języki programowania 1 Kompilacja vs. interpretacja KOMPILACJA Proces, który przetwarza program zapisany w języku programowania,
Indukcja reguł gramatyki j. polskiego
Indukcja reguł gramatyki języka polskiego dr inż. m.golebski@elka.pw.edu.pl Instytut Informatyki Politechnika Warszawska 25 lutego 2008 Plan prezentacji 1 Aktualny stan wiedzy 2 Wyniki badań D. Magermana
Instrukcja. 2. Zaloguj się na stronie: => Login => RESEARCHconnect International users => Login now
Instrukcja 1. Uzyskaj dostęp do systemu (konto, login) telefoniczna lub e-mailowa prośba do DAWP: +48 512 749 598 lub magdalena.lopuszanska-rusek@uj.edu.pl Ważne! Licencja zezwala na korzystanie z programu
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra
KORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.)
KORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.) Pracownia Historii Języka Polskiego XVII i XVIII wieku IJP PAN, Instytut Podstaw Informatyki PAN Podstawowe informacje o projekcie
WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp
WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp Natalia Kotsyba, IBI AL UW 24 marca 2010 Plan zajęć Praca domowa na zapytania do Korpusu IPI PAN za pomocą
ApSIC Xbench: Szybki start wydanie 1 2008-2015 Mariusz Stępień http://mariuszstepien.net/ http://www.facebook.com/mariuszstepien.
ApSIC Xbench jest darmowym i niezwykle przydatnym programem w pracy tłumacza pisemnego korzystającego z narzędzi CAT. Otóż pozwala on przeszukiwać posiadane pamięci tłumaczeniowe (TM) można szukać pojedynczych
Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE
Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu PNJA Gramatyka Praktyczna Kierunek Angielski Język Biznesu Forma studiów stacjonarne Poziom kwalifikacji I stopnia
System Korekty Tekstu Polskiego
Wnioski Grzegorz Szuba System Korekty Tekstu Polskiego Plan prezentacji Geneza problemu i cele pracy Opis algorytmu bezkontekstowego Opis algorytmów kontekstowych Wyniki testów Rozszerzenie pracy - uproszczona
Algorytmy i złożoności. Wykład 3. Listy jednokierunkowe
Algorytmy i złożoności Wykład 3. Listy jednokierunkowe Wstęp. Lista jednokierunkowa jest strukturą pozwalającą na pamiętanie danych w postaci uporzadkowanej, a także na bardzo szybkie wstawianie i usuwanie
KATEGORIA OBSZAR WIEDZY
Moduł 3 - Przetwarzanie tekstów - od kandydata wymaga się zaprezentowania umiejętności wykorzystywania programu do edycji tekstu. Kandydat powinien wykonać zadania o charakterze podstawowym związane z
Zadanie 1 Przygotuj algorytm programu - sortowanie przez wstawianie.
Sortowanie Dane wejściowe: ciąg n-liczb (kluczy) (a 1, a 2, a 3,..., a n 1, a n ) Dane wyjściowe: permutacja ciągu wejściowego (a 1, a 2, a 3,..., a n 1, a n) taka, że a 1 a 2 a 3... a n 1 a n. Będziemy
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2 ws.clarin-pl.eu/websty.shtml Tomasz Walkowiak, Maciej Piasecki Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej
KorBa. Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk
KorBa Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk ALLPPT.com _ Free PowerPoint Templates, Diagrams and Charts PODSTAWOWE
Włodzimierz Gruszczyński * Maciej Ogrodniczuk ** Marcin Woliński ** *IJP PAN **IPI PAN
Włodzimierz Gruszczyński * Maciej Ogrodniczuk ** Marcin Woliński ** *IJP PAN **IPI PAN Wystąpienie przygotowane w ramach projektu Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do roku 1772)
tomografia komputerowa
Badania obrazowe tomografia komputerowa Tomografia komputerowa, głowa lub mózg; bez kontrastu, z następującym podaniem środka kontrastującego Tomografia komputerowa, oczodół, siodło lub tylna jama lub
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Seminarium przetwarzania języka naturalnego Mateusz Kopeć Instytut Podstaw Informatyki Polskiej Akademii Nauk 6 lutego 2012 Plan 1 Zadanie
Windows XP - lekcja 3 Praca z plikami i folderami Ćwiczenia zawarte w tym rozdziale pozwolą na tworzenie, usuwanie i zarządzanie plikami oraz folderami znajdującymi się na dysku twardym. Jedną z nowości
NaCoBeZu na co będę zwracać uwagę. Nauka o języku
NaCoBeZu na co będę zwracać uwagę Komunikacja językowa: Nauka o języku znam pojęcia z zakresu komunikacji językowej: schemat komunikacyjny; nadawca; odbiorca; komunikat; kod; kontekst ; znaki niewerbalne
Spis treści tomu pierwszego
Spis treści tomu pierwszego WSTĘP.... 11 DŹWIĘK JAKO ZJAWISKO FIZYCZNE...15 CHARAKTERYSTYKA AKUSTYCZNA I AUDYTYWNA DŹWIĘKÓW MOWY.. 17 SŁUCH...20 WYŻSZE PIĘTRA UKŁADU SŁUCHOWEGO...22 EMISJE OTOAKUSTYCZNE...25
Programowanie komputerów
Programowanie komputerów Wykład 1-2. Podstawowe pojęcia Plan wykładu Omówienie programu wykładów, laboratoriów oraz egzaminu Etapy rozwiązywania problemów dr Helena Dudycz Katedra Technologii Informacyjnych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji
PRZEWODNIK PO PRZEDMIOCIE RODZAJ ZAJĘĆ LICZBA GODZIN W SEMESTRZE WYKŁAD ĆWICZENIA LABORATORIUM PROJEKT SEMINARIUM 30
Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu PNJA Gramatyka Praktyczna Kierunek Angielski Język Biznesu Forma studiów stacjonarne Poziom kwalifikacji I stopnia
SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie
Warszawa, Wiedza Powszechna 2007 Publikacja przygotowana w latach 2003 2006 w ramach projektu Słownik gramatyczny języka polskiego, sponsorowanego przez Komitet Badań Naukowych (nr rejestracyjny 2 H01D
I. Program II. Opis głównych funkcji programu... 19
07-12-18 Spis treści I. Program... 1 1 Panel główny... 1 2 Edycja szablonu filtrów... 3 A) Zakładka Ogólne... 4 B) Zakładka Grupy filtrów... 5 C) Zakładka Kolumny... 17 D) Zakładka Sortowanie... 18 II.
CZĘŚĆ A PIERWSZE KROKI Z KOMPUTEREM
CZĘŚĆ A PIERWSZE KROKI Z KOMPUTEREM 1.1. PODSTAWOWE INFORMACJE PC to skrót od nazwy Komputer Osobisty (z ang. personal computer). Elementy komputera można podzielić na dwie ogólne kategorie: sprzęt - fizyczne
jest dostępne na różne systemy operacyjne. Niniejsza instrukcja opisuje podstawowe operacje i opcje niezbędne do rozpoczęcia pracy w tym programie.
OmegaT to darmowe narzędzie CAT wykonane w technologii Java, dzięki czemu jest dostępne na różne systemy operacyjne. Niniejsza instrukcja opisuje podstawowe operacje i opcje niezbędne do rozpoczęcia pracy
Ekstrakcja informacji o zdarzeniach z tekstów dziedzinowych
Ekstrakcja informacji o zdarzeniach z tekstów dziedzinowych mgr inż. Michał Marcińczuk opiekun naukowy prof. Zbigniew Huzar Instytut Informatyki Stosowanej Politechnika Wrocławska 17 czerwca 2008 Plan
Definicja. Ciąg wejściowy: Funkcja uporządkowująca: Sortowanie polega na: a 1, a 2,, a n-1, a n. f(a 1 ) f(a 2 ) f(a n )
SORTOWANIE 1 SORTOWANIE Proces ustawiania zbioru elementów w określonym porządku. Stosuje się w celu ułatwienia późniejszego wyszukiwania elementów sortowanego zbioru. 2 Definicja Ciąg wejściowy: a 1,
Instrukcja uŝytkowania programu
PN Instrukcja uŝytkowania programu PIXEL Zakład Informatyki Stosowanej Bydgoszcz Poznań 2 Spis treści SPIS TREŚCI...2 1. URUCHOMIENIE PROGRAMU...3 2. LOGOWANIE OPERATORA DO PROGRAMU...3 3. OKNO GŁÓWNE
KARTA PRZEDMIOTU. 11. ZAŁOŻENIA I CELE PRZEDMIOTU: 1. umiejętność budowania poprawnych struktur zdaniowych oraz użycia poznanych
KARTA PRZEDMIOTU 1. NAZWA PRZEDMIOTU: PNJA- gramatyka praktyczna 2. KIERUNEK: Nauczanie języka angielskiego na poziomie wczesnoszkolnym 3. POZIOM STUDIÓW: studia podyplomowe 4. ROK/ SEMESTR STUDIÓW: rok
Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów
Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów Maciej Piasecki, Jan Kocoń Politechnika Wrocławska Katedra InteligencjiObliczeniowej Grupa
KARTA PRZEDMIOTU. 1. Wypracowanie przez studenta umiejętności budowania poprawnych struktur
Załącznik Nr 1 KARTA PRZEDMIOTU 1. NAZWA PRZEDMIOTU: PNJA- gramatyka praktyczna języka angielskiego 2. KIERUNEK: filologia, specjalność filologia angielska 3. POZIOM STUDIÓW: studia pierwszego stopnia
1. Opis okna podstawowego programu TPrezenter.
OPIS PROGRAMU TPREZENTER. Program TPrezenter przeznaczony jest do pełnej graficznej prezentacji danych bieżących lub archiwalnych dla systemów serii AL154. Umożliwia wygodną i dokładną analizę na monitorze
ToonDoo Maker tworzenie pojedynczej sceny komiksowej
ToonDoo Maker tworzenie pojedynczej sceny komiksowej ToonDoo Maker to narzędzie, które służy do tworzenia pojedynczych scen komiksowych. Można do niego przejść z trzech miejsc: z menu ToonDoos wybierając
Rozdział ten zawiera informacje o sposobie konfiguracji i działania Modułu OPC.
1 Moduł OPC Moduł OPC pozwala na komunikację z serwerami OPC pracującymi w oparciu o model DA (Data Access). Dzięki niemu można odczytać stan obiektów OPC (zmiennych zdefiniowanych w programie PLC), a
2.2. Gramatyki, wyprowadzenia, hierarchia Chomsky'ego
2.2. Gramatyki, wyprowadzenia, hierarchia Chomsky'ego Gramatyka Gramatyką G nazywamy czwórkę uporządkowaną G = gdzie: N zbiór symboli nieterminalnych, T zbiór symboli terminalnych, P zbiór
W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji.
5 Collocations Związek frazeologiczny (kolokacja), to często używane zestawienie słów. Przykłady: strong tea, weapons of mass destruction, make up. Znaczenie całości wyrażenia, nie zawsze wynika ze znaczeń
Instrukcja użytkownika Internetowej Platformy Edukacyjnej UPRP
Instrukcja użytkownika Internetowej Platformy Edukacyjnej UPRP Spis treści 1. Wymagania techniczne 3 2. Dostęp do platformy 4 3. Rejestracja 5 4. Logowanie 7 5. Logowanie portale społecznościowe 9 6. Strona
WPROWADZENIE do Otwartego Systemu Antyplagiatowego
WPROWADZENIE do Otwartego Systemu Antyplagiatowego opracowanie: dr Natalia Kohtamäki WPiA UKSW system nie stwierdza wprost, czy praca jest plagiatem. Oceny dokonuje Promotor pracy na podstawie raportu
PRZEWODNIK PO ETRADER PEKAO ROZDZIAŁ XVIII. ANALIZY I KOMENTARZE SPIS TREŚCI
PRZEWODNIK PO ETRADER PEKAO ROZDZIAŁ XVIII. ANALIZY I KOMENTARZE SPIS TREŚCI 1. OPIS OKNA 3 2. OTWIERANIE OKNA 3 3. ZAWARTOŚĆ OKNA 4 3.1. POZIOMY PASEK ZARZĄDZANIA 5 3.2. LISTA KATEGORII 5 3.3. LISTA MATERIAŁÓW
Data wydania: 2013-06-12. Projekt współfinansowany przez Unię Europejską ze środków Europejskiego Funduszu Społecznego
Wersja 1.0 Projekt współfinansowany przez Unię Europejską ze środków Europejskiego Funduszu Społecznego w ramach Programu Operacyjnego Kapitał Ludzki Tytuł dokumentu: Dokumentacja dla niezalogowanego użytkownika
Eksploracja Zasobów Internetu
document accents, spacing, etc. stopwords noun groups stemming automatic or manual indexing structure recognition structure full text index terms When Google encounters a hyphen ( ) in a query term, e.g.,
SPIS TREŚCI. Spis treści Wstęp Wykaz skrótów, symboli i terminów gramatycznych MIANOWNIK
5 SPIS TREŚCI Spis treści... 5-12 Wstęp... 13-14 Wykaz skrótów, symboli i terminów gramatycznych... 15-16 MIANOWNIK... 17-65 TABELA prezentująca końcówki fleksyjne rzeczowników... 17 RZECZOWNIK, PRZYMIOTNIK...
Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2019/2020
Politechnika Krakowska im. Tadeusza Kościuszki Karta przedmiotu obowiązuje studentów rozpoczynających studia w roku akademickim 2019/2020 Kierunek studiów: Wszystkie kierunki Forma sudiów: stacjonarne
Lokalizacja Oprogramowania
mgr inż. Anton Smoliński anton.smolinski@zut.edu.pl Lokalizacja Oprogramowania 16/12/2016 Wykład 6 Internacjonalizacja, Testowanie, Tłumaczenie Maszynowe Agenda Internacjonalizacja Testowanie lokalizacji
Materiały dla finalistów
Materiały dla finalistów Malachoviacus Informaticus 2016 11 kwietnia 2016 Wprowadzenie Poniższy dokument zawiera opisy zagadnień, które będą niezbędne do rozwiązania zadań w drugim etapie konkursu. Polecamy
KARTA PRZEDMIOTU. 11. ZAŁOŻENIA I CELE PRZEDMIOTU: 1. umiejętność budowania poprawnych struktur zdaniowych oraz użycia poznanych
KARTA PRZEDMIOTU 1. NAZWA PRZEDMIOTU: PNJA- gramatyka praktyczna 2. KIERUNEK: nauczanie języka angielskiego na poziomie wczesnoszkolnym 3. POZIOM STUDIÓW: studia podyplomowe 4. ROK/ SEMESTR STUDIÓW: rok
Zastosowanie metod statystycznych do ekstrakcji słów kluczowych w kontekście projektu LT4eL. Łukasz Degórski
Zastosowanie metod statystycznych do ekstrakcji słów kluczowych w kontekście projektu LT4eL Łukasz Degórski LT4eL Language Technology for e-learning Wykorzystanie narzędzi językowych oraz technik sieci
NARZĘDZIA Narzędzia Narzędzia
- 1 - NARZĘDZIA Aby uruchomić menu programu należy Wskazać myszką podmenu Narzędzia a następnie nacisnąć lewy przycisk myszki lub Wcisnąć klawisz (wejście do menu), następnie klawiszami kursorowymi
Instrukcja obsługi Zaplecza epk w zakresie zarządzania tłumaczeniami opisów procedur, publikacji oraz poradników przedsiębiorcy
Instrukcja obsługi Zaplecza epk w zakresie zarządzania tłumaczeniami opisów procedur, publikacji oraz poradników przedsiębiorcy Spis treści: 1 WSTĘP... 3 2 DOSTĘP DO SYSTEMU... 3 3 OPIS OGÓLNY SEKCJI TŁUMACZENIA...
Analiza i projektowanie obiektowe 2017/2018. Wykład 3: Model wiedzy dziedzinowej
Analiza i projektowanie obiektowe 2017/2018 Wykład 3: Model wiedzy dziedzinowej Jacek Marciniak Wydział Matematyki i Informatyki Uniwersytet im. Adama Mickiewicza 1 Plan wykładu 1. Model wiedzy dziedzinowej
Układ moczowy. Przypadki kliniczne
Układ moczowy Przypadki kliniczne 2015-2016 Przypadek 1 Case courtesy of Dr Frank Gaillard rid: 16699 Mężczyzna, 40 lat lewostronna kolka brzuszna Ból w okolicy lędźwiowej Pytanie 1 Podaj prawdopodobne
Aktualizacja 2008.00.2.2
Aktualizacja 2008.00.2.2 środa, 22 lipca 2009 Uwagi Przed każdą aktualizacją, zalecane jest zrobienie kopii bezpieczeństwa bazy Informujemy również o ukazaniu się kolejnego numeru bezpłatnego periodyku
Bydgoskie Centrum Archiwizacji Cyfrowej sp. z o.o.
STRONA GŁÓWNA ` Usługa earchiwizacja.pl przeznaczona jest zarówno dla osób indywidualnych, jak i firm. Wykorzystuje zasadę przetwarzania danych w chmurze. Pozwala to na dostęp do własnej bazy dokumentów
Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych
Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych Rafał Walkowiak Politechnika Poznańska Studia inżynierskie Informatyka 2014/15 Znajdowanie maksimum w zbiorze
Biblioteka Wirtualnej Nauki
Biblioteka Wirtualnej Nauki BAZA EBSCO EBSCO Publishing oferuje użytkownikom w Polsce dostęp online do pakietu podstawowego baz danych w ramach projektu Electronic Information for Libraries Direct eifl
ROZPOCZĘCIE PRACY Z PLATFORMĄ INFRONT
ROZPOCZĘCIE PRACY Z PLATFORMĄ INFRONT Pierwszym krokiem jest uzyskanie dostępu do danych rynkowych w celu pobrania aktualnych notowań spółek. Możesz to zrobić wybierając opcję Preferencje z menu Narzędzia.
Myśl w języku Python! : nauka programowania / Allen B. Downey. Gliwice, cop Spis treści
Myśl w języku Python! : nauka programowania / Allen B. Downey. Gliwice, cop. 2017 Spis treści Przedmowa 11 1. Jak w programie 21 Czym jest program? 21 Uruchamianie interpretera języka Python 22 Pierwszy
SYLLABUS. Gramatyka kontrastywna 1 i 2
SYLLABUS L p. Element Nazwa Typ Opis Gramatyka kontrastywna i obowiązkowy 3 Instytut Nauk Humanistyczno-Społecznych i Turystyki 4 5 Kod Kierunek, specjalność, poziom i profil PPWSZ-FA--343t-s PPWSZ-FA--343t-n
Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur
Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur Maciej Piasecki, Paweł Kędzia Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Plan prezentacji
Narzędzia NLP Wzmocniona ekstrakcja relacji IS-A na bazie przypadka gramatycznego. System NEKST - wykorzystanie narzędzi NLP
Outline 1 Narzędzia NLP Analiza morfosyntaktyczna Rozpoznawanie nazw własnych Wykrywanie fraz rzeczownikowych/czasownikowych Parsowanie zależnościowe Wykrywanie Question Focus 2 Wzmocniona ekstrakcja relacji
Logowanie do systemu. Rys. 1 Strona logowania
Spis treści Logowanie do systemu... 2 Dostępne operacje... 3 Zarządzanie dokumentami... 4 Zarządzanie katalogami... 4 Dodawanie dokumentów do analizy... 4 Uzupełnianie dodatkowego opisu dokumentu... 5
Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex
Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA ŁACIŃSKIEGO
PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA ŁACIŃSKIEGO FORMY KONTROLI PRACY UCZNIÓW 1. KONTROLA BIEŻĄCA PREZENTACJA ZADAŃ WYKONANYCH W GRUPIE ( OCENY KOLORU ZIELONEGO WAGA 1,00 ) ODPOWIEDŹ USTNA ( OCENY KOLORU
Wyszukiwanie w Katalogu Bibliotek PW za pomocą multiwyszukiwarki Primo
Wyszukiwanie w Katalogu Bibliotek PW za pomocą multiwyszukiwarki Primo Aby znaleźć potrzebne książki i czasopisma, skorzystaj ze wspólnego katalogu Biblioteki Głównej, jej filii oraz większości bibliotek
NIE nowotworom u dzieci
NIE nowotworom u dzieci Ogólnopolski Program Przesiewowych Badań Ultrasonograficznych Fundacji Ronalda McDonalda realizowany na pokładzie specjalistycznego ambulansu Zestawienie wyników badań przeprowadzonych
Analiza danych tekstowych i języka naturalnego
Kod szkolenia: Tytuł szkolenia: ANA/TXT Analiza danych tekstowych i języka naturalnego Dni: 3 Opis: Adresaci szkolenia Dane tekstowe stanowią co najmniej 70% wszystkich danych generowanych w systemach
Program warsztatów CLARIN-PL
W ramach Letniej Szkoły Humanistyki Cyfrowej odbędzie się III cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Narzędzia cyfrowe do analizy języka w naukach humanistycznych i społecznych 17-19
Mariusz Piotrowski Węzeł Centralny OŻK- SB
Mariusz Piotrowski Węzeł Centralny OŻK- SB Analiza frekwencyjna słów używanych w dokumentach JST na przykładzie Strategia marki i promocji miasta Augustowa w latach 2010-2015. Instrukcja użytkowania programu
UWAGA!!! Przed przystąpieniem do zamknięcia roku proszę zrobić kopie bezpieczeństwa
UWAGA!!! Przed przystąpieniem do zamknięcia roku proszę zrobić kopie bezpieczeństwa Następnie należy sprawdzić czy w KOLFK w Słownik i-> Dokumenty-> znajduje się dokument BO- Bilans Otwarcia (w grupie
Przewodnik użytkownika (instrukcja) AutoMagicTest
Przewodnik użytkownika (instrukcja) AutoMagicTest 0.1.21.137 1. Wprowadzenie Aplikacja AutoMagicTest to aplikacja wspierająca testerów w testowaniu i kontrolowaniu jakości stron poprzez ich analizę. Aplikacja
Kryteria ocen z języka polskiego w klasie 4. Ocenę celującą - otrzymuje uczeń, którego wiedza znacznie przekracza poza obowiązujący program nauczania:
Kryteria ocen z języka polskiego w klasie 4 Ocenę celującą - otrzymuje uczeń, którego wiedza znacznie przekracza poza obowiązujący program nauczania: Bierze udział i osiąga sukcesy w konkursach szkolnych
Sentinel Playground. Aplikacja dostępna jest pod adresem internetowym: Ogólne informacje o aplikacji
Sentinel Playground Sentinel Playground jest aplikacją internetową służącą do przeglądania, analizy i oceny zobrazowań satelitarnych Sentinel-2 oraz od niedawna również Landsat 8 i MODIS. Prezentuje dane
OSA OTWARTY SYSTEM ANTYPLAGIATOWY
OSA OTWARTY SYSTEM ANTYPLAGIATOWY Kontrola antyplagiatowa pisemnych prac na Uniwersytecie Mikołaja Kopernika w Toruniu Mariusz Czerniak Plan prezentacji Informacje o systemie OSA Kontrola wstępnych wersji
Sylabus Moduł 2: Przetwarzanie tekstów
Sylabus Moduł 2: Przetwarzanie tekstów Niniejsze opracowanie przeznaczone jest dla osób zamierzających zdać egzamin ECDL (European Computer Driving Licence) na poziomie podstawowym. Publikacja zawiera
Metody Kompilacji Wykład 8 Analiza Syntaktyczna cd. Włodzimierz Bielecki WI ZUT
Metody Kompilacji Wykład 8 Analiza Syntaktyczna cd Analiza Syntaktyczna Wstęp Parser dostaje na wejściu ciąg tokenów od analizatora leksykalnego i sprawdza: czy ciąg ten może być generowany przez gramatykę.
KRYTERIA WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY Z JĘZYKA FRANCUSKIEGO
KRYTERIA WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY Z JĘZYKA FRANCUSKIEGO Ocena dopuszczająca dostateczna dobra i gramatyka Uczeń dysponuje niewielkim zakresem i struktur gramatycznych. Ma problemy z budową
Instrukcja obsługi wewnętrznej poczty mmedica
ul. Kartuska 135C 80-138 GDAŃSK tel./fax. (+48 58) 344 04 15 http://www.maxcon.pl Gdańsk, 26.11.2015 Dokument sporządził: Krzysztof A. Michalski tel.: (+48) 691 748 679 k.michalski@maxcon.pl Instrukcja
Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich
Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich Adam Radziszewski Instytut Informatyki Stosowanej PWr SIIS 23, 12 czerwca 2008 O
Informatyka I. Wykład 4. Tablice. Dr inż. Andrzej Czerepicki. Politechnika Warszawska Wydział Transportu 2018
Informatyka I Wykład 4. Tablice. Dr inż. Andrzej Czerepicki Politechnika Warszawska Wydział Transportu 2018 Tablice Tablica uporządkowany zbiór elementów określonego typu Każdy element tablicy posiada
CLARIN rozproszony system technologii językowych dla różnych języków europejskich
CLARIN rozproszony system technologii językowych dla różnych języków europejskich Maciej Piasecki Politechnika Wrocławska Instytut Informatyki G4.19 Research Group maciej.piasecki@pwr.wroc.pl Projekt CLARIN
Torbiele przymiedniczkowe nie mogą być mylone z wodonerczem i torbielami okołomiedniczkowymi.
Torbiele przymiedniczkowe nie mogą być mylone z wodonerczem i torbielami okołomiedniczkowymi. Przypadek kliniczny 9 Case courtesy of Dr Ahmed Abd Rabou rid: 24528 Dziewczynka, 8 lat Bóle w lewej okolicy
Wstęp do programowania INP001213Wcl rok akademicki 2017/18 semestr zimowy. Wykład 13. Karol Tarnowski A-1 p.
Wstęp do programowania INP001213Wcl rok akademicki 2017/18 semestr zimowy Wykład 13 Karol Tarnowski karol.tarnowski@pwr.edu.pl A-1 p. 411B Plan prezentacji (1) Złożoność algorytmów czy to istotne, skoro
Flex.CRM (contact relation management) System do zarządzania kontaktami
roku Profesjonalne rozwiązania programistyczne od 1995 Flex.CRM (contact relation management) System do zarządzania kontaktami Co to jest CRM? Flex.CRM jest zintegrowanym z systemem Flex Dms modułem umożliwiającym
Wersja z dnia
OPW Doskomp Sp. z o.o. Telefon 042 683 26 77 ul. Piotra Skargi 12, 93-036 Łódź Faks 042 683 26 80 www.doskomp.com.pl office@doskomp.com.pl www.doskomp.jst.pl plus@doskomp.lodz.pl System Planowania, Prognozowania