Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
|
|
- Gabriel Kaźmierczak
- 8 lat temu
- Przeglądów:
Transkrypt
1 Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 marek.maziarz@pwr.edu.pl maciej.piasecki@pwr.edu.pl michal.wendelberger@pwr.edu.pl
2 Plan prezentacji
3 Plan prezentacji Wrocław V Wstęp 2. Wydobywanie kolokacji 3. Kolokacje w aplikacji MeWeX 4. Definiowanie jednostek leksykalnych 5. Jednostki leksykalne w aplikacji MeWeX 6. Podsumowanie
4 Wstęp
5 Wstęp Wrocław V 2015 Cel: Słownik wielowyrazowych jednostek leksykalnych Definicja: Wielowyrazowa jednostka leksykalna czym jest? Metoda: Dwie drogi Zachód to kolokacje, Wschód - kryteria Wychodzimy od kolokacji, które wydobywamy w sposób automatyczny, ale oceniamy za pomocą kryteriów lingwistycznych.
6 Automatyczna ekstrakcja kolokacji z korpusu tekstów Wrocław V 2015
7 Schemat przetwarzania Wrocław V 2015
8 Korpus tekstowy Wrocław V 2015 Zbiór tekstów wraz z zestawem metadanych. Pożądane cechy: reprezentatywność, zachowanie podziału na zdania, wyrazy i segmenty. Zawartość: formy bazowe, napotkane, opis morfologiczny, dodatkowe anotacje.
9 Plik z korpusem (format CCL) Wrocław V 2015
10 Definicja kolokacji Wrocław V 2015 Często zaobserwowane i nieprzypadkowe połączenie słów występujących w bliskim sąsiedztwie. Przykłady interesujących kolokacji: białe wino (ciągła), czerwona kartka (ciągła), nabić [komuś] guza (nieciągła, 1, 2,...)
11 Siła kolokacji Wrocław V 2015 Kolokacją silną jest takie współwystąpienie słów, które według danej miary ma dużą szansę na bycie jednostką wielowyrazową. ciężarowy samochód samochód ciężarowy czerwony czerwony samochód samochód
12 Siła kolokacji Wrocław V 2015 Kolokacją silną jest takie współwystąpienie słów, które według danej miary ma dużą szansę na bycie jednostką wielowyrazową. ciężarowy ciężarowy samochód samochód X 2 = 65,4 czerwony czerwony samochód samochód X 2 = 17,4
13 Ocena nieprzypadkowości Wrocław V 2015 Nieprzypadkowość (siłę) kolokacji mierzyć można różnymi sposobami. Metody te różnią się od siebie podejściem do rozwiązania problemu, ilością potrzebnych danych, złożonością pamięciową i obliczeniową.
14 Więcej o miarach Wrocław V 2015 Funkcje statystyczne: Pointwise Mutual Dependency, Mutual Dependency, Frequency Biased MD, Mutual Expectation, Unigram Subtuples... Testy statystyczne: X 2 Persona, Loglikelihood, TScore, ZScore... Miary szyku: W Order...
15 Więcej o miarach cz. 2 Wrocław V 2015 Miary kontekstowe: więcej informacji, dane pochodzące także z otoczenia kolokacji, funkcje wykorzystujące także kontekst oprócz danych statystycznych dotyczących częstości. Funkcje wektorowe: kombinacje miar, dobór miar, sposób łączenia rankingów, metody przepunktowywania, możliwość stosowania innych miar wektorowych lub klasyfikatorów jako składowych. Metody maszynowego uczenia: dobór cech wyniki miar, sposób przygotowania cech do klasyfikacji.
16 Filtrowanie danych Wrocław V 2015 Filtry statystyczne: częstości, bardziej skomplikowane filtry (entropia, wariancja, ) jeśli zachowane są konteksty. Filtry językowe: trudniejsze, wiedza dziedzinowa, mniejsza ogólność międzyjęzykowa, oparte o części mowy (typy strukturalne), np. operatory języka ograniczeń WCCL. Funkcje dyspersji: względna prostota zastosowania, wymaga zbioru korpusów.
17 Operator języka WCCL Grupa operatorów Rozmiar operatora
18 Funkcje dyspersji Wrocław V 2015 Zadania: zmiana rozkładu danych statystycznych, wstępne wyznaczenie potencjalnie interesujących kolokacji, element filtrowania, Przykład popularnej funkcji: TF-IDF. F w korpusie 1 F w korpusie 2 F w korpusie 3 Suma Nowa częstość , , ,97
19 Zestawienie przykładowych wyników ekstrakcji kolokacji Wrocław V 2015
20 MeWeX Wrocław V 2015
21 Kilka zrzutów ekranu z aplikacji Wrocław V 2015
22 Kilka zrzutów ekranu z aplikacji Wrocław V 2015
23 Czas na wydobycie Wrocław V 2015
24 Przykładowe wyniki Wrocław V 2015
25 Przykładowe wyniki Wrocław V 2015
26 Przykładowe wyniki Wrocław V 2015
27 Przykładowe wyniki Wrocław V 2015
28 Przykładowe wyniki
29 Wielowyrazowe jednostki leksykalne Wrocław V 2015
30 Wielowyrazowa jednostka leksykalna (WJL) Wrocław V 2015 Dwa podejścia DEF. 1. takie połączenie wyrazowe, które jest przechowywane w naszym mentalnym leksykonie jako jednostka, całostka semantyczna i którego to połączenia nie musimy składać na bieżąco w tekście, tylko przywołujemy je z pamięci Svensen 2009, Murphy 2003, Laskowski 1999, Jackendoff 1997 DEF. 2. takie połączenie wyrazowe, którego znaczenia nie jesteśmy w stanie zrekonstruować na podstawie znaczeń elementów składowych Sinclair 1998, Weigand 1998, Malmkjaer 1991
31 Wielowyrazowa jednostka leksykalna (WJL) Wrocław V 2015 Dwa podejścia DEF. 1. takie połączenie wyrazowe, które jest przechowywane w naszym mentalnym leksykonie jako jednostka, całostka semantyczna i którego to połączenia nie musimy składać na bieżąco w tekście, tylko przywołujemy je z pamięci Svensen 2009, Murphy 2003, Laskowski 1999, Jackendoff 1997 DEF. 2. takie połączenie wyrazowe, którego znaczenia nie jesteśmy w stanie zrekonstruować na podstawie znaczeń elementów składowych Sinclair 1998, Weigand 1998, Malmkjaer 1991
32 WJL kryteria Wrocław V 2015 Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką),
33 WJL kryteria Wrocław V 2015 Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika),
34 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres),
35 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku),
36 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki),
37 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki), ü składniowe i fleksyjne nieregularności:
38 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki), ü składniowe i fleksyjne nieregularności: nieseparowalność (*przemysł bardzo ciężki),
39 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki), ü składniowe i fleksyjne nieregularności: nieseparowalność (*przemysł bardzo ciężki), ustalony szyk (jaszczurka zielona 'Lacerta viridis' ~ zielona jaszczurka),
40 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki), ü składniowe i fleksyjne nieregularności: nieseparowalność (*przemysł bardzo ciężki), ustalony szyk (jaszczurka zielona 'Lacerta viridis' ~ zielona jaszczurka), swoista odmiana lub brak odmiany (nabić guza, wyjść za mąż, do sucha),
41 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki), ü składniowe i fleksyjne nieregularności: nieseparowalność (*przemysł bardzo ciężki), ustalony szyk (jaszczurka zielona 'Lacerta viridis' ~ zielona jaszczurka), swoista odmiana lub brak odmiany (nabić guza, wyjść za mąż, do sucha), ü swoisty akcent (náraz 'nagle' na ráz [dwa, trzy]),
42 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia:
43 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy),
44 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka),
45 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet),
46 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet), l istnienie jednowyrazowego derywatu (uniwerbizacja: podstawówka < szkoła podstawowa),
47 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet), l istnienie jednowyrazowego derywatu (uniwerbizacja: podstawówka < szkoła podstawowa),
48 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet), l istnienie jednowyrazowego derywatu (uniwerbizacja: podstawówka < szkoła podstawowa), l istnienie w innym języku odpowiednika jednowyrazowego (zachód słońca sunset),
49 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet), l istnienie jednowyrazowego derywatu (uniwerbizacja: podstawówka < szkoła podstawowa), l istnienie w innym języku odpowiednika jednowyrazowego (zachód słońca sunset), ü bycie terminem (jaszczurka zielona),
50 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet), l istnienie jednowyrazowego derywatu (uniwerbizacja: podstawówka < szkoła podstawowa), l istnienie w innym języku odpowiednika jednowyrazowego (zachód słońca sunset), ü bycie terminem (jaszczurka zielona), ü występowanie w słownikach (hala maszyn jest notowana w
51 WJL kryteria Kryteria û nie są niezależne od siebie, û nie tworzą spójnego systemu klasyfikacji, û silnie zależą od intuicji, û są argumentami post hoc gdy decyzja już została podjęta.
52 WJL kryteria Kryteria û nie są niezależne od siebie, û nie tworzą spójnego systemu klasyfikacji, û silnie zależą od intuicji, û są argumentami post hoc gdy decyzja już została podjęta. System zbudowany na niekompozycyjności ü jedyno kryterium ü (zamiast systemu kryteriów), û zależy od definicji niekompozycyjności, ü decyzja podejmowana jest na podstawie analizy semantycznej, û założenie a priori: leksykalność = niekompozycyjność.
53 WJL kryteria System zbudowany na wielu kryteriach ü Brak założenia a priori: leksykalność = niekompozycyjność. ü Ale jak zbudować spójny system?
54 WJL system kryteriów System zbudowany na wielu kryteriach 14 osób
55 WJL system kryteriów System zbudowany na wielu kryteriach DEF. 1. takie połączenie wyrazowe, które jest przechowywane w naszym mentalnym leksykonie jako jednostka, całostka semantyczna i którego to połączenia nie musimy składać na bieżąco w tekście, tylko przywołujemy je z pamięci Svensen 2009, Murphy 2003, Laskowski 1999, Jackendoff 1997
56 WJL system kryteriów System zbudowany na wielu kryteriach połączenie TAK NIE WJL? maszyna do szycia 13 1 pies Marka 0 14
57 WJL system kryteriów System zbudowany na wielu kryteriach połączenie TAK NIE WJL? maszyna do szycia 13 1!" pies Marka 0 14 #"
58 WJL system kryteriów System zbudowany na wielu kryteriach 14 osób DEF połączeń (varia)
59 WJL system kryteriów System zbudowany na wielu kryteriach 14 osób 5 osób DEF. 1. DEF połączeń (varia) 200 połączeń ze Słowosieci 5 osób DEF kolokacji typu N+Adj
60 WJL system kryteriów System zbudowany na wielu kryteriach DEF połączeń (varia) KRYTERIA (10) DEF połączeń ze Słowosieci DEF kolokacji typu N+Adj
61 WJL system kryteriów System zbudowany na wielu kryteriach DEF połączeń (varia) autor Wyraz uwięziony Szyk swobodny pies Marka (14 x NIE) Termin Metaforyczność Separowalność Specjalistyczność Kompozycyjność Parafraza #1 #"!"!" #" #" #"!"!" #2 #"!" #" #" #" #"!"!"
62 WJL system kryteriów System zbudowany na wielu kryteriach DEF połączeń (varia) autor Wyraz uwięziony Szyk swobodny pies Marka (14 x NIE) Termin Metaforyczność Parafraza #1 #"!"!" #" #" #"!"!" #2 #"!" #" #" #" #"!"!" autor Wyraz uwięziony maszyna do szycia (13 x TAK, 1 x NIE) Szyk swobodny Termin Metaforyczność Separowalność Specjalistyczność Kompozycyjność Separowalność Specjalistyczność Kompozycyjność Parafraza #1 #" #"!" #" #"!" #" #" #2 #"!"!" #" #" #"!" #"
63 WJL system kryteriów System zbudowany na wielu kryteriach DEF połączeń (varia) autor Wyraz uwięziony Szyk swobodny pies Marka (14 x NIE) Termin Metaforyczność Parafraza #1 #"!"!" #" #" #"!"!" #2 #"!" #" #" #" #"!"!" autor Wyraz uwięziony maszyna do szycia (13 x TAK, 1 x NIE) Szyk swobodny Termin Metaforyczność Separowalność Specjalistyczność Kompozycyjność Separowalność Specjalistyczność Kompozycyjność Parafraza #1 #" #"!" #" #"!" #" #" #2 #"!"!" #" #" #"!" #"
64 WJL system kryteriów System zbudowany na wielu kryteriach DEF połączeń (varia) autor Wyraz uwięziony Szyk swobodny pies Marka (14 x NIE) Termin Metaforyczność Parafraza #1 #"!"!" #" #" #"!"!" #2 #"!" #" #" #" #"!"!" autor Wyraz uwięziony maszyna do szycia (13 x TAK, 1 x NIE) Szyk swobodny Termin Metaforyczność Separowalność Specjalistyczność Kompozycyjność Separowalność Specjalistyczność Kompozycyjność Parafraza #1 #" #"!" #" #"!" #" #" #2 #"!"!" #" #" #"!" #"
65 WJL system kryteriów System zbudowany na wielu kryteriach KRYTERIA (10) DEF połączeń (varia)
66 WJL system kryteriów System zbudowany na wielu kryteriach KRYTERIA (10) DEF. 1.
67 WJL system kryteriów System zbudowany na wielu kryteriach KRYTERIA (10) DEF. 1.
68 WJL system kryteriów System zbudowany na wielu kryteriach
69 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ
70 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ Nazwa własna? Wyraz uwięziony? Niepoprawna fraza?
71 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ Część mowy - rzeczownik - przymiotnik - czasownik - przysłówek
72 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ TERMIN?
73 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? #
74 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA?
75 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA?!" N+Adj? # WJL
76 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? #!" N+Adj?!" # WJL
77 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? nie-wjl #!" N+Adj? # WJL!" SEPAROWALNOŚĆ?
78 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? nie-wjl #!" N+Adj? # WJL!" SEPAROWALNOŚĆ?!" #
79 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? nie-wjl #!" N+Adj? # WJL!" SEPAROWALNOŚĆ?!" SZYK USTALONY? # WJL
80 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? nie-wjl #!" N+Adj? # WJL!" SEPAROWALNOŚĆ?!" SZYK USTALONY? # WJL!" #
81 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? nie-wjl #!" N+Adj? # WJL!" SEPAROWALNOŚĆ?!" SZYK USTALONY? # WJL!" # WJL nie-wjl
82 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMINY TERMIN? # PARAFRAZA? nie-wjl #!" N+Adj?!" # JEDNOSTKI NIEKOMPO- ZYCYJNE SEPAROWALNOŚĆ?!" SZYK USTALONY? # ZESTAWIENIA!" # ZESTAWIENIA nie-wjl
83 MeWeX jednostki leksykalne
84 MeWeX jednostki leksykalne
85 MeWeX jednostki leksykalne
86 MeWeX jednostki leksykalne
87 MeWeX jednostki leksykalne
88 MeWeX jednostki leksykalne
89 MeWeX jednostki leksykalne
90 MeWeX jednostki leksykalne
91 MeWeX jednostki leksykalne
92 MeWeX jednostki leksykalne
93 MeWeX jednostki leksykalne
94 MeWeX jednostki leksykalne
95 MeWeX jednostki leksykalne Typ strukturalny decyzja urobek
96 MeWeX jednostki leksykalne Typ strukturalny decyzja urobek
97 Podsumowanie
98 Podsumowanie dwie drogi Językoznawstwo korpusowe i frazeologia Punkt wyjścia: korpus i kolokacje Cel: jednostki leksykalne frazeologizmy terminy zestawienia Środek: aplikacja MeWeX
99 Dziękujemy bardzo za uwagę
Narzędzia do wydobywania słowników związków frazeologicznych i terminów
Narzędzia do wydobywania słowników związków frazeologicznych i terminów Marek Maziarz, Michał Wendelberger Politechnika Wrocławska Instytut Informatyki Grupa Naukowa G4.19 marek.maziarz@pwr.edu.pl michal.wendelberger@pwr.edu.pl
Bardziej szczegółowoNarzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
Bardziej szczegółowoNarzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
Bardziej szczegółowoNarzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra
Bardziej szczegółowoNarzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra
Bardziej szczegółowoProgram warsztatów CLARIN-PL
W ramach Letniej Szkoły Humanistyki Cyfrowej odbędzie się III cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Narzędzia cyfrowe do analizy języka w naukach humanistycznych i społecznych 17-19
Bardziej szczegółowoOpen Access w technologii językowej dla języka polskiego
Open Access w technologii językowej dla języka polskiego Marek Maziarz, Maciej Piasecki Grupa Naukowa Technologii Językowych G4.19 Zakład Sztucznej Inteligencji, Instytut Informatyki, W-8, Politechnika
Bardziej szczegółowoSłowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowania
Słowosiec 3.2 - leksykalna siec semantyczna je zyka polskiego i jej zastosowania Poziom rozszerzony Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 agnieszka.dziob@pwr.edu.pl
Bardziej szczegółowoLingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot
Bardziej szczegółowoKorpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Witold Kieraś Łukasz Kobyliński Maciej Ogrodniczuk Instytut Podstaw Informatyki PAN III Konferencja DARIAH-PL Poznań 9.11.2016
Bardziej szczegółowoCLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy
Cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy 13 15 kwietnia 2015 roku Warszawa, Pałac Staszica, ul. Nowy Świat 72, sala 144
Bardziej szczegółowoLokalizacja Oprogramowania
mgr inż. Anton Smoliński anton.smolinski@zut.edu.pl Lokalizacja Oprogramowania 16/12/2016 Wykład 6 Internacjonalizacja, Testowanie, Tłumaczenie Maszynowe Agenda Internacjonalizacja Testowanie lokalizacji
Bardziej szczegółowoII cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych
II cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych 18-20 maja 2015 roku Politechnika Wrocławska, Centrum Kongresowe,
Bardziej szczegółowoCLARIN rozproszony system technologii językowych dla różnych języków europejskich
CLARIN rozproszony system technologii językowych dla różnych języków europejskich Maciej Piasecki Politechnika Wrocławska Instytut Informatyki G4.19 Research Group maciej.piasecki@pwr.wroc.pl Projekt CLARIN
Bardziej szczegółowoI. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ?... 13 II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY...
I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ?.... 13 II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY............ 17 1. Niepowtarzalność języka każdego z nas.................. 17 1.1. Nasz język indywidualny...........................
Bardziej szczegółowoNarzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur
Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur Maciej Piasecki, Paweł Kędzia Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Plan prezentacji
Bardziej szczegółowoWebSty otwarty webowy system do analiz stylometrycznych
WebSty otwarty webowy system do analiz stylometrycznych Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 maciej.piasecki@pwr.edu.pl
Bardziej szczegółowoEkstrakcja informacji oraz stylometria na usługach psychologii Część 2
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2 ws.clarin-pl.eu/websty.shtml Tomasz Walkowiak, Maciej Piasecki Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej
Bardziej szczegółowoForma. Główny cel kursu. Umiejętności nabywane przez studentów. Wymagania wstępne:
WYDOBYWANIE I WYSZUKIWANIE INFORMACJI Z INTERNETU Forma wykład: 30 godzin laboratorium: 30 godzin Główny cel kursu W ramach kursu studenci poznają podstawy stosowanych powszechnie metod wyszukiwania informacji
Bardziej szczegółowoI. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ? II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY...
Spis treści I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ?... 13 II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY...17 1. Niepowtarzalność języka każdego z nas...17 1.1. Nasz język indywidualny...17 1.2. Czynniki
Bardziej szczegółowoSpis treści tomu pierwszego
Spis treści tomu pierwszego WSTĘP.... 11 DŹWIĘK JAKO ZJAWISKO FIZYCZNE...15 CHARAKTERYSTYKA AKUSTYCZNA I AUDYTYWNA DŹWIĘKÓW MOWY.. 17 SŁUCH...20 WYŻSZE PIĘTRA UKŁADU SŁUCHOWEGO...22 EMISJE OTOAKUSTYCZNE...25
Bardziej szczegółowoSłowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji
Bardziej szczegółowoSłowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika ska Katedra Inteligencji
Bardziej szczegółowoCo wylicza Jasnopis? Bartosz Broda
Co wylicza Jasnopis? Bartosz Broda Analiza języka polskiego Ekstrakcja tekstu Dokument narzędzie do mierzenia zrozumiałości Analiza morfologiczna Analiza morfosyntaktyczna Indeksy Klasa trudności:
Bardziej szczegółowoEGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P8 KWIECIEŃ 2016 Zadanie 1. (0 1) 2) wyszukuje w wypowiedzi potrzebne informacje
Bardziej szczegółowoEGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ: GH-P7 KWIECIEŃ 2017 Zadanie 1. (0 1) 9) wyciąga wnioski wynikające z przesłanek
Bardziej szczegółowoAUTOMATYKA INFORMATYKA
AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław Kowalczuk Inteligentne wydobywanie informacji z internetowych serwisów
Bardziej szczegółowoPolskie korpusy równoległe i zasoby wielojęzyczne w projekcie CESAR
Polskie korpusy równoległe i zasoby wielojęzyczne w projekcie CESAR Piotr Pęzik Uniwersytet Łódzki. META-NET META- NET CESAR IPI PAN & UŁ http://www.meta-net.eu 2 Polskie zasoby w repozytorium META-NET
Bardziej szczegółowoEGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017
EGZMIN W KLSIE TRZECIEJ GIMNZJUM W ROKU SZKOLNYM 2016/2017 CZĘŚĆ 1. JĘZYK POLSKI ZSDY OCENINI ROZWIĄZŃ ZDŃ RKUSZ GH-P8 KWIECIEŃ 2017 Zadanie 1. (0 1) 2) wyszukuje w wypowiedzi potrzebne informacje [ ].
Bardziej szczegółowoCLARIN infrastruktura naukowa technologii językowych i jej potencjał jako narzędzia badawczego
CLARIN infrastruktura naukowa technologii językowych i jej potencjał jako narzędzia badawczego Maciej Piasecki Politechnika Wrocławska Instytut Informatyki Grupa Naukowa G4.19 maciej.piasecki@pwr.wroc.pl
Bardziej szczegółowoEGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P7 KWIECIEŃ 2019 Zadanie 1. (0 1) PF Zadanie 2. (0 1) II. Analiza i interpretacja
Bardziej szczegółowoEGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P2 KWIECIEŃ 2018 Zadanie 1. (0 1) 9) wyciąga wnioski wynikające z przesłanek
Bardziej szczegółowoEGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ: GH-P2 KWIECIEŃ 2017 Zadanie 1. (0 1) FP Zadanie 2. (0 1) B Zadanie 3. (0 1)
Bardziej szczegółowoEGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018
EGZMIN W KLSIE TRZECIEJ GIMNZJUM W ROKU SZKOLNYM 2017/2018 CZĘŚĆ 1. JĘZYK POLSKI ZSDY OCENINI ROZWIĄZŃ ZDŃ RKUSZ GH-P8 KWIECIEŃ 2018 Zadanie 1. (0 1) Zadanie 2. (0 1) C Zadanie 3. (0 1) 3. Świadomość językowa.
Bardziej szczegółowoEGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019
EGZMIN W KLSIE TRZECIEJ GIMNZJUM W ROKU SZKOLNYM 2018/2019 CZĘŚĆ 1. JĘZYK POLSKI ZSDY OCENINI ROZWIĄZŃ ZDŃ RKUSZ GH-P8 KWIECIEŃ 2019 Zadanie 1. (0 1) D Zadanie 2. (0 1) NIE Zadanie 3. (0 1) II. naliza
Bardziej szczegółowoEGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018
EGZAMIN W KLASIE TRZEIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018 ZĘŚĆ 1. JĘZYK POLSKI ZASADY OENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P7 KWIEIEŃ 2018 Zadanie 1. (0 1) 9) wyciąga wnioski wynikające z przesłanek zawartych
Bardziej szczegółowoCLARIN-PL wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych
wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Technologii Językowej
Bardziej szczegółowoZarządzanie i anotowanie korpusów tekstowych w systemie Inforex
Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
Bardziej szczegółowoPRACA DYPLOMOWA MAGISTERSKA
POLITECHNIKA WROCŠAWSKA WYDZIAŠ INFORMATYKI I ZARZ DZANIA KIERUNEK: Informatyka SPECJALNO : Inteligentne Systemy Informatyczne PRACA DYPLOMOWA MAGISTERSKA Automatyczne wydobywanie i klasykowanie kolokacji
Bardziej szczegółowoWebSty - otwarty sieciowy system do analizy stylometrycznej i semantycznej tekstów
IJP PAN / UP Kraków maciejeder@gmail.com WebSty - otwarty sieciowy system do analizy stylometrycznej i semantycznej tekstów ws.clarin-pl.eu/websty.shtml Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika
Bardziej szczegółowoEGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P7 KWIECIEŃ 2016 Zadanie 1. (0 1) 9) wyciąga wnioski wynikające z przesłanek
Bardziej szczegółowoKatedra Języków Specjalistycznych Wydział Lingwistyki Stosowanej U n i w e r s y t e t W a r s z a w s k i. Debiuty Naukowe. Leksykon tekst wyraz
Katedra Języków Specjalistycznych Wydział Lingwistyki Stosowanej U n i w e r s y t e t W a r s z a w s k i Debiuty Naukowe III Leksykon tekst wyraz WARSZAWA 2009-1 - Seria Debiuty Naukowe Redaktor tomu
Bardziej szczegółowoPublikacja sfinansowana z działalności statutowej Wydziału Filologicznego oraz Katedry Logopedii Uniwersytetu Gdańskiego
Recenzent dr hab. Mirosław Michalik, prof. UP Redaktor Wydawnictwa Aneta Lica Projekt okładki i stron tytułowych Karolina Zarychta Skład i łamanie Michał Janczewski Publikacja sfinansowana z działalności
Bardziej szczegółowoEGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P2 KWIECIEŃ 2016 Zadanie 1. (0 1) 9) wyciąga wnioski wynikające z przesłanek
Bardziej szczegółowoPRÓBNY EGZAMIN GIMNAZJALNY Z NOWĄ ERĄ 2015/2016 JĘZYK POLSKI
PRÓBNY EGZAMIN GIMNAZJALNY Z NOWĄ ERĄ 2015/2016 JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ Copyright by Nowa Era Sp. z o.o. Zadanie 1. (0 1) Wymagania szczegółowe 2) wyszukuje w wypowiedzi potrzebne
Bardziej szczegółowoSYLLABUS. Uniwersytet Przyrodniczo-Humanistyczny w Siedlcach Wydział Humanistyczny
Uniwersytet Przyrodniczo-Humanistyczny w Siedlcach Wydział Humanistyczny SYLLABUS Instytut Filologii Polskiej i Lingwistyki Stosowanej Zakład Językoznawstwa Kierunek Podyplomowe Studium Filologii Polskiej
Bardziej szczegółowoEGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2014/2015
EGZMIN W KLSIE TRZECIEJ GIMNZJUM W ROKU SZKOLNYM 2014/2015 CZĘŚĆ 1. JĘZYK POLSKI ZSDY OCENINI ROZWIĄZŃ ZDŃ RKUSZ GH-P7 KWIECIEŃ 2015 Zadanie 1. (0 1) PP Zadanie 2. (0 1) Zadanie 3. (0 1) II. naliza i interpretacja
Bardziej szczegółowoMetody selekcji cech
Metody selekcji cech A po co to Często mamy do dyspozycji dane w postaci zbioru cech lecz nie wiemy które z tych cech będą dla nas istotne. W zbiorze cech mogą wystąpić cechy redundantne niosące identyczną
Bardziej szczegółowoSpis treści. ROZDZIAŁ 2 Wzajemne oddziaływanie między leksykonem a innymi środkami służącymi kodowaniu informacji... 67
Spis treści Wykaz skrótów... 11 Przedmowa... 15 Podziękowania... 17 ROZDZIAŁ 1 Wprowadzenie: założenia metodologiczne i teoretyczne... 19 1. Cel i układ pracy...... 19 2. Język jako przedmiot badań...
Bardziej szczegółowoRozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Seminarium przetwarzania języka naturalnego Mateusz Kopeć Instytut Podstaw Informatyki Polskiej Akademii Nauk 6 lutego 2012 Plan 1 Zadanie
Bardziej szczegółowoEGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P2 KWIECIEŃ 2019 Zadanie 1. (0 1) 2) wyszukuje w wypowiedzi potrzebne informacje
Bardziej szczegółowoSemantyczne podobieństwo stron internetowych
Uniwersytet Mikołaja Kopernika Wydział Matematyki i Informatyki Marcin Lamparski Nr albumu: 184198 Praca magisterska na kierunku Informatyka Semantyczne podobieństwo stron internetowych Praca wykonana
Bardziej szczegółowoInforex - zarządzanie korpusami i ich anotacja
Inforex - zarządzanie korpusami i ich anotacja Marcin Oleksy marcin.oleksy@pwr.edu.pl Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii
Bardziej szczegółowoII. Kontrola i ocena pracy ucznia.
II. Kontrola i ocena pracy ucznia. Formy kontroli A. Kontrola bieżąca (sprawdza postępy uczniów, zachęcając ich do dalszej systematycznej pracy, pozwala na uzupełnienie braków w wiedzy i skorygować błędy).
Bardziej szczegółowoPRÓBNY EGZAMIN GIMNAZJALNY Z NOWĄ ERĄ 2016/2017 JĘZYK POLSKI
PRÓBNY EGZAMIN GIMNAZJALNY Z NOWĄ ERĄ 2016/2017 JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ Copyright by Nowa Era Sp. z o.o. Zadanie 1. (0 1) 2) wyszukuje w wypowiedzi potrzebne informacje [ ]. PP Zadanie
Bardziej szczegółowoSocjolekt polskich alpinistów. Analiza leksykalno-semantyczna słownictwa
Socjolekt polskich alpinistów Analiza leksykalno-semantyczna słownictwa Anna Niepytalska-Osiecka Socjolekt polskich alpinistów Analiza leksykalno-semantyczna słownictwa Copyright by Instytut Języka Polskiego
Bardziej szczegółowoNarzędzia do automatycznej analizy odniesień w tekstach
CLARIN-PL Narzędzia do automatycznej analizy odniesień w tekstach Michał Marcińczuk Jan Kocoń Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl
Bardziej szczegółowoW tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji.
5 Collocations Związek frazeologiczny (kolokacja), to często używane zestawienie słów. Przykłady: strong tea, weapons of mass destruction, make up. Znaczenie całości wyrażenia, nie zawsze wynika ze znaczeń
Bardziej szczegółowoANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO- ROK SZKOLNY 2017/2018 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI
ANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO- ROK SZKOLNY 2017/2018 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI W dniu 16.01.2018r. odbył się próbny egzamin gimnazjalny z języka polskiego. Do
Bardziej szczegółowoSemantyczna analiza języka naturalnego
Semantyczna analiza języka naturalnego Rozwiązanie Applica oparte o IBM SPSS Modeler Piotr Surma Applica 2 Agenda O Applica Analiza tekstu w języku polskim - wyzwania Rozwiązanie Applica Analiza Tekstu
Bardziej szczegółowoPublikacja w repozytorium i przetwarzanie w systemie DSpace
Publikacja w repozytorium i przetwarzanie w systemie DSpace Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
Bardziej szczegółowoZaawansowane narzędzie do analizy korpusu w oparciu o reguły
CLARIN-PL Zaawansowane narzędzie do analizy korpusu w oparciu o reguły Michał Marcińczuk Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl 2015-04-13
Bardziej szczegółowoANALIZA WYNIKÓW EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2016/2017 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI
ANALIZA WYNIKÓW EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2016/2017 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI W dniu 18.04.2016r. odbył się egzamin gimnazjalny z języka polskiego. Do badania diagnostycznego
Bardziej szczegółowoAlgorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań
Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań Anna Manerowska, Michal Kozakiewicz 2.12.2009 1 Wstęp Jako projekt na przedmiot MEUM (Metody Ewolucyjne Uczenia Maszyn)
Bardziej szczegółowoAlgorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych. Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS
Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS Dyskretyzacja - definicja Dyskretyzacja - zamiana atrybutów
Bardziej szczegółowoInforex - zarządzanie korpusami i ich anotacja. Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii Językowych G4.
Inforex - zarządzanie korpusami i ich anotacja Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy Jan Wieczorek Jan Kocoń marcin.oleksy@pwr.edu.pl jan.wieczorek@pwr.edu.pl jan.kocon@pwr.edu.pl
Bardziej szczegółowoJEDNOSTKI WIELOWYRAZOWE. PROCEDURA SPRAWDZANIA LEKSYKALNOŚCI POŁĄCZEŃ WYRAZOWYCH. Seria: PRE nr 11
Na prawach rękopisu Wydział Informatyki i Zarządzania Politechnika Wrocławska JEDNOSTKI WIELOWYRAZOWE. PROCEDURA SPRAWDZANIA LEKSYKALNOŚCI POŁĄCZEŃ WYRAZOWYCH Seria: PRE nr 11 Marek Maziarz, Stanisław
Bardziej szczegółowoW obrębie polskiego języka narodowego należy wydzielić dwa systemy:
Wykład nr 2 W obrębie polskiego języka narodowego należy wydzielić dwa systemy: a) polszczyznę ogólną (zwaną literacką); b)polszczyznę gwarową (gwary ludowe). Jest to podział dokonany ze względu na zasięg
Bardziej szczegółowoGramatyka opisowa języka polskiego Kod przedmiotu
Gramatyka opisowa języka polskiego - opis przedmiotu Informacje ogólne Nazwa przedmiotu Gramatyka opisowa języka polskiego Kod przedmiotu 09.3-WH-FiP-GOP-1-K-S14_pNadGen0FA8C Wydział Kierunek Wydział Humanistyczny
Bardziej szczegółowoInteligentne wydobywanie informacji z internetowych serwisów społecznościowych
Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław
Bardziej szczegółowoKontrola i ocena pracy ucznia.
Kontrola i ocena pracy ucznia. Formy kontroli 1. Kontrola bieżąca (w formie oceny udziału w lekcji, odpowiedzi ustnych, niezapowiedzianych kartkówek i innych form testów osiągnięć szkolnych) to sprawdzanie
Bardziej szczegółowoANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO- ROK SZKOLNY 2016/2017 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI
ANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO- ROK SZKOLNY 2016/2017 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI W dniu 14.02.2017r. odbył się próbny egzamin gimnazjalny z języka polskiego. Do
Bardziej szczegółowoSYLLABUS. Leksykologia i leksykografia
SYLLABUS Lp. Element Opis 1 2 Nazwa Typ Leksykologia i leksykografia Obowiązkowy 3 Instytut Instytut Nauk Humanistyczno-Społecznych i Turystyki 4 5 Kod Kierunek, specjalność, poziom i profil PPWSZ-FP-1-45-s
Bardziej szczegółowoANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2015/2016 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI
ANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2015/2016 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI W dniu 18.01.2016r. odbył się próbny egzamin gimnazjalny z języka polskiego. Do
Bardziej szczegółowoCLARIN infrastruktura naukowa technologii językowych
CLARIN infrastruktura naukowa technologii językowych Maciej Piasecki Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 maciej.piasecki@pwr.edu.pl Przykład: analiza pojęcia Problem:
Bardziej szczegółowoOntologie, czyli o inteligentnych danych
1 Ontologie, czyli o inteligentnych danych Bożena Deka Andrzej Tolarczyk PLAN 2 1. Korzenie filozoficzne 2. Ontologia w informatyce Ontologie a bazy danych Sieć Semantyczna Inteligentne dane 3. Zastosowania
Bardziej szczegółowoSystem Korekty Tekstu Polskiego
Wnioski Grzegorz Szuba System Korekty Tekstu Polskiego Plan prezentacji Geneza problemu i cele pracy Opis algorytmu bezkontekstowego Opis algorytmów kontekstowych Wyniki testów Rozszerzenie pracy - uproszczona
Bardziej szczegółowoPraca Magisterska. Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń. internetowego dla języka polskiego
Praca Magisterska Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń Lingwistycznych zbudowanego przez robota internetowego dla języka polskiego Marcin A. Gadamer Promotor: dr Adrian
Bardziej szczegółowoMorfeusz 2 analizator i generator fleksyjny dla języka polskiego
Morfeusz 2 analizator i generator fleksyjny dla języka polskiego Marcin Woliński i Anna Andrzejczuk Zespół Inżynierii Lingwistycznej Instytut Podstaw Informatyki Polskiej Akademii Nauk Warsztaty CLARIN-PL,
Bardziej szczegółowoAnaliza danych tekstowych i języka naturalnego
Kod szkolenia: Tytuł szkolenia: ANA/TXT Analiza danych tekstowych i języka naturalnego Dni: 3 Opis: Adresaci szkolenia Dane tekstowe stanowią co najmniej 70% wszystkich danych generowanych w systemach
Bardziej szczegółowoAnaliza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów
Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów Maciej Piasecki, Jan Kocoń Politechnika Wrocławska Katedra InteligencjiObliczeniowej Grupa
Bardziej szczegółowoWK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp
WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp Natalia Kotsyba, IBI AL UW 24 marca 2010 Plan zajęć Praca domowa na zapytania do Korpusu IPI PAN za pomocą
Bardziej szczegółowoPublikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji
Bardziej szczegółowoSystemy Wspomagania Decyzji
Rodzaje danych oraz ich przetwarzanie Szkoła Główna Służby Pożarniczej Zakład Informatyki i Łączności January 29, 2014 1 Dane tabelaryczne 2 Dane tekstowe 3 Dane sensoryczne 4 Dane multimedialne 5 Podsumowanie
Bardziej szczegółowoKonotacja składniowajako podstawowy mechanizm zdaniotwórczy
Konotacja składniowa jako podstawowy mechanizm zdaniotwórczy Uniwersytet Kardynała Stefana Wyszyńskiego 1 Pojęcie konotacji 2 Pojęcie konotacji Konotacja otwieranie miejsc; zapowiadanie wystąpienia jakiejś
Bardziej szczegółowoText mining w programie RapidMiner Michał Bereta www.michalbereta.pl
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po
Bardziej szczegółowoJĘZYK NIEMIECKI - ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY SZKOLNE
JĘZYK NIEMIECKI - ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY SZKOLNE Ocena bieżąca postępów ucznia uwzględnia wszystkie cztery sprawności językowe, tj.: rozumienie ze słuchu, pisanie, czytanie,
Bardziej szczegółowoII. Kontrola i ocena pracy ucznia.
II. Kontrola i ocena pracy ucznia. Formy kontroli I Liceum Ogólnokształcące 1. Kontrola bieżąca (w formie oceny udziału w lekcji, odpowiedzi ustnych, niezapowiedzianych kartkówek i innych form testów osiągnięć
Bardziej szczegółowoCLARINPL. wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych CLARIN-PL. Jan Wieczorek Maciej Piasecki
CLARINPL wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych Jan Wieczorek Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa
Bardziej szczegółowoTechniki uczenia maszynowego nazwa przedmiotu SYLABUS
Techniki uczenia maszynowego nazwa SYLABUS Obowiązuje od cyklu kształcenia: 2014/20 Część A. Informacje ogólne Elementy składowe sylabusu Nazwa jednostki prowadzącej studiów Poziom kształcenia Profil studiów
Bardziej szczegółowoZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY Z JĘZYKA NIEMIECKIEGO Nauczyciel prowadzący: mgr Agnieszka Krzeszowiak, mgr Teresa Jaśkowska
ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY Z JĘZYKA NIEMIECKIEGO Nauczyciel prowadzący: mgr Agnieszka Krzeszowiak, mgr Teresa Jaśkowska Ocena bieżąca postępów ucznia uwzględnia wszystkie cztery
Bardziej szczegółowoInteraktywne wyszukiwanie informacji w repozytoriach danych tekstowych
Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Marcin Deptuła Julian Szymański, Henryk Krawczyk Politechnika Gdańska Wydział Elektroniki, Telekomunikacji i Informatyki Katedra Architektury
Bardziej szczegółowo1. Ogólne ćwiczenia przygotowawcze
1. Ogólne ćwiczenia przygotowawcze Poniższe ćwiczenia o charakterze ogólnym zostały opracowane do zastosowania we wszystkich dialogach i monologach IVY. Aby wykonać dodatkowe ćwiczenia, dotyczące danego
Bardziej szczegółowoKONWERSATORIUM Z KULTURY JĘZYKA POLSKIEGO DLA 3-LETNICH STUDIÓW POLONISTYCZNYCH PIERWSZEGO STOPNIA PROBLEMATYKA ZAJĘĆ
KONWERSATORIUM Z KULTURY JĘZYKA POLSKIEGO DLA 3-LETNICH STUDIÓW POLONISTYCZNYCH PIERWSZEGO STOPNIA Warunki zaliczenia przedmiotu: 1. obecność na zajęciach (dopuszczalne dwie nieobecności; pięć i więcej
Bardziej szczegółowoWymagania edukacyjne w bloku humanistycznym dla klas IV VI Szkoła Podstawowa nr 55 im. Jurija Gagarina w Poznaniu
Wymagania edukacyjne w bloku humanistycznym dla klas IV VI Szkoła Podstawowa nr 55 im. Jurija Gagarina w Poznaniu I. Główne założenia PSO.. Każdy uczeń jest oceniany zgodnie z zasadami sprawiedliwości
Bardziej szczegółowoDobór tekstów do Elektronicznego korpusu tekstów polskich z XVII i XVIII w. (do 1772 r.) możliwości i ograniczenia budowanego warsztatu badawczego
Dobór tekstów do Elektronicznego korpusu tekstów polskich z XVII i XVIII w. (do 1772 r.) możliwości i ograniczenia budowanego warsztatu badawczego Dorota Adamiec Instytut Języka Polskiego PAN Elektroniczny
Bardziej szczegółowoWYMAGANIA EDUKACYJNE Z JĘZYKA ANGIELSKIEGO klasa I gimnazjum Mgr Magdalena Mazanek Mgr Magdalena Pajor GRAMATYKA I SŁOWNICTWO.
WYMAGANIA EDUKACYJNE Z JĘZYKA ANGIELSKIEGO klasa I gimnazjum Mgr Magdalena Mazanek Mgr Magdalena Pajor GRAMATYKA I SŁOWNICTWO - potrafi poprawnie operować niedużą ilością poznanych struktur gramatycznych
Bardziej szczegółowoKRYTERIA OCENIANIA Z JĘZYKA NIEMIECKIEGO DLA KLAS TRZECICH ODDZIAŁÓW GIMNAZJALNYCH
KRYTERIA OCENIANIA Z JĘZYKA NIEMIECKIEGO DLA KLAS TRZECICH ODDZIAŁÓW GIMNAZJALNYCH Ocenę celującą otrzymuje uczeń, który spełnia wszystkie kryteria oceny bardzo dobrej, a także wykazuje się dodatkowymi
Bardziej szczegółowo