Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
|
|
- Gabriel Kaźmierczak
- 9 lat temu
- Przeglądów:
Transkrypt
1 Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 marek.maziarz@pwr.edu.pl maciej.piasecki@pwr.edu.pl michal.wendelberger@pwr.edu.pl
2 Plan prezentacji
3 Plan prezentacji Wrocław V Wstęp 2. Wydobywanie kolokacji 3. Kolokacje w aplikacji MeWeX 4. Definiowanie jednostek leksykalnych 5. Jednostki leksykalne w aplikacji MeWeX 6. Podsumowanie
4 Wstęp
5 Wstęp Wrocław V 2015 Cel: Słownik wielowyrazowych jednostek leksykalnych Definicja: Wielowyrazowa jednostka leksykalna czym jest? Metoda: Dwie drogi Zachód to kolokacje, Wschód - kryteria Wychodzimy od kolokacji, które wydobywamy w sposób automatyczny, ale oceniamy za pomocą kryteriów lingwistycznych.
6 Automatyczna ekstrakcja kolokacji z korpusu tekstów Wrocław V 2015
7 Schemat przetwarzania Wrocław V 2015
8 Korpus tekstowy Wrocław V 2015 Zbiór tekstów wraz z zestawem metadanych. Pożądane cechy: reprezentatywność, zachowanie podziału na zdania, wyrazy i segmenty. Zawartość: formy bazowe, napotkane, opis morfologiczny, dodatkowe anotacje.
9 Plik z korpusem (format CCL) Wrocław V 2015
10 Definicja kolokacji Wrocław V 2015 Często zaobserwowane i nieprzypadkowe połączenie słów występujących w bliskim sąsiedztwie. Przykłady interesujących kolokacji: białe wino (ciągła), czerwona kartka (ciągła), nabić [komuś] guza (nieciągła, 1, 2,...)
11 Siła kolokacji Wrocław V 2015 Kolokacją silną jest takie współwystąpienie słów, które według danej miary ma dużą szansę na bycie jednostką wielowyrazową. ciężarowy samochód samochód ciężarowy czerwony czerwony samochód samochód
12 Siła kolokacji Wrocław V 2015 Kolokacją silną jest takie współwystąpienie słów, które według danej miary ma dużą szansę na bycie jednostką wielowyrazową. ciężarowy ciężarowy samochód samochód X 2 = 65,4 czerwony czerwony samochód samochód X 2 = 17,4
13 Ocena nieprzypadkowości Wrocław V 2015 Nieprzypadkowość (siłę) kolokacji mierzyć można różnymi sposobami. Metody te różnią się od siebie podejściem do rozwiązania problemu, ilością potrzebnych danych, złożonością pamięciową i obliczeniową.
14 Więcej o miarach Wrocław V 2015 Funkcje statystyczne: Pointwise Mutual Dependency, Mutual Dependency, Frequency Biased MD, Mutual Expectation, Unigram Subtuples... Testy statystyczne: X 2 Persona, Loglikelihood, TScore, ZScore... Miary szyku: W Order...
15 Więcej o miarach cz. 2 Wrocław V 2015 Miary kontekstowe: więcej informacji, dane pochodzące także z otoczenia kolokacji, funkcje wykorzystujące także kontekst oprócz danych statystycznych dotyczących częstości. Funkcje wektorowe: kombinacje miar, dobór miar, sposób łączenia rankingów, metody przepunktowywania, możliwość stosowania innych miar wektorowych lub klasyfikatorów jako składowych. Metody maszynowego uczenia: dobór cech wyniki miar, sposób przygotowania cech do klasyfikacji.
16 Filtrowanie danych Wrocław V 2015 Filtry statystyczne: częstości, bardziej skomplikowane filtry (entropia, wariancja, ) jeśli zachowane są konteksty. Filtry językowe: trudniejsze, wiedza dziedzinowa, mniejsza ogólność międzyjęzykowa, oparte o części mowy (typy strukturalne), np. operatory języka ograniczeń WCCL. Funkcje dyspersji: względna prostota zastosowania, wymaga zbioru korpusów.
17 Operator języka WCCL Grupa operatorów Rozmiar operatora
18 Funkcje dyspersji Wrocław V 2015 Zadania: zmiana rozkładu danych statystycznych, wstępne wyznaczenie potencjalnie interesujących kolokacji, element filtrowania, Przykład popularnej funkcji: TF-IDF. F w korpusie 1 F w korpusie 2 F w korpusie 3 Suma Nowa częstość , , ,97
19 Zestawienie przykładowych wyników ekstrakcji kolokacji Wrocław V 2015
20 MeWeX Wrocław V 2015
21 Kilka zrzutów ekranu z aplikacji Wrocław V 2015
22 Kilka zrzutów ekranu z aplikacji Wrocław V 2015
23 Czas na wydobycie Wrocław V 2015
24 Przykładowe wyniki Wrocław V 2015
25 Przykładowe wyniki Wrocław V 2015
26 Przykładowe wyniki Wrocław V 2015
27 Przykładowe wyniki Wrocław V 2015
28 Przykładowe wyniki
29 Wielowyrazowe jednostki leksykalne Wrocław V 2015
30 Wielowyrazowa jednostka leksykalna (WJL) Wrocław V 2015 Dwa podejścia DEF. 1. takie połączenie wyrazowe, które jest przechowywane w naszym mentalnym leksykonie jako jednostka, całostka semantyczna i którego to połączenia nie musimy składać na bieżąco w tekście, tylko przywołujemy je z pamięci Svensen 2009, Murphy 2003, Laskowski 1999, Jackendoff 1997 DEF. 2. takie połączenie wyrazowe, którego znaczenia nie jesteśmy w stanie zrekonstruować na podstawie znaczeń elementów składowych Sinclair 1998, Weigand 1998, Malmkjaer 1991
31 Wielowyrazowa jednostka leksykalna (WJL) Wrocław V 2015 Dwa podejścia DEF. 1. takie połączenie wyrazowe, które jest przechowywane w naszym mentalnym leksykonie jako jednostka, całostka semantyczna i którego to połączenia nie musimy składać na bieżąco w tekście, tylko przywołujemy je z pamięci Svensen 2009, Murphy 2003, Laskowski 1999, Jackendoff 1997 DEF. 2. takie połączenie wyrazowe, którego znaczenia nie jesteśmy w stanie zrekonstruować na podstawie znaczeń elementów składowych Sinclair 1998, Weigand 1998, Malmkjaer 1991
32 WJL kryteria Wrocław V 2015 Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką),
33 WJL kryteria Wrocław V 2015 Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika),
34 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres),
35 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku),
36 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki),
37 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki), ü składniowe i fleksyjne nieregularności:
38 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki), ü składniowe i fleksyjne nieregularności: nieseparowalność (*przemysł bardzo ciężki),
39 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki), ü składniowe i fleksyjne nieregularności: nieseparowalność (*przemysł bardzo ciężki), ustalony szyk (jaszczurka zielona 'Lacerta viridis' ~ zielona jaszczurka),
40 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki), ü składniowe i fleksyjne nieregularności: nieseparowalność (*przemysł bardzo ciężki), ustalony szyk (jaszczurka zielona 'Lacerta viridis' ~ zielona jaszczurka), swoista odmiana lub brak odmiany (nabić guza, wyjść za mąż, do sucha),
41 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki), ü składniowe i fleksyjne nieregularności: nieseparowalność (*przemysł bardzo ciężki), ustalony szyk (jaszczurka zielona 'Lacerta viridis' ~ zielona jaszczurka), swoista odmiana lub brak odmiany (nabić guza, wyjść za mąż, do sucha), ü swoisty akcent (náraz 'nagle' na ráz [dwa, trzy]),
42 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia:
43 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy),
44 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka),
45 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet),
46 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet), l istnienie jednowyrazowego derywatu (uniwerbizacja: podstawówka < szkoła podstawowa),
47 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet), l istnienie jednowyrazowego derywatu (uniwerbizacja: podstawówka < szkoła podstawowa),
48 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet), l istnienie jednowyrazowego derywatu (uniwerbizacja: podstawówka < szkoła podstawowa), l istnienie w innym języku odpowiednika jednowyrazowego (zachód słońca sunset),
49 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet), l istnienie jednowyrazowego derywatu (uniwerbizacja: podstawówka < szkoła podstawowa), l istnienie w innym języku odpowiednika jednowyrazowego (zachód słońca sunset), ü bycie terminem (jaszczurka zielona),
50 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet), l istnienie jednowyrazowego derywatu (uniwerbizacja: podstawówka < szkoła podstawowa), l istnienie w innym języku odpowiednika jednowyrazowego (zachód słońca sunset), ü bycie terminem (jaszczurka zielona), ü występowanie w słownikach (hala maszyn jest notowana w
51 WJL kryteria Kryteria û nie są niezależne od siebie, û nie tworzą spójnego systemu klasyfikacji, û silnie zależą od intuicji, û są argumentami post hoc gdy decyzja już została podjęta.
52 WJL kryteria Kryteria û nie są niezależne od siebie, û nie tworzą spójnego systemu klasyfikacji, û silnie zależą od intuicji, û są argumentami post hoc gdy decyzja już została podjęta. System zbudowany na niekompozycyjności ü jedyno kryterium ü (zamiast systemu kryteriów), û zależy od definicji niekompozycyjności, ü decyzja podejmowana jest na podstawie analizy semantycznej, û założenie a priori: leksykalność = niekompozycyjność.
53 WJL kryteria System zbudowany na wielu kryteriach ü Brak założenia a priori: leksykalność = niekompozycyjność. ü Ale jak zbudować spójny system?
54 WJL system kryteriów System zbudowany na wielu kryteriach 14 osób
55 WJL system kryteriów System zbudowany na wielu kryteriach DEF. 1. takie połączenie wyrazowe, które jest przechowywane w naszym mentalnym leksykonie jako jednostka, całostka semantyczna i którego to połączenia nie musimy składać na bieżąco w tekście, tylko przywołujemy je z pamięci Svensen 2009, Murphy 2003, Laskowski 1999, Jackendoff 1997
56 WJL system kryteriów System zbudowany na wielu kryteriach połączenie TAK NIE WJL? maszyna do szycia 13 1 pies Marka 0 14
57 WJL system kryteriów System zbudowany na wielu kryteriach połączenie TAK NIE WJL? maszyna do szycia 13 1!" pies Marka 0 14 #"
58 WJL system kryteriów System zbudowany na wielu kryteriach 14 osób DEF połączeń (varia)
59 WJL system kryteriów System zbudowany na wielu kryteriach 14 osób 5 osób DEF. 1. DEF połączeń (varia) 200 połączeń ze Słowosieci 5 osób DEF kolokacji typu N+Adj
60 WJL system kryteriów System zbudowany na wielu kryteriach DEF połączeń (varia) KRYTERIA (10) DEF połączeń ze Słowosieci DEF kolokacji typu N+Adj
61 WJL system kryteriów System zbudowany na wielu kryteriach DEF połączeń (varia) autor Wyraz uwięziony Szyk swobodny pies Marka (14 x NIE) Termin Metaforyczność Separowalność Specjalistyczność Kompozycyjność Parafraza #1 #"!"!" #" #" #"!"!" #2 #"!" #" #" #" #"!"!"
62 WJL system kryteriów System zbudowany na wielu kryteriach DEF połączeń (varia) autor Wyraz uwięziony Szyk swobodny pies Marka (14 x NIE) Termin Metaforyczność Parafraza #1 #"!"!" #" #" #"!"!" #2 #"!" #" #" #" #"!"!" autor Wyraz uwięziony maszyna do szycia (13 x TAK, 1 x NIE) Szyk swobodny Termin Metaforyczność Separowalność Specjalistyczność Kompozycyjność Separowalność Specjalistyczność Kompozycyjność Parafraza #1 #" #"!" #" #"!" #" #" #2 #"!"!" #" #" #"!" #"
63 WJL system kryteriów System zbudowany na wielu kryteriach DEF połączeń (varia) autor Wyraz uwięziony Szyk swobodny pies Marka (14 x NIE) Termin Metaforyczność Parafraza #1 #"!"!" #" #" #"!"!" #2 #"!" #" #" #" #"!"!" autor Wyraz uwięziony maszyna do szycia (13 x TAK, 1 x NIE) Szyk swobodny Termin Metaforyczność Separowalność Specjalistyczność Kompozycyjność Separowalność Specjalistyczność Kompozycyjność Parafraza #1 #" #"!" #" #"!" #" #" #2 #"!"!" #" #" #"!" #"
64 WJL system kryteriów System zbudowany na wielu kryteriach DEF połączeń (varia) autor Wyraz uwięziony Szyk swobodny pies Marka (14 x NIE) Termin Metaforyczność Parafraza #1 #"!"!" #" #" #"!"!" #2 #"!" #" #" #" #"!"!" autor Wyraz uwięziony maszyna do szycia (13 x TAK, 1 x NIE) Szyk swobodny Termin Metaforyczność Separowalność Specjalistyczność Kompozycyjność Separowalność Specjalistyczność Kompozycyjność Parafraza #1 #" #"!" #" #"!" #" #" #2 #"!"!" #" #" #"!" #"
65 WJL system kryteriów System zbudowany na wielu kryteriach KRYTERIA (10) DEF połączeń (varia)
66 WJL system kryteriów System zbudowany na wielu kryteriach KRYTERIA (10) DEF. 1.
67 WJL system kryteriów System zbudowany na wielu kryteriach KRYTERIA (10) DEF. 1.
68 WJL system kryteriów System zbudowany na wielu kryteriach
69 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ
70 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ Nazwa własna? Wyraz uwięziony? Niepoprawna fraza?
71 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ Część mowy - rzeczownik - przymiotnik - czasownik - przysłówek
72 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ TERMIN?
73 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? #
74 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA?
75 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA?!" N+Adj? # WJL
76 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? #!" N+Adj?!" # WJL
77 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? nie-wjl #!" N+Adj? # WJL!" SEPAROWALNOŚĆ?
78 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? nie-wjl #!" N+Adj? # WJL!" SEPAROWALNOŚĆ?!" #
79 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? nie-wjl #!" N+Adj? # WJL!" SEPAROWALNOŚĆ?!" SZYK USTALONY? # WJL
80 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? nie-wjl #!" N+Adj? # WJL!" SEPAROWALNOŚĆ?!" SZYK USTALONY? # WJL!" #
81 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? nie-wjl #!" N+Adj? # WJL!" SEPAROWALNOŚĆ?!" SZYK USTALONY? # WJL!" # WJL nie-wjl
82 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMINY TERMIN? # PARAFRAZA? nie-wjl #!" N+Adj?!" # JEDNOSTKI NIEKOMPO- ZYCYJNE SEPAROWALNOŚĆ?!" SZYK USTALONY? # ZESTAWIENIA!" # ZESTAWIENIA nie-wjl
83 MeWeX jednostki leksykalne
84 MeWeX jednostki leksykalne
85 MeWeX jednostki leksykalne
86 MeWeX jednostki leksykalne
87 MeWeX jednostki leksykalne
88 MeWeX jednostki leksykalne
89 MeWeX jednostki leksykalne
90 MeWeX jednostki leksykalne
91 MeWeX jednostki leksykalne
92 MeWeX jednostki leksykalne
93 MeWeX jednostki leksykalne
94 MeWeX jednostki leksykalne
95 MeWeX jednostki leksykalne Typ strukturalny decyzja urobek
96 MeWeX jednostki leksykalne Typ strukturalny decyzja urobek
97 Podsumowanie
98 Podsumowanie dwie drogi Językoznawstwo korpusowe i frazeologia Punkt wyjścia: korpus i kolokacje Cel: jednostki leksykalne frazeologizmy terminy zestawienia Środek: aplikacja MeWeX
99 Dziękujemy bardzo za uwagę
Narzędzia do wydobywania słowników związków frazeologicznych i terminów
Narzędzia do wydobywania słowników związków frazeologicznych i terminów Marek Maziarz, Michał Wendelberger Politechnika Wrocławska Instytut Informatyki Grupa Naukowa G4.19 marek.maziarz@pwr.edu.pl michal.wendelberger@pwr.edu.pl
Narzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
Narzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra
Program warsztatów CLARIN-PL
W ramach Letniej Szkoły Humanistyki Cyfrowej odbędzie się III cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Narzędzia cyfrowe do analizy języka w naukach humanistycznych i społecznych 17-19
Open Access w technologii językowej dla języka polskiego
Open Access w technologii językowej dla języka polskiego Marek Maziarz, Maciej Piasecki Grupa Naukowa Technologii Językowych G4.19 Zakład Sztucznej Inteligencji, Instytut Informatyki, W-8, Politechnika
Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowania
Słowosiec 3.2 - leksykalna siec semantyczna je zyka polskiego i jej zastosowania Poziom rozszerzony Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 agnieszka.dziob@pwr.edu.pl
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Witold Kieraś Łukasz Kobyliński Maciej Ogrodniczuk Instytut Podstaw Informatyki PAN III Konferencja DARIAH-PL Poznań 9.11.2016
CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy
Cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy 13 15 kwietnia 2015 roku Warszawa, Pałac Staszica, ul. Nowy Świat 72, sala 144
Lokalizacja Oprogramowania
mgr inż. Anton Smoliński anton.smolinski@zut.edu.pl Lokalizacja Oprogramowania 16/12/2016 Wykład 6 Internacjonalizacja, Testowanie, Tłumaczenie Maszynowe Agenda Internacjonalizacja Testowanie lokalizacji
II cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych
II cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych 18-20 maja 2015 roku Politechnika Wrocławska, Centrum Kongresowe,
CLARIN rozproszony system technologii językowych dla różnych języków europejskich
CLARIN rozproszony system technologii językowych dla różnych języków europejskich Maciej Piasecki Politechnika Wrocławska Instytut Informatyki G4.19 Research Group maciej.piasecki@pwr.wroc.pl Projekt CLARIN
I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ?... 13 II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY...
I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ?.... 13 II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY............ 17 1. Niepowtarzalność języka każdego z nas.................. 17 1.1. Nasz język indywidualny...........................
Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur
Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur Maciej Piasecki, Paweł Kędzia Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Plan prezentacji
WebSty otwarty webowy system do analiz stylometrycznych
WebSty otwarty webowy system do analiz stylometrycznych Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 maciej.piasecki@pwr.edu.pl
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2 ws.clarin-pl.eu/websty.shtml Tomasz Walkowiak, Maciej Piasecki Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej
Forma. Główny cel kursu. Umiejętności nabywane przez studentów. Wymagania wstępne:
WYDOBYWANIE I WYSZUKIWANIE INFORMACJI Z INTERNETU Forma wykład: 30 godzin laboratorium: 30 godzin Główny cel kursu W ramach kursu studenci poznają podstawy stosowanych powszechnie metod wyszukiwania informacji
I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ? II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY...
Spis treści I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ?... 13 II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY...17 1. Niepowtarzalność języka każdego z nas...17 1.1. Nasz język indywidualny...17 1.2. Czynniki
Spis treści tomu pierwszego
Spis treści tomu pierwszego WSTĘP.... 11 DŹWIĘK JAKO ZJAWISKO FIZYCZNE...15 CHARAKTERYSTYKA AKUSTYCZNA I AUDYTYWNA DŹWIĘKÓW MOWY.. 17 SŁUCH...20 WYŻSZE PIĘTRA UKŁADU SŁUCHOWEGO...22 EMISJE OTOAKUSTYCZNE...25
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika ska Katedra Inteligencji
Co wylicza Jasnopis? Bartosz Broda
Co wylicza Jasnopis? Bartosz Broda Analiza języka polskiego Ekstrakcja tekstu Dokument narzędzie do mierzenia zrozumiałości Analiza morfologiczna Analiza morfosyntaktyczna Indeksy Klasa trudności:
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P8 KWIECIEŃ 2016 Zadanie 1. (0 1) 2) wyszukuje w wypowiedzi potrzebne informacje
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ: GH-P7 KWIECIEŃ 2017 Zadanie 1. (0 1) 9) wyciąga wnioski wynikające z przesłanek
AUTOMATYKA INFORMATYKA
AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław Kowalczuk Inteligentne wydobywanie informacji z internetowych serwisów
Polskie korpusy równoległe i zasoby wielojęzyczne w projekcie CESAR
Polskie korpusy równoległe i zasoby wielojęzyczne w projekcie CESAR Piotr Pęzik Uniwersytet Łódzki. META-NET META- NET CESAR IPI PAN & UŁ http://www.meta-net.eu 2 Polskie zasoby w repozytorium META-NET
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017
EGZMIN W KLSIE TRZECIEJ GIMNZJUM W ROKU SZKOLNYM 2016/2017 CZĘŚĆ 1. JĘZYK POLSKI ZSDY OCENINI ROZWIĄZŃ ZDŃ RKUSZ GH-P8 KWIECIEŃ 2017 Zadanie 1. (0 1) 2) wyszukuje w wypowiedzi potrzebne informacje [ ].
CLARIN infrastruktura naukowa technologii językowych i jej potencjał jako narzędzia badawczego
CLARIN infrastruktura naukowa technologii językowych i jej potencjał jako narzędzia badawczego Maciej Piasecki Politechnika Wrocławska Instytut Informatyki Grupa Naukowa G4.19 maciej.piasecki@pwr.wroc.pl
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P7 KWIECIEŃ 2019 Zadanie 1. (0 1) PF Zadanie 2. (0 1) II. Analiza i interpretacja
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P2 KWIECIEŃ 2018 Zadanie 1. (0 1) 9) wyciąga wnioski wynikające z przesłanek
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ: GH-P2 KWIECIEŃ 2017 Zadanie 1. (0 1) FP Zadanie 2. (0 1) B Zadanie 3. (0 1)
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018
EGZMIN W KLSIE TRZECIEJ GIMNZJUM W ROKU SZKOLNYM 2017/2018 CZĘŚĆ 1. JĘZYK POLSKI ZSDY OCENINI ROZWIĄZŃ ZDŃ RKUSZ GH-P8 KWIECIEŃ 2018 Zadanie 1. (0 1) Zadanie 2. (0 1) C Zadanie 3. (0 1) 3. Świadomość językowa.
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019
EGZMIN W KLSIE TRZECIEJ GIMNZJUM W ROKU SZKOLNYM 2018/2019 CZĘŚĆ 1. JĘZYK POLSKI ZSDY OCENINI ROZWIĄZŃ ZDŃ RKUSZ GH-P8 KWIECIEŃ 2019 Zadanie 1. (0 1) D Zadanie 2. (0 1) NIE Zadanie 3. (0 1) II. naliza
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018
EGZAMIN W KLASIE TRZEIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018 ZĘŚĆ 1. JĘZYK POLSKI ZASADY OENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P7 KWIEIEŃ 2018 Zadanie 1. (0 1) 9) wyciąga wnioski wynikające z przesłanek zawartych
CLARIN-PL wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych
wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Technologii Językowej
Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex
Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
PRACA DYPLOMOWA MAGISTERSKA
POLITECHNIKA WROCŠAWSKA WYDZIAŠ INFORMATYKI I ZARZ DZANIA KIERUNEK: Informatyka SPECJALNO : Inteligentne Systemy Informatyczne PRACA DYPLOMOWA MAGISTERSKA Automatyczne wydobywanie i klasykowanie kolokacji
WebSty - otwarty sieciowy system do analizy stylometrycznej i semantycznej tekstów
IJP PAN / UP Kraków maciejeder@gmail.com WebSty - otwarty sieciowy system do analizy stylometrycznej i semantycznej tekstów ws.clarin-pl.eu/websty.shtml Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P7 KWIECIEŃ 2016 Zadanie 1. (0 1) 9) wyciąga wnioski wynikające z przesłanek
Katedra Języków Specjalistycznych Wydział Lingwistyki Stosowanej U n i w e r s y t e t W a r s z a w s k i. Debiuty Naukowe. Leksykon tekst wyraz
Katedra Języków Specjalistycznych Wydział Lingwistyki Stosowanej U n i w e r s y t e t W a r s z a w s k i Debiuty Naukowe III Leksykon tekst wyraz WARSZAWA 2009-1 - Seria Debiuty Naukowe Redaktor tomu
Publikacja sfinansowana z działalności statutowej Wydziału Filologicznego oraz Katedry Logopedii Uniwersytetu Gdańskiego
Recenzent dr hab. Mirosław Michalik, prof. UP Redaktor Wydawnictwa Aneta Lica Projekt okładki i stron tytułowych Karolina Zarychta Skład i łamanie Michał Janczewski Publikacja sfinansowana z działalności
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P2 KWIECIEŃ 2016 Zadanie 1. (0 1) 9) wyciąga wnioski wynikające z przesłanek
PRÓBNY EGZAMIN GIMNAZJALNY Z NOWĄ ERĄ 2015/2016 JĘZYK POLSKI
PRÓBNY EGZAMIN GIMNAZJALNY Z NOWĄ ERĄ 2015/2016 JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ Copyright by Nowa Era Sp. z o.o. Zadanie 1. (0 1) Wymagania szczegółowe 2) wyszukuje w wypowiedzi potrzebne
SYLLABUS. Uniwersytet Przyrodniczo-Humanistyczny w Siedlcach Wydział Humanistyczny
Uniwersytet Przyrodniczo-Humanistyczny w Siedlcach Wydział Humanistyczny SYLLABUS Instytut Filologii Polskiej i Lingwistyki Stosowanej Zakład Językoznawstwa Kierunek Podyplomowe Studium Filologii Polskiej
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2014/2015
EGZMIN W KLSIE TRZECIEJ GIMNZJUM W ROKU SZKOLNYM 2014/2015 CZĘŚĆ 1. JĘZYK POLSKI ZSDY OCENINI ROZWIĄZŃ ZDŃ RKUSZ GH-P7 KWIECIEŃ 2015 Zadanie 1. (0 1) PP Zadanie 2. (0 1) Zadanie 3. (0 1) II. naliza i interpretacja
Metody selekcji cech
Metody selekcji cech A po co to Często mamy do dyspozycji dane w postaci zbioru cech lecz nie wiemy które z tych cech będą dla nas istotne. W zbiorze cech mogą wystąpić cechy redundantne niosące identyczną
Spis treści. ROZDZIAŁ 2 Wzajemne oddziaływanie między leksykonem a innymi środkami służącymi kodowaniu informacji... 67
Spis treści Wykaz skrótów... 11 Przedmowa... 15 Podziękowania... 17 ROZDZIAŁ 1 Wprowadzenie: założenia metodologiczne i teoretyczne... 19 1. Cel i układ pracy...... 19 2. Język jako przedmiot badań...
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Seminarium przetwarzania języka naturalnego Mateusz Kopeć Instytut Podstaw Informatyki Polskiej Akademii Nauk 6 lutego 2012 Plan 1 Zadanie
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P2 KWIECIEŃ 2019 Zadanie 1. (0 1) 2) wyszukuje w wypowiedzi potrzebne informacje
Semantyczne podobieństwo stron internetowych
Uniwersytet Mikołaja Kopernika Wydział Matematyki i Informatyki Marcin Lamparski Nr albumu: 184198 Praca magisterska na kierunku Informatyka Semantyczne podobieństwo stron internetowych Praca wykonana
Inforex - zarządzanie korpusami i ich anotacja
Inforex - zarządzanie korpusami i ich anotacja Marcin Oleksy marcin.oleksy@pwr.edu.pl Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii
II. Kontrola i ocena pracy ucznia.
II. Kontrola i ocena pracy ucznia. Formy kontroli A. Kontrola bieżąca (sprawdza postępy uczniów, zachęcając ich do dalszej systematycznej pracy, pozwala na uzupełnienie braków w wiedzy i skorygować błędy).
PRÓBNY EGZAMIN GIMNAZJALNY Z NOWĄ ERĄ 2016/2017 JĘZYK POLSKI
PRÓBNY EGZAMIN GIMNAZJALNY Z NOWĄ ERĄ 2016/2017 JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ Copyright by Nowa Era Sp. z o.o. Zadanie 1. (0 1) 2) wyszukuje w wypowiedzi potrzebne informacje [ ]. PP Zadanie
Socjolekt polskich alpinistów. Analiza leksykalno-semantyczna słownictwa
Socjolekt polskich alpinistów Analiza leksykalno-semantyczna słownictwa Anna Niepytalska-Osiecka Socjolekt polskich alpinistów Analiza leksykalno-semantyczna słownictwa Copyright by Instytut Języka Polskiego
Narzędzia do automatycznej analizy odniesień w tekstach
CLARIN-PL Narzędzia do automatycznej analizy odniesień w tekstach Michał Marcińczuk Jan Kocoń Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl
W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji.
5 Collocations Związek frazeologiczny (kolokacja), to często używane zestawienie słów. Przykłady: strong tea, weapons of mass destruction, make up. Znaczenie całości wyrażenia, nie zawsze wynika ze znaczeń
ANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO- ROK SZKOLNY 2017/2018 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI
ANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO- ROK SZKOLNY 2017/2018 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI W dniu 16.01.2018r. odbył się próbny egzamin gimnazjalny z języka polskiego. Do
Semantyczna analiza języka naturalnego
Semantyczna analiza języka naturalnego Rozwiązanie Applica oparte o IBM SPSS Modeler Piotr Surma Applica 2 Agenda O Applica Analiza tekstu w języku polskim - wyzwania Rozwiązanie Applica Analiza Tekstu
Publikacja w repozytorium i przetwarzanie w systemie DSpace
Publikacja w repozytorium i przetwarzanie w systemie DSpace Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
Zaawansowane narzędzie do analizy korpusu w oparciu o reguły
CLARIN-PL Zaawansowane narzędzie do analizy korpusu w oparciu o reguły Michał Marcińczuk Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl 2015-04-13
ANALIZA WYNIKÓW EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2016/2017 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI
ANALIZA WYNIKÓW EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2016/2017 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI W dniu 18.04.2016r. odbył się egzamin gimnazjalny z języka polskiego. Do badania diagnostycznego
Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań
Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań Anna Manerowska, Michal Kozakiewicz 2.12.2009 1 Wstęp Jako projekt na przedmiot MEUM (Metody Ewolucyjne Uczenia Maszyn)
Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych. Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS
Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS Dyskretyzacja - definicja Dyskretyzacja - zamiana atrybutów
Inforex - zarządzanie korpusami i ich anotacja. Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii Językowych G4.
Inforex - zarządzanie korpusami i ich anotacja Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy Jan Wieczorek Jan Kocoń marcin.oleksy@pwr.edu.pl jan.wieczorek@pwr.edu.pl jan.kocon@pwr.edu.pl
JEDNOSTKI WIELOWYRAZOWE. PROCEDURA SPRAWDZANIA LEKSYKALNOŚCI POŁĄCZEŃ WYRAZOWYCH. Seria: PRE nr 11
Na prawach rękopisu Wydział Informatyki i Zarządzania Politechnika Wrocławska JEDNOSTKI WIELOWYRAZOWE. PROCEDURA SPRAWDZANIA LEKSYKALNOŚCI POŁĄCZEŃ WYRAZOWYCH Seria: PRE nr 11 Marek Maziarz, Stanisław
W obrębie polskiego języka narodowego należy wydzielić dwa systemy:
Wykład nr 2 W obrębie polskiego języka narodowego należy wydzielić dwa systemy: a) polszczyznę ogólną (zwaną literacką); b)polszczyznę gwarową (gwary ludowe). Jest to podział dokonany ze względu na zasięg
Gramatyka opisowa języka polskiego Kod przedmiotu
Gramatyka opisowa języka polskiego - opis przedmiotu Informacje ogólne Nazwa przedmiotu Gramatyka opisowa języka polskiego Kod przedmiotu 09.3-WH-FiP-GOP-1-K-S14_pNadGen0FA8C Wydział Kierunek Wydział Humanistyczny
Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych
Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław
Kontrola i ocena pracy ucznia.
Kontrola i ocena pracy ucznia. Formy kontroli 1. Kontrola bieżąca (w formie oceny udziału w lekcji, odpowiedzi ustnych, niezapowiedzianych kartkówek i innych form testów osiągnięć szkolnych) to sprawdzanie
ANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO- ROK SZKOLNY 2016/2017 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI
ANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO- ROK SZKOLNY 2016/2017 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI W dniu 14.02.2017r. odbył się próbny egzamin gimnazjalny z języka polskiego. Do
SYLLABUS. Leksykologia i leksykografia
SYLLABUS Lp. Element Opis 1 2 Nazwa Typ Leksykologia i leksykografia Obowiązkowy 3 Instytut Instytut Nauk Humanistyczno-Społecznych i Turystyki 4 5 Kod Kierunek, specjalność, poziom i profil PPWSZ-FP-1-45-s
ANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2015/2016 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI
ANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2015/2016 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI W dniu 18.01.2016r. odbył się próbny egzamin gimnazjalny z języka polskiego. Do
CLARIN infrastruktura naukowa technologii językowych
CLARIN infrastruktura naukowa technologii językowych Maciej Piasecki Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 maciej.piasecki@pwr.edu.pl Przykład: analiza pojęcia Problem:
Ontologie, czyli o inteligentnych danych
1 Ontologie, czyli o inteligentnych danych Bożena Deka Andrzej Tolarczyk PLAN 2 1. Korzenie filozoficzne 2. Ontologia w informatyce Ontologie a bazy danych Sieć Semantyczna Inteligentne dane 3. Zastosowania
System Korekty Tekstu Polskiego
Wnioski Grzegorz Szuba System Korekty Tekstu Polskiego Plan prezentacji Geneza problemu i cele pracy Opis algorytmu bezkontekstowego Opis algorytmów kontekstowych Wyniki testów Rozszerzenie pracy - uproszczona
Praca Magisterska. Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń. internetowego dla języka polskiego
Praca Magisterska Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń Lingwistycznych zbudowanego przez robota internetowego dla języka polskiego Marcin A. Gadamer Promotor: dr Adrian
Morfeusz 2 analizator i generator fleksyjny dla języka polskiego
Morfeusz 2 analizator i generator fleksyjny dla języka polskiego Marcin Woliński i Anna Andrzejczuk Zespół Inżynierii Lingwistycznej Instytut Podstaw Informatyki Polskiej Akademii Nauk Warsztaty CLARIN-PL,
Analiza danych tekstowych i języka naturalnego
Kod szkolenia: Tytuł szkolenia: ANA/TXT Analiza danych tekstowych i języka naturalnego Dni: 3 Opis: Adresaci szkolenia Dane tekstowe stanowią co najmniej 70% wszystkich danych generowanych w systemach
Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów
Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów Maciej Piasecki, Jan Kocoń Politechnika Wrocławska Katedra InteligencjiObliczeniowej Grupa
WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp
WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp Natalia Kotsyba, IBI AL UW 24 marca 2010 Plan zajęć Praca domowa na zapytania do Korpusu IPI PAN za pomocą
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji
Systemy Wspomagania Decyzji
Rodzaje danych oraz ich przetwarzanie Szkoła Główna Służby Pożarniczej Zakład Informatyki i Łączności January 29, 2014 1 Dane tabelaryczne 2 Dane tekstowe 3 Dane sensoryczne 4 Dane multimedialne 5 Podsumowanie
Konotacja składniowajako podstawowy mechanizm zdaniotwórczy
Konotacja składniowa jako podstawowy mechanizm zdaniotwórczy Uniwersytet Kardynała Stefana Wyszyńskiego 1 Pojęcie konotacji 2 Pojęcie konotacji Konotacja otwieranie miejsc; zapowiadanie wystąpienia jakiejś
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po
JĘZYK NIEMIECKI - ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY SZKOLNE
JĘZYK NIEMIECKI - ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY SZKOLNE Ocena bieżąca postępów ucznia uwzględnia wszystkie cztery sprawności językowe, tj.: rozumienie ze słuchu, pisanie, czytanie,
II. Kontrola i ocena pracy ucznia.
II. Kontrola i ocena pracy ucznia. Formy kontroli I Liceum Ogólnokształcące 1. Kontrola bieżąca (w formie oceny udziału w lekcji, odpowiedzi ustnych, niezapowiedzianych kartkówek i innych form testów osiągnięć
CLARINPL. wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych CLARIN-PL. Jan Wieczorek Maciej Piasecki
CLARINPL wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych Jan Wieczorek Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa
Techniki uczenia maszynowego nazwa przedmiotu SYLABUS
Techniki uczenia maszynowego nazwa SYLABUS Obowiązuje od cyklu kształcenia: 2014/20 Część A. Informacje ogólne Elementy składowe sylabusu Nazwa jednostki prowadzącej studiów Poziom kształcenia Profil studiów
ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY Z JĘZYKA NIEMIECKIEGO Nauczyciel prowadzący: mgr Agnieszka Krzeszowiak, mgr Teresa Jaśkowska
ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY Z JĘZYKA NIEMIECKIEGO Nauczyciel prowadzący: mgr Agnieszka Krzeszowiak, mgr Teresa Jaśkowska Ocena bieżąca postępów ucznia uwzględnia wszystkie cztery
Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych
Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Marcin Deptuła Julian Szymański, Henryk Krawczyk Politechnika Gdańska Wydział Elektroniki, Telekomunikacji i Informatyki Katedra Architektury
1. Ogólne ćwiczenia przygotowawcze
1. Ogólne ćwiczenia przygotowawcze Poniższe ćwiczenia o charakterze ogólnym zostały opracowane do zastosowania we wszystkich dialogach i monologach IVY. Aby wykonać dodatkowe ćwiczenia, dotyczące danego
KONWERSATORIUM Z KULTURY JĘZYKA POLSKIEGO DLA 3-LETNICH STUDIÓW POLONISTYCZNYCH PIERWSZEGO STOPNIA PROBLEMATYKA ZAJĘĆ
KONWERSATORIUM Z KULTURY JĘZYKA POLSKIEGO DLA 3-LETNICH STUDIÓW POLONISTYCZNYCH PIERWSZEGO STOPNIA Warunki zaliczenia przedmiotu: 1. obecność na zajęciach (dopuszczalne dwie nieobecności; pięć i więcej
Wymagania edukacyjne w bloku humanistycznym dla klas IV VI Szkoła Podstawowa nr 55 im. Jurija Gagarina w Poznaniu
Wymagania edukacyjne w bloku humanistycznym dla klas IV VI Szkoła Podstawowa nr 55 im. Jurija Gagarina w Poznaniu I. Główne założenia PSO.. Każdy uczeń jest oceniany zgodnie z zasadami sprawiedliwości
Dobór tekstów do Elektronicznego korpusu tekstów polskich z XVII i XVIII w. (do 1772 r.) możliwości i ograniczenia budowanego warsztatu badawczego
Dobór tekstów do Elektronicznego korpusu tekstów polskich z XVII i XVIII w. (do 1772 r.) możliwości i ograniczenia budowanego warsztatu badawczego Dorota Adamiec Instytut Języka Polskiego PAN Elektroniczny
WYMAGANIA EDUKACYJNE Z JĘZYKA ANGIELSKIEGO klasa I gimnazjum Mgr Magdalena Mazanek Mgr Magdalena Pajor GRAMATYKA I SŁOWNICTWO.
WYMAGANIA EDUKACYJNE Z JĘZYKA ANGIELSKIEGO klasa I gimnazjum Mgr Magdalena Mazanek Mgr Magdalena Pajor GRAMATYKA I SŁOWNICTWO - potrafi poprawnie operować niedużą ilością poznanych struktur gramatycznych
KRYTERIA OCENIANIA Z JĘZYKA NIEMIECKIEGO DLA KLAS TRZECICH ODDZIAŁÓW GIMNAZJALNYCH
KRYTERIA OCENIANIA Z JĘZYKA NIEMIECKIEGO DLA KLAS TRZECICH ODDZIAŁÓW GIMNAZJALNYCH Ocenę celującą otrzymuje uczeń, który spełnia wszystkie kryteria oceny bardzo dobrej, a także wykazuje się dodatkowymi