Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych"

Transkrypt

1 Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19

2 Plan prezentacji

3 Plan prezentacji Wrocław V Wstęp 2. Wydobywanie kolokacji 3. Kolokacje w aplikacji MeWeX 4. Definiowanie jednostek leksykalnych 5. Jednostki leksykalne w aplikacji MeWeX 6. Podsumowanie

4 Wstęp

5 Wstęp Wrocław V 2015 Cel: Słownik wielowyrazowych jednostek leksykalnych Definicja: Wielowyrazowa jednostka leksykalna czym jest? Metoda: Dwie drogi Zachód to kolokacje, Wschód - kryteria Wychodzimy od kolokacji, które wydobywamy w sposób automatyczny, ale oceniamy za pomocą kryteriów lingwistycznych.

6 Automatyczna ekstrakcja kolokacji z korpusu tekstów Wrocław V 2015

7 Schemat przetwarzania Wrocław V 2015

8 Korpus tekstowy Wrocław V 2015 Zbiór tekstów wraz z zestawem metadanych. Pożądane cechy: reprezentatywność, zachowanie podziału na zdania, wyrazy i segmenty. Zawartość: formy bazowe, napotkane, opis morfologiczny, dodatkowe anotacje.

9 Plik z korpusem (format CCL) Wrocław V 2015

10 Definicja kolokacji Wrocław V 2015 Często zaobserwowane i nieprzypadkowe połączenie słów występujących w bliskim sąsiedztwie. Przykłady interesujących kolokacji: białe wino (ciągła), czerwona kartka (ciągła), nabić [komuś] guza (nieciągła, 1, 2,...)

11 Siła kolokacji Wrocław V 2015 Kolokacją silną jest takie współwystąpienie słów, które według danej miary ma dużą szansę na bycie jednostką wielowyrazową. ciężarowy samochód samochód ciężarowy czerwony czerwony samochód samochód

12 Siła kolokacji Wrocław V 2015 Kolokacją silną jest takie współwystąpienie słów, które według danej miary ma dużą szansę na bycie jednostką wielowyrazową. ciężarowy ciężarowy samochód samochód X 2 = 65,4 czerwony czerwony samochód samochód X 2 = 17,4

13 Ocena nieprzypadkowości Wrocław V 2015 Nieprzypadkowość (siłę) kolokacji mierzyć można różnymi sposobami. Metody te różnią się od siebie podejściem do rozwiązania problemu, ilością potrzebnych danych, złożonością pamięciową i obliczeniową.

14 Więcej o miarach Wrocław V 2015 Funkcje statystyczne: Pointwise Mutual Dependency, Mutual Dependency, Frequency Biased MD, Mutual Expectation, Unigram Subtuples... Testy statystyczne: X 2 Persona, Loglikelihood, TScore, ZScore... Miary szyku: W Order...

15 Więcej o miarach cz. 2 Wrocław V 2015 Miary kontekstowe: więcej informacji, dane pochodzące także z otoczenia kolokacji, funkcje wykorzystujące także kontekst oprócz danych statystycznych dotyczących częstości. Funkcje wektorowe: kombinacje miar, dobór miar, sposób łączenia rankingów, metody przepunktowywania, możliwość stosowania innych miar wektorowych lub klasyfikatorów jako składowych. Metody maszynowego uczenia: dobór cech wyniki miar, sposób przygotowania cech do klasyfikacji.

16 Filtrowanie danych Wrocław V 2015 Filtry statystyczne: częstości, bardziej skomplikowane filtry (entropia, wariancja, ) jeśli zachowane są konteksty. Filtry językowe: trudniejsze, wiedza dziedzinowa, mniejsza ogólność międzyjęzykowa, oparte o części mowy (typy strukturalne), np. operatory języka ograniczeń WCCL. Funkcje dyspersji: względna prostota zastosowania, wymaga zbioru korpusów.

17 Operator języka WCCL Grupa operatorów Rozmiar operatora

18 Funkcje dyspersji Wrocław V 2015 Zadania: zmiana rozkładu danych statystycznych, wstępne wyznaczenie potencjalnie interesujących kolokacji, element filtrowania, Przykład popularnej funkcji: TF-IDF. F w korpusie 1 F w korpusie 2 F w korpusie 3 Suma Nowa częstość , , ,97

19 Zestawienie przykładowych wyników ekstrakcji kolokacji Wrocław V 2015

20 MeWeX Wrocław V 2015

21 Kilka zrzutów ekranu z aplikacji Wrocław V 2015

22 Kilka zrzutów ekranu z aplikacji Wrocław V 2015

23 Czas na wydobycie Wrocław V 2015

24 Przykładowe wyniki Wrocław V 2015

25 Przykładowe wyniki Wrocław V 2015

26 Przykładowe wyniki Wrocław V 2015

27 Przykładowe wyniki Wrocław V 2015

28 Przykładowe wyniki

29 Wielowyrazowe jednostki leksykalne Wrocław V 2015

30 Wielowyrazowa jednostka leksykalna (WJL) Wrocław V 2015 Dwa podejścia DEF. 1. takie połączenie wyrazowe, które jest przechowywane w naszym mentalnym leksykonie jako jednostka, całostka semantyczna i którego to połączenia nie musimy składać na bieżąco w tekście, tylko przywołujemy je z pamięci Svensen 2009, Murphy 2003, Laskowski 1999, Jackendoff 1997 DEF. 2. takie połączenie wyrazowe, którego znaczenia nie jesteśmy w stanie zrekonstruować na podstawie znaczeń elementów składowych Sinclair 1998, Weigand 1998, Malmkjaer 1991

31 Wielowyrazowa jednostka leksykalna (WJL) Wrocław V 2015 Dwa podejścia DEF. 1. takie połączenie wyrazowe, które jest przechowywane w naszym mentalnym leksykonie jako jednostka, całostka semantyczna i którego to połączenia nie musimy składać na bieżąco w tekście, tylko przywołujemy je z pamięci Svensen 2009, Murphy 2003, Laskowski 1999, Jackendoff 1997 DEF. 2. takie połączenie wyrazowe, którego znaczenia nie jesteśmy w stanie zrekonstruować na podstawie znaczeń elementów składowych Sinclair 1998, Weigand 1998, Malmkjaer 1991

32 WJL kryteria Wrocław V 2015 Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką),

33 WJL kryteria Wrocław V 2015 Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika),

34 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres),

35 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku),

36 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki),

37 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki), ü składniowe i fleksyjne nieregularności:

38 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki), ü składniowe i fleksyjne nieregularności: nieseparowalność (*przemysł bardzo ciężki),

39 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki), ü składniowe i fleksyjne nieregularności: nieseparowalność (*przemysł bardzo ciężki), ustalony szyk (jaszczurka zielona 'Lacerta viridis' ~ zielona jaszczurka),

40 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki), ü składniowe i fleksyjne nieregularności: nieseparowalność (*przemysł bardzo ciężki), ustalony szyk (jaszczurka zielona 'Lacerta viridis' ~ zielona jaszczurka), swoista odmiana lub brak odmiany (nabić guza, wyjść za mąż, do sucha),

41 WJL kryteria Kryteria (Zgusta 1971) ü semantyczna niekompozycyjność ([On jest jego] prawą ręką), ü metaforyczność/ obrazowość/ ekspresywność (pies ogrodnika), ü zawężenie znaczenia (maszyna do pisania), wariant: jednostka nazwą jednego pojęcia (bardzo zawężony zakres), ü wyrazy uwięzione (zbić z pantałyku), ü zamkniętość substytucyjna (*przemysł nielekki), ü składniowe i fleksyjne nieregularności: nieseparowalność (*przemysł bardzo ciężki), ustalony szyk (jaszczurka zielona 'Lacerta viridis' ~ zielona jaszczurka), swoista odmiana lub brak odmiany (nabić guza, wyjść za mąż, do sucha), ü swoisty akcent (náraz 'nagle' na ráz [dwa, trzy]),

42 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia:

43 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy),

44 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka),

45 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet),

46 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet), l istnienie jednowyrazowego derywatu (uniwerbizacja: podstawówka < szkoła podstawowa),

47 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet), l istnienie jednowyrazowego derywatu (uniwerbizacja: podstawówka < szkoła podstawowa),

48 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet), l istnienie jednowyrazowego derywatu (uniwerbizacja: podstawówka < szkoła podstawowa), l istnienie w innym języku odpowiednika jednowyrazowego (zachód słońca sunset),

49 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet), l istnienie jednowyrazowego derywatu (uniwerbizacja: podstawówka < szkoła podstawowa), l istnienie w innym języku odpowiednika jednowyrazowego (zachód słońca sunset), ü bycie terminem (jaszczurka zielona),

50 WJL kryteria Kryteria cd. (Zgusta 1971) ü analogia: l podobieństwo strukturalne i semantyczne do jednostki, którą wg jaśniejszych kryteriów uznaliśmy za WJL (maszyna do szycia <- maszyna do pisania, pociąg pośpieszny <- pociąg osobowy), l występowanie jednowyrazowego synonimu (kobieta lekkich obyczajów ~ prostytutka), l występowanie krótkiej serii połączeń wyrazowych i wyrazów (szkoła podstawowa ~ szkoła średnia ~ uniwersytet), l istnienie jednowyrazowego derywatu (uniwerbizacja: podstawówka < szkoła podstawowa), l istnienie w innym języku odpowiednika jednowyrazowego (zachód słońca sunset), ü bycie terminem (jaszczurka zielona), ü występowanie w słownikach (hala maszyn jest notowana w

51 WJL kryteria Kryteria û nie są niezależne od siebie, û nie tworzą spójnego systemu klasyfikacji, û silnie zależą od intuicji, û są argumentami post hoc gdy decyzja już została podjęta.

52 WJL kryteria Kryteria û nie są niezależne od siebie, û nie tworzą spójnego systemu klasyfikacji, û silnie zależą od intuicji, û są argumentami post hoc gdy decyzja już została podjęta. System zbudowany na niekompozycyjności ü jedyno kryterium ü (zamiast systemu kryteriów), û zależy od definicji niekompozycyjności, ü decyzja podejmowana jest na podstawie analizy semantycznej, û założenie a priori: leksykalność = niekompozycyjność.

53 WJL kryteria System zbudowany na wielu kryteriach ü Brak założenia a priori: leksykalność = niekompozycyjność. ü Ale jak zbudować spójny system?

54 WJL system kryteriów System zbudowany na wielu kryteriach 14 osób

55 WJL system kryteriów System zbudowany na wielu kryteriach DEF. 1. takie połączenie wyrazowe, które jest przechowywane w naszym mentalnym leksykonie jako jednostka, całostka semantyczna i którego to połączenia nie musimy składać na bieżąco w tekście, tylko przywołujemy je z pamięci Svensen 2009, Murphy 2003, Laskowski 1999, Jackendoff 1997

56 WJL system kryteriów System zbudowany na wielu kryteriach połączenie TAK NIE WJL? maszyna do szycia 13 1 pies Marka 0 14

57 WJL system kryteriów System zbudowany na wielu kryteriach połączenie TAK NIE WJL? maszyna do szycia 13 1!" pies Marka 0 14 #"

58 WJL system kryteriów System zbudowany na wielu kryteriach 14 osób DEF połączeń (varia)

59 WJL system kryteriów System zbudowany na wielu kryteriach 14 osób 5 osób DEF. 1. DEF połączeń (varia) 200 połączeń ze Słowosieci 5 osób DEF kolokacji typu N+Adj

60 WJL system kryteriów System zbudowany na wielu kryteriach DEF połączeń (varia) KRYTERIA (10) DEF połączeń ze Słowosieci DEF kolokacji typu N+Adj

61 WJL system kryteriów System zbudowany na wielu kryteriach DEF połączeń (varia) autor Wyraz uwięziony Szyk swobodny pies Marka (14 x NIE) Termin Metaforyczność Separowalność Specjalistyczność Kompozycyjność Parafraza #1 #"!"!" #" #" #"!"!" #2 #"!" #" #" #" #"!"!"

62 WJL system kryteriów System zbudowany na wielu kryteriach DEF połączeń (varia) autor Wyraz uwięziony Szyk swobodny pies Marka (14 x NIE) Termin Metaforyczność Parafraza #1 #"!"!" #" #" #"!"!" #2 #"!" #" #" #" #"!"!" autor Wyraz uwięziony maszyna do szycia (13 x TAK, 1 x NIE) Szyk swobodny Termin Metaforyczność Separowalność Specjalistyczność Kompozycyjność Separowalność Specjalistyczność Kompozycyjność Parafraza #1 #" #"!" #" #"!" #" #" #2 #"!"!" #" #" #"!" #"

63 WJL system kryteriów System zbudowany na wielu kryteriach DEF połączeń (varia) autor Wyraz uwięziony Szyk swobodny pies Marka (14 x NIE) Termin Metaforyczność Parafraza #1 #"!"!" #" #" #"!"!" #2 #"!" #" #" #" #"!"!" autor Wyraz uwięziony maszyna do szycia (13 x TAK, 1 x NIE) Szyk swobodny Termin Metaforyczność Separowalność Specjalistyczność Kompozycyjność Separowalność Specjalistyczność Kompozycyjność Parafraza #1 #" #"!" #" #"!" #" #" #2 #"!"!" #" #" #"!" #"

64 WJL system kryteriów System zbudowany na wielu kryteriach DEF połączeń (varia) autor Wyraz uwięziony Szyk swobodny pies Marka (14 x NIE) Termin Metaforyczność Parafraza #1 #"!"!" #" #" #"!"!" #2 #"!" #" #" #" #"!"!" autor Wyraz uwięziony maszyna do szycia (13 x TAK, 1 x NIE) Szyk swobodny Termin Metaforyczność Separowalność Specjalistyczność Kompozycyjność Separowalność Specjalistyczność Kompozycyjność Parafraza #1 #" #"!" #" #"!" #" #" #2 #"!"!" #" #" #"!" #"

65 WJL system kryteriów System zbudowany na wielu kryteriach KRYTERIA (10) DEF połączeń (varia)

66 WJL system kryteriów System zbudowany na wielu kryteriach KRYTERIA (10) DEF. 1.

67 WJL system kryteriów System zbudowany na wielu kryteriach KRYTERIA (10) DEF. 1.

68 WJL system kryteriów System zbudowany na wielu kryteriach

69 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ

70 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ Nazwa własna? Wyraz uwięziony? Niepoprawna fraza?

71 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ Część mowy - rzeczownik - przymiotnik - czasownik - przysłówek

72 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ TERMIN?

73 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? #

74 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA?

75 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA?!" N+Adj? # WJL

76 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? #!" N+Adj?!" # WJL

77 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? nie-wjl #!" N+Adj? # WJL!" SEPAROWALNOŚĆ?

78 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? nie-wjl #!" N+Adj? # WJL!" SEPAROWALNOŚĆ?!" #

79 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? nie-wjl #!" N+Adj? # WJL!" SEPAROWALNOŚĆ?!" SZYK USTALONY? # WJL

80 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? nie-wjl #!" N+Adj? # WJL!" SEPAROWALNOŚĆ?!" SZYK USTALONY? # WJL!" #

81 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMIN? # WJL PARAFRAZA? nie-wjl #!" N+Adj? # WJL!" SEPAROWALNOŚĆ?!" SZYK USTALONY? # WJL!" # WJL nie-wjl

82 WJL system kryteriów System zbudowany na wielu kryteriach Połączenie XYZ!" TERMINY TERMIN? # PARAFRAZA? nie-wjl #!" N+Adj?!" # JEDNOSTKI NIEKOMPO- ZYCYJNE SEPAROWALNOŚĆ?!" SZYK USTALONY? # ZESTAWIENIA!" # ZESTAWIENIA nie-wjl

83 MeWeX jednostki leksykalne

84 MeWeX jednostki leksykalne

85 MeWeX jednostki leksykalne

86 MeWeX jednostki leksykalne

87 MeWeX jednostki leksykalne

88 MeWeX jednostki leksykalne

89 MeWeX jednostki leksykalne

90 MeWeX jednostki leksykalne

91 MeWeX jednostki leksykalne

92 MeWeX jednostki leksykalne

93 MeWeX jednostki leksykalne

94 MeWeX jednostki leksykalne

95 MeWeX jednostki leksykalne Typ strukturalny decyzja urobek

96 MeWeX jednostki leksykalne Typ strukturalny decyzja urobek

97 Podsumowanie

98 Podsumowanie dwie drogi Językoznawstwo korpusowe i frazeologia Punkt wyjścia: korpus i kolokacje Cel: jednostki leksykalne frazeologizmy terminy zestawienia Środek: aplikacja MeWeX

99 Dziękujemy bardzo za uwagę

CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy

CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy Cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy 13 15 kwietnia 2015 roku Warszawa, Pałac Staszica, ul. Nowy Świat 72, sala 144

Bardziej szczegółowo

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

CLARIN rozproszony system technologii językowych dla różnych języków europejskich CLARIN rozproszony system technologii językowych dla różnych języków europejskich Maciej Piasecki Politechnika Wrocławska Instytut Informatyki G4.19 Research Group maciej.piasecki@pwr.wroc.pl Projekt CLARIN

Bardziej szczegółowo

II cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych

II cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych II cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych 18-20 maja 2015 roku Politechnika Wrocławska, Centrum Kongresowe,

Bardziej szczegółowo

I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ?... 13 II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY...

I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ?... 13 II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY... I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ?.... 13 II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY............ 17 1. Niepowtarzalność języka każdego z nas.................. 17 1.1. Nasz język indywidualny...........................

Bardziej szczegółowo

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji

Bardziej szczegółowo

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika ska Katedra Inteligencji

Bardziej szczegółowo

Spis treści tomu pierwszego

Spis treści tomu pierwszego Spis treści tomu pierwszego WSTĘP.... 11 DŹWIĘK JAKO ZJAWISKO FIZYCZNE...15 CHARAKTERYSTYKA AKUSTYCZNA I AUDYTYWNA DŹWIĘKÓW MOWY.. 17 SŁUCH...20 WYŻSZE PIĘTRA UKŁADU SŁUCHOWEGO...22 EMISJE OTOAKUSTYCZNE...25

Bardziej szczegółowo

Polskie korpusy równoległe i zasoby wielojęzyczne w projekcie CESAR

Polskie korpusy równoległe i zasoby wielojęzyczne w projekcie CESAR Polskie korpusy równoległe i zasoby wielojęzyczne w projekcie CESAR Piotr Pęzik Uniwersytet Łódzki. META-NET META- NET CESAR IPI PAN & UŁ http://www.meta-net.eu 2 Polskie zasoby w repozytorium META-NET

Bardziej szczegółowo

Co wylicza Jasnopis? Bartosz Broda

Co wylicza Jasnopis? Bartosz Broda Co wylicza Jasnopis? Bartosz Broda Analiza języka polskiego Ekstrakcja tekstu Dokument narzędzie do mierzenia zrozumiałości Analiza morfologiczna Analiza morfosyntaktyczna Indeksy Klasa trudności:

Bardziej szczegółowo

Spis treści. ROZDZIAŁ 2 Wzajemne oddziaływanie między leksykonem a innymi środkami służącymi kodowaniu informacji... 67

Spis treści. ROZDZIAŁ 2 Wzajemne oddziaływanie między leksykonem a innymi środkami służącymi kodowaniu informacji... 67 Spis treści Wykaz skrótów... 11 Przedmowa... 15 Podziękowania... 17 ROZDZIAŁ 1 Wprowadzenie: założenia metodologiczne i teoretyczne... 19 1. Cel i układ pracy...... 19 2. Język jako przedmiot badań...

Bardziej szczegółowo

Katedra Języków Specjalistycznych Wydział Lingwistyki Stosowanej U n i w e r s y t e t W a r s z a w s k i. Debiuty Naukowe. Leksykon tekst wyraz

Katedra Języków Specjalistycznych Wydział Lingwistyki Stosowanej U n i w e r s y t e t W a r s z a w s k i. Debiuty Naukowe. Leksykon tekst wyraz Katedra Języków Specjalistycznych Wydział Lingwistyki Stosowanej U n i w e r s y t e t W a r s z a w s k i Debiuty Naukowe III Leksykon tekst wyraz WARSZAWA 2009-1 - Seria Debiuty Naukowe Redaktor tomu

Bardziej szczegółowo

Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska

Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Seminarium przetwarzania języka naturalnego Mateusz Kopeć Instytut Podstaw Informatyki Polskiej Akademii Nauk 6 lutego 2012 Plan 1 Zadanie

Bardziej szczegółowo

PRACA DYPLOMOWA MAGISTERSKA

PRACA DYPLOMOWA MAGISTERSKA POLITECHNIKA WROCŠAWSKA WYDZIAŠ INFORMATYKI I ZARZ DZANIA KIERUNEK: Informatyka SPECJALNO : Inteligentne Systemy Informatyczne PRACA DYPLOMOWA MAGISTERSKA Automatyczne wydobywanie i klasykowanie kolokacji

Bardziej szczegółowo

W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji.

W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji. 5 Collocations Związek frazeologiczny (kolokacja), to często używane zestawienie słów. Przykłady: strong tea, weapons of mass destruction, make up. Znaczenie całości wyrażenia, nie zawsze wynika ze znaczeń

Bardziej szczegółowo

Semantyczne podobieństwo stron internetowych

Semantyczne podobieństwo stron internetowych Uniwersytet Mikołaja Kopernika Wydział Matematyki i Informatyki Marcin Lamparski Nr albumu: 184198 Praca magisterska na kierunku Informatyka Semantyczne podobieństwo stron internetowych Praca wykonana

Bardziej szczegółowo

II. Kontrola i ocena pracy ucznia.

II. Kontrola i ocena pracy ucznia. II. Kontrola i ocena pracy ucznia. Formy kontroli A. Kontrola bieżąca (sprawdza postępy uczniów, zachęcając ich do dalszej systematycznej pracy, pozwala na uzupełnienie braków w wiedzy i skorygować błędy).

Bardziej szczegółowo

W obrębie polskiego języka narodowego należy wydzielić dwa systemy:

W obrębie polskiego języka narodowego należy wydzielić dwa systemy: Wykład nr 2 W obrębie polskiego języka narodowego należy wydzielić dwa systemy: a) polszczyznę ogólną (zwaną literacką); b)polszczyznę gwarową (gwary ludowe). Jest to podział dokonany ze względu na zasięg

Bardziej szczegółowo

Analiza danych tekstowych i języka naturalnego

Analiza danych tekstowych i języka naturalnego Kod szkolenia: Tytuł szkolenia: ANA/TXT Analiza danych tekstowych i języka naturalnego Dni: 3 Opis: Adresaci szkolenia Dane tekstowe stanowią co najmniej 70% wszystkich danych generowanych w systemach

Bardziej szczegółowo

Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych

Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław

Bardziej szczegółowo

WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp

WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp Natalia Kotsyba, IBI AL UW 24 marca 2010 Plan zajęć Praca domowa na zapytania do Korpusu IPI PAN za pomocą

Bardziej szczegółowo

Ontologie, czyli o inteligentnych danych

Ontologie, czyli o inteligentnych danych 1 Ontologie, czyli o inteligentnych danych Bożena Deka Andrzej Tolarczyk PLAN 2 1. Korzenie filozoficzne 2. Ontologia w informatyce Ontologie a bazy danych Sieć Semantyczna Inteligentne dane 3. Zastosowania

Bardziej szczegółowo

Morfeusz 2 analizator i generator fleksyjny dla języka polskiego

Morfeusz 2 analizator i generator fleksyjny dla języka polskiego Morfeusz 2 analizator i generator fleksyjny dla języka polskiego Marcin Woliński i Anna Andrzejczuk Zespół Inżynierii Lingwistycznej Instytut Podstaw Informatyki Polskiej Akademii Nauk Warsztaty CLARIN-PL,

Bardziej szczegółowo

System Korekty Tekstu Polskiego

System Korekty Tekstu Polskiego Wnioski Grzegorz Szuba System Korekty Tekstu Polskiego Plan prezentacji Geneza problemu i cele pracy Opis algorytmu bezkontekstowego Opis algorytmów kontekstowych Wyniki testów Rozszerzenie pracy - uproszczona

Bardziej szczegółowo

Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań

Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań Anna Manerowska, Michal Kozakiewicz 2.12.2009 1 Wstęp Jako projekt na przedmiot MEUM (Metody Ewolucyjne Uczenia Maszyn)

Bardziej szczegółowo

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po

Bardziej szczegółowo

Systemy Wspomagania Decyzji

Systemy Wspomagania Decyzji Rodzaje danych oraz ich przetwarzanie Szkoła Główna Służby Pożarniczej Zakład Informatyki i Łączności January 29, 2014 1 Dane tabelaryczne 2 Dane tekstowe 3 Dane sensoryczne 4 Dane multimedialne 5 Podsumowanie

Bardziej szczegółowo

II. Kontrola i ocena pracy ucznia.

II. Kontrola i ocena pracy ucznia. II. Kontrola i ocena pracy ucznia. Formy kontroli I Liceum Ogólnokształcące 1. Kontrola bieżąca (w formie oceny udziału w lekcji, odpowiedzi ustnych, niezapowiedzianych kartkówek i innych form testów osiągnięć

Bardziej szczegółowo

Techniki uczenia maszynowego nazwa przedmiotu SYLABUS

Techniki uczenia maszynowego nazwa przedmiotu SYLABUS Techniki uczenia maszynowego nazwa SYLABUS Obowiązuje od cyklu kształcenia: 2014/20 Część A. Informacje ogólne Elementy składowe sylabusu Nazwa jednostki prowadzącej studiów Poziom kształcenia Profil studiów

Bardziej szczegółowo

1. Ogólne ćwiczenia przygotowawcze

1. Ogólne ćwiczenia przygotowawcze 1. Ogólne ćwiczenia przygotowawcze Poniższe ćwiczenia o charakterze ogólnym zostały opracowane do zastosowania we wszystkich dialogach i monologach IVY. Aby wykonać dodatkowe ćwiczenia, dotyczące danego

Bardziej szczegółowo

Zapytanie ofertowe nr 1/2016

Zapytanie ofertowe nr 1/2016 to Zapytanie ofertowe nr 1/2016 z dnia 11052016 Espeo Software Sp z oo 2 Zapytanie ofertowe nr 1/2016 z dnia 11052016 Zapytanie ofertowe nr 1/2016 z dnia 11052016 Zamawiający: Espeo Software Sp z oo Adres:

Bardziej szczegółowo

Język ludzki kod maszynowy

Język ludzki kod maszynowy Język ludzki kod maszynowy poziom wysoki Język ludzki (mowa) Język programowania wysokiego poziomu Jeśli liczba punktów jest większa niż 50, test zostaje zaliczony; w przeciwnym razie testu nie zalicza

Bardziej szczegółowo

Marek Świdziński Elementy gramatyki opisowej języka polskiego Uniwersytet Warszawski * Wydział Polonistyki Seria szósta, T. XXXIII Warszawa 1997

Marek Świdziński Elementy gramatyki opisowej języka polskiego Uniwersytet Warszawski * Wydział Polonistyki Seria szósta, T. XXXIII Warszawa 1997 1 Marek Świdziński Elementy gramatyki opisowej języka polskiego Uniwersytet Warszawski * Wydział Polonistyki Seria szósta, T. XXXIII Warszawa 1997 SPIS TREŚCI WSTĘP... 1 WYKŁAD 1: WPROWADZENIE DO JĘZYKOZNAWSTWA

Bardziej szczegółowo

Jak mysz siedzi pod miotłą? Dziecięce wyjaśnienia zwrotów frazeologicznych

Jak mysz siedzi pod miotłą? Dziecięce wyjaśnienia zwrotów frazeologicznych Małgorzata Dagiel Jak mysz siedzi pod miotłą? Dziecięce wyjaśnienia zwrotów frazeologicznych Odpowiedź na tytułowe pytanie: Jak mysz siedzi pod miotłą? (pod warunkiem, że rozumie się znaczenie słów siedzieć,

Bardziej szczegółowo

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich

Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich Adam Radziszewski Instytut Informatyki Stosowanej PWr SIIS 23, 12 czerwca 2008 O

Bardziej szczegółowo

Konotacja składniowajako podstawowy mechanizm zdaniotwórczy

Konotacja składniowajako podstawowy mechanizm zdaniotwórczy Konotacja składniowa jako podstawowy mechanizm zdaniotwórczy Uniwersytet Kardynała Stefana Wyszyńskiego 1 Pojęcie konotacji 2 Pojęcie konotacji Konotacja otwieranie miejsc; zapowiadanie wystąpienia jakiejś

Bardziej szczegółowo

Praca Magisterska. Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń. internetowego dla języka polskiego

Praca Magisterska. Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń. internetowego dla języka polskiego Praca Magisterska Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń Lingwistycznych zbudowanego przez robota internetowego dla języka polskiego Marcin A. Gadamer Promotor: dr Adrian

Bardziej szczegółowo

Raport z badao OBUT 2011 w Szkole Podstawowej nr 6 im. Henryka Sienkiewicza w Pruszkowie

Raport z badao OBUT 2011 w Szkole Podstawowej nr 6 im. Henryka Sienkiewicza w Pruszkowie Raport z badao OBUT 2011 w Szkole Podstawowej nr 6 im. Henryka Sienkiewicza w Pruszkowie W badaniu OBUT wzięło udział 89 uczniów z czterech klas III. Badanie składało się z dwóch części: z badania umiejętności

Bardziej szczegółowo

Walenty. słownik walencyjny języka polskiego z kontrolą i koordynacją. Filip Skwarski. 5 listopada 2012 r. IPI PAN

Walenty. słownik walencyjny języka polskiego z kontrolą i koordynacją. Filip Skwarski. 5 listopada 2012 r. IPI PAN Walenty słownik walencyjny języka polskiego z kontrolą i koordynacją Filip Skwarski IPI PAN 5 listopada 2012 r. Układ 1 Wstęp Istniejące opisy walencyjne Po co nam kolejny słownik walencyjny? Opracowanie

Bardziej szczegółowo

Zautomatyzowane tworzenie korpusów błędów dla języka polskiego

Zautomatyzowane tworzenie korpusów błędów dla języka polskiego Zautomatyzowane tworzenie korpusów błędów dla języka polskiego Marcin Miłkowski Instytut Filozofii i Socjologii PAN Zakład Logiki i Kognitywistyki Adres projektu: morfologik.blogspot.com Korpusy błędów

Bardziej szczegółowo

Oprogramowanie typu CAT

Oprogramowanie typu CAT Oprogramowanie typu CAT (Computer Aided Translation) Informacje ogólne Copyright Jacek Scholz 2009 Wprowadzenie: narzędzia do wspomagania translacji Bazy pamięci tłumaczet umaczeń (Translation Memory)

Bardziej szczegółowo

Uniwersytet w Białymstoku Wydział Ekonomiczno-Informatyczny w Wilnie SYLLABUS na rok akademicki 2012/2013 http://www.wilno.uwb.edu.

Uniwersytet w Białymstoku Wydział Ekonomiczno-Informatyczny w Wilnie SYLLABUS na rok akademicki 2012/2013 http://www.wilno.uwb.edu. SYLLABUS na rok akademicki 01/013 Tryb studiów Studia stacjonarne Kierunek studiów Informatyka Poziom studiów Pierwszego stopnia Rok studiów/ semestr /3 Specjalność Bez specjalności Kod katedry/zakładu

Bardziej szczegółowo

TP1 - TABELE PRZESTAWNE od A do Z

TP1 - TABELE PRZESTAWNE od A do Z TP1 - TABELE PRZESTAWNE od A do Z Program szkolenia 1. Tabele programu Excel 1.1. Wstawianie tabeli 1.2. Style tabeli 1.3. Właściwości tabeli 1.4. Narzędzia tabel 1.4.1. Usuń duplikaty 1.4.2. Konwertuj

Bardziej szczegółowo

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie

SGJP Model odmiany Przymiotniki Rzeczowniki Czasowniki Podsumowanie Warszawa, Wiedza Powszechna 2007 Publikacja przygotowana w latach 2003 2006 w ramach projektu Słownik gramatyczny języka polskiego, sponsorowanego przez Komitet Badań Naukowych (nr rejestracyjny 2 H01D

Bardziej szczegółowo

Badanie opinii Omniwatch. Oferta badawcza

Badanie opinii Omniwatch. Oferta badawcza Badanie opinii Omniwatch Oferta badawcza Kim jesteśmy? SW Research Agencja badań rynku i opinii Rok założenia 2011 Wizerunek Firma oferująca profesjonalne rozwiązania badawcze, usługi analityczne i doradcze.

Bardziej szczegółowo

Klasyfikacje języków świata cz. 2.:klasyfikacja geograficzna i typo

Klasyfikacje języków świata cz. 2.:klasyfikacja geograficzna i typo Klasyfikacje języków świata cz. 2.: klasyfikacja geograficzna i typologiczna Uniwersytet Kardynała Stefana Wyszyńskiego 1 Klasyfikacje języków świata 2 3 Podstawy klasyfikacji typologicznej Różne klasyfikacje

Bardziej szczegółowo

CLARIN-PL w praktyce badawczej

CLARIN-PL w praktyce badawczej CLARIN-PL w praktyce badawczej Podsumowanie cyklu wykładów i warsztatów Streszczenie: CLARIN- PL jest infrastrukturą naukową technologii językowych, która udostępnia narzędzia badawcze do analizy zapisów

Bardziej szczegółowo

Funkcje systemu infokadra

Funkcje systemu infokadra System Informacji Zarządczej - infokadra jest rozwiązaniem skierowanym dla kadry zarządzającej w obszarze administracji publicznej. Jest przyjaznym i łatwym w użyciu narzędziem analityczno-raportowym,

Bardziej szczegółowo

Badanie opinii Warsaw Watch. Oferta badawcza

Badanie opinii Warsaw Watch. Oferta badawcza Badanie opinii Warsaw Watch Oferta badawcza Kim jesteśmy? SW Research Agencja badań rynku i opinii Rok założenia 2011 Wizerunek Firma oferująca profesjonalne rozwiązania badawcze, usługi analityczne i

Bardziej szczegółowo

Wymagania edukacyjne w bloku humanistycznym dla klas IV VI Szkoła Podstawowa nr 55 im. Jurija Gagarina w Poznaniu

Wymagania edukacyjne w bloku humanistycznym dla klas IV VI Szkoła Podstawowa nr 55 im. Jurija Gagarina w Poznaniu Wymagania edukacyjne w bloku humanistycznym dla klas IV VI Szkoła Podstawowa nr 55 im. Jurija Gagarina w Poznaniu I. Główne założenia PSO. 1. Każdy uczeń jest oceniany zgodnie z zasadami sprawiedliwości

Bardziej szczegółowo

Jarosław Wilk, doktorant Wydziału Cybernetyki WAT

Jarosław Wilk, doktorant Wydziału Cybernetyki WAT Bezpieczeństwo i interoperacyjność platform integracyjnych warunkami powodzenia biznesu internetowego charakterystyka oraz podejście do rozwiązania problemu Jarosław Wilk, doktorant Wydziału Cybernetyki

Bardziej szczegółowo

CZĘŚĆ I ETAPU PISEMNEGO

CZĘŚĆ I ETAPU PISEMNEGO I.1.1. Technik architektury krajobrazu 321[07] Do egzaminu zostało zgłoszonych: 1173 Przystąpiło łącznie: 1028 przystąpiło: 1024 przystąpiło: 1008 ETAP PISEMNY ETAP PRAKTYCZNY zdało: 850 (82,9%) zdało:

Bardziej szczegółowo

ANALIZA WYNIKÓW EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2014/2015 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI

ANALIZA WYNIKÓW EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2014/2015 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI ANALIZA WYNIKÓW EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2014/2015 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI W dniu 21.04.2015r. odbył się egzamin gimnazjalny z języka polskiego. Do badania diagnostycznego

Bardziej szczegółowo

Wstęp Wraz z rozwojem nauki, jej rosnącą rolą w życiu codziennym i stałym poszerzaniem oferty edukacyjnej wzrasta zapotrzebowanie na typ komunikacji, który sprzyja systematycznemu opisowi rzeczywistości,

Bardziej szczegółowo

Z punktu widzenia kognitywisty: język naturalny

Z punktu widzenia kognitywisty: język naturalny Z punktu widzenia kognitywisty: język naturalny Wykład I: Czym jest język? http://konderak.eu/pwk13.html Piotr Konderak kondorp@bacon.umcs.lublin.pl p. 205, Collegium Humanicum konsultacje: czwartki, 11:10-12:40

Bardziej szczegółowo

Polszczyzna i inżynieria lingwistyczna. Autor: Marcin Miłkowski (IFiS PAN)

Polszczyzna i inżynieria lingwistyczna. Autor: Marcin Miłkowski (IFiS PAN) Polszczyzna i inżynieria lingwistyczna Autor: Marcin Miłkowski (IFiS PAN) 1 Polszczyzna i jej cechy szczególne Polszczyzną posługuje się od 40 do 48 milionów osób: najczęściej używany język zachodniosłowiański

Bardziej szczegółowo

Języki deskryptorowe. Dr Marek Nahotko

Języki deskryptorowe. Dr Marek Nahotko Języki deskryptorowe Dr Marek Nahotko 1 Literatura: Języki deskryptorowe dla SINTO / Lucyna Bielicka, Joanna Tomasik-Beck. Warszawa, 1981; Zasady budowy tezaurusów / Kazimierz Leski. Warszawa, 1978; Języki

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Adam Dudczak Poznańskie Centrum Superkomputerowo-Sieciowe (maneo@man.poznan.pl) I Konferencja Polskie Biblioteki

Bardziej szczegółowo

Wikisłownik. (więcej niż słownik) Piotr Derbeth Kubowicz. Wikiwarsztaty Wrocław, 7 marca 2009. Stowarzyszenie Wikimedia Polska

Wikisłownik. (więcej niż słownik) Piotr Derbeth Kubowicz. Wikiwarsztaty Wrocław, 7 marca 2009. Stowarzyszenie Wikimedia Polska Wikisłownik (więcej niż słownik) Piotr Derbeth Kubowicz Stowarzyszenie Wikimedia Polska Wikiwarsztaty Wrocław, 7 marca 2009 Piotr Kubowicz (WMPL) Wikisłownik 7 marca 2009 1 / 35 Część I Wstęp Piotr Kubowicz

Bardziej szczegółowo

Oracle11g: Wprowadzenie do SQL

Oracle11g: Wprowadzenie do SQL Oracle11g: Wprowadzenie do SQL OPIS: Kurs ten oferuje uczestnikom wprowadzenie do technologii bazy Oracle11g, koncepcji bazy relacyjnej i efektywnego języka programowania o nazwie SQL. Kurs dostarczy twórcom

Bardziej szczegółowo

Rola języka XML narzędziem

Rola języka XML narzędziem Wprowadzenie do XML dr inż. Adam Iwaniak Szkolenie w Luboradzy, ZCPWZ, 12-13.02.2009r. Rola języka XML narzędziem Pierwszą rewolucją internetową było dostarczenie ludziom informacji. Znajdujemy się teraz

Bardziej szczegółowo

KRYTERIA OCENIANIA Z JĘZYKA ANGIELSKIEGO W KLASACH I-III GIMNAZJUM

KRYTERIA OCENIANIA Z JĘZYKA ANGIELSKIEGO W KLASACH I-III GIMNAZJUM KRYTERIA OCENIANIA Z JĘZYKA ANGIELSKIEGO W KLASACH I-III GIMNAZJUM Zgodnie z własnym Programem nauczania w Gimnazjum Specjalnym Nr 100 w Warszawie dla uczniów z upośledzeniem umysłowym w stopniu lekkim

Bardziej szczegółowo

Spis treści 5. Spis treści. Część pierwsza Podstawy projektowania systemów organizacyjnych przedsiębiorstwa

Spis treści 5. Spis treści. Część pierwsza Podstawy projektowania systemów organizacyjnych przedsiębiorstwa Spis treści 5 Spis treści Wstęp (Adam Stabryła)... 11 Część pierwsza Podstawy projektowania systemów organizacyjnych przedsiębiorstwa Rozdział 1. Interpretacja i zakres metodologii projektowania (Janusz

Bardziej szczegółowo

Systemy baz danych w zarządzaniu przedsiębiorstwem. W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi

Systemy baz danych w zarządzaniu przedsiębiorstwem. W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi Systemy baz danych w zarządzaniu przedsiębiorstwem W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi Proces zarządzania danymi Zarządzanie danymi obejmuje czynności: gromadzenie

Bardziej szczegółowo

Definicje. Algorytm to:

Definicje. Algorytm to: Algorytmy Definicje Algorytm to: skończony ciąg operacji na obiektach, ze ściśle ustalonym porządkiem wykonania, dający możliwość realizacji zadania określonej klasy pewien ciąg czynności, który prowadzi

Bardziej szczegółowo

Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst

Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst Mariusz Owsianny, PCSS Dr inż. Ewa Kuśmierek, Kierownik Projektu, PCSS Partnerzy konsorcjum Zaawansowany system automatycznego

Bardziej szczegółowo

Korpusy mowy i narzędzia do ich przetwarzania

Korpusy mowy i narzędzia do ich przetwarzania Korpusy mowy i narzędzia do ich przetwarzania Danijel Korzinek, Krzysztof Marasek Polsko-Japońska Akademia Technik Komputerowych Katedra Multimediów kmarasek@pjwstk.edu.pl danijel@pjwstk.edu.pl 2015-05-18

Bardziej szczegółowo

Gimnazjum w Zespole Szkół im. Hipolity i Kazimierza Gnoioskich w Siennicy

Gimnazjum w Zespole Szkół im. Hipolity i Kazimierza Gnoioskich w Siennicy Gimnazjum w Zespole Szkół im. Hipolity i Kazimierza Gnoioskich w Siennicy Opracowanie wyników egzaminu gimnazjalnego za rok szkolny 2009/2010: Częśd matematyczno-przyrodnicza Częśd humanistyczna Częśd

Bardziej szczegółowo

FILOLOGIA ANGIELSKA PRAKTYCZNA NAUKA JĘZYKA ANGIELSKIEGO FORMAT EGZAMINÓW. STUDIA I STOPNIA - egzamin osiągnięć po roku 2

FILOLOGIA ANGIELSKA PRAKTYCZNA NAUKA JĘZYKA ANGIELSKIEGO FORMAT EGZAMINÓW. STUDIA I STOPNIA - egzamin osiągnięć po roku 2 FILOLOGIA ANGIELSKA PRAKTYCZNA NAUKA JĘZYKA ANGIELSKIEGO FORMAT EGZAMINÓW STUDIA I STOPNIA - egzamin osiągnięć po roku 2 STUDIA II STOPNIA - egzamin osiągnięć po roku 1 Strona 1 z 7 STUDIA I STOPNIA EGZAMIN

Bardziej szczegółowo

Informatyka kl. 1. Semestr I

Informatyka kl. 1. Semestr I Informatyka kl. 1 Znajomość roli informatyki we współczesnym świecie. Rozróżnianie zestawu urządzeń w komputerze, rodzajów pamięci komputera, urządzeń wejścia i wyjścia. Umiejętność tworzenia dokumentu

Bardziej szczegółowo

Uniwersytet Śląski w Katowicach str. 1 Wydział Matematyki Fizyki i Chemii, Instytut Matematyki

Uniwersytet Śląski w Katowicach str. 1 Wydział Matematyki Fizyki i Chemii, Instytut Matematyki Uniwersytet Śląski w Katowicach str. 1 Kierunek i poziom studiów: Matematyka, studia II stopnia, rok 1 Sylabus modułu: Moduł specjalistyczny Kod modułu: 03-MO2N-12-MSpe Nazwa wariantu modułu (opcjonalnie):

Bardziej szczegółowo

OLAP i hurtownie danych c.d.

OLAP i hurtownie danych c.d. OLAP i hurtownie danych c.d. Przypomnienie OLAP -narzędzia analizy danych Hurtownie danych -duże bazy danych zorientowane tematycznie, nieulotne, zmienne w czasie, wspierjące procesy podejmowania decyzji

Bardziej szczegółowo

Proces badawczy schemat i zasady realizacji

Proces badawczy schemat i zasady realizacji Proces badawczy schemat i zasady realizacji Agata Górny Zaoczne Studia Doktoranckie z Ekonomii Warszawa, 14 grudnia 2014 Metodologia i metoda badawcza Metodologia Zadania metodologii Metodologia nauka

Bardziej szczegółowo

Zadania. Przygotowanie zbiorów danych. 1. Sposób 1: 2. Sposób 2:

Zadania. Przygotowanie zbiorów danych. 1. Sposób 1: 2. Sposób 2: Wstęp Jednym z typowych zastosowań metod sztucznej inteligencji i uczenia maszynowego jest przetwarzanie języka naturalnego (ang. Natural Language Processing, NLP), której typowych przykładem jest analiza

Bardziej szczegółowo

Praca magisterska Jakub Reczycki. Opiekun : dr inż. Jacek Rumiński. Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska

Praca magisterska Jakub Reczycki. Opiekun : dr inż. Jacek Rumiński. Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska System gromadzenia, indeksowania i opisu słownikowego norm i rekomendacji Praca magisterska Jakub Reczycki Opiekun : dr inż. Jacek Rumiński Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska

Bardziej szczegółowo

Centrum Technologii Językowych CLARIN- PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego

Centrum Technologii Językowych CLARIN- PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego Centrum Technologii Językowych CLARIN- PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego Maciej Piasecki, Tomasz Walkowiak Politechnika ska Katedra Inteligencji Obliczeniowej

Bardziej szczegółowo

14 Wyszukiwarka PELCRA dla danych NKJP

14 Wyszukiwarka PELCRA dla danych NKJP 14 Wyszukiwarka PELCRA dla danych NKJP Piotr Pęzik 14.1. O wyszukiwarce Wyszukiwarka PELCRA 1 to jedna z dwóch wyszukiwarek internetowych dostępnych dla danych NKJP. Narzędzie to pozwala na szybkie i wygodne

Bardziej szczegółowo

JEZIORO, ŁÓDKA, CHMURA CO MOŻE WYNIKAĆ Z ICH KOMBINACJI?

JEZIORO, ŁÓDKA, CHMURA CO MOŻE WYNIKAĆ Z ICH KOMBINACJI? Małgorzata Dagiel JEZIORO, ŁÓDKA, CHMURA CO MOŻE WYNIKAĆ Z ICH KOMBINACJI? Rozważania na temat umiejętności językowych trzecioklasistów w zakresie składni rozpocznę od przykładu zadania złożonego z pięciu

Bardziej szczegółowo

4. Zaimek wskazujący Zaimek względny Zaimek pytający Zaimek nieokreślony 55

4. Zaimek wskazujący Zaimek względny Zaimek pytający Zaimek nieokreślony 55 SPIS TREŚCI Wstęp 11 Zarys fonetyki języka portugalskiego 13 1. Odmiany języka portugalskiego 13 2. Przegląd głosek 14 2.1. Spółgłoski 14 2.2. Samogłoski 15 2.3. Półsamogłoski 16 3. Akcent 16 4. Najważniejsze

Bardziej szczegółowo

Obrazkowy Test Słownikowy Rozumienie (OTSR): wystandaryzowane i znormalizowane narzędzie do oceny zasobu słownictwa dzieci w wieku 2-6 lat

Obrazkowy Test Słownikowy Rozumienie (OTSR): wystandaryzowane i znormalizowane narzędzie do oceny zasobu słownictwa dzieci w wieku 2-6 lat Wydział Psychologii Uniwersytetu Warszawskiego Obrazkowy Test Słownikowy Rozumienie (OTSR): wystandaryzowane i znormalizowane narzędzie do oceny zasobu słownictwa dzieci w wieku 2-6 lat Magdalena Łuniewska,

Bardziej szczegółowo

1. Opis merytoryczny

1. Opis merytoryczny WNIOSEK O PORTFOLIO: Opracowanie koncepcji wielojęzycznych generatorów gramatycznych pełniących rolę narzędzi informatycznych typu Machine-Aided Human Translation Autorzy: Mirosław Gajer, Zbigniew Handzel,

Bardziej szczegółowo

KRYTERIA OCENIANIA JĘZYK POLSKI

KRYTERIA OCENIANIA JĘZYK POLSKI KRYTERIA OCENIANIA JĘZYK POLSKI Kryteria ocen z języka polskiego dla uczniów kl.i-iii gimnazjum z orzeczeniem o upośledzeniu w stopniu Lekkim Kryteria ocen z języka polskiego w klasie I gimnazjum Kryteria

Bardziej szczegółowo

Propozycja rozszerzenia składni zapytań programu Poliqarp o elementy statystyczne

Propozycja rozszerzenia składni zapytań programu Poliqarp o elementy statystyczne Propozycja rozszerzenia składni zapytań programu Poliqarp o elementy statystyczne Aleksander Buczyński 2006.06.26 Poliqarp - stan obecny Zwracane są kolejne konteksty wystąpień ciągów segmentów pasujących

Bardziej szczegółowo

Analiza metod wykrywania przekazów steganograficznych. Magdalena Pejas Wydział EiTI PW magdap7@gazeta.pl

Analiza metod wykrywania przekazów steganograficznych. Magdalena Pejas Wydział EiTI PW magdap7@gazeta.pl Analiza metod wykrywania przekazów steganograficznych Magdalena Pejas Wydział EiTI PW magdap7@gazeta.pl Plan prezentacji Wprowadzenie Cel pracy Tezy pracy Koncepcja systemu Typy i wyniki testów Optymalizacja

Bardziej szczegółowo

Gramatyka kontrastywna polsko-angielska. III rok filologii angielskiej studia niestacjonarne I stopnia, semestr II. Profil ogólnoakademicki 2012-2013

Gramatyka kontrastywna polsko-angielska. III rok filologii angielskiej studia niestacjonarne I stopnia, semestr II. Profil ogólnoakademicki 2012-2013 PRZEWODNIK PO PRZEDMIOCIE I. KARTA PRZEDMIOTU: Gramatyka kontrastywna polsko-angielska III rok filologii angielskiej studia niestacjonarne I stopnia, semestr II Profil ogólnoakademicki 2012-2013 CEL PRZEDMIOTU

Bardziej szczegółowo

EGZAMIN MATURALNY 2013 JĘZYK NIEMIECKI

EGZAMIN MATURALNY 2013 JĘZYK NIEMIECKI entralna Komisja Egzaminacyjna w Warszawie EGZAMIN MATURALNY 2013 JĘZYK NIEMIEKI POZIOM ROZSZERZONY Kryteria oceniania odpowiedzi MAJ 2013 ZADANIA OTWARTE Zadanie 1. (0,5 pkt) Przetwarzanie tekstu 1.1.

Bardziej szczegółowo

AKADEMIA MUZYCZNA IM. I.J. PADEREWSKIEGO W POZNANIU WYDZIAŁ INSTRUMENTÓW SMYCZKOWYCH, HARFY, GITARY I LUTNICTWA

AKADEMIA MUZYCZNA IM. I.J. PADEREWSKIEGO W POZNANIU WYDZIAŁ INSTRUMENTÓW SMYCZKOWYCH, HARFY, GITARY I LUTNICTWA AKADEMIA MUZYCZNA IM. I.J. PADEREWSKIEGO W POZNANIU WYDZIAŁ INSTRUMENTÓW SMYCZKOWYCH, HARFY, GITARY I LUTNICTWA Moduł/Przedmiot: Kultura języka Kod modułu: xxx Koordynator modułu: mgr Stefan Drajewski

Bardziej szczegółowo

Plik pobrany ze strony www.zadania.pl

Plik pobrany ze strony www.zadania.pl Plik pobrany ze strony www.zadania.pl Wpisuje zdający przed rozpoczęciem pracy PESEL ZDAJĄCEGO Miejsce na nalepkę z kodem szkoły PRÓBNY EGZAMIN MATURALNY Z MATEMATYKI Instrukcja dla zdającego Arkusz I

Bardziej szczegółowo

PRZEDMIOTOWY SYSTEM OCENIANIA JĘZYK KASZUBSKI

PRZEDMIOTOWY SYSTEM OCENIANIA JĘZYK KASZUBSKI PRZEDMIOTOWY SYSTEM OCENIANIA JĘZYK KASZUBSKI KLASY I VI I. Ocenianie osiągnięć uczniów w zakresie języka kaszubskiego ma na celu : - zmierzenie wyników pracy ucznia, - ujawnienie jego osiągnięć i braków,

Bardziej szczegółowo

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład II Reprezentacja danych w technice cyfrowej 1 III. Reprezentacja danych w komputerze Rodzaje danych w technice cyfrowej 010010101010 001010111010

Bardziej szczegółowo

Wydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych

Wydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Informatyki i Elektroniki Instrukcja do zajęć laboratoryjnych wersja: 1.0 Nr ćwiczenia: 12, 13 Temat: Cel ćwiczenia: Wymagane przygotowanie

Bardziej szczegółowo

Projektowanie oprogramowania cd. Projektowanie oprogramowania cd. 1/34

Projektowanie oprogramowania cd. Projektowanie oprogramowania cd. 1/34 Projektowanie oprogramowania cd. Projektowanie oprogramowania cd. 1/34 Projektowanie oprogramowania cd. 2/34 Modelowanie CRC Modelowanie CRC (class-responsibility-collaborator) Metoda identyfikowania poszczególnych

Bardziej szczegółowo

WYMAGANIA EDUKACYJNE JĘZYK NIEMIECKI. OSIĄGNIĘCIA UCZNIA NA STOPIEŃ: dopuszczający dostateczny dobry bardzo dobry celujący

WYMAGANIA EDUKACYJNE JĘZYK NIEMIECKI. OSIĄGNIĘCIA UCZNIA NA STOPIEŃ: dopuszczający dostateczny dobry bardzo dobry celujący WYMAGANIA EDUKACYJNE JĘZYK NIEMIECKI I. GRAMATYKA I SŁOWNICTWO uczeń opanował niewiele zagadnień gramatycznych określonych w rozkładzie uczeń potrafi budować zdania, ale przeważnie niespójne, z dużą ilością

Bardziej szczegółowo

Umysł-język-świat 2012

Umysł-język-świat 2012 Umysł-język-świat 2012 Wykład X: Między psycholingwistyką a neurolingwistyką Teorie neurolingwistyczne John Hughlings Jackson (1835-1911) badał jak bodźce wywołują reakcje i złożoność reakcji Dwa poziomy

Bardziej szczegółowo

Jak pisać publikacje naukowe? Nie o naukowej, a technicznej stronie pisania artykułu

Jak pisać publikacje naukowe? Nie o naukowej, a technicznej stronie pisania artykułu XXVIII Letnia Szkoła Naukowa Metodologii Nauk Empirycznych Zakopane, 12-14.05.2014 Jak pisać publikacje naukowe? Nie o naukowej, a technicznej stronie pisania artykułu Maciej Zaborowicz Instytut Inżynierii

Bardziej szczegółowo

Zastosowanie metod statystycznych do problemu ujednoznaczniania struktury zdania w języku polskim

Zastosowanie metod statystycznych do problemu ujednoznaczniania struktury zdania w języku polskim Motywacja Zastosowanie metod statystycznych do problemu ujednoznaczniania struktury zdania w języku polskim Seminarium IPI PAN, 03.01.2011 Outline Motywacja 1 Motywacja Poziomy anotacji Równoważność dystrybucyjna

Bardziej szczegółowo

Analiza statystyczna trudności tekstu

Analiza statystyczna trudności tekstu Analiza statystyczna trudności tekstu Łukasz Dębowski ldebowsk@ipipan.waw.pl Problem badawczy Chcielibyśmy mieć wzór matematyczny,...... który dla dowolnego tekstu...... na podstawie pewnych statystyk......

Bardziej szczegółowo