Słowosieć leksykalna sieć semantyczna języka polskiego i jej zastosowanie w analizie znaczeń

Wielkość: px
Rozpocząć pokaz od strony:

Download "Słowosieć leksykalna sieć semantyczna języka polskiego i jej zastosowanie w analizie znaczeń"

Transkrypt

1 Słowosieć leksykalna sieć semantyczna języka polskiego i jej zastosowanie w analizie znaczeń Paweł Kędzia, Marek Maziarz, Maciej Piasecki, Ewa Rudnicka i Piotr Pęzik * Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 pawel.kedzia@, marek.maziarz@, maciej.piasecki, ewa.rudnicka@pwr.edu.pl *Uniwersytet Łódzki Wydział Filologiczny Instytut Anglistyki pezik@uni.lodz.pl

2 Plan prezentacji Warsztaty

3 Plan prezentacji Warsztaty 1. Wstęp 2. Relacje 3. Dodatkowe elementy opisu 4. Proces budowy Słowosieci 5. Efekt 6. Zastosowania 7. Ujednoznacznianie znaczeń słów 8. WoSeDon 9. Stenogramy sejmowe

4 1. Wstęp Warsztaty

5 Wordnet Warsztaty Uniwersytet w Princeton, lata 80., psycholingwistyka i lingwistyka informatyczna (J. Miller, Ch. Fellbaum) Badania nad językiem dzieci Wielka sieć leksykalno-semantyczna języka angielskiego Cztery części mowy rzeczowniki, czasowniki, przymiotniki i przysłówki Synset zbiór prawie synonimów (ang. near synonyms) Relacje semantyczne Podstawowy zasób językowy Global Wordnet Association

6 Relacyjna semantyka leksykalna Warsztaty System semantyczny języka jako sieć relacji John Lyons (1963), Structural semantics znaczenie wyrazu = zbiór jego relacji znaczeniowych główne relacje znaczeniowe (sense relations): synonimia, antonimia, hiponimia, meronimia (relacje paradygmatyczne) Igor Mel čuk, Jurij Apresjan, Aleksandr Žolkovskij, lata 60. model sens tekst funkcje leksykalne paradygmatyczne i syntagmatyczne (Mel čuk 1996), neostrukturalizm Alan Cruse, Gregory Murphy (Uniwersytet w Manchester), lata 80.

7 Słowosieć (plwordnet) Warsztaty Pochodzenie Politechnika ska, szereg projektów cel: bardzo obszerny opis systemu relacji leksykalno-semantycznych Relacje leksykalno-semantyczne, ok. 40 głównych typów rzeczownik czasownik przymiotnik hiponimia meronimia antonimia mieszkaniec role semantyczne hiponimia kauzacja procesywność zawieranie roli aspektowość hiponimia wartość cechy gradacyjność charakteryzowanie symilatywność

8 Synset Warsztaty Synset zbiór jednostek leksykalnych o wspólnych relacjach konstytutywnych, np. hiperonimii, holo/meronimii, jednostki zawarte w synsecie są uznawane za synonimy jest rodzajem skróconego zapisu, np. {afekt 1, uczucie 2} hiperonim {miłość 1, umiłowanie 1, kochanie 1} Relacje konstytutywne podstawa konstrukcji synsetu, współdzielone i relatywnie częste Dodatkowe rozróżnienia: rejestr stylistyczny, aspekt

9 Bogata sieć relacji Warsztaty

10 2. Relacje Warsztaty

11 Relacje Warsztaty 1. Relacje synsetów = pomiędzy zbiorami synonimów. 2. Relacje jednostek leksykalnych = pomiędzy znaczeniami. 3. Relacja synonimii.

12 Relacje synsetów Warsztaty relacje pomiędzy zbiorami synonimów hiponimia meronimia fuzzynimia bliskoznaczność instancja 0% 20% 40% 60% 80% mieszkaniec Rzeczowniki

13 Relacje synsetów Warsztaty relacje pomiędzy zbiorami synonimów 0% 20% 40% 60% 80% hiponimia meronimia bliskoznaczność fuzzynimia kauzatywność procesywność wielokrotność inchoatywność uprzedniość presupozycja stanowość Czasowniki

14 Relacje synsetów Warsztaty Hiponimia Najważniejsza z relacji synsetów 70% 65,9% Rzeczowniki 60% 50% 40% 30% 20% 10% 15,1% 12,4% 3,7% 2,6% 0,3% 0% 66% instancji wszystkich relacji synsetów kościec każdego wordnetu

15 Relacje synsetów Warsztaty Hiponimia testy podstawieniowe tygrys 1 (zw) «Panthera tigris» kot 1 (zw) «każdy ssak z rodziny kotowatych» Hiponimia Jeśli coś jest tygrysem 1, to musi być kotem 1. Jeśli coś jest kotem 1, to niekoniecznie jest tygrysem 1. Jeśli coś nie jest kotem 1, to nie może być tygrysem 1.

16 Relacje synsetów Warsztaty Hiponimia testy podstawieniowe tygrys 1 (zw) «Panthera tigris» kot 1 (zw) «każdy ssak z rodziny kotowatych» Hiponimia Jeśli coś jest tygrysem 1, to musi być kotem 1. Jeśli coś jest kotem 1, to niekoniecznie jest tygrysem 1. Jeśli coś nie jest kotem 1, to nie może być tygrysem 1.

17 Relacje synsetów Warsztaty Hiponimia testy podstawieniowe tygrys 1 (zw) «Panthera tigris» kot 1 (zw) «każdy ssak z rodziny kotowatych» Hiponimia Jeśli coś jest tygrysem 1, to musi być kotem 1. TAK Jeśli coś jest kotem 1, to niekoniecznie jest tygrysem 1. TAK Jeśli coś nie jest kotem 1, to nie może być tygrysem 1. TAK

18 Relacje synsetów Warsztaty Hiponimia «każdy ssak z rodziny kotowatych» «Acinonyx jubatus» «Panthera onca» «Panthera leo» «Panthera tigris»

19 Relacje synsetów Warsztaty Hiponimia

20 Relacje synsetów Warsztaty Hiponimia istota żywa 1 (zw) organizm 1 (rz) mięsożerca 1 (zw) drapieżnik 1 (zw) kot 1 (zw) «każdy ssak z rodziny kotowatych» tygrys 1 (zw) «Panthera tigris»

21 Relacje synsetów Warsztaty Hiponimia hiperonim hiponimy

22 Relacje synsetów Warsztaty Meronimia relacja część całość druga w kolejności, 15% instancji relacji 70% 65,9% Rzeczowniki 60% 50% 40% 30% 20% 10% 15,1% 12,4% 3,7% 2,6% 0,3% 0%

23 Relacje synsetów Warsztaty Meronimia relacja część całość holonim (całość) meronimy (części)

24 Relacje synsetów Warsztaty Meronimia test podstawieniowy Meronimia Kiosk 3 jest częścią okrętu podwodnego 1. meronim (część) holonim (całość)

25 Relacje synsetów Warsztaty Meronimia test podstawieniowy Meronimia Kiosk 3 jest częścią okrętu podwodnego 1. TAK meronim (część) holonim (całość)

26 Relacje jednostek leksykalnych Warsztaty relacje pomiędzy jednostkami leksykalnymi (znaczeniami) nie mniej ważne niż relacje synsetów dostarczają informacji dodatkowej

27 Relacje jednostek leksykalnych Warsztaty

28 Relacje jednostek leksykalnych «kaleczyć, ranić, rozcinając ciało i odsłaniając wewnętrzne tkanki» Warsztaty «używać sztyletu w celu zadania ciosu» «o zwierzętach: gryźć»

29 Relacje jednostek leksykalnych Warsztaty

30 Relacje jednostek leksykalnych Warsztaty

31 Relacje jednostek leksykalnych Warsztaty

32 Relacje jednostek leksykalnych Warsztaty

33 Relacje jednostek leksykalnych Warsztaty AGENS rozpruwacz 1 (os) «ktoś, kto rozpruwa» NARZĘDZIE «sztyletujesię sztyletem 1 (wytw)»

34 Relacje jednostek leksykalnych Warsztaty AGENS rozpruwacz 1 (os) «ktoś, kto rozpruwa» NARZĘDZIE «sztyletujesię sztyletem 1 (wytw)»

35 Relacje jednostek leksykalnych Warsztaty AGENS rozpruwacz 1 (os) «ktoś, kto rozpruwa» NARZĘDZIE «sztyletujesię sztyletem 1 (wytw)»

36 Relacje jednostek leksykalnych Warsztaty rozpruwać 1 (dtk) «kaleczyć (kogoś); czynność wykonywana przez mordercę nazywanego rozpruwaczem» NARZĘDZIE «sztyletujesię sztyletem 1 (wytw)»

37 Relacje jednostek leksykalnych Warsztaty rozpruwać 1 (dtk) «kaleczyć (kogoś); czynność wykonywana przez mordercę nazywanego rozpruwaczem» sztyletować 1 (wal) «kaleczyć (kogoś) sztyletem»

38 Relacje jednostek leksykalnych Warsztaty 1. Relacje o charakterze derywacyjnym: np. rola agens: rozpruwacz 1 (os) rozpruwać 1 (dtk), np. zawieranie roli narzędzie: sztyletować 1 (wal) sztylet 1 (wytw). 2. Pozostałe relacje: antonimia: miłość 1 (czuj) nienawiść 1 (czuj), konwersja: mąż 2 (os) żona 1 (os).

39 Relacje jednostek leksykalnych Warsztaty Testy podstawieniowe Rola agens Rzeczownik rozpruwacz 1 jest derywatem czasownika rozpruwać 1. Rozpruwacz 1 jest rozpruwaczem 1, ponieważ rozpruwacz 1 rozpruwa 1. Rozpruwacz 1 to AGENS czynności rozpruwać 1. Znaczenie rozpruwacza 1 zawiera w sobie czynność wyrażaną przez czasownik rozpruwać 1.

40 Relacje jednostek leksykalnych Warsztaty Testy podstawieniowe Rola agens Rzeczownik rozpruwacz 1 jest derywatem czasownika rozpruwać 1. Rozpruwacz 1 jest rozpruwaczem 1, ponieważ rozpruwacz 1 rozpruwa 1. Rozpruwacz 1 to AGENS czynności rozpruwać 1. Znaczenie rozpruwacza 1 zawiera w sobie czynność wyrażaną przez czasownik rozpruwać 1.

41 Relacja synonimii Warsztaty Pełna synonimia jest rzadka (lingwistyka = językoznawstwo). Synonimia w wordnetach = synonimia częściowa. Definicja synonimii X i Y są synonimami, jeżeli w sieci relacji konstytutywnych zajmują dokładnie tę samą pozycję i nie różnią się w sposób istotny rejestrem. Relacje konstytutywne = hiponimia, meronimia,

42 Relacja synonimii Warsztaty holk, hulk «północnoeur. żaglowiec (XIV XVI w.); miał 2 lub 3 maszty, był większy od kogi, którą zastąpił; miał też większą nośność dzięki innej konstrukcji poszycia (klepkowego na zakładkę).» [Encyklopedie PWN; Kopaliński, Słownik wyrazów obcych]

43 Relacja synonimii Warsztaty {hulk 1 (wytw), holk 1 (wytw)} holk 1 = hulk 1 (warianty) pełna synonimia, te same testy podstawieniowe, to samo miejsce w sieci.

44 Relacja synonimii Warsztaty Pełna synonimia jest rzadka (lingwistyka = językoznawstwo). Synonimia w wordnetach = synonimia częściowa. Definicja synonimii X i Y są synonimami, jeżeli w sieci relacji konstytutywnych zajmują dokładnie tę samą pozycję i nie różnią się w sposób istotny rejestrem. Relacje konstytutywne = hiponimia, meronimia, Istotnie różnią się np. rejestry wulgarny i potoczny.

45 Relacja synonimii Warsztaty Pełna synonimia jest rzadka (lingwistyka = językoznawstwo). Synonimia w wordnetach = synonimia częściowa. Definicja synonimii X i Y są synonimami, jeżeli w sieci relacji konstytutywnych zajmują dokładnie tę samą pozycję i nie różnią się w sposób istotny rejestrem. Relacje konstytutywne = hiponimia, meronimia, Istotnie różnią się np. rejestry wulgarny i potoczny.

46 Relacja synonimii Warsztaty Pełna synonimia jest rzadka (lingwistyka = językoznawstwo). Synonimia w wordnetach = synonimia częściowa. Definicja synonimii X i Y są synonimami, jeżeli w sieci relacji konstytutywnych zajmują dokładnie tę samą pozycję i nie różnią się w sposób istotny rejestrem. Relacje konstytutywne = hiponimia, meronimia, Istotnie różnią się np. rejestry wulgarny i potoczny.

47 Relacja synonimii Warsztaty {afekt 1, uczucie 2} hiponimia {miłość 1, umiłowanie 1, kochanie 1}

48 3. Dodatkowe elementy opisu Warsztaty

49 Rejestr jednostki leksykalnej Warsztaty Rejestr = zakres stosowalności jednostki leksykalnej. 11 rejestrów Słowosieci

50 Rejestr jednostki leksykalnej Warsztaty Rejestr = zakres stosowalności jednostki leksykalnej. 11 rejestrów Słowosieci: nienorm. nienormatywne daw. dawne reg. regionalne środ. środowiskowe specj. specjalistyczne urz. urzędowe książk. książkowe wulg. wulgarne posp. pospolite pot. potoczne og. rejestr ogólny

51 Rejestr jednostki leksykalnej Warsztaty Rejestr = zakres stosowalności jednostki leksykalnej. 11 rejestrów Słowosieci: nienorm. nienormatywne daw. dawne reg. regionalne środ. środowiskowe specj. specjalistyczne urz. urzędowe książk. książkowe wulg. wulgarne posp. pospolite pot. potoczne og. rejestr ogólny hulk 1 (wytw) specj. holk 1 (wytw) specj. tygrys 1 (zw) og. rozpruwacz 1 (os) pot.

52 Rejestr jednostki leksykalnej Warsztaty drzewo decyzyjne procedura postępowania specj. og. pot. książk. daw. reg. środ. urz. posp. wulg. nienorm. Warstwy słownictwa 0% 10% 20% 30% 40% 50% 60% 70%

53 Rejestr jednostki leksykalnej Warsztaty

54 Glosy Warsztaty Glosy to skrócone definicje. W Słowosieci jest ich ponad 90 tys.

55 Glosy Warsztaty Glosy to skrócone definicje. W Słowosieci jest ich ponad 90 tys. tygrys 1 (zw)og. «Panthera tigris gatunek dużego, drapieżnego ssaka łożyskowego z rodziny kotowatych (Felidae), największy z żyjących współcześnie czterech wielkich, ryczących kotów z rodzaju Panthera, jeden z największych drapieżników lądowych wielkością ustępuje jedynie niektórym niedźwiedziom» rozpruwacz 1 (os)pot. «określenie mordercy, który okalecza swoje ofiary za pomocą noża; rozpruwacz odcina głowę lub końcyzny, rozcina tułów, masakruje różne części ciała»

56 Przykłady użycia Warsztaty dokumentacja korpusowa lub ilustracja znaczenia preparowane lub ze źródeł o otwartej licencji ponad 100 tys. opisanych znaczeń (głównie rzeczowników i przymiotników) tygrys 1 (zw)og. 1 «Panthera tigris gatunek dużego, drapieżnego ssaka łożyskowego z rodziny kotowatych (Felidae), największy z żyjących współcześnie czterech wielkich, ryczących kotów z rodzaju Panthera, jeden z największych drapieżników lądowych wielkością ustępuje jedynie niektórym niedźwiedziom» Umiejętność chowania pazurów umożliwia tygrysowi bardzo ciche stąpanie przy podkradaniu się do ofiary, a ich wysunięcie ułatwia przytrzymywanie i rozrywanie zdobyczy. (źródło: Wikipedia)

57 Przykłady użycia Warsztaty dokumentacja korpusowa lub ilustracja znaczenia preparowane lub ze źródeł o otwartej licencji ponad 100 tys. opisanych znaczeń (głównie rzeczowników i przymiotników) fluita 1 (wytw)specj. «typ handlowego statku żaglowego, zbudowany przez budowniczych z Hoorn i rozwijany w Holandii od lat 90. XVI wieku, następnie używany także w innych krajach» Fluita miała zaokrągloną rufę; nadbudówki (kasztele) były niższe, niż na galeonach. (źródło: Wikipedia) wyłącznie źródła o otwartej licencji

58 Dziedziny Słowosieci Warsztaty skróty w nawiasach: tygrys 1 (zw) zw = zwierzęta fluita 1 (wytw) wytw = wytwory (artefakty) rozpruwacz 1 (os) os = osoby, ludzie sztyletować 1 (wal) wal = walka i rywalizacja rozpruwać 1 (dtk) dtk = kontakt fizyczny zamek 1 (msc) msc = miejsce nienawiść 1 (czuj) czuj = uczucia, emocje mają techniczny charakter pomagają w orientowaniu się w sieci

59 Dziedziny Słowosieci Warsztaty gatunki i rasy zwierząt pejoratywne określenia ludzi

60 Nastawienie emocjonalne Warsztaty ANOTACJA NASTAWIENIEM EMOCJONALNYM Emocje podstawowe radość, smutek, złość, strach, zaufanie, obrzydzenie, zaskoczenie czymś nieprzewidywanym i czekanie na coś miłego (Ekman 1992; Plutchik 1980) Wartości uniwersalne użyteczność / bezużyteczność, dobro drugiego człowieka / krzywda, prawda, wiedza / niewiedza, błąd, piękno / brzydota, szczęście i nieszczęście (Puzynina 1992) Nastawienie pozytywne (bardzo słabo), negatywne (bardzo słabo), neutralne. Ponad oznakowanych jednostek.

61 Nastawienie emocjonalne Warsztaty rozpruwacz 1 (os) pot. «określenie mordercy, który okalecza swoje ofiary za pomocą noża; rozpruwacz odcina głowę lub kończyny, rozcina tułów, masakruje różne części ciała.» ##A1: {złość, wstręt, strach; błąd, krzywda, nieszczęście} m [Całe miasteczko żyło w strachu przed rozpruwaczem, nikt nie wychodził z domu po zmroku.] ##A2: {złość, wstręt, strach; błąd, krzywda, nieszczęście} m [Rozpruwacz przyczynił się do śmierci 9-letniej dziewczynki.]

62 Nastawienie emocjonalne Warsztaty pierwszy anotator rozpruwacz 1 (os) pot. «określenie mordercy, który okalecza swoje ofiary za pomocą emocje podstawowe wartości nastawienie noża; rozpruwacz odcina głowę lub kończyny, rozcina tułów, masakruje różne części ciała.» ##A1: {złość, wstręt, strach; błąd, krzywda, nieszczęście} m [Całe miasteczko żyło w strachu przed rozpruwaczem, nikt nie wychodził z domu po zmroku.] ##A2: {złość, wstręt, strach; błąd, krzywda, nieszczęście} m [Rozpruwacz przyczynił się do śmierci 9-letniej dziewczynki.]

63 Nastawienie emocjonalne Warsztaty rozpruwacz 1 (os) pot. «określenie mordercy, który okalecza swoje ofiary za pomocą noża; rozpruwacz odcina głowę lub kończyny, rozcina tułów, masakruje różne części ciała.» ##A1: {złość, wstręt, strach; błąd, krzywda, nieszczęście} m [Całe miasteczko żyło w strachu przed rozpruwaczem, nikt nie wychodził z domu po zmroku.] ##A2: {złość, wstręt, strach; błąd, krzywda, nieszczęście} m [Rozpruwacz przyczynił się do śmierci 9-letniej dziewczynki.] drugi anotator

64 4. Proces budowy Słowosieci Warsztaty

65 Proces budowy Słowosieci Warsztaty Kto tworzy Słowosieć? zespół polonistów, 10 anglistów informatycy, specjaliści od przetwarzania języka sztuczna inteligencja (narzędzia półautomatyczne)

66 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów

67 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów siatka haseł (słowa najczęstsze)

68 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów siatka haseł (słowa najczęstsze) wyróżnić znaczenia

69 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów wyróżnić znaczenia siatka haseł (słowa najczęstsze) narzędzia komputerowe

70 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów wyróżnić znaczenia siatka haseł (słowa najczęstsze) narzędzia komputerowe konkordancer korpusu

71 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów wyróżnić znaczenia siatka haseł (słowa najczęstsze) Sketch Engine narzędzia komputerowe konkordancer korpusu automatyczne przykłady użycia Inforex

72 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów wyróżnić znaczenia siatka haseł (słowa najczęstsze) narzędzia komputerowe konkordancer korpusu

73 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów wyróżnić znaczenia siatka haseł (słowa najczęstsze) narzędzia komputerowe konkordancer korpusu automatyczne przykłady użycia

74 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów wyróżnić gryźć znaczenia siatka haseł (słowa najczęstsze) n.a. - przykłady `o zwierzętach: użycia gryźć -> wyróżnianie używając znaczeń, przykłady typowe, zębów, 10 znaczeń powodując (Marek) rany `o zjawiskach pogodowych (np. mrozie): gryźć, szczypać `o owadach: `o zmartwieniach, wyrzutach sumienia: gryźć `o ludziach: dokuczać, szkodzić komuś Przykłady użycia wyrazu kąsać narzędzia komputerowe konkordancer korpusu automatyczne przykłady użycia

75 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów wyróżnić znaczenia siatka haseł (słowa najczęstsze) narzędzia komputerowe konkordancer korpusu automatyczne przykłady użycia

76 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów wyróżnić znaczenia siatka haseł (słowa najczęstsze) narzędzia komputerowe konkordancer korpusu automatyczne przykłady użycia wytyczne zespół Słowosieci

77 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów wyróżnić znaczenia siatka haseł (słowa najczęstsze) narzędzia komputerowe konkordancer korpusu automatyczne przykłady użycia słowniki, encyklopedie, l eksykony wytyczne zespół Słowosieci

78 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów siatka haseł (słowa najczęstsze) wyróżnić znaczenia zdefiniować jednostkę narzędzia komputerowe słowniki, encyklopedie, l eksykony wytyczne zespół Słowosieci

79 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów siatka haseł (słowa najczęstsze) wyróżnić znaczenia zdefiniować jednostkę przypisać relacje = podpiąć narzędzia komputerowe Tkacz Wordnetu słowniki, encyklopedie, l eksykony wytyczne zespół Słowosieci

80 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów siatka haseł (słowa najczęstsze) wyróżnić znaczenia zdefiniować jednostkę przypisać relacje = podpiąć narzędzia komputerowe Tkacz Wordnetu słowniki, encyklopedie, l eksykony wytyczne zespół Słowosieci

81 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów siatka haseł (słowa najczęstsze) wyróżnić znaczenia zdefiniować jednostkę przypisać relacje = podpiąć narzędzia komputerowe Tkacz Wordnetu słowniki, encyklopedie, leksykony wytyczne zespół Słowosieci

82 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów siatka haseł (słowa najczęstsze) wyróżnić znaczenia zdefiniować jednostkę przypisać relacje = podpiąć narzędzia komputerowe Tkacz Wordnetu funkcja podobieństwa znaczeniowego słowniki, encyklopedie, l eksykony wytyczne zespół Słowosieci

83 Proces budowy Słowosieci Warsztaty antonim hiperonim hiponim kohiponim wyraz bliskoznaczny holonim

84 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów siatka haseł (słowa najczęstsze) wyróżnić znaczenia zdefiniować jednostkę przypisać relacje = podpiąć narzędzia komputerowe Tkacz Wordnetu funkcja podobieństwa znaczeniowego słowniki, encyklopedie, l eksykony wytyczne zespół Słowosieci

85 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów siatka haseł (słowa najczęstsze) wyróżnić znaczenia zdefiniować jednostkę przypisać relacje = podpiąć +kwalifikator +definicję +przykład użycia wytyczne narzędzia komputerowe konkordancer automatyczne przykłady użycia Tkacz Wordnetu funkcja podobieństwa znaczeniowego słowniki, encyklopedie, l eksykony zespół Słowosieci

86 Proces budowy Słowosieci Warsztaty Korpus Słowosieci 2 mld tokenów siatka haseł (słowa najczęstsze) wyróżnić znaczenia zdefiniować jednostkę przypisać relacje = podpiąć +kwalifikator +definicję +przykład użycia intuicja

87 5. Efekt Warsztaty

88 Słowosieć w liczbach Warsztaty Liczba haseł (lematów) w Słowosieci i w WordNecie Słowosieć WordNet haseł synsetów jednostek relacji > > rzeczownik czasownik przymiotnik przysłówek

89 Słowosieć w liczbach Warsztaty Słowosieć a słowniki polszczyzny współczesnej Słowosieć Praktyczny słownik współczesnej polszczyzny Słownik języka polskiego W. Doroszewskiego Uniwersalny słownik języka polskiego Inny słownik języka polskiego haseł [tys.]

90 Słowosieć w liczbach Warsztaty Słowosieć 2.3 koniec kwietnia br. przymiotnik + nastawienie

91 Praca ze Słowosiecią Warsztaty Słowosieć online Słowosieć mobilna WordnetLoom- Viewer

92 Praca ze Słowosiecią Warsztaty

93 Praca ze Słowosiecią Warsztaty Słowosieć mobilna

94 Praca ze Słowosiecią Warsztaty WordnetLoom

95 6. Zastosowania Warsztaty

96 Zastosowania: projekty badawcze (wybrane) Warsztaty Semantyczna anotacja korpusu gestów wskazujących (Lis, 2012) Leksykony semantycznych ram walencyjnych (Hajnicz, 2011; Hajnicz, 2012) Wyznaczanie pól semantycznych Grupowanie czasowników na potrzeby badania klas alternacji Kategoryzacja wyrażeń metaforycznych w oparciu o hiperonimy Wspomagana komputerowo analiza danych jakościowych Badania nad frazeologią Nauka języka przygotowanie słowniku dla kursu języka czeskiego dla obcokrajowców (Uniwersytet Masaryka, Brno) Konstrukcja programów do nauki języka Badanie treści prac uczniowskich/studenckich Edukacyjne: językoznawstwo, leksykologia, leksykografia Tłumaczenia Analiza leksykalizacji pojęć

97 Zastosowania (wybrane) Warsztaty Wyszukiwanie semantyczne w korpusach tekstu Grupowanie semantyczne tekstów określanie podobieństwa zdań i fragmentów tekstów, np. (Siemiński, 2012) Klasyfikacja semantyczna tekstu, np. (Maciołek, 2010) Korekta rozpoznawania mowy w systemach dialogowych Systemy odpowiedzi na pytania w języku naturalnym Np. do rozpoznania typu pytania Wydobywanie terminologii i słów kluczowych, np. (Mykowiecka i Marciniak, 2012) Wnioskowania w oparciu o logiki naturalne Tworzenie programów do grania w gry słowne Wykrywanie i generowanie pleonazmów

98 Zastosowania (wybrane) Warsztaty Definiowanie cech na potrzeby Text Mining ze stron WWW (Maciolek and Dobrowolski, 2013) Rzutowanie pomiędzy leksykonem a ontologią (Wróblewska et al., 2013) Miara podobieństwa semantycznego słów na potrzeby analizy ontologii (Lula and Paliwoda-Pękosz, 2009) Automatyczne wydobywanie leksykonów atrybutów opinii (Wawer and Gołuchowski, 2012) Rozpoznawanie i klasyfikacja nazw własnych (własne G4.19) Ujednoznacznianie sensów słów (Gołuchowski and Przepiórkowski, 2012, własne G4.19, 2015) Rozpoznawanie powiązań anaforycznych (własne G4.19)

99 7. Ujednoznacznianie sensów słów Warsztaty

100 Ujednoznacznianie sensów słów Warsztaty Idea ujednoznaczniania sensów słów: zamek

101 Ujednoznacznianie sensów słów Warsztaty Idea ujednoznaczniania sensów słów (cd.): zamek

102 Ujednoznacznianie sensów słów Warsztaty Idea ujednoznaczniania sensów słów (cd.): zamek

103 Ujednoznacznianie sensów słów Warsztaty Idea ujednoznaczniania sensów słów (cd.): zamek

104 Ujednoznacznianie sensów słów Warsztaty Idea ujednoznaczniania sensów słów (cd.): Po powrocie z pracy zepsułem zamek. ` ` `

105 Ujednoznacznianie sensów słów Warsztaty Idea ujednoznaczniania sensów słów (cd.): Po powrocie z pracy zepsułem zamek w drzwiach. ` ` `

106 Ujednoznacznianie sensów słów Warsztaty Proces polegający na przypisaniu słowu odpowiedniego znaczenia wybranego ze zbioru znaczeń słów, odpowiadającego znaczeniu słowa w danym kontekście.

107 Ujednoznacznianie sensów słów Warsztaty Uczenie na podstawie oznaczeń w tekstach: Wymagane duże zasoby ręcznie oznaczonych tekstów; Czasochłonność ręcznego oznaczania tekstów (koszty); Każde słowo z osobna posiada swoje anotacje; Rozpoznawanie znaczeń kolejnego słowa = anotacje tego słowa = kolejne koszty; Zaleta: duża dokładność systemu; Wada: niska kompletność rozpoznawanych znaczeń;

108 Ujednoznacznianie sensów słów Warsztaty Uczenie bez wstępnego oznaczania w tekście: Nie jest wymagane wstępne znakowanie znaczeń w tekstach; Wykorzystanie istniejących struktur opisujących zależności między znaczeniami słów (Słowosieć); Zaleta: dużo większa kompletność rozpoznawanych słów w stosunku do ujednoznaczniania na podstawie ręcznych anotacji; Wada: mniejsza dokładność rozpoznawanych w stosunku do systemów uczonych na podstawie ręcznych oznaczeń;

109 Ujednoznacznianie sensów słów Warsztaty Nienadzorowane podejście oparte o przetwarzanie grafu. Po powrocie z pracy zepsułem zamek w drzwiach. graf dla słowa zamek.

110 Ujednoznacznianie sensów słów Warsztaty Po powrocie z pracy zepsułem zamek w drzwiach.

111 Ujednoznacznianie sensów słów Warsztaty 0 Proces aktywacji synsetów Nienadzorowane podejście oparte o przetwarzanie grafu.... rezydencja budowla obronna strażnica baszta zamek-1 (budowla) brama furtka drzwi zamek-2 (w drzwiach) Mam zamek w kurtce i garniturze zamknięcie zatrzask mieć zamek-6 (suwak) posiadać kurtka zapięcie garnitur

112 Ujednoznacznianie sensów słów Warsztaty Surowe wyjście WoSeDona anotacje WSD dla słowa zamek w zdaniu Po powrocie z pracy zepsułem zamek w drzwiach. <tok> <orth>zamek</orth> <lex disamb="1"> <base>zamek</base><ctag>subst:sg:acc:m3</ctag> </lex> <prop key="sense:ukb:syns_id">4190</prop> <prop key="sense:ukb:syns_rank">4190/ / / / / / / </prop> <prop key="sense:ukb:unitsstr">zamek.2(3:wytw)</prop> </tok> Anotacja w formacie CCL zawierająca informacje o znaczeniu słowa zamek.

113 8. WoSeDon Warsztaty

114 WoSeDon Warsztaty Narzędzie do generowania i przeglądania list frekwencyjnych znaczeń Słowosieci z korpusów tekstów. Korpus musi posiadać wcześniej przypisane znaczenia, za co również odpowiada WoSeDon w fazie wstępnej przetwarzania tekstu (preprocessingu). Dostępność poprzez przeglądarkę pod adresem:

115 WoSeDon okno główne Warsztaty

116 WoSeDon schemat działania Warsztaty Przetwarzanie korpusu do CCL (WCRFT, Liner, WoSeDon) Korpus w DSpace Przejście do WoSeDon a

117 WoSeDon funkcjonalność Warsztaty Generowanie i przeglądanie list frekwencyjnych znaczeń z korpusów tekstów. Generowanie listy bezpośrednio z DSpace poprzez kliknięcie w przycisk: Ewentualnie poprzez wklejenie URI (np. do WoSeDona:

118 WoSeDon funkcjonalność Warsztaty

119 WoSeDon funkcjonalność Warsztaty

120 WoSeDon dalsze prace Warsztaty Rozwój interfejsu o kolejne informacje np. liczba wszystkich znaczeń w korpusie, liczba różnych znaczeń itp. Nowe pomysły, Państwa sugestie.

121 9. Stenogramy sejmowe Warsztaty

122 Stenogramy sejmowe Warsztaty Sejm ostatnich kadencji lata metadane: data partia poseł automatycznie ujednoznacznione sensy słów prezentacja w aplikacji KOPER autorstwa dra P. Pęzika

123 Stenogramy sejmowe Warsztaty

124 Stenogramy sejmowe Warsztaty składnia zapytań wersja robocza <lemma=kryzys:30679> hasło ID synsetu ID synsetu identyfikuje znaczenia konkordancja + trendy (szeregi czasowe)

125 Stenogramy sejmowe Warsztaty kryzys 1 (cech) (pogorszenie się sytuacji w sferze społecznej) kryzys 2 (pos) (kryzys gospodarczy, recesja) kryzys 3 (st) (pogorszenie się sytuacji człowieka, np. kryzys małżeński) kryzys 4 (zdarz) (w chorobie)

126 Stenogramy sejmowe Warsztaty kryzys 4 (zdarz) (w chorobie)

127 Stenogramy sejmowe konkordancje Warsztaty ściąganie w formacie *.xls

128 Stenogramy sejmowe szeregi czasowe Warsztaty ściąganie w różnych formatach graficznych

129 Stenogramy sejmowe szeregi czasowe kryzys 2 (pos) Warsztaty

130 Stenogramy sejmowe szeregi czasowe Warsztaty

131 Stenogramy sejmowe szeregi czasowe Warsztaty klikalne punkty

132 Stenogramy sejmowe szeregi czasowe Warsztaty mógłby także zagrozić A przecież, jak mówiłem kryzys stabilności polskiego systemu wcześniej, taki bankowego. minister Jacek Rostowski, PO,

133 Stenogramy sejmowe szeregi czasowe Warsztaty

134 Stenogramy sejmowe szeregi czasowe Warsztaty Z tego, co usłyszałem w exposé, wyn ika, że kryzys poseł Leszek Miller, SLD, gospodarczy nie stuka do naszych drzwi, nie łomocze - jest już w przedpokoju, powiesił płaszcz, założył kapcie i zaczyna czuć się jak u siebie w domu.

135 Stenogramy sejmowe szeregi czasowe Warsztaty

136 Stenogramy sejmowe szeregi czasowe Taką potrzebą chwili na przykład uzasadnialiśmy zmiany, które weszły w 2009 r. i obowiązywały przez 2 lata w okresie tzw. - niektórzy tak to nazywają - pierwszej fali poseł Adam Szejnfeld, PO, Warsztaty kryzysu.

137 Stenogramy sejmowe szeregi czasowe Warsztaty

138 Stenogramy sejmowe Warsztaty Plany: pozostałe kadencje Sejmu wyszukiwanie po polach leksykalnych - tj. po grupie hiponimów danej jednostki - np. hiponimy rzeczownika kobieta w zn. «dorosły człowiek płci żeńskiej»

139 Dziękujmy bardzo za uwagę

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen Paweł Ke dzia, Marek Maziarz, Maciej Piasecki i Piotr Pe zik * Politechnika ska Katedra Inteligencji

Bardziej szczegółowo

S owosiec leksykalna siec semantyczna jezyka polskiego i jej zastosowania

S owosiec leksykalna siec semantyczna jezyka polskiego i jej zastosowania S owosiec 3.0 - leksykalna siec semantyczna jezyka polskiego i jej zastosowania Agnieszka Dziob, Marek Maziarz, Maciej Piasecki Politechnika Wroc awska Katedra Inteligencji Obliczeniowej Grupa Naukowa

Bardziej szczegółowo

Słowosieć leksykalna sieć semantyczna języka polskiego i jej zastosowania

Słowosieć leksykalna sieć semantyczna języka polskiego i jej zastosowania Słowosieć 3.0 - leksykalna sieć semantyczna języka polskiego i jej zastosowania Agnieszka Dziob, Marek Maziarz, Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa

Bardziej szczegółowo

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika ska Katedra Inteligencji

Bardziej szczegółowo

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji

Bardziej szczegółowo

Słowosieć - polskie zasoby leksykalne i możliwość ich wykorzystania

Słowosieć - polskie zasoby leksykalne i możliwość ich wykorzystania Słowosieć - polskie zasoby leksykalne i możliwość ich wykorzystania Agnieszka Dziob Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 agnieszka.dziob@pwr.edu.pl 2018-05-24

Bardziej szczegółowo

Program warsztatów CLARIN-PL

Program warsztatów CLARIN-PL W ramach Letniej Szkoły Humanistyki Cyfrowej odbędzie się III cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Narzędzia cyfrowe do analizy języka w naukach humanistycznych i społecznych 17-19

Bardziej szczegółowo

Słowosiec leksykalna siec semantyczna języka polskiego i jej zastosowania

Słowosiec leksykalna siec semantyczna języka polskiego i jej zastosowania Słowosiec 4.0 - leksykalna siec semantyczna języka polskiego i jej zastosowania Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Ewa Rudnicka Politechnika Wrocławska Katedra Inteligencji Obliczeniowej

Bardziej szczegółowo

Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowania

Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowania Słowosiec 3.2 - leksykalna siec semantyczna je zyka polskiego i jej zastosowania Poziom rozszerzony Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 agnieszka.dziob@pwr.edu.pl

Bardziej szczegółowo

Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur

Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur Maciej Piasecki, Paweł Kędzia Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Plan prezentacji

Bardziej szczegółowo

Open Access w technologii językowej dla języka polskiego

Open Access w technologii językowej dla języka polskiego Open Access w technologii językowej dla języka polskiego Marek Maziarz, Maciej Piasecki Grupa Naukowa Technologii Językowych G4.19 Zakład Sztucznej Inteligencji, Instytut Informatyki, W-8, Politechnika

Bardziej szczegółowo

Wydobywanie informacji oraz cech tekstów: tworzenie prostych statystyk Część 1

Wydobywanie informacji oraz cech tekstów: tworzenie prostych statystyk Część 1 Wydobywanie informacji oraz cech tekstów: tworzenie prostych statystyk Część 1 Jan Kocoń, Tomasz Walkowiak Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej Wydział Informatyki

Bardziej szczegółowo

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra

Bardziej szczegółowo

Wydobywanie informacji oraz cech tekstów: analiza frekwencyjna

Wydobywanie informacji oraz cech tekstów: analiza frekwencyjna Wydobywanie informacji oraz cech tekstów: analiza frekwencyjna Maciej Piasecki, Tomasz Walkowiak Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej Wydział Informatyki i Zarządzania

Bardziej szczegółowo

Narzędzia do automatycznego wydobywania kolokacji

Narzędzia do automatycznego wydobywania kolokacji Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl

Bardziej szczegółowo

Narzędzia do automatycznego wydobywania kolokacji

Narzędzia do automatycznego wydobywania kolokacji Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl

Bardziej szczegółowo

Narzędzia do automatycznej analizy odniesień w tekstach

Narzędzia do automatycznej analizy odniesień w tekstach CLARIN-PL Narzędzia do automatycznej analizy odniesień w tekstach Michał Marcińczuk Jan Kocoń Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl

Bardziej szczegółowo

Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów

Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów Maciej Piasecki, Jan Kocoń Politechnika Wrocławska Katedra InteligencjiObliczeniowej Grupa

Bardziej szczegółowo

CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy

CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy Cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy 13 15 kwietnia 2015 roku Warszawa, Pałac Staszica, ul. Nowy Świat 72, sala 144

Bardziej szczegółowo

Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex

Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej

Bardziej szczegółowo

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

CLARIN rozproszony system technologii językowych dla różnych języków europejskich CLARIN rozproszony system technologii językowych dla różnych języków europejskich Maciej Piasecki Politechnika Wrocławska Instytut Informatyki G4.19 Research Group maciej.piasecki@pwr.wroc.pl Projekt CLARIN

Bardziej szczegółowo

II cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych

II cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych II cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych 18-20 maja 2015 roku Politechnika Wrocławska, Centrum Kongresowe,

Bardziej szczegółowo

Część 1. Wydobywanie informacji z tekstu i stylometria CLARIN-PL. Tomasz Walkowiak, Maciej Piasecki

Część 1. Wydobywanie informacji z tekstu i stylometria CLARIN-PL. Tomasz Walkowiak, Maciej Piasecki Wydobywanie informacji z tekstu i stylometria Część 1 Tomasz Walkowiak, Maciej Piasecki Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej Wydział Informatyki i Zarządzania

Bardziej szczegółowo

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot

Bardziej szczegółowo

Inforex - zarządzanie korpusami i ich anotacja

Inforex - zarządzanie korpusami i ich anotacja Inforex - zarządzanie korpusami i ich anotacja Marcin Oleksy marcin.oleksy@pwr.edu.pl Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii

Bardziej szczegółowo

Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego

Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Witold Kieraś Łukasz Kobyliński Maciej Ogrodniczuk Instytut Podstaw Informatyki PAN III Konferencja DARIAH-PL Poznań 9.11.2016

Bardziej szczegółowo

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji

Bardziej szczegółowo

Automatyczne rozpoznawanie polskich leksykalnych relacji derywacyjno-semantycznych

Automatyczne rozpoznawanie polskich leksykalnych relacji derywacyjno-semantycznych Automatyczne rozpoznawanie polskich leksykalnych relacji derywacyjno-semantycznych Maciej Piasecki, Marek Maziarz, Radosław Ramocki, Paweł Minda Grupa Naukowa G4.19 Instytut Informatyki PWr. Słowosieć

Bardziej szczegółowo

Inforex - zarządzanie korpusami i ich anotacja. Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii Językowych G4.

Inforex - zarządzanie korpusami i ich anotacja. Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii Językowych G4. Inforex - zarządzanie korpusami i ich anotacja Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy Jan Wieczorek Jan Kocoń marcin.oleksy@pwr.edu.pl jan.wieczorek@pwr.edu.pl jan.kocon@pwr.edu.pl

Bardziej szczegółowo

Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska

Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Seminarium przetwarzania języka naturalnego Mateusz Kopeć Instytut Podstaw Informatyki Polskiej Akademii Nauk 6 lutego 2012 Plan 1 Zadanie

Bardziej szczegółowo

Praca magisterska Jakub Reczycki. Opiekun : dr inż. Jacek Rumiński. Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska

Praca magisterska Jakub Reczycki. Opiekun : dr inż. Jacek Rumiński. Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska System gromadzenia, indeksowania i opisu słownikowego norm i rekomendacji Praca magisterska Jakub Reczycki Opiekun : dr inż. Jacek Rumiński Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska

Bardziej szczegółowo

MAREK MAZIARZ MACIEJ PIASECKI EWA RUDNICKA

MAREK MAZIARZ MACIEJ PIASECKI EWA RUDNICKA POLONICA XXXIV PL ISSN 0137-9712 MAREK MAZIARZ MACIEJ PIASECKI EWA RUDNICKA Słowosieć polski wordnet. Proces tworzenia tezaurusa 1. Wstęp WordNet Uniwersytetu w Princeton to pierwsza na świecie baza danych

Bardziej szczegółowo

KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów)

KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów) KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów) Marcin Oleksy Michał Marcińczuk Politechnika ska Instytut Informatyki

Bardziej szczegółowo

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Adam Dudczak Poznańskie Centrum Superkomputerowo-Sieciowe (maneo@man.poznan.pl) I Konferencja Polskie Biblioteki

Bardziej szczegółowo

Forma. Główny cel kursu. Umiejętności nabywane przez studentów. Wymagania wstępne:

Forma. Główny cel kursu. Umiejętności nabywane przez studentów. Wymagania wstępne: WYDOBYWANIE I WYSZUKIWANIE INFORMACJI Z INTERNETU Forma wykład: 30 godzin laboratorium: 30 godzin Główny cel kursu W ramach kursu studenci poznają podstawy stosowanych powszechnie metod wyszukiwania informacji

Bardziej szczegółowo

Słowosieć jako narzędzie wspomagające pracę tłumacza

Słowosieć jako narzędzie wspomagające pracę tłumacza Rocznik Kognitywistyczny V/2011 DOI 10.4467/20843895RK.12.004.0408 s. 33 42 AGNIESZKA DZIOB, PAULINA ŁAZAREWICZ Uniwersytet Wrocławski, Politechnika Wrocławska Słowosieć jako narzędzie wspomagające pracę

Bardziej szczegółowo

LEM wydobywanie statystyk z korpusów

LEM wydobywanie statystyk z korpusów LEM wydobywanie statystyk z korpusów Maciej Piasecki, Tomasz Walkowiak Politechnika Wroc awska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Maciej Maryl Instytut Bada Literackich Polska Akademia

Bardziej szczegółowo

Marek Maziarz, Maciej Piasecki, Ewa Rudnicka, Stanisław Szpakowicz. Nowy system kwalifikatorów Słowosieci

Marek Maziarz, Maciej Piasecki, Ewa Rudnicka, Stanisław Szpakowicz. Nowy system kwalifikatorów Słowosieci Marek Maziarz, Maciej Piasecki, Ewa Rudnicka, Stanisław Szpakowicz Nowy system kwalifikatorów Słowosieci Krótka instrukcja 0. KRYTERIUM POPRAWNOŚCIOWE (nienorm.) 1. KRYTERIUM CHRONOLOGICZNE (daw.) 2. KRYTERIUM

Bardziej szczegółowo

I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ?... 13 II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY...

I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ?... 13 II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY... I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ?.... 13 II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY............ 17 1. Niepowtarzalność języka każdego z nas.................. 17 1.1. Nasz język indywidualny...........................

Bardziej szczegółowo

Narzędzia do wydobywania słowników związków frazeologicznych i terminów

Narzędzia do wydobywania słowników związków frazeologicznych i terminów Narzędzia do wydobywania słowników związków frazeologicznych i terminów Marek Maziarz, Michał Wendelberger Politechnika Wrocławska Instytut Informatyki Grupa Naukowa G4.19 marek.maziarz@pwr.edu.pl michal.wendelberger@pwr.edu.pl

Bardziej szczegółowo

Dwujęzyczna Słowosieć

Dwujęzyczna Słowosieć CLARIN-PL Dwujęzyczna Słowosieć Ewa Rudnicka Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 ewa.rudnicka@pwr.wroc.pl Dwujęzyczna Słowosieć Warsztaty CLARIN-PL Poznań 2018

Bardziej szczegółowo

AUTOMATYKA INFORMATYKA

AUTOMATYKA INFORMATYKA AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław Kowalczuk Inteligentne wydobywanie informacji z internetowych serwisów

Bardziej szczegółowo

Ontologie, czyli o inteligentnych danych

Ontologie, czyli o inteligentnych danych 1 Ontologie, czyli o inteligentnych danych Bożena Deka Andrzej Tolarczyk PLAN 2 1. Korzenie filozoficzne 2. Ontologia w informatyce Ontologie a bazy danych Sieć Semantyczna Inteligentne dane 3. Zastosowania

Bardziej szczegółowo

WebSty otwarty webowy system do analiz stylometrycznych

WebSty otwarty webowy system do analiz stylometrycznych WebSty otwarty webowy system do analiz stylometrycznych Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 maciej.piasecki@pwr.edu.pl

Bardziej szczegółowo

Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2

Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2 Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2 ws.clarin-pl.eu/websty.shtml Tomasz Walkowiak, Maciej Piasecki Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej

Bardziej szczegółowo

CLARIN infrastruktura naukowa technologii językowych i jej potencjał jako narzędzia badawczego

CLARIN infrastruktura naukowa technologii językowych i jej potencjał jako narzędzia badawczego CLARIN infrastruktura naukowa technologii językowych i jej potencjał jako narzędzia badawczego Maciej Piasecki Politechnika Wrocławska Instytut Informatyki Grupa Naukowa G4.19 maciej.piasecki@pwr.wroc.pl

Bardziej szczegółowo

KorBa. Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk

KorBa. Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk KorBa Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk ALLPPT.com _ Free PowerPoint Templates, Diagrams and Charts PODSTAWOWE

Bardziej szczegółowo

CLARIN-PL w praktyce badawczej

CLARIN-PL w praktyce badawczej CLARIN-PL w praktyce badawczej Podsumowanie cyklu wykładów i warsztatów Streszczenie: CLARIN- PL jest infrastrukturą naukową technologii językowych, która udostępnia narzędzia badawcze do analizy zapisów

Bardziej szczegółowo

Tom 6 Opis oprogramowania Część 8 Narzędzie do kontroli danych elementarnych, danych wynikowych oraz kontroli obmiaru do celów fakturowania

Tom 6 Opis oprogramowania Część 8 Narzędzie do kontroli danych elementarnych, danych wynikowych oraz kontroli obmiaru do celów fakturowania Część 8 Narzędzie do kontroli danych elementarnych, danych wynikowych oraz kontroli Diagnostyka stanu nawierzchni - DSN Generalna Dyrekcja Dróg Krajowych i Autostrad Warszawa, 21 maja 2012 Historia dokumentu

Bardziej szczegółowo

Narzędzia do automatycznej analizy odniesień w tekstach

Narzędzia do automatycznej analizy odniesień w tekstach CLARIN-PL Narzędzia do automatycznej analizy odniesień w tekstach Michał Marcińczuk Jan Kocoń Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl

Bardziej szczegółowo

2. Wymagania wstępne w zakresie wiedzy, umiejętności oraz kompetencji społecznych (jeśli obowiązują): BRAK

2. Wymagania wstępne w zakresie wiedzy, umiejętności oraz kompetencji społecznych (jeśli obowiązują): BRAK OPIS MODUŁU KSZTAŁCENIA (SYLABUS) I. Informacje ogólne 1. Nazwa modułu kształcenia: JĘZYKOZNAWSTWO OGÓLNE 2. Kod modułu kształcenia: 08-KODM-JOG 3. Rodzaj modułu kształcenia: OBLIGATORYJNY 4. Kierunek

Bardziej szczegółowo

Scenariusz godziny wychowawczej w klasie VI

Scenariusz godziny wychowawczej w klasie VI Scenariusz godziny wychowawczej w klasie VI Temat: Uczymy się korzystać z różnych źródeł informacji Cel ogólny: Doskonalenie umiejętności korzystania z różnych źródeł informacji. Cel szczegółowe: Uczeń:

Bardziej szczegółowo

Polszczyzna i inżynieria lingwistyczna. Autor: Marcin Miłkowski (IFiS PAN)

Polszczyzna i inżynieria lingwistyczna. Autor: Marcin Miłkowski (IFiS PAN) Polszczyzna i inżynieria lingwistyczna Autor: Marcin Miłkowski (IFiS PAN) 1 Polszczyzna i jej cechy szczególne Polszczyzną posługuje się od 40 do 48 milionów osób: najczęściej używany język zachodniosłowiański

Bardziej szczegółowo

Obrazkowy Test Słownikowy Rozumienie (OTSR): wystandaryzowane i znormalizowane narzędzie do oceny zasobu słownictwa dzieci w wieku 2-6 lat

Obrazkowy Test Słownikowy Rozumienie (OTSR): wystandaryzowane i znormalizowane narzędzie do oceny zasobu słownictwa dzieci w wieku 2-6 lat Wydział Psychologii Uniwersytetu Warszawskiego Obrazkowy Test Słownikowy Rozumienie (OTSR): wystandaryzowane i znormalizowane narzędzie do oceny zasobu słownictwa dzieci w wieku 2-6 lat Magdalena Łuniewska,

Bardziej szczegółowo

Języki deskryptorowe. Dr Marek Nahotko

Języki deskryptorowe. Dr Marek Nahotko Języki deskryptorowe Dr Marek Nahotko 1 Literatura: Języki deskryptorowe dla SINTO / Lucyna Bielicka, Joanna Tomasik-Beck. Warszawa, 1981; Zasady budowy tezaurusów / Kazimierz Leski. Warszawa, 1978; Języki

Bardziej szczegółowo

Katedra Języków Specjalistycznych Wydział Lingwistyki Stosowanej U n i w e r s y t e t W a r s z a w s k i. Debiuty Naukowe. Leksykon tekst wyraz

Katedra Języków Specjalistycznych Wydział Lingwistyki Stosowanej U n i w e r s y t e t W a r s z a w s k i. Debiuty Naukowe. Leksykon tekst wyraz Katedra Języków Specjalistycznych Wydział Lingwistyki Stosowanej U n i w e r s y t e t W a r s z a w s k i Debiuty Naukowe III Leksykon tekst wyraz WARSZAWA 2009-1 - Seria Debiuty Naukowe Redaktor tomu

Bardziej szczegółowo

Semantyczna analiza języka naturalnego

Semantyczna analiza języka naturalnego Semantyczna analiza języka naturalnego Rozwiązanie Applica oparte o IBM SPSS Modeler Piotr Surma Applica 2 Agenda O Applica Analiza tekstu w języku polskim - wyzwania Rozwiązanie Applica Analiza Tekstu

Bardziej szczegółowo

CLARIN infrastruktura naukowa technologii językowych

CLARIN infrastruktura naukowa technologii językowych CLARIN infrastruktura naukowa technologii językowych Maciej Piasecki Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 maciej.piasecki@pwr.edu.pl Przykład: analiza pojęcia Problem:

Bardziej szczegółowo

Centrum Technologii Językowych CLARIN- PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego

Centrum Technologii Językowych CLARIN- PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego Centrum Technologii Językowych CLARIN- PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego Maciej Piasecki, Tomasz Walkowiak Politechnika ska Katedra Inteligencji Obliczeniowej

Bardziej szczegółowo

Rzutowanie Słowosieci na pojęcia ontologii SUMO i inne zasoby semantyczne

Rzutowanie Słowosieci na pojęcia ontologii SUMO i inne zasoby semantyczne Rzutowanie Słowosieci na pojęcia ontologii SUMO i inne zasoby semantyczne Paweł Kędzia, Maciej Piasecki, Michał Marcińczuk, Marek Maziarz, Jan Wieczorek, Marcin Oleksy Grupa Naukowa G4.19 Katedra Inteligencji

Bardziej szczegółowo

Zapytanie ofertowe nr 1/2016

Zapytanie ofertowe nr 1/2016 to Zapytanie ofertowe nr 1/2016 z dnia 11052016 Espeo Software Sp z oo 2 Zapytanie ofertowe nr 1/2016 z dnia 11052016 Zapytanie ofertowe nr 1/2016 z dnia 11052016 Zamawiający: Espeo Software Sp z oo Adres:

Bardziej szczegółowo

I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ? II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY...

I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ? II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY... Spis treści I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ?... 13 II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY...17 1. Niepowtarzalność języka każdego z nas...17 1.1. Nasz język indywidualny...17 1.2. Czynniki

Bardziej szczegółowo

2

2 1 2 3 4 5 Dużo pisze się i słyszy o projektach wdrożeń systemów zarządzania wiedzą, które nie przyniosły oczekiwanych rezultatów, bo mało kto korzystał z tych systemów. Technologia nie jest bowiem lekarstwem

Bardziej szczegółowo

Spis treści tomu pierwszego

Spis treści tomu pierwszego Spis treści tomu pierwszego WSTĘP.... 11 DŹWIĘK JAKO ZJAWISKO FIZYCZNE...15 CHARAKTERYSTYKA AKUSTYCZNA I AUDYTYWNA DŹWIĘKÓW MOWY.. 17 SŁUCH...20 WYŻSZE PIĘTRA UKŁADU SŁUCHOWEGO...22 EMISJE OTOAKUSTYCZNE...25

Bardziej szczegółowo

2. Nabieramy umiejętności korzystania ze słowników

2. Nabieramy umiejętności korzystania ze słowników a. 2. Nabieramy umiejętności korzystania ze słowników Uczeń: i. a) Wiadomości zna rodzaje słowników i encyklopedii, zna budowę encyklopedii i słowników, zna zasady korzystania z encyklopedii i słowników,

Bardziej szczegółowo

Co to jest znaczenie? Współczesne koncepcje znaczenia i najważn. i najważniejsze teorie semantyczne

Co to jest znaczenie? Współczesne koncepcje znaczenia i najważn. i najważniejsze teorie semantyczne Co to jest znaczenie? Współczesne koncepcje znaczenia i najważniejsze teorie semantyczne Uniwersytet Kardynała Stefana Wyszyńskiego 1 Koncepcje znaczenia 2 3 1. Koncepcje referencjalne znaczenie jako byt

Bardziej szczegółowo

EmotiWord, semantyczne powiązanie i podobieństwo, odległość znaczeniowa

EmotiWord, semantyczne powiązanie i podobieństwo, odległość znaczeniowa , semantyczne powiązanie i podobieństwo, odległość Projekt przejściowy ARR Politechnika Wrocławska Wydział Elektroniki Wrocław, 22 października 2013 Spis treści 1 językowa 2, kryteria 3 Streszczenie artykułu

Bardziej szczegółowo

Część 1. Ekstrakcja informacji oraz stylometria na usługach psychologii CLARIN-PL. Tomasz Walkowiak

Część 1. Ekstrakcja informacji oraz stylometria na usługach psychologii CLARIN-PL. Tomasz Walkowiak CLARIN-PL Ekstrakcja informacji oraz stylometria na usługach psychologii Część 1 Tomasz Walkowiak Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej Wydział Informatyki i Zarządzania

Bardziej szczegółowo

ANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO- ROK SZKOLNY 2017/2018 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI

ANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO- ROK SZKOLNY 2017/2018 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI ANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO- ROK SZKOLNY 2017/2018 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI W dniu 16.01.2018r. odbył się próbny egzamin gimnazjalny z języka polskiego. Do

Bardziej szczegółowo

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra

Bardziej szczegółowo

SZKOŁA PODSTAWOWA W MYŚLACHOWICACH

SZKOŁA PODSTAWOWA W MYŚLACHOWICACH SZKOŁA PODSTAWOWA W MYŚLACHOWICACH WYMAGANIA NA OCENY ŚRÓDROCZNE I ROCZNE PRZEDMIOT Język angielski NAUCZYCIEL Magdalena Niewiedział KLASA VII ROK SZKOLNY 2018/2019 L.P. 1. ZAKRES OCENY Znajomość środków

Bardziej szczegółowo

Neurobook. Inteligentne repozytoria wiedzy. Cezary Dołęga

Neurobook. Inteligentne repozytoria wiedzy. Cezary Dołęga Neurobook Inteligentne repozytoria wiedzy Cezary Dołęga adres-mailowy@neurosoft.pl Plan prezentacji Definicja repozytorium wiedzy, cechy Techniki SI w repozytoriach wiedzy Przetwarzanie obrazów Analiza

Bardziej szczegółowo

Kodowanie produktów - cz. 1

Kodowanie produktów - cz. 1 Kodowanie produktów - cz. 1 25.07.2005 r. Wstęp Do identyfikacji wyrobów od dawna używa się różnego rodzaju kodów i klasyfikacji. Obecnie stosuje się m.in. natowską kodyfikację wyrobów, kodowanie wyrobów

Bardziej szczegółowo

WSKAZÓWKI DLA AUTORÓW Optymalizacja publikacji naukowych dla wyników wyszukiwarek ASEO 1

WSKAZÓWKI DLA AUTORÓW Optymalizacja publikacji naukowych dla wyników wyszukiwarek ASEO 1 WSKAZÓWKI DLA AUTORÓW Optymalizacja publikacji naukowych dla wyników wyszukiwarek ASEO 1 W celu zwiększenia indeksowania i przeszukiwania publikacji autorskich przez naukowe wyszukiwarki internetowe, należy

Bardziej szczegółowo

Aplikacja testowej wersji tezaurusa w systemie komputerowym ALEPH w Bibliotece CIOP-PIB

Aplikacja testowej wersji tezaurusa w systemie komputerowym ALEPH w Bibliotece CIOP-PIB Aplikacja testowej wersji tezaurusa w systemie komputerowym ALEPH w Bibliotece CIOP-PIB IX Krajowe Forum Informacji Naukowej i Technicznej Zakopane wrzesień 2007 Biblioteka CIOP-PIB Biblioteka CIOP-PIB

Bardziej szczegółowo

Niko 2 Przedmiotowy System Oceniania

Niko 2 Przedmiotowy System Oceniania Niko 2 Przedmiotowy System Oceniania TREŚCI NAUCZANIA REALIZOWANE W PODRĘCZNIKU NIKO 2 I PODLEGAJĄCE OCENIANIU MÓWIENIE I SŁUCHANIE - opisywanie ilustracji - komentowanie przedstawionej na obrazku sytuacji

Bardziej szczegółowo

Słowniki i korpusy języka polskiego

Słowniki i korpusy języka polskiego Słowniki i korpusy języka polskiego Leksykografia opracowywanie słowników, słownikarstwo nauka o metodach i technice opracowywania słowników Słownik zbiór słów lub wyrażeń ułożonych i opracowanych według

Bardziej szczegółowo

Dwujęzyczna Słowosieć możliwości wykorzystania w pracy tłumacza i w analizie porównawczej

Dwujęzyczna Słowosieć możliwości wykorzystania w pracy tłumacza i w analizie porównawczej CLARIN-PL Dwujęzyczna Słowosieć możliwości wykorzystania w pracy tłumacza i w analizie porównawczej Ewa Rudnicka Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 ewa.rudnicka@pwr.wroc.pl

Bardziej szczegółowo

Wykorzystanie standardów serii ISO 19100 oraz OGC dla potrzeb budowy infrastruktury danych przestrzennych

Wykorzystanie standardów serii ISO 19100 oraz OGC dla potrzeb budowy infrastruktury danych przestrzennych Wykorzystanie standardów serii ISO 19100 oraz OGC dla potrzeb budowy infrastruktury danych przestrzennych dr inż. Adam Iwaniak Infrastruktura Danych Przestrzennych w Polsce i Europie Seminarium, AR Wrocław

Bardziej szczegółowo

APLIKOWANIE DO COST W KRÓTKI KURS NAUKACH HUMANISTYCZNYCH MACIEJ MARYL. dr Maciej Maryl

APLIKOWANIE DO COST W KRÓTKI KURS NAUKACH HUMANISTYCZNYCH MACIEJ MARYL. dr Maciej Maryl APLIKOWANIE DO COST W NAUKACH HUMANISTYCZNYCH KRÓTKI KURS MACIEJ MARYL dr Maciej Maryl Od autora Poniższa prezentacja została wygłoszona w ramach warsztatów na Uniwersytecie Łódzkim (26 IX 2017) Prezentowane

Bardziej szczegółowo

DOTACJA NA UTRZYMANIE POTENCJAŁU BADAWCZEGO DOTACJA Wykaz planowanych do realizacji zadań badawczych, ujętych w planie zadaniowym jednostki

DOTACJA NA UTRZYMANIE POTENCJAŁU BADAWCZEGO DOTACJA Wykaz planowanych do realizacji zadań badawczych, ujętych w planie zadaniowym jednostki DOTACJA NA UTRZYMANIE POTENCJAŁU BADAWCZEGO DOTACJA 2016 Wykaz planowanych do realizacji zadań badawczych, ujętych w planie zadaniowym jednostki Instytut Bibliotekoznawstwa i Informacji Naukowej 1. Dzieje

Bardziej szczegółowo

English in Mind Wydanie egzaminacyjne - zgodność zawartości podręcznika ze standardami wymagań egzaminu gimnazjalnego z języka angielskiego

English in Mind Wydanie egzaminacyjne - zgodność zawartości podręcznika ze standardami wymagań egzaminu gimnazjalnego z języka angielskiego English in Mind Wydanie egzaminacyjne - zgodność zawartości podręcznika ze standardami wymagań egzaminu gimnazjalnego z języka angielskiego CZYTELNA STRUKTURA KURSU materiał przedstawiony w 4 modułach

Bardziej szczegółowo

Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich

Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich Adam Radziszewski Instytut Informatyki Stosowanej PWr SIIS 23, 12 czerwca 2008 O

Bardziej szczegółowo

Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud

Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy Jan Wieczorek Jan Kocoń marcin.oleksy@pwr.edu.pl jan.wieczorek@pwr.edu.pl

Bardziej szczegółowo

Odpowiedzi i punktacja zadań do zestawu W kręgu muzyki GH-A1(A4)

Odpowiedzi i punktacja zadań do zestawu W kręgu muzyki GH-A1(A4) Odpowiedzi i punktacja zadań do zestawu W kręgu muzyki GH-A1(A4) Klucz odpowiedzi do zadań zamkniętych 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 B A B C D D D C C B A D B A C A B D A C Nr zad.

Bardziej szczegółowo

Publikacja w repozytorium i przetwarzanie w systemie DSpace

Publikacja w repozytorium i przetwarzanie w systemie DSpace Publikacja w repozytorium i przetwarzanie w systemie DSpace Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej

Bardziej szczegółowo

Ujednoznacznianie sensów słów

Ujednoznacznianie sensów słów ł ę ł ń ł Warsztaty Ujednoznacznianie sensów słów Ujednoznacznianie sensów słów Idea ujednoznaczniania sensów słów: zamek Warsztaty Ujednoznacznianie sensów słów Idea ujednoznaczniania sensów słów (cd.):

Bardziej szczegółowo

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2) Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2) Ewa Wołoszko Praca pisana pod kierunkiem Pani dr hab. Małgorzaty Doman Plan tego wystąpienia Teoria Narzędzia

Bardziej szczegółowo

Ćwiczenia technik efektywnego uczenia się Spotkanie 4

Ćwiczenia technik efektywnego uczenia się Spotkanie 4 Ćwiczenia technik efektywnego uczenia się Spotkanie 4 Sprawdź sam siebie Na kolejne zajęcia niezbędne będą Trzy zakreślacze tekstu w różnych kolorach, np. żółty, niebieski, zielony Pudełko pamięci/ MemoBox.

Bardziej szczegółowo

WYMAGANIA EDUKACYJNE Z JĘZYKA POLSKIEGO - POZIOM PODSTAWOWY

WYMAGANIA EDUKACYJNE Z JĘZYKA POLSKIEGO - POZIOM PODSTAWOWY WYMAGANIA EDUKACYJNE Z JĘZYKA POLSKIEGO - POZIOM PODSTAWOWY WIADOMOŚCI O EPOCE wiadomości Określa ramy czasowe i genezę nazwy epoki. Wymienia głównych reprezentantów omawianych kierunków literackich. Wymienia

Bardziej szczegółowo

Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud

Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji

Bardziej szczegółowo

Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst

Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst Mariusz Owsianny, PCSS Dr inż. Ewa Kuśmierek, Kierownik Projektu, PCSS Partnerzy konsorcjum Zaawansowany system automatycznego

Bardziej szczegółowo

ANALIZA WYNIKÓW EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2016/2017 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI

ANALIZA WYNIKÓW EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2016/2017 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI ANALIZA WYNIKÓW EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2016/2017 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI W dniu 18.04.2016r. odbył się egzamin gimnazjalny z języka polskiego. Do badania diagnostycznego

Bardziej szczegółowo

Bazy danych TERMINOLOGIA

Bazy danych TERMINOLOGIA Bazy danych TERMINOLOGIA Dane Dane są wartościami przechowywanymi w bazie danych. Dane są statyczne w tym sensie, że zachowują swój stan aż do zmodyfikowania ich ręcznie lub przez jakiś automatyczny proces.

Bardziej szczegółowo

KIERUNKOWE EFEKTY KSZTAŁCENIA

KIERUNKOWE EFEKTY KSZTAŁCENIA WYDZIAŁ INFORMATYKI I ZARZĄDZANIA Kierunek studiów: INFORMATYKA Stopień studiów: STUDIA I STOPNIA Obszar Wiedzy/Kształcenia: OBSZAR NAUK TECHNICZNYCH Obszar nauki: DZIEDZINA NAUK TECHNICZNYCH Dyscyplina

Bardziej szczegółowo

Analiza danych i data mining.

Analiza danych i data mining. Analiza danych i data mining. mgr Katarzyna Racka Wykładowca WNEI PWSZ w Płocku Przedsiębiorczy student 2016 15 XI 2016 r. Cel warsztatu Przekazanie wiedzy na temat: analizy i zarządzania danymi (data

Bardziej szczegółowo

Reprezentacja wiedzy wprowadzenie, sieci semantyczne, ramy

Reprezentacja wiedzy wprowadzenie, sieci semantyczne, ramy Reprezentacja wiedzy wprowadzenie, sieci semantyczne, ramy Agnieszka Ławrynowicz 17 listopada 2016 Plan wykładu 1 Wprowadzenie: wiedza, reprezentacja, wnioskowanie, bazy wiedzy 2 Systemy oparte o wiedzę

Bardziej szczegółowo

Tomasz Grześ. Systemy zarządzania treścią

Tomasz Grześ. Systemy zarządzania treścią Tomasz Grześ Systemy zarządzania treścią Co to jest CMS? CMS (ang. Content Management System System Zarządzania Treścią) CMS definicje TREŚĆ Dowolny rodzaj informacji cyfrowej. Może to być np. tekst, obraz,

Bardziej szczegółowo