Rzutowanie Słowosieci na pojęcia ontologii SUMO i inne zasoby semantyczne

Wielkość: px
Rozpocząć pokaz od strony:

Download "Rzutowanie Słowosieci na pojęcia ontologii SUMO i inne zasoby semantyczne"

Transkrypt

1 Rzutowanie Słowosieci na pojęcia ontologii SUMO i inne zasoby semantyczne Paweł Kędzia, Maciej Piasecki, Michał Marcińczuk, Marek Maziarz, Jan Wieczorek, Marcin Oleksy Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej Politechnika Wrocławska CLARIN-PL 27 IV 2016

2 Plan Słowosieć a ontologia Słowosieć a baza wiedzy System zasobów wiedzy Ontologia SUMO i związki z wordnetami Rzutowanie na SUMO Powiązania pomiędzy Słowosiecią a NELexicon 2.0 Odniesienia do Wikipedii 2 / 33

3 Słowosieć a ontologia Słowosieć, ani żaden wordnet nie są ontologiami ontologia: wymóg rozłącznych kategorii sieć: nakładanie się znaczeń jednostek o wspólnym hiperonimie ontologia: precyzja definiowania sieć: język potoczny a język naukowy, np. lew jako synonim lwa afrykańskiego ontologia: kompletność opisu sieć: struktura zależna od leksykalizacji ontologia: hiperonimia jako drzewo sieć: luki na poziomie pojęć ogólnych ontologia: intencjonalny opis rzeczywistości sieć: warunkowana użyciem języka 3 / 33

4 Słowosieć a baza wiedzy Słowosieć opisuje znaczenia leksykalne Nie zawiera opisu bytów, faktów, ogólnej wiedzy o świecie Nazwy własne z zasady nie były objęte opisem w ramach Słowosieci nazwy stanowią otwartą klasę i mocno zależną od kontekstu Wyjątki nazwy będące podstawą słowotwórczą do lematów, które są częste w korpusie Polska charakteryzowanie polski Polska Agencja Prasowa, PAP synonimia międzyparadygmatyczna dla relacyjnych papowski 4 / 33

5 Słowosieć jako interfejs pomiędzy tekstem a zasobami wiedzy 5 / 33

6 SUMO Suggested Upper Merged Ontology Darmowa, otwarta, rozszerzenia na licencji GNU GPL Formalna: termów, aksjomatów 6 / 33

7 SUMO Suggested Upper Merged Ontology Strona domowa: Cała zrzutowana na Princeton WordNet Otwarte biomedyczne ontologie (OBO) częściowo zrzutowane na SUMO ( FarsNet (WN języka perskiego) posiada rzutowanie na SUMO Powiązana w MCR z WordNet Domains, Base Concepts, Top Ontology oraz AdimenSUMO 7 / 33

8 Rzutowanie na SUMO Co nam daje rzutowanie Słowosieci na SUMO? 1 Przejście na poziom pojęć ontologicznych 2 Ogólniejszy opis słów z tekstu m.in. cechy klasyfikatora (role semantyczne selekcja cech) 3 Powiązanie z innymi zasobami połączonymi z SUMO 8 / 33

9 Cechy stanowiące podstawę reguł przenoszenia relacji Cel: przeniesienie relacji z PWN SUMO na Słowosieć SUMO Relacje międzyjęzykowe (rzutowania) pomiędzy Słowosiecią i WordNetem: i-synonymy, i-hyponymy, i-part-of-meronymy,... Relacje rzutowania pomiędzy WordNetem i SUMO: equivalent, instance of and subsumed, Dziedziny synsetów Słowosieci i WordNetu: body, grp, food, loc,... Wielka litera w pierwszym lemacie synsetu Słowosieci Odwołałanie do konkretnych pojęć SUMO: Currency, GroupOfPeople, FieldOfStudy, Human,... 9 / 33

10 Proces rzutowania 10 / 33

11 Relacje rzutowania: PWN-SUMO oraz plwn-sumo 1 equivalent (ekwiwalencja) synset odpowiada pojęciu SUMO ze względu na znaczenie synsetu, ze szczególnym wagą przykładaną do denotacji synsetu, np. plant 2 equivalent Plant. 2 instance of (instancja) denotacja synsetu jest instancją pojęcia SUMO, np. Aristotle 1 instance of Man, lub jest elementem kolekcji denotowanej przez pojęcie SUMO, np. {Eden 2} instance of Region 3 subsumed (podklasa) denotacja synsetu zawiera się w denotacji pojęcia SUMO np. {town 1} subsumed City. 4 R inna relacja (tylko w rzutowaniu plwn SUMO) 11 / 33

12 Reguły rzutowania (1) Typy 1 Proste przenoszące relację oparte na relacji i-synonymy synonimii międzyjęzykowej, relacja: synset WordNetu pojęcie SUMO jest kopiowana na relację synset Słowosieci pojęcie SUMO. 2 Złożone przenoszące bądź zmieniające relację na podstawie szeregu cech jest rozpoznawany typ relacji pomiędzy Słowosiecią i SUMO relacja wynikowa może się różnić od analogicznej relacji pomiędzy WordNetem i SUMO 12 / 33

13 Reguły rzutowania (2) Reguła prosta zapisana w pseudokodzie Algorithm 1 Przykłady prostych reguł rzutowania. 1: if R(PLWN PWN) = I-synonymy and R(PWN SUMO) = equivalent then 2: R(PLWN SUMO) = equivalent 3: end if 4: if R(PLWN PWN) = I-synonymy and R(PWN SUMO) = instance of then 5: R(PLWN SUMO) = instance of 6: end if 7: if R(PLWN PWN) = I-synonymy and R(PWN SUMO) = subsumed then 8: R(PLWN SUMO) = subsumed 9: end if 13 / 33

14 Przykłady prostych reguł Efekt zastosowania prostych reguł z Algorytmu 1 Relacja subsumed: 1 {kark 1 (body)} subsumed BodyPart {kark 1 (body)} jest i-synonym {nape 1 (body)} 2 {mieczyk 1 (plant)} subsumed FloweringPlant {mieczyk 1 (plant)} jest i-synonym {genus Gladiolus 1 (plant)} Relacja instance of: 1 {geometria rzutowa 1 (cogn)} instance of FieldOfStudy {geometria rzutowa 1 (cogn)} jest i-synonym dla {projective geometry 1 (cogn)} 2 {Ateny 1 (loc)} instance of City {Ateny 1 (cogn)} jest i-synonym {Athens 1 (cogn)} Relacja equivalent: 1 {czekolada 1 (food)} equivalent Chocolate {czekolada 1 (food)} jest i-synonym {chocolate 2 (food)} 2 {wał rozrządu 1 (arte)} equivalent Camshaft {wał rozrządu 1 (arte)} jest i-synonym {camshaft 1 (arte)} 14 / 33

15 Reguły rzutowania (3) Reguła złożona zapisana w pseudokodzie Algorithm 2 Przykłady reguł rzutowania, które odwołują się do dziedzin synsetów Słowosieci i WordNetu 1: if R(PLWN PWN) = I-part-of-meronymy and R(PWN SUMO) = equivalent then 2: if PLWN SYNSET zaczyna się wielką literą then 3: if D(PLWN) {loc} and D(PWN) {natobj} then 4: R(PLWN SUMO) = instance of 5: end if 6: if D(PLWN) {rel} and D(PWN) {loc} then 7: R(PLWN SUMO) = instance of 8: end if 9: end if 10: end if 15 / 33

16 Przykłady reguł rzutowania Złożone reguły Efekty zastosowania złożonych reguł z Algorytmu 2: 1 {Europa Wschodnia 1 (loc)} instance of Europe {Europa Wschodnia 1 (loc)} I-part-of-meronymy {Europe 1 (natobj)} instance of Europe 2 {Europa Zachodnia 1 (loc)} instance of Europe {Europa Zachodnia 1 (loc)} I-part-of-meronymy {Europe 1 (natobj)} instance of Europe 3 {Europa Południowo-Wschodnia 1 (loc)} instance of Europe {Europa Południowo-Wschodnia 1 (loc)} I-part-of-meronymy {Europe 1 (natobj)} instance of Europe 4 {Amazonia 1 (loc)} instance of SouthAmerica {Amazonia 1 (loc)} I-part-of-meronymy {South America 1 (natobj)} instance of SouthAmerica 5 {Hetmańszczyzna 1 (rel)} instance of Ukraine {Hetmańszczyzna 1 (rel)} I-part-of-meronymy {Ukraine 1 (natobj)} instance of Ukraine 16 / 33

17 Reguły rzutowania (4) Reguła złożona zapisana w pseudokodzie Algorithm 3 Przykłady reguł wykorzystujących dziedziny synsetów Słowosieci i WordNetu oraz pojęcia SUMO 1: if R(PLWN PWN) = I-part-of-holonymy and R(PWN SUMO) = subsumed then 2: if D(PLWN) {natphen} and D(PWN) {st} then 3: if SUMO CONCEPT=DiseaseOrSyndrome then 4: R(PLWN SUMO) = subsumed 5: end if 6: end if 7: end if 17 / 33

18 Przykłady reguł rzutowania Złożone reguły Efekty zastosowania złożonych reguł z Algorytmu 2: 1 {dysplazja śmiertelna 1 (natphen)} subsumed DiseaseOrSyndrome {dysplazja śmiertelna 1 (natphen)} I-part-of-holonymy {birth defect 1 (st)} subsumed DiseaseOrSyndrome 2 {zespół delecji 13q 1 (natphen)} subsumed DiseaseOrSyndrome {zespół delecji 13q 1 (natphen)} I-part-of-holonymy {birth defect 1 (st)} subsumed DiseaseOrSyndrome 3 {fetopatia cukrzycowa 1 (natphen)} subsumed DiseaseOrSyndrome {fetopatia cukrzycowa 1 (natphen)} I-part-of-holonymy {birth defect 1 (st)} subsumed DiseaseOrSyndrome 4 {ślepota z Rodrigue 1 (natphen)} subsumed DiseaseOrSyndrome {ślepota z Rodrigue 1 (natphen)} I-part-of-holonymy {birth defect 1 (st)} subsumed DiseaseOrSyndrome 5 {pentalogia Cantrella 1 (natphen)} subsumed DiseaseOrSyndrome {pentalogia Cantrella 1 (natphen)} I-part-of-holonymy {birth defect 1 (st)} subsumed DiseaseOrSyndrome 18 / 33

19 Reguły rzutowania (5) Przykłady przypadków kiedy typ relacji nie może być rozstrzygnięty automatycznie Algorithm 4 Przykład przypadku kiedy typ relacji nie może być rozstrzygnięty automatycznie 1: if R(PLWN PWN) = I-part-of-meronymy and R(PWN SUMO) = subsumed then 2: if D(PLWN) {loc, body, arte, grp,..., class} then 3: R(PLWN SUMO) = manually 4: end if 5: end if 19 / 33

20 Przykłady reguł rzutowania Złożone reguły Efekty zastosowania złożonych reguł z Algorytmu 4: 1 {okno 7 (arte)} manually Region {okno 7 (arte)} I-part-of-meronymy {hotbed 2 (arte)} subsumed Region 2 {skrzydło 9 (arte)} manually Door {skrzydło 9 (arte)} I-part-of-meronymy {door 1 (arte)} subsumed Door 3 {strzelnica 2 (loc)} manually Corporation {strzelnica 2 (loc)} I-part-of-meronymy {amusement park 1 (loc)} subsumed Corporation 4 {biblioteka szkolna 1 (loc)} manually School {biblioteka szkolna 1 (loc)} I-part-of-meronymy {school 2 (arte)} subsumed School 5 {oliwka 5 (body)} manually BodyPart {oliwka 5 (body)} I-part-of-meronymy {medulla oblongata 1 (arte)} subsumed BodyPart 6 {węzina 1 (body)} manually ThyroidGland {węzina 1 (body)} I-part-of-meronymy {thyroid gland 1 (arte)} subsumed ThyroidGland 20 / 33

21 Uaktualnianie rzutowania - Krok 1 Redukcja relacji niedookreślonych R RReduktor redukuje niedookreślone relacje wynikające z wielu rzutowań plwn-pwn Przykład: abnegat.1(os) hiper pa slob.1 Human R abnegat.1(os) hipo pa person.1 Human subsumed agnegat.1(os) - subsumed - Human 21 / 33

22 Uaktualnianie rzutowania - Krok 2 Poprawa typu relacji rzutującej Bulbulator propaguje wynik prostych reguł na pozostałe rzutowania dla danej pary {znaczenie, pojęcie SUMO} Przykład: krzesło.1(wytw) syn pa chair.1(wytw) Chair equivalent krzesło.1(wytw) hipo pa fighting chair.1(wytw) Chair subsumed krzesło.1(wytw) hiper pa Eames chair.1(wytw) Chair subsumed krzesło.1(wytw) hiper pa ladder-back.1(wytw) Chair subsumed krzesło.1(wytw) hiper pa straight chair.1(wytw) Chair subsumed krzesło.1(wytw) hiper pa tablet-armed chair.1(wytw) Chair subsumed krzesło.1(wytw) - equivalent - Chair 22 / 33

23 Uaktualnianie rzutowania - Krok 3 Poprawa typu relacji rzutującej Oknak dla danej pary {znaczenie, pojęcie SUMO} wyszukuje różne kombinacje wystąpień relacji m.językowych i ustala typ relacji rzutującej. mero:el pa oraz hipo pa subsumed mero:cz pa oraz hipo pa subsumed mero:cz pa oraz hiper pa subsumed synmr pa oraz syncz pa subsumed synmr pa oraz hipo pa subsumed syn pa oraz hiper pa equivalent hipo pa oraz hiper pa instance of lasek.1 hipo pa forest.1 Forest subsumed lasek.1 synmr pa forest.2 Forest equivalent lasek.1 - subsumed - Forest 23 / 33

24 Uaktualnianie rzutowania - Krok 4 Redukcja nadmiarowych rzutowań Corec Redukuje niepotrzebne rzutowania na podstawie szczegółowości pojęć Znaczenie z 1 posiada rzutowania na pojęcia A, B, C, D Znamy strukturę SUMO wiemy, które pojęcie z którym jest połączone Jeżeli pomiędzy A, B, C, D zachodzi relacja isa: wybieramy pojęcie najbardziej szczegółowe Relacje zachowujemy takie, jakie były przy konkretnych rzutowaniach 24 / 33

25 Uaktualnianie rzutowania - Krok 5 Redukcja nadmiarowych rzutowań Serdel Dla zadanego znaczenia usuwa rzutowania na SubjectiveAssessmentAttribute przy założeniu, że istnieją inne dla niego Przykład: matnia.1(st) subsumed TrapOrCage matnia.1(st) subsumed SubjectiveAssessmentAttribute matnia.1(st) -- subsumed -- TrapOrCage 25 / 33

26 Uaktualnianie rzutowania - Krok 6 Generowanie nowych rzutowań Rubin Wykorzystując relacje międzyjęzykowe oraz strukturę hiperonimiczną WordNetów generuje nowe rzutowania Rysunek: Rzutowanie plwn - PWN - SUMO 26 / 33

27 Ocena wyników algorytmu Krok 1: Automatyczna ocena wyników algorytmu rzutowania: Różne relacje wygenerowane dla tej samej pary {synset Słowosieci, pojęcie SUMO} Zaobserwowany błąd: 0,06% Krok 2: Ocena ręczna przez lingwistów: Próbka 160 rezultatów rzutowania Schemat oceny: 2+1 Trzy klasy: poprawne, niepoprawne, podłączony do hiperonimu Zgodność pomiędzy anotatorami: 81% Zmierzona dokładność rzutowania: 0,831 % Co zrobić z synsetami zrzutowanymi za pomocą relacji R? 27 / 33

28 Statystyki rzutowania (1) Ogólne statystyki zrzutowanych i niezrzutowanych synsetów Liczba rzutowań Kwiecień 2014: Liczba rzutowań Maj 2014: Liczba rzutowań Luty 2016: Liczba zrzutowanych synsetów: , tj. 89.2% wszystkich Tablica: Liczba synsetów Słowosieci zrzutowanych na SUMO i pozostawionych do decyzji (ręcznie) POS Ręcznie Zrzutowane Ręcznie [%] Maj Luty Maj Luty Maj Luty Rzeczownik ,8 3,8 Czasownik ,5 5,0 Przymiotnik ,8 4,4 28 / 33

29 Statystyki rzutowania (5) Pięć najczęstszych pojęć SUMO w rezultatach rzutowania dla każdej relacji. Relacja Znaczenie Liczba synsetów Human 405 SocialRole 274 Equivalent Position 270 Bird 198 Female 76 City FieldOfStudy Instance of Human SocialRole 421 Position 339 SubjectiveAssessmentAttribute Human Subsumed Position FloweringPlant SocialRole / 33

30 Powiązania pomiędzy Słowosiecią a NELexicon 2.0 Hierarchia kategorii nazw w NELexicon 2.0 (2,4 mln nazw własnych): 102 kategoria, 3 poziomy Ręczne rzutowanie kategorii najniższego poziomu na wybrane synsety np. nam liv plant roślina 1 w niektórych przypadkach więcej niż jeden synset np. nam eve human aniversary rocznica 2, rocznica 1 Ręczne rzutowanie na pojęcia SUMO 80 ze 102 kategorii zrzutowanych np. nam pro model car SelfPoweredRoadVehicle Automatyczne rzutowanie nazw w oparciu o miarę powiązania znaczeniowego wydobytą z korpusu, pary wydobyte przez wzorce z tekstu oraz struktury Wikipedii za pomocą WordnetWeaver 30 / 33

31 Odniesienia do Wikipedii Ręcznie dodane powiązania do haseł Wikipedii synset hasło Wikipedii np. Polska 1 {##L Dodawane tylko wtedy, gdy jednostka leksykalna ze Słowosieci oznacza ten sam byt (np. zwierzę/roślinę etc.), które opisane jest w haśle Wikipedii, Wszystkie elementy synsetu mają te samo powiązanie jeżeli Wikipedia omawia jakiś takson, który określony jest liczbą mnogą (np. kręgowce), to nie można takiego hasła łączyć z jednostką, która jest wyrażona w liczbie pojedynczej (np. kręgowiec) Synsety połączone bliskoznacznością opatrujemy tym samym powiązaniem Łączna liczba powiązań: około 54 tys. 31 / 33

32 Podsumowanie Reguły wykorzystujące wyniki ręcznego rzutowania WordNet na SUMO oraz ręcznego rzutownania międzyjęzykowego pozwoliły na zbudowania efektywnych reguł rzutowania na SUMO Słowosieć stała się interfejsem pomiędzy zasobami wiedzy a językiem Powiązania pomiędzy NELexicon a Słowosiecią wymagają pogłębienia z poziomu kategorii do indywidualnych nazw System zasobów jest dalej rozszerzony przez powiązania do struktur walencyjnych (Walenty) oraz słownika wielowyrazowych jednostek leksykalnych 32 / 33

33 33 / 33

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji

Bardziej szczegółowo

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika ska Katedra Inteligencji

Bardziej szczegółowo

Program warsztatów CLARIN-PL

Program warsztatów CLARIN-PL W ramach Letniej Szkoły Humanistyki Cyfrowej odbędzie się III cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Narzędzia cyfrowe do analizy języka w naukach humanistycznych i społecznych 17-19

Bardziej szczegółowo

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra

Bardziej szczegółowo

Open Access w technologii językowej dla języka polskiego

Open Access w technologii językowej dla języka polskiego Open Access w technologii językowej dla języka polskiego Marek Maziarz, Maciej Piasecki Grupa Naukowa Technologii Językowych G4.19 Zakład Sztucznej Inteligencji, Instytut Informatyki, W-8, Politechnika

Bardziej szczegółowo

Narzędzia do automatycznego wydobywania kolokacji

Narzędzia do automatycznego wydobywania kolokacji Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl

Bardziej szczegółowo

Narzędzia do automatycznego wydobywania kolokacji

Narzędzia do automatycznego wydobywania kolokacji Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl

Bardziej szczegółowo

Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów

Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów Maciej Piasecki, Jan Kocoń Politechnika Wrocławska Katedra InteligencjiObliczeniowej Grupa

Bardziej szczegółowo

Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowania

Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowania Słowosiec 3.2 - leksykalna siec semantyczna je zyka polskiego i jej zastosowania Poziom rozszerzony Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 agnieszka.dziob@pwr.edu.pl

Bardziej szczegółowo

Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur

Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur Maciej Piasecki, Paweł Kędzia Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Plan prezentacji

Bardziej szczegółowo

Słowosiec leksykalna siec semantyczna języka polskiego i jej zastosowania

Słowosiec leksykalna siec semantyczna języka polskiego i jej zastosowania Słowosiec 4.0 - leksykalna siec semantyczna języka polskiego i jej zastosowania Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Ewa Rudnicka Politechnika Wrocławska Katedra Inteligencji Obliczeniowej

Bardziej szczegółowo

CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy

CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy Cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy 13 15 kwietnia 2015 roku Warszawa, Pałac Staszica, ul. Nowy Świat 72, sala 144

Bardziej szczegółowo

Słowosieć leksykalna sieć semantyczna języka polskiego i jej zastosowania

Słowosieć leksykalna sieć semantyczna języka polskiego i jej zastosowania Słowosieć 3.0 - leksykalna sieć semantyczna języka polskiego i jej zastosowania Agnieszka Dziob, Marek Maziarz, Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa

Bardziej szczegółowo

Dwujęzyczna Słowosieć

Dwujęzyczna Słowosieć CLARIN-PL Dwujęzyczna Słowosieć Ewa Rudnicka Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 ewa.rudnicka@pwr.wroc.pl Dwujęzyczna Słowosieć Warsztaty CLARIN-PL Poznań 2018

Bardziej szczegółowo

WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp

WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp Natalia Kotsyba, IBI AL UW 24 marca 2010 Plan zajęć Praca domowa na zapytania do Korpusu IPI PAN za pomocą

Bardziej szczegółowo

S owosiec leksykalna siec semantyczna jezyka polskiego i jej zastosowania

S owosiec leksykalna siec semantyczna jezyka polskiego i jej zastosowania S owosiec 3.0 - leksykalna siec semantyczna jezyka polskiego i jej zastosowania Agnieszka Dziob, Marek Maziarz, Maciej Piasecki Politechnika Wroc awska Katedra Inteligencji Obliczeniowej Grupa Naukowa

Bardziej szczegółowo

II cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych

II cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych II cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych 18-20 maja 2015 roku Politechnika Wrocławska, Centrum Kongresowe,

Bardziej szczegółowo

Narzędzia do automatycznej analizy odniesień w tekstach

Narzędzia do automatycznej analizy odniesień w tekstach CLARIN-PL Narzędzia do automatycznej analizy odniesień w tekstach Michał Marcińczuk Jan Kocoń Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl

Bardziej szczegółowo

Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex

Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej

Bardziej szczegółowo

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska DRZEWO REGRESYJNE Sposób konstrukcji i przycinania

Bardziej szczegółowo

Słowosieć jako narzędzie wspomagające pracę tłumacza

Słowosieć jako narzędzie wspomagające pracę tłumacza Rocznik Kognitywistyczny V/2011 DOI 10.4467/20843895RK.12.004.0408 s. 33 42 AGNIESZKA DZIOB, PAULINA ŁAZAREWICZ Uniwersytet Wrocławski, Politechnika Wrocławska Słowosieć jako narzędzie wspomagające pracę

Bardziej szczegółowo

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

CLARIN rozproszony system technologii językowych dla różnych języków europejskich CLARIN rozproszony system technologii językowych dla różnych języków europejskich Maciej Piasecki Politechnika Wrocławska Instytut Informatyki G4.19 Research Group maciej.piasecki@pwr.wroc.pl Projekt CLARIN

Bardziej szczegółowo

Dwujęzyczna Słowosieć możliwości wykorzystania w pracy tłumacza i w analizie porównawczej

Dwujęzyczna Słowosieć możliwości wykorzystania w pracy tłumacza i w analizie porównawczej CLARIN-PL Dwujęzyczna Słowosieć możliwości wykorzystania w pracy tłumacza i w analizie porównawczej Ewa Rudnicka Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 ewa.rudnicka@pwr.wroc.pl

Bardziej szczegółowo

Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2

Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2 Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2 ws.clarin-pl.eu/websty.shtml Tomasz Walkowiak, Maciej Piasecki Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej

Bardziej szczegółowo

Internet Semantyczny. Wstęp do OWL 2

Internet Semantyczny. Wstęp do OWL 2 Internet Semantyczny Wstęp do OWL 2 RDFS Podstawowymi elementami które określamy w RDFS są klasy (ang. class) zasobów i właściwości (ang. property) zasobów charakterystyczne dla interesującego nas fragmentu

Bardziej szczegółowo

WebSty otwarty webowy system do analiz stylometrycznych

WebSty otwarty webowy system do analiz stylometrycznych WebSty otwarty webowy system do analiz stylometrycznych Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 maciej.piasecki@pwr.edu.pl

Bardziej szczegółowo

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji

Bardziej szczegółowo

Rozwiązywanie dysambiguacji za pomocą lingwistycznej sieci symantycznych relacji leksykalnych na przykładzie systemu WordNet

Rozwiązywanie dysambiguacji za pomocą lingwistycznej sieci symantycznych relacji leksykalnych na przykładzie systemu WordNet Rozwiązywanie dysambiguacji za pomocą lingwistycznej sieci symantycznych relacji leksykalnych na przykładzie systemu WordNet Julian Szymański, Kamila Błaszczyk, Artur Chełmecki 18 marca 2007 1 Wstęp Rozwój

Bardziej szczegółowo

Semantic Web Internet Semantyczny

Semantic Web Internet Semantyczny Semantic Web Internet Semantyczny Semantyczny Internet - Wizja (1/2) Pomysłodawca sieci WWW - Tim Berners-Lee, fizyk pracujący w CERN Jego wizja sieci o wiele bardziej ambitna niż istniejąca obecnie (syntaktyczna)

Bardziej szczegółowo

Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud

Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy Jan Wieczorek Jan Kocoń marcin.oleksy@pwr.edu.pl jan.wieczorek@pwr.edu.pl

Bardziej szczegółowo

Oracle11g: Wprowadzenie do SQL

Oracle11g: Wprowadzenie do SQL Oracle11g: Wprowadzenie do SQL OPIS: Kurs ten oferuje uczestnikom wprowadzenie do technologii bazy Oracle11g, koncepcji bazy relacyjnej i efektywnego języka programowania o nazwie SQL. Kurs dostarczy twórcom

Bardziej szczegółowo

Analiza leksykalna 1. Teoria kompilacji. Dr inż. Janusz Majewski Katedra Informatyki

Analiza leksykalna 1. Teoria kompilacji. Dr inż. Janusz Majewski Katedra Informatyki Analiza leksykalna 1 Teoria kompilacji Dr inż. Janusz Majewski Katedra Informatyki Zadanie analizy leksykalnej Kod źródłowy (ciąg znaków) Analizator leksykalny SKANER Ciąg symboli leksykalnych (tokenów)

Bardziej szczegółowo

Zastosowanie Wikipedii w przetwarzaniu języka naturalnego

Zastosowanie Wikipedii w przetwarzaniu języka naturalnego Zastosowanie Wikipedii w przetwarzaniu języka naturalnego Plan prezentacji Wikipedia Klasyfikacja Zastosowanie w NLP Plan prezentacji Wikipedia Klasyfikacja Zastosowanie w NLP Rysunek : http://img2.wikia.nocookie.net/

Bardziej szczegółowo

Platforma e-learnigowa Moodle Testy i oceny

Platforma e-learnigowa Moodle Testy i oceny Platforma e-learnigowa Moodle Testy i oceny 02.02.2011 Przygotowanie quizu - baza pytań Pytania Baza pytań niezależna od quizów Struktura bazy: kategorie obejmujące określoną część materiału, np. pytania

Bardziej szczegółowo

B jest globalnym pokryciem zbioru {d} wtedy i tylko wtedy, gdy {d} zależy od B i nie istnieje B T takie, że {d} zależy od B ;

B jest globalnym pokryciem zbioru {d} wtedy i tylko wtedy, gdy {d} zależy od B i nie istnieje B T takie, że {d} zależy od B ; Algorytm LEM1 Oznaczenia i definicje: U - uniwersum, tj. zbiór obiektów; A - zbiór atrybutów warunkowych; d - atrybut decyzyjny; IND(B) = {(x, y) U U : a B a(x) = a(y)} - relacja nierozróżnialności, tj.

Bardziej szczegółowo

SEMANTYCZNE ZNACZNIKOWANIE ARTYKUŁÓW WIKIPEDII SYNSETAMI SŁOWNIKA WORDNETA 1

SEMANTYCZNE ZNACZNIKOWANIE ARTYKUŁÓW WIKIPEDII SYNSETAMI SŁOWNIKA WORDNETA 1 ZESZYTY NAUKOWE WYDZIAŁU ELEKTRONIKI, TELEKOMUNIKACJI I INFORMATYKI POLITECHNIKI GDAŃSKIEJ Nr 10 Seria:ICT Young 2012 SEMANTYCZNE ZNACZNIKOWANIE ARTYKUŁÓW WIKIPEDII SYNSETAMI SŁOWNIKA WORDNETA 1 Politechnika

Bardziej szczegółowo

Systemy uczące się wykład 2

Systemy uczące się wykład 2 Systemy uczące się wykład 2 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 19 X 2018 Podstawowe definicje Fakt; Przesłanka; Konkluzja; Reguła; Wnioskowanie. Typy wnioskowania

Bardziej szczegółowo

mgr inż. Magdalena Deckert Poznań, r. Metody przyrostowego uczenia się ze strumieni danych.

mgr inż. Magdalena Deckert Poznań, r. Metody przyrostowego uczenia się ze strumieni danych. mgr inż. Magdalena Deckert Poznań, 30.11.2010r. Metody przyrostowego uczenia się ze strumieni danych. Plan prezentacji Wstęp Concept drift i typy zmian Algorytmy przyrostowego uczenia się ze strumieni

Bardziej szczegółowo

Ontologie, czyli o inteligentnych danych

Ontologie, czyli o inteligentnych danych 1 Ontologie, czyli o inteligentnych danych Bożena Deka Andrzej Tolarczyk PLAN 2 1. Korzenie filozoficzne 2. Ontologia w informatyce Ontologie a bazy danych Sieć Semantyczna Inteligentne dane 3. Zastosowania

Bardziej szczegółowo

Automatyczne rozpoznawanie polskich leksykalnych relacji derywacyjno-semantycznych

Automatyczne rozpoznawanie polskich leksykalnych relacji derywacyjno-semantycznych Automatyczne rozpoznawanie polskich leksykalnych relacji derywacyjno-semantycznych Maciej Piasecki, Marek Maziarz, Radosław Ramocki, Paweł Minda Grupa Naukowa G4.19 Instytut Informatyki PWr. Słowosieć

Bardziej szczegółowo

Lokalizacja Oprogramowania

Lokalizacja Oprogramowania mgr inż. Anton Smoliński anton.smolinski@zut.edu.pl Lokalizacja Oprogramowania 16/12/2016 Wykład 6 Internacjonalizacja, Testowanie, Tłumaczenie Maszynowe Agenda Internacjonalizacja Testowanie lokalizacji

Bardziej szczegółowo

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Adam Dudczak Poznańskie Centrum Superkomputerowo-Sieciowe (maneo@man.poznan.pl) I Konferencja Polskie Biblioteki

Bardziej szczegółowo

Spis treści. 1 Moduł RFID (APA) 3

Spis treści. 1 Moduł RFID (APA) 3 Spis treści 1 Moduł RFID (APA) 3 1.1 Konfigurowanie Modułu RFID..................... 3 1.1.1 Lista elementów Modułu RFID................. 3 1.1.2 Konfiguracja Modułu RFID (APA)............... 4 1.1.2.1

Bardziej szczegółowo

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu

Bardziej szczegółowo

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen Paweł Ke dzia, Marek Maziarz, Maciej Piasecki i Piotr Pe zik * Politechnika ska Katedra Inteligencji

Bardziej szczegółowo

Sztuczna Inteligencja Projekt

Sztuczna Inteligencja Projekt Sztuczna Inteligencja Projekt Temat: Algorytm LEM2 Liczba osób realizujących projekt: 2 1. Zaimplementować algorytm LEM 2. 2. Zaimplementować klasyfikator Classif ier. 3. Za pomocą algorytmu LEM 2 wygenerować

Bardziej szczegółowo

030 PROJEKTOWANIE BAZ DANYCH. Prof. dr hab. Marek Wisła

030 PROJEKTOWANIE BAZ DANYCH. Prof. dr hab. Marek Wisła 030 PROJEKTOWANIE BAZ DANYCH Prof. dr hab. Marek Wisła Elementy procesu projektowania bazy danych Badanie zależności funkcyjnych Normalizacja Projektowanie bazy danych Model ER, diagramy ERD Encje, atrybuty,

Bardziej szczegółowo

Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud

Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji

Bardziej szczegółowo

System Korekty Tekstu Polskiego

System Korekty Tekstu Polskiego Wnioski Grzegorz Szuba System Korekty Tekstu Polskiego Plan prezentacji Geneza problemu i cele pracy Opis algorytmu bezkontekstowego Opis algorytmów kontekstowych Wyniki testów Rozszerzenie pracy - uproszczona

Bardziej szczegółowo

Publikacja w repozytorium i przetwarzanie w systemie DSpace

Publikacja w repozytorium i przetwarzanie w systemie DSpace Publikacja w repozytorium i przetwarzanie w systemie DSpace Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej

Bardziej szczegółowo

Internet Semantyczny i Logika II

Internet Semantyczny i Logika II Internet Semantyczny i Logika II Ontologie Definicja Grubera: Ontologia to formalna specyfikacja konceptualizacji pewnego obszaru wiedzy czy opisu elementów rzeczywistości. W Internecie Semantycznym językiem

Bardziej szczegółowo

Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych

Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Marcin Deptuła Julian Szymański, Henryk Krawczyk Politechnika Gdańska Wydział Elektroniki, Telekomunikacji i Informatyki Katedra Architektury

Bardziej szczegółowo

Reprezentacja wiedzy wprowadzenie, sieci semantyczne, ramy

Reprezentacja wiedzy wprowadzenie, sieci semantyczne, ramy Reprezentacja wiedzy wprowadzenie, sieci semantyczne, ramy Agnieszka Ławrynowicz 17 listopada 2016 Plan wykładu 1 Wprowadzenie: wiedza, reprezentacja, wnioskowanie, bazy wiedzy 2 Systemy oparte o wiedzę

Bardziej szczegółowo

Zaawansowane narzędzie do analizy korpusu w oparciu o reguły

Zaawansowane narzędzie do analizy korpusu w oparciu o reguły CLARIN-PL Zaawansowane narzędzie do analizy korpusu w oparciu o reguły Michał Marcińczuk Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl 2015-04-13

Bardziej szczegółowo

Spis treści tomu pierwszego

Spis treści tomu pierwszego Spis treści tomu pierwszego WSTĘP.... 11 DŹWIĘK JAKO ZJAWISKO FIZYCZNE...15 CHARAKTERYSTYKA AKUSTYCZNA I AUDYTYWNA DŹWIĘKÓW MOWY.. 17 SŁUCH...20 WYŻSZE PIĘTRA UKŁADU SŁUCHOWEGO...22 EMISJE OTOAKUSTYCZNE...25

Bardziej szczegółowo

Zadanie analizy leksykalnej

Zadanie analizy leksykalnej Analiza leksykalna 1 Teoria kompilacji Dr inŝ. Janusz Majewski Katedra Informatyki Zadanie analizy leksykalnej Przykład: We: COST := ( PRICE + TAX ) * 0.98 Wy: id 1 := ( id 2 + id 3 ) * num 4 Tablica symboli:

Bardziej szczegółowo

Praca magisterska Jakub Reczycki. Opiekun : dr inż. Jacek Rumiński. Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska

Praca magisterska Jakub Reczycki. Opiekun : dr inż. Jacek Rumiński. Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska System gromadzenia, indeksowania i opisu słownikowego norm i rekomendacji Praca magisterska Jakub Reczycki Opiekun : dr inż. Jacek Rumiński Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska

Bardziej szczegółowo

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny

Bardziej szczegółowo

XML-owe bazy danych ćwiczenia 1

XML-owe bazy danych ćwiczenia 1 XML-owe bazy danych ćwiczenia 1 Pierwsza część ćwiczeń będzie zapoznaniem się z przykładową bazą danych dokumentów XML dbxml oraz bazą danych obiektowo-relacyjną Oracle, która pozwala na przechowywanie

Bardziej szczegółowo

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra

Bardziej szczegółowo

Języki programowania zasady ich tworzenia

Języki programowania zasady ich tworzenia Strona 1 z 18 Języki programowania zasady ich tworzenia Definicja 5 Językami formalnymi nazywamy każdy system, w którym stosując dobrze określone reguły należące do ustalonego zbioru, możemy uzyskać wszystkie

Bardziej szczegółowo

1 Moduł Lutron HomeWorks QS

1 Moduł Lutron HomeWorks QS 1 Moduł Lutron HomeWorks QS Moduł Lutron HomeWorks QS daje użytkownikowi Systemu możliwość współpracy oprogramowania z urządzeniami firmy Lutron serii HomeWorks QS. System Vision może używać go do odbierania

Bardziej szczegółowo

Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji

Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji Michał Witczak Data Mining 20 maja 2012 r. 1. Wstęp Dostarczone zostały nam 4 pliki, z których dwa stanowiły zbiory uczące

Bardziej szczegółowo

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot

Bardziej szczegółowo

Słowosieć - polskie zasoby leksykalne i możliwość ich wykorzystania

Słowosieć - polskie zasoby leksykalne i możliwość ich wykorzystania Słowosieć - polskie zasoby leksykalne i możliwość ich wykorzystania Agnieszka Dziob Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 agnieszka.dziob@pwr.edu.pl 2018-05-24

Bardziej szczegółowo

Optymalizacja. Wybrane algorytmy

Optymalizacja. Wybrane algorytmy dr hab. inż. Instytut Informatyki Politechnika Poznańska www.cs.put.poznan.pl/mkomosinski, Andrzej Jaszkiewicz Problem optymalizacji kombinatorycznej Problem optymalizacji kombinatorycznej jest problemem

Bardziej szczegółowo

Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska

Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Seminarium przetwarzania języka naturalnego Mateusz Kopeć Instytut Podstaw Informatyki Polskiej Akademii Nauk 6 lutego 2012 Plan 1 Zadanie

Bardziej szczegółowo

Bazy danych TERMINOLOGIA

Bazy danych TERMINOLOGIA Bazy danych TERMINOLOGIA Dane Dane są wartościami przechowywanymi w bazie danych. Dane są statyczne w tym sensie, że zachowują swój stan aż do zmodyfikowania ich ręcznie lub przez jakiś automatyczny proces.

Bardziej szczegółowo

INTERNETOWE BAZY DANYCH materiały pomocnicze - wykład X

INTERNETOWE BAZY DANYCH materiały pomocnicze - wykład X Wrocław 2006 INTERNETOWE BAZY DANYCH materiały pomocnicze - wykład X Paweł Skrobanek C-3, pok. 323 e-mail: pawel.skrobanek@pwr.wroc.pl INTERNETOWE BAZY DANYCH PLAN NA DZIŚ zajęcia 1: 2. Procedury składowane

Bardziej szczegółowo

Wprowadzenie do Prologa

Wprowadzenie do Prologa Wprowadzenie do Prologa Rozdział 1 Tutorial Introduction Maciej Gapiński Dominika Wałęga Spis treści 1. Podstawowe informacje 2. Obiekty i relacje 3. Reguły 4. Fakty 5. Zapytania 6. Zmienne i stałe Podstawowe

Bardziej szczegółowo

Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych

Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych Rafał Walkowiak Politechnika Poznańska Studia inżynierskie Informatyka 2013/14 Znajdowanie maksimum w zbiorze

Bardziej szczegółowo

WPROWADZENIE DO BAZ DANYCH

WPROWADZENIE DO BAZ DANYCH WPROWADZENIE DO BAZ DANYCH Pojęcie danych i baz danych Dane to wszystkie informacje jakie przechowujemy, aby w każdej chwili mieć do nich dostęp. Baza danych (data base) to uporządkowany zbiór danych z

Bardziej szczegółowo

1 Moduł E-mail. 1.1 Konfigurowanie Modułu E-mail

1 Moduł E-mail. 1.1 Konfigurowanie Modułu E-mail 1 Moduł E-mail Moduł E-mail daje użytkownikowi Systemu możliwość wysyłania wiadomości e-mail poprzez istniejące konto SMTP. System Vision może używać go do wysyłania informacji o zdefiniowanych w jednostce

Bardziej szczegółowo

Paweł Kurzawa, Delfina Kongo

Paweł Kurzawa, Delfina Kongo Paweł Kurzawa, Delfina Kongo Pierwsze prace nad standaryzacją Obiektowych baz danych zaczęły się w roku 1991. Stworzona została grupa do prac nad standardem, została ona nazwana Object Database Management

Bardziej szczegółowo

Układy VLSI Bramki 1.0

Układy VLSI Bramki 1.0 Spis treści: 1. Wstęp... 2 2. Opis edytora schematów... 2 2.1 Dodawanie bramek do schematu:... 3 2.2 Łączenie bramek... 3 2.3 Usuwanie bramek... 3 2.4 Usuwanie pojedynczych połączeń... 4 2.5 Dodawanie

Bardziej szczegółowo

Pattern Classification

Pattern Classification Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors

Bardziej szczegółowo

Kategorialny Parser Składniowo-Semantyczny dla języka polskiego

Kategorialny Parser Składniowo-Semantyczny dla języka polskiego Kategorialny Parser Składniowo-Semantyczny dla języka polskiego Wojciech Jaworski Instytut Informatyki Uniwersytetu Warszawskiego Instytut Podstaw Informatyki Polskiej Akademii Nauk 26 kwietnia 2016 Wojciech

Bardziej szczegółowo

Okno główne programu. 1. Zlecenia. W systemie wprowadza się zlecenia: Remontowe Serwisowe Usługowe Kompletacji

Okno główne programu. 1. Zlecenia. W systemie wprowadza się zlecenia: Remontowe Serwisowe Usługowe Kompletacji Programu SERWIS XL przeznaczony jest do ewidencji i rozliczenia prowadzonej działalności serwisowej, usługowej oraz produkcyjnej. Pozwala na prowadzenie ewidencji napraw sprzętu przyjmowanego do serwisu,

Bardziej szczegółowo

Internet Semantyczny. Logika opisowa

Internet Semantyczny. Logika opisowa Internet Semantyczny Logika opisowa Ontologie Definicja Grubera: Ontologia to formalna specyfikacja konceptualizacji pewnego obszaru wiedzy czy opisu elementów rzeczywistości. W Internecie Semantycznym

Bardziej szczegółowo

Podstawy Informatyki. Algorytmy i ich poprawność

Podstawy Informatyki. Algorytmy i ich poprawność Podstawy Informatyki Algorytmy i ich poprawność Błędy Błędy: językowe logiczne Błędy językowe Związane ze składnią języka Wykrywane automatycznie przez kompilator lub interpreter Prosty sposób usuwania

Bardziej szczegółowo

Charakterystyki oraz wyszukiwanie obrazów cyfrowych

Charakterystyki oraz wyszukiwanie obrazów cyfrowych Algorytmy Graficzne Charakterystyki oraz wyszukiwanie obrazów cyfrowych Autor: Mateusz Nostitz-Jackowski 1 / 7 Działanie programu: Do poprawnego działania projektu potrzeba programu Mathematica 5.2 (możliwe

Bardziej szczegółowo

Systemy ekspertowe i ich zastosowania. Katarzyna Karp Marek Grabowski

Systemy ekspertowe i ich zastosowania. Katarzyna Karp Marek Grabowski Systemy ekspertowe i ich zastosowania Katarzyna Karp Marek Grabowski Plan prezentacji Wstęp Własności systemów ekspertowych Rodzaje baz wiedzy Metody reprezentacji wiedzy Metody wnioskowania Języki do

Bardziej szczegółowo

Analiza leksykalna 1. Języki formalne i automaty. Dr inż. Janusz Majewski Katedra Informatyki

Analiza leksykalna 1. Języki formalne i automaty. Dr inż. Janusz Majewski Katedra Informatyki Analiza leksykalna 1 Języki formalne i automaty Dr inż. Janusz Majewski Katedra Informatyki Zadanie analizy leksykalnej Kod źródłowy (ciąg znaków) Analizator leksykalny SKANER Ciąg symboli leksykalnych

Bardziej szczegółowo

Narzędzia do automatycznej analizy odniesień w tekstach

Narzędzia do automatycznej analizy odniesień w tekstach CLARIN-PL Narzędzia do automatycznej analizy odniesień w tekstach Michał Marcińczuk Jan Kocoń Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl

Bardziej szczegółowo

Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych

Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych Rafał Walkowiak Politechnika Poznańska Studia inżynierskie Informatyka 2014/15 Znajdowanie maksimum w zbiorze

Bardziej szczegółowo

Wstęp do Techniki Cyfrowej... Teoria automatów

Wstęp do Techniki Cyfrowej... Teoria automatów Wstęp do Techniki Cyfrowej... Teoria automatów Alfabety i litery Układ logiczny opisywany jest przez wektory, których wartości reprezentowane są przez ciągi kombinacji zerojedynkowych. Zwiększenie stopnia

Bardziej szczegółowo

KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów)

KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów) KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów) Marcin Oleksy Michał Marcińczuk Politechnika ska Instytut Informatyki

Bardziej szczegółowo

Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska

Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska e-mail: bartosz.krawczyk@pwr.wroc.pl Czym jest klasyfikacja

Bardziej szczegółowo

W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji.

W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji. 5 Collocations Związek frazeologiczny (kolokacja), to często używane zestawienie słów. Przykłady: strong tea, weapons of mass destruction, make up. Znaczenie całości wyrażenia, nie zawsze wynika ze znaczeń

Bardziej szczegółowo

Normalizacja baz danych

Normalizacja baz danych Wrocławska Wyższa Szkoła Informatyki Stosowanej Normalizacja baz danych Dr hab. inż. Krzysztof Pieczarka Email: krzysztof.pieczarka@gmail.com Normalizacja relacji ma na celu takie jej przekształcenie,

Bardziej szczegółowo

WYKŁAD 6. Reguły decyzyjne

WYKŁAD 6. Reguły decyzyjne Wrocław University of Technology WYKŁAD 6 Reguły decyzyjne autor: Maciej Zięba Politechnika Wrocławska Reprezentacje wiedzy Wiedza w postaci reguł decyzyjnych Wiedza reprezentowania jest w postaci reguł

Bardziej szczegółowo

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po

Bardziej szczegółowo

Słowosieć leksykalna sieć semantyczna języka polskiego i jej zastosowanie w analizie znaczeń

Słowosieć leksykalna sieć semantyczna języka polskiego i jej zastosowanie w analizie znaczeń Słowosieć 3.0 - leksykalna sieć semantyczna języka polskiego i jej zastosowanie w analizie znaczeń Paweł Kędzia, Marek Maziarz, Maciej Piasecki, Ewa Rudnicka i Piotr Pęzik * Politechnika Wrocławska Katedra

Bardziej szczegółowo

Eksploracja danych. KLASYFIKACJA I REGRESJA cz. 2. Wojciech Waloszek. Teresa Zawadzka.

Eksploracja danych. KLASYFIKACJA I REGRESJA cz. 2. Wojciech Waloszek. Teresa Zawadzka. Eksploracja danych KLASYFIKACJA I REGRESJA cz. 2 Wojciech Waloszek wowal@eti.pg.gda.pl Teresa Zawadzka tegra@eti.pg.gda.pl Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki

Bardziej szczegółowo

ALGORYTMY SZTUCZNEJ INTELIGENCJI

ALGORYTMY SZTUCZNEJ INTELIGENCJI ALGORYTMY SZTUCZNEJ INTELIGENCJI Sieci neuronowe 06.12.2014 Krzysztof Salamon 1 Wstęp Sprawozdanie to dotyczy ćwiczeń z zakresu sieci neuronowych realizowanym na przedmiocie: Algorytmy Sztucznej Inteligencji.

Bardziej szczegółowo

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016 EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P2 KWIECIEŃ 2016 Zadanie 1. (0 1) 9) wyciąga wnioski wynikające z przesłanek

Bardziej szczegółowo

WIZUALIZACJA INFORMACJI TEKSTOWEJ

WIZUALIZACJA INFORMACJI TEKSTOWEJ WIZUALIZACJA INFORMACJI TEKSTOWEJ Michał Kołkowski Promotor: prof. dr hab. Włodzisław Duch SPIS TREŚCI 1. Ogólnie o projekcie 2. Baza WordNet. 1. Ogólny opis 2. Budowa na podstawie plików WNDB 3. WordNet

Bardziej szczegółowo