Rzutowanie Słowosieci na pojęcia ontologii SUMO i inne zasoby semantyczne
|
|
- Tomasz Rosiński
- 7 lat temu
- Przeglądów:
Transkrypt
1 Rzutowanie Słowosieci na pojęcia ontologii SUMO i inne zasoby semantyczne Paweł Kędzia, Maciej Piasecki, Michał Marcińczuk, Marek Maziarz, Jan Wieczorek, Marcin Oleksy Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej Politechnika Wrocławska CLARIN-PL 27 IV 2016
2 Plan Słowosieć a ontologia Słowosieć a baza wiedzy System zasobów wiedzy Ontologia SUMO i związki z wordnetami Rzutowanie na SUMO Powiązania pomiędzy Słowosiecią a NELexicon 2.0 Odniesienia do Wikipedii 2 / 33
3 Słowosieć a ontologia Słowosieć, ani żaden wordnet nie są ontologiami ontologia: wymóg rozłącznych kategorii sieć: nakładanie się znaczeń jednostek o wspólnym hiperonimie ontologia: precyzja definiowania sieć: język potoczny a język naukowy, np. lew jako synonim lwa afrykańskiego ontologia: kompletność opisu sieć: struktura zależna od leksykalizacji ontologia: hiperonimia jako drzewo sieć: luki na poziomie pojęć ogólnych ontologia: intencjonalny opis rzeczywistości sieć: warunkowana użyciem języka 3 / 33
4 Słowosieć a baza wiedzy Słowosieć opisuje znaczenia leksykalne Nie zawiera opisu bytów, faktów, ogólnej wiedzy o świecie Nazwy własne z zasady nie były objęte opisem w ramach Słowosieci nazwy stanowią otwartą klasę i mocno zależną od kontekstu Wyjątki nazwy będące podstawą słowotwórczą do lematów, które są częste w korpusie Polska charakteryzowanie polski Polska Agencja Prasowa, PAP synonimia międzyparadygmatyczna dla relacyjnych papowski 4 / 33
5 Słowosieć jako interfejs pomiędzy tekstem a zasobami wiedzy 5 / 33
6 SUMO Suggested Upper Merged Ontology Darmowa, otwarta, rozszerzenia na licencji GNU GPL Formalna: termów, aksjomatów 6 / 33
7 SUMO Suggested Upper Merged Ontology Strona domowa: Cała zrzutowana na Princeton WordNet Otwarte biomedyczne ontologie (OBO) częściowo zrzutowane na SUMO ( FarsNet (WN języka perskiego) posiada rzutowanie na SUMO Powiązana w MCR z WordNet Domains, Base Concepts, Top Ontology oraz AdimenSUMO 7 / 33
8 Rzutowanie na SUMO Co nam daje rzutowanie Słowosieci na SUMO? 1 Przejście na poziom pojęć ontologicznych 2 Ogólniejszy opis słów z tekstu m.in. cechy klasyfikatora (role semantyczne selekcja cech) 3 Powiązanie z innymi zasobami połączonymi z SUMO 8 / 33
9 Cechy stanowiące podstawę reguł przenoszenia relacji Cel: przeniesienie relacji z PWN SUMO na Słowosieć SUMO Relacje międzyjęzykowe (rzutowania) pomiędzy Słowosiecią i WordNetem: i-synonymy, i-hyponymy, i-part-of-meronymy,... Relacje rzutowania pomiędzy WordNetem i SUMO: equivalent, instance of and subsumed, Dziedziny synsetów Słowosieci i WordNetu: body, grp, food, loc,... Wielka litera w pierwszym lemacie synsetu Słowosieci Odwołałanie do konkretnych pojęć SUMO: Currency, GroupOfPeople, FieldOfStudy, Human,... 9 / 33
10 Proces rzutowania 10 / 33
11 Relacje rzutowania: PWN-SUMO oraz plwn-sumo 1 equivalent (ekwiwalencja) synset odpowiada pojęciu SUMO ze względu na znaczenie synsetu, ze szczególnym wagą przykładaną do denotacji synsetu, np. plant 2 equivalent Plant. 2 instance of (instancja) denotacja synsetu jest instancją pojęcia SUMO, np. Aristotle 1 instance of Man, lub jest elementem kolekcji denotowanej przez pojęcie SUMO, np. {Eden 2} instance of Region 3 subsumed (podklasa) denotacja synsetu zawiera się w denotacji pojęcia SUMO np. {town 1} subsumed City. 4 R inna relacja (tylko w rzutowaniu plwn SUMO) 11 / 33
12 Reguły rzutowania (1) Typy 1 Proste przenoszące relację oparte na relacji i-synonymy synonimii międzyjęzykowej, relacja: synset WordNetu pojęcie SUMO jest kopiowana na relację synset Słowosieci pojęcie SUMO. 2 Złożone przenoszące bądź zmieniające relację na podstawie szeregu cech jest rozpoznawany typ relacji pomiędzy Słowosiecią i SUMO relacja wynikowa może się różnić od analogicznej relacji pomiędzy WordNetem i SUMO 12 / 33
13 Reguły rzutowania (2) Reguła prosta zapisana w pseudokodzie Algorithm 1 Przykłady prostych reguł rzutowania. 1: if R(PLWN PWN) = I-synonymy and R(PWN SUMO) = equivalent then 2: R(PLWN SUMO) = equivalent 3: end if 4: if R(PLWN PWN) = I-synonymy and R(PWN SUMO) = instance of then 5: R(PLWN SUMO) = instance of 6: end if 7: if R(PLWN PWN) = I-synonymy and R(PWN SUMO) = subsumed then 8: R(PLWN SUMO) = subsumed 9: end if 13 / 33
14 Przykłady prostych reguł Efekt zastosowania prostych reguł z Algorytmu 1 Relacja subsumed: 1 {kark 1 (body)} subsumed BodyPart {kark 1 (body)} jest i-synonym {nape 1 (body)} 2 {mieczyk 1 (plant)} subsumed FloweringPlant {mieczyk 1 (plant)} jest i-synonym {genus Gladiolus 1 (plant)} Relacja instance of: 1 {geometria rzutowa 1 (cogn)} instance of FieldOfStudy {geometria rzutowa 1 (cogn)} jest i-synonym dla {projective geometry 1 (cogn)} 2 {Ateny 1 (loc)} instance of City {Ateny 1 (cogn)} jest i-synonym {Athens 1 (cogn)} Relacja equivalent: 1 {czekolada 1 (food)} equivalent Chocolate {czekolada 1 (food)} jest i-synonym {chocolate 2 (food)} 2 {wał rozrządu 1 (arte)} equivalent Camshaft {wał rozrządu 1 (arte)} jest i-synonym {camshaft 1 (arte)} 14 / 33
15 Reguły rzutowania (3) Reguła złożona zapisana w pseudokodzie Algorithm 2 Przykłady reguł rzutowania, które odwołują się do dziedzin synsetów Słowosieci i WordNetu 1: if R(PLWN PWN) = I-part-of-meronymy and R(PWN SUMO) = equivalent then 2: if PLWN SYNSET zaczyna się wielką literą then 3: if D(PLWN) {loc} and D(PWN) {natobj} then 4: R(PLWN SUMO) = instance of 5: end if 6: if D(PLWN) {rel} and D(PWN) {loc} then 7: R(PLWN SUMO) = instance of 8: end if 9: end if 10: end if 15 / 33
16 Przykłady reguł rzutowania Złożone reguły Efekty zastosowania złożonych reguł z Algorytmu 2: 1 {Europa Wschodnia 1 (loc)} instance of Europe {Europa Wschodnia 1 (loc)} I-part-of-meronymy {Europe 1 (natobj)} instance of Europe 2 {Europa Zachodnia 1 (loc)} instance of Europe {Europa Zachodnia 1 (loc)} I-part-of-meronymy {Europe 1 (natobj)} instance of Europe 3 {Europa Południowo-Wschodnia 1 (loc)} instance of Europe {Europa Południowo-Wschodnia 1 (loc)} I-part-of-meronymy {Europe 1 (natobj)} instance of Europe 4 {Amazonia 1 (loc)} instance of SouthAmerica {Amazonia 1 (loc)} I-part-of-meronymy {South America 1 (natobj)} instance of SouthAmerica 5 {Hetmańszczyzna 1 (rel)} instance of Ukraine {Hetmańszczyzna 1 (rel)} I-part-of-meronymy {Ukraine 1 (natobj)} instance of Ukraine 16 / 33
17 Reguły rzutowania (4) Reguła złożona zapisana w pseudokodzie Algorithm 3 Przykłady reguł wykorzystujących dziedziny synsetów Słowosieci i WordNetu oraz pojęcia SUMO 1: if R(PLWN PWN) = I-part-of-holonymy and R(PWN SUMO) = subsumed then 2: if D(PLWN) {natphen} and D(PWN) {st} then 3: if SUMO CONCEPT=DiseaseOrSyndrome then 4: R(PLWN SUMO) = subsumed 5: end if 6: end if 7: end if 17 / 33
18 Przykłady reguł rzutowania Złożone reguły Efekty zastosowania złożonych reguł z Algorytmu 2: 1 {dysplazja śmiertelna 1 (natphen)} subsumed DiseaseOrSyndrome {dysplazja śmiertelna 1 (natphen)} I-part-of-holonymy {birth defect 1 (st)} subsumed DiseaseOrSyndrome 2 {zespół delecji 13q 1 (natphen)} subsumed DiseaseOrSyndrome {zespół delecji 13q 1 (natphen)} I-part-of-holonymy {birth defect 1 (st)} subsumed DiseaseOrSyndrome 3 {fetopatia cukrzycowa 1 (natphen)} subsumed DiseaseOrSyndrome {fetopatia cukrzycowa 1 (natphen)} I-part-of-holonymy {birth defect 1 (st)} subsumed DiseaseOrSyndrome 4 {ślepota z Rodrigue 1 (natphen)} subsumed DiseaseOrSyndrome {ślepota z Rodrigue 1 (natphen)} I-part-of-holonymy {birth defect 1 (st)} subsumed DiseaseOrSyndrome 5 {pentalogia Cantrella 1 (natphen)} subsumed DiseaseOrSyndrome {pentalogia Cantrella 1 (natphen)} I-part-of-holonymy {birth defect 1 (st)} subsumed DiseaseOrSyndrome 18 / 33
19 Reguły rzutowania (5) Przykłady przypadków kiedy typ relacji nie może być rozstrzygnięty automatycznie Algorithm 4 Przykład przypadku kiedy typ relacji nie może być rozstrzygnięty automatycznie 1: if R(PLWN PWN) = I-part-of-meronymy and R(PWN SUMO) = subsumed then 2: if D(PLWN) {loc, body, arte, grp,..., class} then 3: R(PLWN SUMO) = manually 4: end if 5: end if 19 / 33
20 Przykłady reguł rzutowania Złożone reguły Efekty zastosowania złożonych reguł z Algorytmu 4: 1 {okno 7 (arte)} manually Region {okno 7 (arte)} I-part-of-meronymy {hotbed 2 (arte)} subsumed Region 2 {skrzydło 9 (arte)} manually Door {skrzydło 9 (arte)} I-part-of-meronymy {door 1 (arte)} subsumed Door 3 {strzelnica 2 (loc)} manually Corporation {strzelnica 2 (loc)} I-part-of-meronymy {amusement park 1 (loc)} subsumed Corporation 4 {biblioteka szkolna 1 (loc)} manually School {biblioteka szkolna 1 (loc)} I-part-of-meronymy {school 2 (arte)} subsumed School 5 {oliwka 5 (body)} manually BodyPart {oliwka 5 (body)} I-part-of-meronymy {medulla oblongata 1 (arte)} subsumed BodyPart 6 {węzina 1 (body)} manually ThyroidGland {węzina 1 (body)} I-part-of-meronymy {thyroid gland 1 (arte)} subsumed ThyroidGland 20 / 33
21 Uaktualnianie rzutowania - Krok 1 Redukcja relacji niedookreślonych R RReduktor redukuje niedookreślone relacje wynikające z wielu rzutowań plwn-pwn Przykład: abnegat.1(os) hiper pa slob.1 Human R abnegat.1(os) hipo pa person.1 Human subsumed agnegat.1(os) - subsumed - Human 21 / 33
22 Uaktualnianie rzutowania - Krok 2 Poprawa typu relacji rzutującej Bulbulator propaguje wynik prostych reguł na pozostałe rzutowania dla danej pary {znaczenie, pojęcie SUMO} Przykład: krzesło.1(wytw) syn pa chair.1(wytw) Chair equivalent krzesło.1(wytw) hipo pa fighting chair.1(wytw) Chair subsumed krzesło.1(wytw) hiper pa Eames chair.1(wytw) Chair subsumed krzesło.1(wytw) hiper pa ladder-back.1(wytw) Chair subsumed krzesło.1(wytw) hiper pa straight chair.1(wytw) Chair subsumed krzesło.1(wytw) hiper pa tablet-armed chair.1(wytw) Chair subsumed krzesło.1(wytw) - equivalent - Chair 22 / 33
23 Uaktualnianie rzutowania - Krok 3 Poprawa typu relacji rzutującej Oknak dla danej pary {znaczenie, pojęcie SUMO} wyszukuje różne kombinacje wystąpień relacji m.językowych i ustala typ relacji rzutującej. mero:el pa oraz hipo pa subsumed mero:cz pa oraz hipo pa subsumed mero:cz pa oraz hiper pa subsumed synmr pa oraz syncz pa subsumed synmr pa oraz hipo pa subsumed syn pa oraz hiper pa equivalent hipo pa oraz hiper pa instance of lasek.1 hipo pa forest.1 Forest subsumed lasek.1 synmr pa forest.2 Forest equivalent lasek.1 - subsumed - Forest 23 / 33
24 Uaktualnianie rzutowania - Krok 4 Redukcja nadmiarowych rzutowań Corec Redukuje niepotrzebne rzutowania na podstawie szczegółowości pojęć Znaczenie z 1 posiada rzutowania na pojęcia A, B, C, D Znamy strukturę SUMO wiemy, które pojęcie z którym jest połączone Jeżeli pomiędzy A, B, C, D zachodzi relacja isa: wybieramy pojęcie najbardziej szczegółowe Relacje zachowujemy takie, jakie były przy konkretnych rzutowaniach 24 / 33
25 Uaktualnianie rzutowania - Krok 5 Redukcja nadmiarowych rzutowań Serdel Dla zadanego znaczenia usuwa rzutowania na SubjectiveAssessmentAttribute przy założeniu, że istnieją inne dla niego Przykład: matnia.1(st) subsumed TrapOrCage matnia.1(st) subsumed SubjectiveAssessmentAttribute matnia.1(st) -- subsumed -- TrapOrCage 25 / 33
26 Uaktualnianie rzutowania - Krok 6 Generowanie nowych rzutowań Rubin Wykorzystując relacje międzyjęzykowe oraz strukturę hiperonimiczną WordNetów generuje nowe rzutowania Rysunek: Rzutowanie plwn - PWN - SUMO 26 / 33
27 Ocena wyników algorytmu Krok 1: Automatyczna ocena wyników algorytmu rzutowania: Różne relacje wygenerowane dla tej samej pary {synset Słowosieci, pojęcie SUMO} Zaobserwowany błąd: 0,06% Krok 2: Ocena ręczna przez lingwistów: Próbka 160 rezultatów rzutowania Schemat oceny: 2+1 Trzy klasy: poprawne, niepoprawne, podłączony do hiperonimu Zgodność pomiędzy anotatorami: 81% Zmierzona dokładność rzutowania: 0,831 % Co zrobić z synsetami zrzutowanymi za pomocą relacji R? 27 / 33
28 Statystyki rzutowania (1) Ogólne statystyki zrzutowanych i niezrzutowanych synsetów Liczba rzutowań Kwiecień 2014: Liczba rzutowań Maj 2014: Liczba rzutowań Luty 2016: Liczba zrzutowanych synsetów: , tj. 89.2% wszystkich Tablica: Liczba synsetów Słowosieci zrzutowanych na SUMO i pozostawionych do decyzji (ręcznie) POS Ręcznie Zrzutowane Ręcznie [%] Maj Luty Maj Luty Maj Luty Rzeczownik ,8 3,8 Czasownik ,5 5,0 Przymiotnik ,8 4,4 28 / 33
29 Statystyki rzutowania (5) Pięć najczęstszych pojęć SUMO w rezultatach rzutowania dla każdej relacji. Relacja Znaczenie Liczba synsetów Human 405 SocialRole 274 Equivalent Position 270 Bird 198 Female 76 City FieldOfStudy Instance of Human SocialRole 421 Position 339 SubjectiveAssessmentAttribute Human Subsumed Position FloweringPlant SocialRole / 33
30 Powiązania pomiędzy Słowosiecią a NELexicon 2.0 Hierarchia kategorii nazw w NELexicon 2.0 (2,4 mln nazw własnych): 102 kategoria, 3 poziomy Ręczne rzutowanie kategorii najniższego poziomu na wybrane synsety np. nam liv plant roślina 1 w niektórych przypadkach więcej niż jeden synset np. nam eve human aniversary rocznica 2, rocznica 1 Ręczne rzutowanie na pojęcia SUMO 80 ze 102 kategorii zrzutowanych np. nam pro model car SelfPoweredRoadVehicle Automatyczne rzutowanie nazw w oparciu o miarę powiązania znaczeniowego wydobytą z korpusu, pary wydobyte przez wzorce z tekstu oraz struktury Wikipedii za pomocą WordnetWeaver 30 / 33
31 Odniesienia do Wikipedii Ręcznie dodane powiązania do haseł Wikipedii synset hasło Wikipedii np. Polska 1 {##L Dodawane tylko wtedy, gdy jednostka leksykalna ze Słowosieci oznacza ten sam byt (np. zwierzę/roślinę etc.), które opisane jest w haśle Wikipedii, Wszystkie elementy synsetu mają te samo powiązanie jeżeli Wikipedia omawia jakiś takson, który określony jest liczbą mnogą (np. kręgowce), to nie można takiego hasła łączyć z jednostką, która jest wyrażona w liczbie pojedynczej (np. kręgowiec) Synsety połączone bliskoznacznością opatrujemy tym samym powiązaniem Łączna liczba powiązań: około 54 tys. 31 / 33
32 Podsumowanie Reguły wykorzystujące wyniki ręcznego rzutowania WordNet na SUMO oraz ręcznego rzutownania międzyjęzykowego pozwoliły na zbudowania efektywnych reguł rzutowania na SUMO Słowosieć stała się interfejsem pomiędzy zasobami wiedzy a językiem Powiązania pomiędzy NELexicon a Słowosiecią wymagają pogłębienia z poziomu kategorii do indywidualnych nazw System zasobów jest dalej rozszerzony przez powiązania do struktur walencyjnych (Walenty) oraz słownika wielowyrazowych jednostek leksykalnych 32 / 33
33 33 / 33
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika ska Katedra Inteligencji
Program warsztatów CLARIN-PL
W ramach Letniej Szkoły Humanistyki Cyfrowej odbędzie się III cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Narzędzia cyfrowe do analizy języka w naukach humanistycznych i społecznych 17-19
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra
Open Access w technologii językowej dla języka polskiego
Open Access w technologii językowej dla języka polskiego Marek Maziarz, Maciej Piasecki Grupa Naukowa Technologii Językowych G4.19 Zakład Sztucznej Inteligencji, Instytut Informatyki, W-8, Politechnika
Narzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
Narzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów
Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów Maciej Piasecki, Jan Kocoń Politechnika Wrocławska Katedra InteligencjiObliczeniowej Grupa
Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowania
Słowosiec 3.2 - leksykalna siec semantyczna je zyka polskiego i jej zastosowania Poziom rozszerzony Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 agnieszka.dziob@pwr.edu.pl
Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur
Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur Maciej Piasecki, Paweł Kędzia Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Plan prezentacji
Słowosiec leksykalna siec semantyczna języka polskiego i jej zastosowania
Słowosiec 4.0 - leksykalna siec semantyczna języka polskiego i jej zastosowania Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Ewa Rudnicka Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy
Cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy 13 15 kwietnia 2015 roku Warszawa, Pałac Staszica, ul. Nowy Świat 72, sala 144
Słowosieć leksykalna sieć semantyczna języka polskiego i jej zastosowania
Słowosieć 3.0 - leksykalna sieć semantyczna języka polskiego i jej zastosowania Agnieszka Dziob, Marek Maziarz, Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa
Dwujęzyczna Słowosieć
CLARIN-PL Dwujęzyczna Słowosieć Ewa Rudnicka Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 ewa.rudnicka@pwr.wroc.pl Dwujęzyczna Słowosieć Warsztaty CLARIN-PL Poznań 2018
WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp
WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp Natalia Kotsyba, IBI AL UW 24 marca 2010 Plan zajęć Praca domowa na zapytania do Korpusu IPI PAN za pomocą
S owosiec leksykalna siec semantyczna jezyka polskiego i jej zastosowania
S owosiec 3.0 - leksykalna siec semantyczna jezyka polskiego i jej zastosowania Agnieszka Dziob, Marek Maziarz, Maciej Piasecki Politechnika Wroc awska Katedra Inteligencji Obliczeniowej Grupa Naukowa
II cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych
II cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych 18-20 maja 2015 roku Politechnika Wrocławska, Centrum Kongresowe,
Narzędzia do automatycznej analizy odniesień w tekstach
CLARIN-PL Narzędzia do automatycznej analizy odniesień w tekstach Michał Marcińczuk Jan Kocoń Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl
Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex
Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska
SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska DRZEWO REGRESYJNE Sposób konstrukcji i przycinania
Słowosieć jako narzędzie wspomagające pracę tłumacza
Rocznik Kognitywistyczny V/2011 DOI 10.4467/20843895RK.12.004.0408 s. 33 42 AGNIESZKA DZIOB, PAULINA ŁAZAREWICZ Uniwersytet Wrocławski, Politechnika Wrocławska Słowosieć jako narzędzie wspomagające pracę
CLARIN rozproszony system technologii językowych dla różnych języków europejskich
CLARIN rozproszony system technologii językowych dla różnych języków europejskich Maciej Piasecki Politechnika Wrocławska Instytut Informatyki G4.19 Research Group maciej.piasecki@pwr.wroc.pl Projekt CLARIN
Dwujęzyczna Słowosieć możliwości wykorzystania w pracy tłumacza i w analizie porównawczej
CLARIN-PL Dwujęzyczna Słowosieć możliwości wykorzystania w pracy tłumacza i w analizie porównawczej Ewa Rudnicka Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 ewa.rudnicka@pwr.wroc.pl
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2 ws.clarin-pl.eu/websty.shtml Tomasz Walkowiak, Maciej Piasecki Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej
Internet Semantyczny. Wstęp do OWL 2
Internet Semantyczny Wstęp do OWL 2 RDFS Podstawowymi elementami które określamy w RDFS są klasy (ang. class) zasobów i właściwości (ang. property) zasobów charakterystyczne dla interesującego nas fragmentu
WebSty otwarty webowy system do analiz stylometrycznych
WebSty otwarty webowy system do analiz stylometrycznych Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 maciej.piasecki@pwr.edu.pl
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji
Rozwiązywanie dysambiguacji za pomocą lingwistycznej sieci symantycznych relacji leksykalnych na przykładzie systemu WordNet
Rozwiązywanie dysambiguacji za pomocą lingwistycznej sieci symantycznych relacji leksykalnych na przykładzie systemu WordNet Julian Szymański, Kamila Błaszczyk, Artur Chełmecki 18 marca 2007 1 Wstęp Rozwój
Semantic Web Internet Semantyczny
Semantic Web Internet Semantyczny Semantyczny Internet - Wizja (1/2) Pomysłodawca sieci WWW - Tim Berners-Lee, fizyk pracujący w CERN Jego wizja sieci o wiele bardziej ambitna niż istniejąca obecnie (syntaktyczna)
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy Jan Wieczorek Jan Kocoń marcin.oleksy@pwr.edu.pl jan.wieczorek@pwr.edu.pl
Oracle11g: Wprowadzenie do SQL
Oracle11g: Wprowadzenie do SQL OPIS: Kurs ten oferuje uczestnikom wprowadzenie do technologii bazy Oracle11g, koncepcji bazy relacyjnej i efektywnego języka programowania o nazwie SQL. Kurs dostarczy twórcom
Analiza leksykalna 1. Teoria kompilacji. Dr inż. Janusz Majewski Katedra Informatyki
Analiza leksykalna 1 Teoria kompilacji Dr inż. Janusz Majewski Katedra Informatyki Zadanie analizy leksykalnej Kod źródłowy (ciąg znaków) Analizator leksykalny SKANER Ciąg symboli leksykalnych (tokenów)
Zastosowanie Wikipedii w przetwarzaniu języka naturalnego
Zastosowanie Wikipedii w przetwarzaniu języka naturalnego Plan prezentacji Wikipedia Klasyfikacja Zastosowanie w NLP Plan prezentacji Wikipedia Klasyfikacja Zastosowanie w NLP Rysunek : http://img2.wikia.nocookie.net/
Platforma e-learnigowa Moodle Testy i oceny
Platforma e-learnigowa Moodle Testy i oceny 02.02.2011 Przygotowanie quizu - baza pytań Pytania Baza pytań niezależna od quizów Struktura bazy: kategorie obejmujące określoną część materiału, np. pytania
B jest globalnym pokryciem zbioru {d} wtedy i tylko wtedy, gdy {d} zależy od B i nie istnieje B T takie, że {d} zależy od B ;
Algorytm LEM1 Oznaczenia i definicje: U - uniwersum, tj. zbiór obiektów; A - zbiór atrybutów warunkowych; d - atrybut decyzyjny; IND(B) = {(x, y) U U : a B a(x) = a(y)} - relacja nierozróżnialności, tj.
SEMANTYCZNE ZNACZNIKOWANIE ARTYKUŁÓW WIKIPEDII SYNSETAMI SŁOWNIKA WORDNETA 1
ZESZYTY NAUKOWE WYDZIAŁU ELEKTRONIKI, TELEKOMUNIKACJI I INFORMATYKI POLITECHNIKI GDAŃSKIEJ Nr 10 Seria:ICT Young 2012 SEMANTYCZNE ZNACZNIKOWANIE ARTYKUŁÓW WIKIPEDII SYNSETAMI SŁOWNIKA WORDNETA 1 Politechnika
Systemy uczące się wykład 2
Systemy uczące się wykład 2 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 19 X 2018 Podstawowe definicje Fakt; Przesłanka; Konkluzja; Reguła; Wnioskowanie. Typy wnioskowania
mgr inż. Magdalena Deckert Poznań, r. Metody przyrostowego uczenia się ze strumieni danych.
mgr inż. Magdalena Deckert Poznań, 30.11.2010r. Metody przyrostowego uczenia się ze strumieni danych. Plan prezentacji Wstęp Concept drift i typy zmian Algorytmy przyrostowego uczenia się ze strumieni
Ontologie, czyli o inteligentnych danych
1 Ontologie, czyli o inteligentnych danych Bożena Deka Andrzej Tolarczyk PLAN 2 1. Korzenie filozoficzne 2. Ontologia w informatyce Ontologie a bazy danych Sieć Semantyczna Inteligentne dane 3. Zastosowania
Automatyczne rozpoznawanie polskich leksykalnych relacji derywacyjno-semantycznych
Automatyczne rozpoznawanie polskich leksykalnych relacji derywacyjno-semantycznych Maciej Piasecki, Marek Maziarz, Radosław Ramocki, Paweł Minda Grupa Naukowa G4.19 Instytut Informatyki PWr. Słowosieć
Lokalizacja Oprogramowania
mgr inż. Anton Smoliński anton.smolinski@zut.edu.pl Lokalizacja Oprogramowania 16/12/2016 Wykład 6 Internacjonalizacja, Testowanie, Tłumaczenie Maszynowe Agenda Internacjonalizacja Testowanie lokalizacji
Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych
Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Adam Dudczak Poznańskie Centrum Superkomputerowo-Sieciowe (maneo@man.poznan.pl) I Konferencja Polskie Biblioteki
Spis treści. 1 Moduł RFID (APA) 3
Spis treści 1 Moduł RFID (APA) 3 1.1 Konfigurowanie Modułu RFID..................... 3 1.1.1 Lista elementów Modułu RFID................. 3 1.1.2 Konfiguracja Modułu RFID (APA)............... 4 1.1.2.1
Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen Paweł Ke dzia, Marek Maziarz, Maciej Piasecki i Piotr Pe zik * Politechnika ska Katedra Inteligencji
Sztuczna Inteligencja Projekt
Sztuczna Inteligencja Projekt Temat: Algorytm LEM2 Liczba osób realizujących projekt: 2 1. Zaimplementować algorytm LEM 2. 2. Zaimplementować klasyfikator Classif ier. 3. Za pomocą algorytmu LEM 2 wygenerować
030 PROJEKTOWANIE BAZ DANYCH. Prof. dr hab. Marek Wisła
030 PROJEKTOWANIE BAZ DANYCH Prof. dr hab. Marek Wisła Elementy procesu projektowania bazy danych Badanie zależności funkcyjnych Normalizacja Projektowanie bazy danych Model ER, diagramy ERD Encje, atrybuty,
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji
System Korekty Tekstu Polskiego
Wnioski Grzegorz Szuba System Korekty Tekstu Polskiego Plan prezentacji Geneza problemu i cele pracy Opis algorytmu bezkontekstowego Opis algorytmów kontekstowych Wyniki testów Rozszerzenie pracy - uproszczona
Publikacja w repozytorium i przetwarzanie w systemie DSpace
Publikacja w repozytorium i przetwarzanie w systemie DSpace Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
Internet Semantyczny i Logika II
Internet Semantyczny i Logika II Ontologie Definicja Grubera: Ontologia to formalna specyfikacja konceptualizacji pewnego obszaru wiedzy czy opisu elementów rzeczywistości. W Internecie Semantycznym językiem
Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych
Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Marcin Deptuła Julian Szymański, Henryk Krawczyk Politechnika Gdańska Wydział Elektroniki, Telekomunikacji i Informatyki Katedra Architektury
Reprezentacja wiedzy wprowadzenie, sieci semantyczne, ramy
Reprezentacja wiedzy wprowadzenie, sieci semantyczne, ramy Agnieszka Ławrynowicz 17 listopada 2016 Plan wykładu 1 Wprowadzenie: wiedza, reprezentacja, wnioskowanie, bazy wiedzy 2 Systemy oparte o wiedzę
Zaawansowane narzędzie do analizy korpusu w oparciu o reguły
CLARIN-PL Zaawansowane narzędzie do analizy korpusu w oparciu o reguły Michał Marcińczuk Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl 2015-04-13
Spis treści tomu pierwszego
Spis treści tomu pierwszego WSTĘP.... 11 DŹWIĘK JAKO ZJAWISKO FIZYCZNE...15 CHARAKTERYSTYKA AKUSTYCZNA I AUDYTYWNA DŹWIĘKÓW MOWY.. 17 SŁUCH...20 WYŻSZE PIĘTRA UKŁADU SŁUCHOWEGO...22 EMISJE OTOAKUSTYCZNE...25
Zadanie analizy leksykalnej
Analiza leksykalna 1 Teoria kompilacji Dr inŝ. Janusz Majewski Katedra Informatyki Zadanie analizy leksykalnej Przykład: We: COST := ( PRICE + TAX ) * 0.98 Wy: id 1 := ( id 2 + id 3 ) * num 4 Tablica symboli:
Praca magisterska Jakub Reczycki. Opiekun : dr inż. Jacek Rumiński. Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska
System gromadzenia, indeksowania i opisu słownikowego norm i rekomendacji Praca magisterska Jakub Reczycki Opiekun : dr inż. Jacek Rumiński Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny
XML-owe bazy danych ćwiczenia 1
XML-owe bazy danych ćwiczenia 1 Pierwsza część ćwiczeń będzie zapoznaniem się z przykładową bazą danych dokumentów XML dbxml oraz bazą danych obiektowo-relacyjną Oracle, która pozwala na przechowywanie
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra
Języki programowania zasady ich tworzenia
Strona 1 z 18 Języki programowania zasady ich tworzenia Definicja 5 Językami formalnymi nazywamy każdy system, w którym stosując dobrze określone reguły należące do ustalonego zbioru, możemy uzyskać wszystkie
1 Moduł Lutron HomeWorks QS
1 Moduł Lutron HomeWorks QS Moduł Lutron HomeWorks QS daje użytkownikowi Systemu możliwość współpracy oprogramowania z urządzeniami firmy Lutron serii HomeWorks QS. System Vision może używać go do odbierania
Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji
Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji Michał Witczak Data Mining 20 maja 2012 r. 1. Wstęp Dostarczone zostały nam 4 pliki, z których dwa stanowiły zbiory uczące
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot
Słowosieć - polskie zasoby leksykalne i możliwość ich wykorzystania
Słowosieć - polskie zasoby leksykalne i możliwość ich wykorzystania Agnieszka Dziob Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 agnieszka.dziob@pwr.edu.pl 2018-05-24
Optymalizacja. Wybrane algorytmy
dr hab. inż. Instytut Informatyki Politechnika Poznańska www.cs.put.poznan.pl/mkomosinski, Andrzej Jaszkiewicz Problem optymalizacji kombinatorycznej Problem optymalizacji kombinatorycznej jest problemem
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Seminarium przetwarzania języka naturalnego Mateusz Kopeć Instytut Podstaw Informatyki Polskiej Akademii Nauk 6 lutego 2012 Plan 1 Zadanie
Bazy danych TERMINOLOGIA
Bazy danych TERMINOLOGIA Dane Dane są wartościami przechowywanymi w bazie danych. Dane są statyczne w tym sensie, że zachowują swój stan aż do zmodyfikowania ich ręcznie lub przez jakiś automatyczny proces.
INTERNETOWE BAZY DANYCH materiały pomocnicze - wykład X
Wrocław 2006 INTERNETOWE BAZY DANYCH materiały pomocnicze - wykład X Paweł Skrobanek C-3, pok. 323 e-mail: pawel.skrobanek@pwr.wroc.pl INTERNETOWE BAZY DANYCH PLAN NA DZIŚ zajęcia 1: 2. Procedury składowane
Wprowadzenie do Prologa
Wprowadzenie do Prologa Rozdział 1 Tutorial Introduction Maciej Gapiński Dominika Wałęga Spis treści 1. Podstawowe informacje 2. Obiekty i relacje 3. Reguły 4. Fakty 5. Zapytania 6. Zmienne i stałe Podstawowe
Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych
Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych Rafał Walkowiak Politechnika Poznańska Studia inżynierskie Informatyka 2013/14 Znajdowanie maksimum w zbiorze
WPROWADZENIE DO BAZ DANYCH
WPROWADZENIE DO BAZ DANYCH Pojęcie danych i baz danych Dane to wszystkie informacje jakie przechowujemy, aby w każdej chwili mieć do nich dostęp. Baza danych (data base) to uporządkowany zbiór danych z
1 Moduł E-mail. 1.1 Konfigurowanie Modułu E-mail
1 Moduł E-mail Moduł E-mail daje użytkownikowi Systemu możliwość wysyłania wiadomości e-mail poprzez istniejące konto SMTP. System Vision może używać go do wysyłania informacji o zdefiniowanych w jednostce
Paweł Kurzawa, Delfina Kongo
Paweł Kurzawa, Delfina Kongo Pierwsze prace nad standaryzacją Obiektowych baz danych zaczęły się w roku 1991. Stworzona została grupa do prac nad standardem, została ona nazwana Object Database Management
Układy VLSI Bramki 1.0
Spis treści: 1. Wstęp... 2 2. Opis edytora schematów... 2 2.1 Dodawanie bramek do schematu:... 3 2.2 Łączenie bramek... 3 2.3 Usuwanie bramek... 3 2.4 Usuwanie pojedynczych połączeń... 4 2.5 Dodawanie
Pattern Classification
Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors
Kategorialny Parser Składniowo-Semantyczny dla języka polskiego
Kategorialny Parser Składniowo-Semantyczny dla języka polskiego Wojciech Jaworski Instytut Informatyki Uniwersytetu Warszawskiego Instytut Podstaw Informatyki Polskiej Akademii Nauk 26 kwietnia 2016 Wojciech
Okno główne programu. 1. Zlecenia. W systemie wprowadza się zlecenia: Remontowe Serwisowe Usługowe Kompletacji
Programu SERWIS XL przeznaczony jest do ewidencji i rozliczenia prowadzonej działalności serwisowej, usługowej oraz produkcyjnej. Pozwala na prowadzenie ewidencji napraw sprzętu przyjmowanego do serwisu,
Internet Semantyczny. Logika opisowa
Internet Semantyczny Logika opisowa Ontologie Definicja Grubera: Ontologia to formalna specyfikacja konceptualizacji pewnego obszaru wiedzy czy opisu elementów rzeczywistości. W Internecie Semantycznym
Podstawy Informatyki. Algorytmy i ich poprawność
Podstawy Informatyki Algorytmy i ich poprawność Błędy Błędy: językowe logiczne Błędy językowe Związane ze składnią języka Wykrywane automatycznie przez kompilator lub interpreter Prosty sposób usuwania
Charakterystyki oraz wyszukiwanie obrazów cyfrowych
Algorytmy Graficzne Charakterystyki oraz wyszukiwanie obrazów cyfrowych Autor: Mateusz Nostitz-Jackowski 1 / 7 Działanie programu: Do poprawnego działania projektu potrzeba programu Mathematica 5.2 (możliwe
Systemy ekspertowe i ich zastosowania. Katarzyna Karp Marek Grabowski
Systemy ekspertowe i ich zastosowania Katarzyna Karp Marek Grabowski Plan prezentacji Wstęp Własności systemów ekspertowych Rodzaje baz wiedzy Metody reprezentacji wiedzy Metody wnioskowania Języki do
Analiza leksykalna 1. Języki formalne i automaty. Dr inż. Janusz Majewski Katedra Informatyki
Analiza leksykalna 1 Języki formalne i automaty Dr inż. Janusz Majewski Katedra Informatyki Zadanie analizy leksykalnej Kod źródłowy (ciąg znaków) Analizator leksykalny SKANER Ciąg symboli leksykalnych
Narzędzia do automatycznej analizy odniesień w tekstach
CLARIN-PL Narzędzia do automatycznej analizy odniesień w tekstach Michał Marcińczuk Jan Kocoń Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl
Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych
Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych Rafał Walkowiak Politechnika Poznańska Studia inżynierskie Informatyka 2014/15 Znajdowanie maksimum w zbiorze
Wstęp do Techniki Cyfrowej... Teoria automatów
Wstęp do Techniki Cyfrowej... Teoria automatów Alfabety i litery Układ logiczny opisywany jest przez wektory, których wartości reprezentowane są przez ciągi kombinacji zerojedynkowych. Zwiększenie stopnia
KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów)
KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów) Marcin Oleksy Michał Marcińczuk Politechnika ska Instytut Informatyki
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska e-mail: bartosz.krawczyk@pwr.wroc.pl Czym jest klasyfikacja
W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji.
5 Collocations Związek frazeologiczny (kolokacja), to często używane zestawienie słów. Przykłady: strong tea, weapons of mass destruction, make up. Znaczenie całości wyrażenia, nie zawsze wynika ze znaczeń
Normalizacja baz danych
Wrocławska Wyższa Szkoła Informatyki Stosowanej Normalizacja baz danych Dr hab. inż. Krzysztof Pieczarka Email: krzysztof.pieczarka@gmail.com Normalizacja relacji ma na celu takie jej przekształcenie,
WYKŁAD 6. Reguły decyzyjne
Wrocław University of Technology WYKŁAD 6 Reguły decyzyjne autor: Maciej Zięba Politechnika Wrocławska Reprezentacje wiedzy Wiedza w postaci reguł decyzyjnych Wiedza reprezentowania jest w postaci reguł
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po
Słowosieć leksykalna sieć semantyczna języka polskiego i jej zastosowanie w analizie znaczeń
Słowosieć 3.0 - leksykalna sieć semantyczna języka polskiego i jej zastosowanie w analizie znaczeń Paweł Kędzia, Marek Maziarz, Maciej Piasecki, Ewa Rudnicka i Piotr Pęzik * Politechnika Wrocławska Katedra
Eksploracja danych. KLASYFIKACJA I REGRESJA cz. 2. Wojciech Waloszek. Teresa Zawadzka.
Eksploracja danych KLASYFIKACJA I REGRESJA cz. 2 Wojciech Waloszek wowal@eti.pg.gda.pl Teresa Zawadzka tegra@eti.pg.gda.pl Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki
ALGORYTMY SZTUCZNEJ INTELIGENCJI
ALGORYTMY SZTUCZNEJ INTELIGENCJI Sieci neuronowe 06.12.2014 Krzysztof Salamon 1 Wstęp Sprawozdanie to dotyczy ćwiczeń z zakresu sieci neuronowych realizowanym na przedmiocie: Algorytmy Sztucznej Inteligencji.
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P2 KWIECIEŃ 2016 Zadanie 1. (0 1) 9) wyciąga wnioski wynikające z przesłanek
WIZUALIZACJA INFORMACJI TEKSTOWEJ
WIZUALIZACJA INFORMACJI TEKSTOWEJ Michał Kołkowski Promotor: prof. dr hab. Włodzisław Duch SPIS TREŚCI 1. Ogólnie o projekcie 2. Baza WordNet. 1. Ogólny opis 2. Budowa na podstawie plików WNDB 3. WordNet