Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska
|
|
- Szczepan Janowski
- 9 lat temu
- Przeglądów:
Transkrypt
1 Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Seminarium przetwarzania języka naturalnego Mateusz Kopeć Instytut Podstaw Informatyki Polskiej Akademii Nauk 6 lutego 2012
2 Plan 1 Zadanie WSD Problem WSD Wybór tematu pracy 2 Opis rozwiazania Algorytm Leska Rozszerzony algorytm Leska 3 Ewaluacja Miary ewaluacji Dane testowe Eksperymenty Najlepsze metody 4 Wnioski i porównanie Trudne przypadki Porównanie z innymi metodami i możliwe rozszerzenia
3 Plan 1 Zadanie WSD Problem WSD Wybór tematu pracy 2 Opis rozwiazania Algorytm Leska Rozszerzony algorytm Leska 3 Ewaluacja Miary ewaluacji Dane testowe Eksperymenty Najlepsze metody 4 Wnioski i porównanie Trudne przypadki Porównanie z innymi metodami i możliwe rozszerzenia
4 Word Sense Disambiguation Rozróżnianie Sensów Słów - Word Sense Disambiguation Problem: wieloznaczność słów Zadanie: wybór właściwego znaczenia w danym kontekście wejście: zbiór możliwych sensów i kontekst wyjście: odpowiedni sens Przykład Zamek może oznaczać (m.in.): 1 budowlę, 2 zamek do drzwi. Przykład 1 Przed nimi widać było ogromny zamek 1. 2 Długo się zastanawiał, czy zamkn ał zamek 2 po wyjściu z domu.
5 Zastosowania WSD Rozwiazenie przydatne w: Tłumaczeniu maszynowym, Question answering, Wyszukiwaniu informacji, Klasyfikacji tekstów, itp. Przykład Tłumaczenie: polski angielski. Słowo piłka: piłka ball? piłka small saw? Seminaria tutejsze: Mechanizm budowy streszczeń dokumentów w wyszukiwarce NEKST Metody nadzorowane w ujednoznacznianiu sensów słów korpusu dziedzinowego
6 Zastosowania WSD przykład
7 Pokrycie tekstu Możliwe sa dwa podejścia do WSD: Rozróżnianie sensów wybranego słowa lub małej liczby słów w kontekście (lexical sample), Rozróżnianie sensów wszystkich słów w kontekście (all-words).
8 Słownik sensów Wybór słownika sensów i jego cechy zależa od zastosowania: W tłumaczeniach trzeba rozróżniać sensy różnie przekładane, W syntezie mowy wystarczy rozróżniać homografy, W praktyce najczęściej podział jest gruboziarnisty.
9 Sposoby rozwiazywania Klasyfikacja z nadzorem Zalety: + Wysoka skuteczność. Wady: - Duży koszt ręcznej anotacji przykładów treningowych. Klasyfikacja bez nadzoru Zalety: + Niski koszt. + Szeroka stosowalność. Wady: - Mniejsza skuteczność.
10 Temat pracy Pierwszy plan: Rozróżnianie sensów wszystkich słów w kontekście (all-words), Uczenie z minimalnym nadzorem, oparte na idei boostrapingu, Tym samym metoda możliwie ogólna. Problemy: Brak testowego zbioru do ewaluacji. Brak odpowiedniego słownika sensów. Trudności w stworzeniu samodzielnie takich zasobów.
11 Temat pracy Co udało się znaleźć: Odpowiedni dla WSD słownik dla 106 często występujacych słów wieloznacznych, Duży (>1 mln słów) zbiór tekstów do ewaluacji, oznaczony sensami z powyższego słownika. Drugi plan: Potencjalne rozróżnianie sensów wszystkich słów w kontekście (all-words), w praktyce tylko wybrane słowa, dla których istnieja wpisy w słowniku. Brak fazy uczenia, algorytm opiera się na porównaniu definicji sensów z kontekstem słowa.
12 Plan 1 Zadanie WSD Problem WSD Wybór tematu pracy 2 Opis rozwiazania Algorytm Leska Rozszerzony algorytm Leska 3 Ewaluacja Miary ewaluacji Dane testowe Eksperymenty Najlepsze metody 4 Wnioski i porównanie Trudne przypadki Porównanie z innymi metodami i możliwe rozszerzenia
13 Algorytm Leska Jeden z pierwszych algorytmów (1986) opartych na wiedzy. Porównywane sa definicje wielu sensów wielu słów. Niech słowa W 1 i W 2 występuja we wspólnym kontekście. Wtedy działanie jest następujace: dla każdego sensu i słowa W 1, dla każdego sensu j słowa W 2, oblicz Przecięcie(i, j), równe liczbie słów wspólnych w definicji sensu i oraz j, znajdź i i j, dla których Przecięcie(i, j) jest największe, przypisz sens i słowu W 1 i sens j słowu W 2.
14 Uproszczony algorytm Leska Uproszczony algorytm Leska porównuje kontekst z definicja dla pojedynczego słowa wieloznacznego. Działa następujaco: dla każdego sensu i słowa W w kontekście c, oblicz Przecięcie(i, c), które jest równe ilości wspólnych słów w definicji i oraz kontekście c, znajdź i, dla którego Przecięcie(i, c) jest największe, przypisz sens i słowu W.
15 Jak to działa? - przykład Słowo: zamek 1 Obronna budowla z kamienia. 2 Urzadzenie pozwalajace na zamykanie czegoś, np. zamek w drzwiach. Kontekst... po czym zamknał zamek w drzwiach, kilkukrotnie się upewniajac, czy z pewnościa... Działanie algorytmu: Porównanie definicji 1. z kontekstem, Porównanie definicji 2. z kontekstem, Wybór bardziej podobnej definicji sensu.
16 Rozszerzony algorytm Leska Rozszerzony algorytm Leska porównuje kontekst z definicja dla pojedynczego słowa wieloznacznego. Różni się wyłacznie tym, że używa bardziej wyszukanej funkcji podobieństwa zamiast zwykłego przecięcia tekstowego. Działa następujaco: dla każdego sensu i słowa W w kontekście c, oblicz Podobieństwo(i, c), znajdź i, dla którego Podobieństwo(i, c) jest największe, przypisz sens i słowu W.
17 Obliczanie podobieństwa kontekstu i definicji W skrócie: 1 Z kontekstu jest tworzony wektor: współrzędne słowa z kontekstu, wartości pewne wagi tychże słów. 2 Z definicji sensu jest tworzony analogiczny wektor. 3 Wektory s a porównywane poprzez np. ich przemnożenie przez siebie.
18 Obliczanie podobieństwa kontekstu i definicji I Parametryzacja tego obliczenia: Rozmiar definicji krótka, długa. Rozmiar kontekstu Lematyzacja tak/nie. Binaryzacja tak/nie. IDF tak/nie. IGF tak/nie. Dolne wartości skrajne między 0 a 1. Górne wartości skrajne między 0 a 1. Normalizacja definicji tak/nie. Normalizacja kontekstu brak/liniowa/kwadratowa.
19 Obliczanie podobieństwa kontekstu i definicji II Rozszerzenie 7 możliwości: brak rozszerzenia, naiwne, za pomoca synonimów ze słownika synonimy.ux.pl, ostrożne, za pomoca synonimów ze słownika synonimy.ux.pl, naiwne, za pomoca synonimów ze Słowosieci, pobieranych z synsetów zawierajacych słowo bazowe, ostrożne, za pomoca synonimów ze Słowosieci, pobieranych z synsetów zawierajacych słowo bazowe, naiwne, za pomoca synonimów ze Słowosieci, pobieranych z synsetów zawierajacych słowo bazowe oraz synsetów znajdujacych się w określonej relacji (hiperonimii, części, bliskoznaczności i fuzzynimii synsetów) z nimi, za pomoca słów znajdujacych się najbliżej wg miary korpusowego podobieństwa znaczeniowego.
20 Obliczanie podobieństwa kontekstu i definicji III Porównanie wektorów produkt kartezjański cosinus odległość euklidesowa (odwrócona) współczynnik Jaccarda współczynnik Pearsona (przesunięty) uśredniona dywergencja Kullbacka-Leiblera (odwrócona)
21 Plan 1 Zadanie WSD Problem WSD Wybór tematu pracy 2 Opis rozwiazania Algorytm Leska Rozszerzony algorytm Leska 3 Ewaluacja Miary ewaluacji Dane testowe Eksperymenty Najlepsze metody 4 Wnioski i porównanie Trudne przypadki Porównanie z innymi metodami i możliwe rozszerzenia
22 Miary ewaluacji Zadanie polega na wybraniu dla każdego wystapienia słowa ze słownika jednego pasujacego sensu. Najprostsza miara skuteczność ACC. Obliczania jako stosunek ilości dobrych odpowiedzi do wszystkich odpowiedzi. Ale czy to odpowiednia miara? Przykład: ciało 127 razy w 1. sensie, 6 razy w drugim.
23 Dodatkowe miary ewaluacji Miara IMPROVE: Oznacza liczbę słów wieloznacznych, dla których metoda pokonała MFS. Miara RARE: Promuje poprawne rozpoznawanie rzadszych sensów. 1 Waga odpowiedzi: 1 + ln częstość danego sensu. W przypadku ciała: częstszy sens ma wagę ok. 1, rzadki ok. 4.
24 Dane testowe Dane z ręcznie anotowanej części NKJP, tym samym zrównoważone. Korpus podzielony na dwie części (na poziomie tekstów): rozwojowa i testowa. Statystyki użytych tekstów Liczba tekstów Liczba segmentów Cały korpus Część rozwojowa Część testowa
25 Słownik sensów Słownik stworzony na potrzeby NKJP. 106 słów wieloznacznych, od 2 do 7 sensów na słowo. 50 rzeczowników, 48 czasowników oraz 8 przymiotników. Średnia ilość sensów/słowo: 2,85.
26 Słownik sensów Statystyki wystapień słów wieloznacznych w części rozwojowej Części mowy Liczba wyst. w słowniku Liczba wyst. w korpusie MFS Random Rzeczowniki ,809 0,397 Czasowniki ,753 0,313 Przymiotniki ,796 0,362 Wszystkie ,784 0,358
27 Słownik sensów
28 Przestrzeń poszukiwań Parametr Liczba Przyjmowane wartości Wartości Rozmiar definicji 2 pełna, krótka Rozmiar kontekstu 7 1, 2, 5, 10, 20, 30, 50 Lematyzacja 2 tak, nie Binaryzacja 2 tak, nie IGF 2 tak, nie IDF 2 tak, nie Dolne wartości skrajne 5 0,00, 0,01, 0,05, 0,10, 0,20 Górne wartości skrajne 5 0,80, 0,90, 0,95, 0,99, 1,00 Normalizacja definicji 2 tak, nie Normalizacja kontekstu 3 brak, liniowa, kwadratowa Rozszerzenie 7 brak, słowosieć-naiwne, słowosiećostrożne, synonimy.ux-naiwne, synonimy.ux-ostrożne, słowosieć-relacje, słowosieć-podobieństwo semantyczne Porównanie wektorów 6 product, cosine, euclidean, jaccard, pearson, kullback
29 Przeprowadzone eksperymenty 6 zestawów: Zestaw I - rozmiar definicji, kontekstu, lematyzacja metod, Zestaw II - IDF, IGF, binaryzacja - 64 metody, Zestaw III - normalizacja definicji, kontekstu, wielkość kontekstu metody, Zestaw IV - rozszerzanie kontekstu - 84 metody, Zestaw V - przecięcie wektorów - 96 metod, Zestaw VI - odrzucanie skrajnych wartości metod.
30 Najlepsze metody Parametr Najlepsza względem: ACC RARE IMPROVE Rozmiar definicji pełna Rozmiar kontekstu 30 Lematyzacja tak Binaryzacja nie IGF tak IDF tak Dolne wartości skrajne 0,01 Górne wartości skrajne 1 0,99 Normalizacja definicji nie tak Normalizacja kontekstu liniowa kwadratowa Rozszerzenie słowosieć-podobieństwo semantyczne Porównanie wektorów product jaccard
31 Skuteczność wybranych trzech najlepszych metod Miara ACC RARE IMPROVE Wynik na części rozwojowej 0, , Wynik na części testowej 0, ,4 27 Wynik na całym korpusie 0, ,203 (/2 = 15626,602) 31
32 10 najłatwiejszych słów 1 najlepsza względem ACC 2 najlepsza względem RARE 3 najlepsza względem IMPROVE Słowo Liczba Rozkład MFS Random punkt /53/27/23 0,368 0,250 0,325 0,386 0,392 stanać 75 31/28/16 0,413 0,333 0,533 0,546 0,546 składać 82 34/31/9/5/2/1 0,414 0,166 0,439 0,463 0,463 zwrócić 90 39/37/14/0 0,433 0,250 0,588 0,500 0,500 strona /108/100 0,443 0,333 0,459 0,483 0,473 grać /30/25/5 0,454 0,250 0,672 0,600 0,518 góra /52/13/6/3 0,459 0,200 0,540 0,518 0,510 stosunek 83 41/38/4 0,493 0,333 0,566 0,566 0,614 brać /56/10/6/2/1/1 0,500 0,142 0,493 0,421 0,407 stać /183/19/3 0,502 0,250 0,466 0,502 0,509
33 10 najtrudniejszych słów 1 najlepsza względem ACC 2 najlepsza względem RARE 3 najlepsza względem IMPROVE Słowo Liczba Rozkład MFS Random rola /1/0 0,991 0,333 0,973 0,965 0,973 kultura /1 0,991 0,500 0,974 0,940 0,940 zasada /1 0,994 0,500 0,978 0,962 0,962 nastapić 65 65/0 1,000 0,500 0,169 0,323 0,353 powstać /0/0 1,000 0,333 0,237 0,163 0,172 podstawa /0 1,000 0,500 0,965 0,958 0,965 piłka 43 43/0 1,000 0,500 1,000 1,000 1,000 członek /0/0 1,000 0,333 0,835 0,882 0,876 czuć /0 1,000 0,500 0,994 0,982 0,988 prowadzenie 2 2/0/0 1,000 0,333 0,500 0,500 0,500
34 Plan 1 Zadanie WSD Problem WSD Wybór tematu pracy 2 Opis rozwiazania Algorytm Leska Rozszerzony algorytm Leska 3 Ewaluacja Miary ewaluacji Dane testowe Eksperymenty Najlepsze metody 4 Wnioski i porównanie Trudne przypadki Porównanie z innymi metodami i możliwe rozszerzenia
35 Trudne przypadki Powstać sensy: 1 zaczać istnieć w rzeczywistości lub w świadomości (122 wystapienia), 2 zmienić pozycję na stojac a (0 wystapień), 3 sprzeciwić się lub wystapić zbrojnie (0 wystapień). Nastapić sensy: 1 wejść na coś stopa, atakować (65 wystapień), 2 zdarzyć się (0 wystapień).
36 Trudne przypadki cd. Udać sensy: 1 zakończyć się powodzeniem (150 wystapień), 2 pójść, pojechać (21 wystapień), 3 udawać: sprawiać wrażenie, że coś robimy (3 wystapienia). Zostać sensy: 1 ulec (do tworzenia strony biernej) (633 wystapienia), 2 stać się kimś (64 wystapienia), 3 być/trwać w jakimś stanie/miejscu, nie zmienić się (51 wystapień), 4 ostać się z całości (28 wystapień).
37 Trudne przypadki cd. Metoda Rzeczowniki Czasowniki Przymiotniki Najlepsza względem ACC 0,726 0,574 0,676
38 Porównanie z metodami z nadzorem W danych testowych MFS niemal 80%. Zatem trywialny system z nadzorem osiaga taka skuteczność! Specyfika: oddzielna metoda dla każdego słowa. Skuteczność: 91,46% na podkorpusie NKJP, z walidacja krzyżowa.
39 Porównanie z metodami bez nadzoru Brak prób rozróżniania sensu polskich słów metodami bez nadzoru. Semeval 2007: All-words dla języka angielskiego. Gruboziarniste sensy poprzez pogrupowanie sensów Wordnetu wystapień, 30% wystapień słów monosemicznych. 3,06 sensu/słowo (w Wordnecie: 6,18), 78,89% MFS, 52,43% Random. Najlepszy system oparty na wiedzy: ok. 60% F1. Semeval 2010: All-words dziedzinowe dla języka angielskiego. Drobniejszy podział na sensy: 23,2% Random. Najlepszy system oparty na wiedzy: ok. 50% F1.
40 Możliwe rozszerzenia systemu Metoda jest niestabilna wymaga analizy trudnych przypadków. Pożadane było zagwarantowanie skuteczności prawie zawsze powyżej heurystyki Random. Rozszerzenie metody na klasyfikację w sposób zależny dla wielu słów wieloznacznych w kontekście. Wymaga to jednak stworzenia kosztownych zasobów: słownika oraz korpusu.
41 To już wszystko Dziękuję za uwagę!
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Witold Kieraś Łukasz Kobyliński Maciej Ogrodniczuk Instytut Podstaw Informatyki PAN III Konferencja DARIAH-PL Poznań 9.11.2016
Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur
Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur Maciej Piasecki, Paweł Kędzia Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Plan prezentacji
EmotiWord, semantyczne powiązanie i podobieństwo, odległość znaczeniowa
, semantyczne powiązanie i podobieństwo, odległość Projekt przejściowy ARR Politechnika Wrocławska Wydział Elektroniki Wrocław, 22 października 2013 Spis treści 1 językowa 2, kryteria 3 Streszczenie artykułu
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
Narzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
Narzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra
Open Access w technologii językowej dla języka polskiego
Open Access w technologii językowej dla języka polskiego Marek Maziarz, Maciej Piasecki Grupa Naukowa Technologii Językowych G4.19 Zakład Sztucznej Inteligencji, Instytut Informatyki, W-8, Politechnika
AUTOMATYKA INFORMATYKA
AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław Kowalczuk Inteligentne wydobywanie informacji z internetowych serwisów
Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex
Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
Program warsztatów CLARIN-PL
W ramach Letniej Szkoły Humanistyki Cyfrowej odbędzie się III cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Narzędzia cyfrowe do analizy języka w naukach humanistycznych i społecznych 17-19
Spis treści tomu pierwszego
Spis treści tomu pierwszego WSTĘP.... 11 DŹWIĘK JAKO ZJAWISKO FIZYCZNE...15 CHARAKTERYSTYKA AKUSTYCZNA I AUDYTYWNA DŹWIĘKÓW MOWY.. 17 SŁUCH...20 WYŻSZE PIĘTRA UKŁADU SŁUCHOWEGO...22 EMISJE OTOAKUSTYCZNE...25
KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów)
KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów) Marcin Oleksy Michał Marcińczuk Politechnika ska Instytut Informatyki
Rozwiązywanie dysambiguacji za pomocą lingwistycznej sieci symantycznych relacji leksykalnych na przykładzie systemu WordNet
Rozwiązywanie dysambiguacji za pomocą lingwistycznej sieci symantycznych relacji leksykalnych na przykładzie systemu WordNet Julian Szymański, Kamila Błaszczyk, Artur Chełmecki 18 marca 2007 1 Wstęp Rozwój
TEORETYCZNE PODSTAWY INFORMATYKI
1 TEORETYCZNE PODSTAWY INFORMATYKI WFAiS UJ, Informatyka Stosowana I rok studiów, I stopień Wykład 16 2 Data Science: Uczenie maszynowe Uczenie maszynowe: co to znaczy? Metody Regresja Klasyfikacja Klastering
Inforex - zarządzanie korpusami i ich anotacja
Inforex - zarządzanie korpusami i ich anotacja Marcin Oleksy marcin.oleksy@pwr.edu.pl Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii
Inforex - zarządzanie korpusami i ich anotacja. Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii Językowych G4.
Inforex - zarządzanie korpusami i ich anotacja Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy Jan Wieczorek Jan Kocoń marcin.oleksy@pwr.edu.pl jan.wieczorek@pwr.edu.pl jan.kocon@pwr.edu.pl
Word sense disambiguation dokończenie
Word sense disambiguation dokończenie 1. Krótkie przypomnienie: a) Podejście intuicyjne : podział słowa na znaczenia według słownika oraz przypisywanie każdemu wystąpieniu tego słowa jednego ze znaczeń
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot
Optymalizacja ciągła
Optymalizacja ciągła 5. Metoda stochastycznego spadku wzdłuż gradientu Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 04.04.2019 1 / 20 Wprowadzenie Minimalizacja różniczkowalnej
Testowanie modeli predykcyjnych
Testowanie modeli predykcyjnych Wstęp Podczas budowy modelu, którego celem jest przewidywanie pewnych wartości na podstawie zbioru danych uczących poważnym problemem jest ocena jakości uczenia i zdolności
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny
Analiza danych tekstowych i języka naturalnego
Kod szkolenia: Tytuł szkolenia: ANA/TXT Analiza danych tekstowych i języka naturalnego Dni: 3 Opis: Adresaci szkolenia Dane tekstowe stanowią co najmniej 70% wszystkich danych generowanych w systemach
komputery? Andrzej Skowron, Hung Son Nguyen Instytut Matematyki, Wydział MIM, UW
Czego moga się nauczyć komputery? Andrzej Skowron, Hung Son Nguyen son@mimuw.edu.pl; skowron@mimuw.edu.pl Instytut Matematyki, Wydział MIM, UW colt.tex Czego mogą się nauczyć komputery? Andrzej Skowron,
CLARIN rozproszony system technologii językowych dla różnych języków europejskich
CLARIN rozproszony system technologii językowych dla różnych języków europejskich Maciej Piasecki Politechnika Wrocławska Instytut Informatyki G4.19 Research Group maciej.piasecki@pwr.wroc.pl Projekt CLARIN
Optymalizacja. Przeszukiwanie lokalne
dr hab. inż. Instytut Informatyki Politechnika Poznańska www.cs.put.poznan.pl/mkomosinski, Maciej Hapke Idea sąsiedztwa Definicja sąsiedztwa x S zbiór N(x) S rozwiązań, które leżą blisko rozwiązania x
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji
Rozdział przedstawia kilka najważniejszych algorytmów rozpoznających znaczenie słów w zależności od użytego kontekstu.
Word Sense Disambiguation I WSTĘP Rozdział przedstawia kilka najważniejszych algorytmów rozpoznających znaczenie słów w zależności od użytego kontekstu. 1. Jaka jest idea rozpoznawania znaczenia słów?
Wstęp do przetwarzania języka naturalnego
Wstęp do przetwarzania języka naturalnego Wykład 9 Wektoryzacja dokumentów i podstawowe miary podobieństwa Wojciech Czarnecki 17 grudnia 2013 Section 1 Przypomnienie Bag of words model Podejście Przypomnienie
S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor
S O M SELF-ORGANIZING MAPS Przemysław Szczepańczyk Łukasz Myszor Podstawy teoretyczne Map Samoorganizujących się stworzył prof. Teuvo Kohonen (1982 r.). SOM wywodzi się ze sztucznych sieci neuronowych.
Praca Magisterska. Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń. internetowego dla języka polskiego
Praca Magisterska Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń Lingwistycznych zbudowanego przez robota internetowego dla języka polskiego Marcin A. Gadamer Promotor: dr Adrian
3. Macierze i Układy Równań Liniowych
3. Macierze i Układy Równań Liniowych Rozważamy równanie macierzowe z końcówki ostatniego wykładu ( ) 3 1 X = 4 1 ( ) 2 5 Podstawiając X = ( ) x y i wymnażając, otrzymujemy układ 2 równań liniowych 3x
Wprowadzenie do uczenia maszynowego
Wprowadzenie do uczenia maszynowego Agnieszka Ławrynowicz 12 stycznia 2017 Co to jest uczenie maszynowe? dziedzina nauki, która zajmuje się sprawianiem aby komputery mogły uczyć się bez ich zaprogramowania
Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18
Eksploracja Danych wykład 4 Sebastian Zając WMP.SNŚ UKSW 10 maja 2017 Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja 2017 1 / 18 Klasyfikacja danych Klasyfikacja Najczęściej stosowana (najstarsza)
2) R stosuje w obliczeniach wzór na logarytm potęgi oraz wzór na zamianę podstawy logarytmu.
ZAKRES ROZSZERZONY 1. Liczby rzeczywiste. Uczeń: 1) przedstawia liczby rzeczywiste w różnych postaciach (np. ułamka zwykłego, ułamka dziesiętnego okresowego, z użyciem symboli pierwiastków, potęg); 2)
Zaglądamy pod maskę: podstawy działania silnika wyszukiwawczego na przykładzie Lucene
2..22 Zaglądamy pod maskę: podstawy działania silnika wyszukiwawczego na przykładzie Lucene Dominika Puzio Indeks Podstawy: dokument Dokument: jednostka danych, pojedynczy element na liście wyników wyszukiwania,
ROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ.
ROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ. LICZBA TEMAT GODZIN LEKCYJNYCH Potęgi, pierwiastki i logarytmy (8 h) Potęgi 3 Pierwiastki 3 Potęgi o wykładnikach
W poszukiwaniu sensu w świecie widzialnym
W poszukiwaniu sensu w świecie widzialnym Andrzej Śluzek Nanyang Technological University Singapore Uniwersytet Mikołaja Kopernika Toruń AGH, Kraków, 28 maja 2010 1 Podziękowania Przedstawione wyniki powstały
CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy
Cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy 13 15 kwietnia 2015 roku Warszawa, Pałac Staszica, ul. Nowy Świat 72, sala 144
Tytuł rozprawy: Metody semantycznej kategoryzacji w zadaniach analizy dokumentów tekstowych.
dr hab. inż. Piotr Gawrysiak, prof. PW Instytut Informatyki Wydział Elektroniki i Technik Informacyjnych Politechnika Warszawska Warszawa, 29 marca 2019 RECENZJA ROZPRAWY DOKTORSKIEJ MGR. PIOTRA BORKOWSKIEGO
Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych. Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS
Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS Dyskretyzacja - definicja Dyskretyzacja - zamiana atrybutów
Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych
Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław
Metody eksploracji danych w odkrywaniu wiedzy (MED) projekt, dokumentacja końcowa
Metody eksploracji danych w odkrywaniu wiedzy (MED) projekt, dokumentacja końcowa Konrad Miziński 14 stycznia 2015 1 Temat projektu Grupowanie hierarchiczne na podstawie algorytmu k-średnich. 2 Dokumenty
Zastosowanie Wikipedii w przetwarzaniu języka naturalnego
Zastosowanie Wikipedii w przetwarzaniu języka naturalnego Plan prezentacji Wikipedia Klasyfikacja Zastosowanie w NLP Plan prezentacji Wikipedia Klasyfikacja Zastosowanie w NLP Rysunek : http://img2.wikia.nocookie.net/
Dlaczego należy uwzględniać zarówno wynik maturalny jak i wskaźnik EWD?
EWD co to jest? Metoda EWD to zestaw technik statystycznych pozwalających oszacować wkład szkoły w końcowe wyniki egzaminacyjne. Wkład ten nazywamy właśnie edukacyjną wartością dodaną. EWD jest egzaminacyjnym
Wydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych
Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Informatyki i Elektroniki Instrukcja do zajęć laboratoryjnych wersja: 1.0 Nr ćwiczenia: 12, 13 Temat: Cel ćwiczenia: Wymagane przygotowanie
Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury. Paweł Kobojek, prof. dr hab. inż. Khalid Saeed
Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury Paweł Kobojek, prof. dr hab. inż. Khalid Saeed Zakres pracy Przegląd stanu wiedzy w dziedzinie biometrii, ze szczególnym naciskiem
Co wylicza Jasnopis? Bartosz Broda
Co wylicza Jasnopis? Bartosz Broda Analiza języka polskiego Ekstrakcja tekstu Dokument narzędzie do mierzenia zrozumiałości Analiza morfologiczna Analiza morfosyntaktyczna Indeksy Klasa trudności:
Rozwiązywanie układów równań liniowych metody dokładne Materiały pomocnicze do ćwiczeń z metod numerycznych
Rozwiązywanie układów równań liniowych metody dokładne Materiały pomocnicze do ćwiczeń z metod numerycznych Piotr Modliński Wydział Geodezji i Kartografii PW 13 stycznia 2012 P. Modliński, GiK PW Rozw.
WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp
WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp Natalia Kotsyba, IBI AL UW 24 marca 2010 Plan zajęć Praca domowa na zapytania do Korpusu IPI PAN za pomocą
Techniki Optymalizacji: Stochastyczny spadek wzdłuż gradientu I
Techniki Optymalizacji: Stochastyczny spadek wzdłuż gradientu I Wojciech Kotłowski Instytut Informatyki Politechniki Poznańskiej email: imię.nazwisko@cs.put.poznan.pl pok. 2 (CW) tel. (61)665-2936 konsultacje:
KorBa. Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk
KorBa Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk ALLPPT.com _ Free PowerPoint Templates, Diagrams and Charts PODSTAWOWE
Jazda autonomiczna Delphi zgodna z zasadami sztucznej inteligencji
Jazda autonomiczna Delphi zgodna z zasadami sztucznej inteligencji data aktualizacji: 2017.10.11 Delphi Kraków Rozwój jazdy autonomicznej zmienia krajobraz technologii transportu w sposób tak dynamiczny,
Szablony funkcji i szablony klas
Bogdan Kreczmer bogdan.kreczmer@pwr.wroc.pl Zakład Podstaw Cybernetyki i Robotyki Instytut Informatyki, Automatyki i Robotyki Politechnika Wrocławska Kurs: Copyright c 2011 Bogdan Kreczmer Niniejszy dokument
POD- I NADOKREŚLONE UKŁADY ALGEBRAICZNYCH RÓWNAŃ LINIOWYCH
POD- I NADOKREŚLONE UKŁADY ALGEBRAICZNYCH RÓWNAŃ LINIOWYCH Transport, studia I stopnia rok akademicki 2011/2012 Instytut L-5, Wydział Inżynierii Lądowej, Politechnika Krakowska Ewa Pabisek Adam Wosatko
Algorytm grupowania danych typu kwantyzacji wektorów
Algorytm grupowania danych typu kwantyzacji wektorów Wstęp Definicja problemu: Typowe, problemem często spotykanym w zagadnieniach eksploracji danych (ang. data mining) jest zagadnienie grupowania danych
Zaawansowane narzędzie do analizy korpusu w oparciu o reguły
CLARIN-PL Zaawansowane narzędzie do analizy korpusu w oparciu o reguły Michał Marcińczuk Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl 2015-04-13
Uczenie sieci radialnych (RBF)
Uczenie sieci radialnych (RBF) Budowa sieci radialnej Lokalne odwzorowanie przestrzeni wokół neuronu MLP RBF Budowa sieci radialnych Zawsze jedna warstwa ukryta Budowa neuronu Neuron radialny powinien
Zapytanie ofertowe nr 1/2016
to Zapytanie ofertowe nr 1/2016 z dnia 11052016 Espeo Software Sp z oo 2 Zapytanie ofertowe nr 1/2016 z dnia 11052016 Zapytanie ofertowe nr 1/2016 z dnia 11052016 Zamawiający: Espeo Software Sp z oo Adres:
Ruch jednostajnie zmienny prostoliniowy
Ruch jednostajnie zmienny prostoliniowy Przyspieszenie w ruchu jednostajnie zmiennym prostoliniowym Jest to taki ruch, w którym wektor przyspieszenia jest stały, co do wartości (niezerowej), kierunku i
Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu - metodologia badań
Raport 1/2015 Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu - metodologia badań autor: Michał Osmoła INIME Instytut nauk informatycznych i matematycznych z zastosowaniem
Funkcjonowanie systemu antyplagiatowego (OSA) na Uniwersytecie Jagiellońskim
Funkcjonowanie systemu antyplagiatowego (OSA) na Uniwersytecie Jagiellońskim dr Agnieszka Kowalska Pełnomocnik Rektora ds. wprowadzenia systemu antyplagiatowego w Uniwersytecie Jagiellońskim Otwarty
Metody nadzorowane w ujednoznacznianiu sensów s lów korpusu ekonomicznego
Metody nadzorowane w ujednoznacznianiu sensów s lów korpusu ekonomicznego Lukasz Kobyliński Instytut Podstaw Informatyki Polskiej Akademii Nauk ul. J. K. Ordona 21, 01-237 Warszawa 21 listopada 2011 Lukasz
Liczba zadań a rzetelność testu na przykładzie testów biegłości językowej z języka angielskiego
Ewaluacja biegłości językowej Od pomiaru do sztuki pomiaru Liczba zadań a rzetelność testu na przykładzie testów biegłości językowej z języka angielskiego Tomasz Żółtak Instytut Badań Edukacyjnych oraz
Metody zbiorów przybliżonych w uczeniu się podobieństwa z wielowymiarowych zbiorów danych
Metody zbiorów przybliżonych w uczeniu się podobieństwa z wielowymiarowych zbiorów danych WMIM, Uniwersytet Warszawski ul. Banacha 2, 02-097 Warszawa, Polska andrzejanusz@gmail.com 13.06.2013 Dlaczego
Systemy uczące się wykład 2
Systemy uczące się wykład 2 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 19 X 2018 Podstawowe definicje Fakt; Przesłanka; Konkluzja; Reguła; Wnioskowanie. Typy wnioskowania
Polszczyzna i inżynieria lingwistyczna. Autor: Marcin Miłkowski (IFiS PAN)
Polszczyzna i inżynieria lingwistyczna Autor: Marcin Miłkowski (IFiS PAN) 1 Polszczyzna i jej cechy szczególne Polszczyzną posługuje się od 40 do 48 milionów osób: najczęściej używany język zachodniosłowiański
Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych
Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Adam Dudczak Poznańskie Centrum Superkomputerowo-Sieciowe (maneo@man.poznan.pl) I Konferencja Polskie Biblioteki
Wyszukiwanie informacji w internecie. Nguyen Hung Son
Wyszukiwanie informacji w internecie Nguyen Hung Son Jak znaleźć informację w internecie? Wyszukiwarki internetowe: Potężne machiny wykorzystujące najnowsze metody z różnych dziedzin Architektura: trzy
Szkoła Podstawowa Nr 45 z Oddziałami Integracyjnymi im. Jana Pawła II w Białymstoku Przedmiotowy system oceniania JĘZYK ANGIELSKI
Szkoła Podstawowa Nr 45 z Oddziałami Integracyjnymi im. Jana Pawła II w Białymstoku Przedmiotowy system oceniania JĘZYK ANGIELSKI Normy wymagań na oceny w klasie IV Ocena dopuszczająca W zakresie gramatyki
Uczenie nienadzorowane w wydobywaniu znaczeń leksykalnych słów
Uczenie nienadzorowane w wydobywaniu znaczeń leksykalnych słów Bartosz Broda Politechnika Wrocławska Samsung Research Institute Poland 20 maja 2013 Plan prezentacji 1 Wstęp 2 Rozstrzyganie niejednoznaczności
LUBELSKA PRÓBA PRZED MATURĄ 09 MARCA Kartoteka testu. Maksymalna liczba punktów. Nr zad. Matematyka dla klasy 3 poziom podstawowy
Matematyka dla klasy poziom podstawowy LUBELSKA PRÓBA PRZED MATURĄ 09 MARCA 06 Kartoteka testu Nr zad Wymaganie ogólne. II. Wykorzystanie i interpretowanie reprezentacji.. II. Wykorzystanie i interpretowanie
Rozwiazywanie układów równań liniowych. Ax = b
Rozwiazywanie układów równań liniowych Ax = b 1 PLAN REFERATU: Warunki istnienia rozwiazań układu Metoda najmniejszych kwadratów Metoda najmniejszych kwadratów - algorytm rekurencyjny Rozwiazanie układu
Kodowanie i kompresja Streszczenie Studia dzienne Wykład 6
Kodowanie i kompresja Streszczenie Studia dzienne Wykład 6 1 Kody cykliczne: dekodowanie Definicja 1 (Syndrom) Niech K będzie kodem cyklicznym z wielomianem generuja- cym g(x). Resztę z dzielenia słowa
Wymagania edukacyjne z języka angielskiego dla klasy II gimnazjum. Ocenę dopuszczającą otrzymuje uczeń, który: OSIĄGNIĘCIA
Wymagania edukacyjne z języka angielskiego dla klasy II gimnazjum Ocenę dopuszczającą otrzymuje uczeń, który: SŁOWNICTWO zna podstawowe informacje dotyczące użycia struktur gramatycznych z zakresu: konstrukcje:
Konstrukcja biortogonalnych baz dyskryminacyjnych dla problemu klasyfikacji sygnałów. Wit Jakuczun
Konstrukcja biortogonalnych baz dyskryminacyjnych dla problemu klasyfikacji sygnałów Politechnika Warszawska Strona 1 Podstawowe definicje Politechnika Warszawska Strona 2 Podstawowe definicje Zbiór treningowy
Wprowadzenie do metod numerycznych Wykład 3 Metody algebry liniowej I Wektory i macierze
Wprowadzenie do metod numerycznych Wykład 3 Metody algebry liniowej I Wektory i macierze Polsko-Japońska Wyższa Szkoła Technik Komputerowych Katedra Informatyki Stosowanej Spis treści Spis treści 1 Wektory
P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H
W O J S K O W A A K A D E M I A T E C H N I C Z N A W Y D Z I A Ł E L E K T R O N I K I Drukować dwustronnie P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H Grupa... Data wykonania
Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta
Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta www.michalbereta.pl Sieci radialne zawsze posiadają jedną warstwę ukrytą, która składa się z neuronów radialnych. Warstwa wyjściowa składa
Problem ujednoznaczniania sensu w kontekście ekstrakcji relacji semantycznych
Problem ujednoznaczniania sensu w kontekście ekstrakcji relacji semantycznych Instytut Podstaw Informatyki Polskiej Akademii Nauk 16 kwietnia 2012 Plan prezentacji Ekstrakcja informacji Zasoby językowe
Załącznik nr 2 Wymagania programowe w klasie V
Załącznik nr 2 Wymagania programowe w klasie V Ocena celująca Ocena bardzo dobra Ocena dobra Ocena dostateczna Ocena dopuszczająca UCZEŃ KOŃCZĄCY KLASĘ PIĄTĄ w zakresie znajomości środków językowych całościowo,
Lokalizacja Oprogramowania
mgr inż. Anton Smoliński anton.smolinski@zut.edu.pl Lokalizacja Oprogramowania 16/12/2016 Wykład 6 Internacjonalizacja, Testowanie, Tłumaczenie Maszynowe Agenda Internacjonalizacja Testowanie lokalizacji
Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35
Statystyka Wykład 7 Magdalena Alama-Bućko 16 kwietnia 2017 Magdalena Alama-Bućko Statystyka 16 kwietnia 2017 1 / 35 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia
KORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.)
KORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.) Pracownia Historii Języka Polskiego XVII i XVIII wieku IJP PAN, Instytut Podstaw Informatyki PAN Podstawowe informacje o projekcie
Uczenie się pojedynczego neuronu. Jeśli zastosowana zostanie funkcja bipolarna s y: y=-1 gdy z<0 y=1 gdy z>=0. Wówczas: W 1 x 1 + w 2 x 2 + = 0
Uczenie się pojedynczego neuronu W0 X0=1 W1 x1 W2 s f y x2 Wp xp p x i w i=x w+wo i=0 Jeśli zastosowana zostanie funkcja bipolarna s y: y=-1 gdy z=0 Wówczas: W 1 x 1 + w 2 x 2 + = 0 Algorytm
Metody klasyfikacji danych - część 1 p.1/24
Metody klasyfikacji danych - część 1 Inteligentne Usługi Informacyjne Jerzy Dembski Metody klasyfikacji danych - część 1 p.1/24 Plan wykładu - Zadanie klasyfikacji danych - Przeglad problemów klasyfikacji
SPECYFIKA PRZYWÓDZTWA EDUKACYJNEGO I KOMPETENCJE POLSKICH DYREKTORÓW
Prezentacja przedstawiona podczas VIII Kongresu Zarządzania Oświatą, OSKKO, Warszawa 25-27.09.2013 www.oskko.edu.pl/kongres/ SPECYFIKA PRZYWÓDZTWA EDUKACYJNEGO I KOMPETENCJE POLSKICH DYREKTORÓW DR ROMAN
KLASYFIKACJA. Słownik języka polskiego
KLASYFIKACJA KLASYFIKACJA Słownik języka polskiego Klasyfikacja systematyczny podział przedmiotów lub zjawisk na klasy, działy, poddziały, wykonywany według określonej zasady Klasyfikacja polega na przyporządkowaniu
Kodowanie i kompresja Tomasz Jurdziński Studia Wieczorowe Wykład Kody liniowe - kodowanie w oparciu o macierz parzystości
Kodowanie i kompresja Tomasz Jurdziński Studia Wieczorowe Wykład 13 1 Kody liniowe - kodowanie w oparciu o macierz parzystości Przykład Różne macierze parzystości dla kodu powtórzeniowego. Co wiemy z algebry
O czym w Sejmie piszczy? Analiza tekstowa przemówień poselskich
O czym w Sejmie piszczy? Analiza tekstowa przemówień poselskich mgr Aleksander Nosarzewski Szkoła Główna Handlowa w Warszawie pod kierunkiem naukowym dr hab. Bogumiła Kamińskiego, prof. SGH Problem Potrzeba
System wspomagania harmonogramowania przedsięwzięć budowlanych
System wspomagania harmonogramowania przedsięwzięć budowlanych Wojciech Bożejko 1 Zdzisław Hejducki 2 Mariusz Uchroński 1 Mieczysław Wodecki 3 1 Instytut Informatyki, Automatyki i Robotyki Politechnika
Wyszukiwanie dokumentów WWW bazujące na słowach kluczowych
Eksploracja zasobów internetowych Wykład 3 Wyszukiwanie dokumentów WWW bazujące na słowach kluczowych mgr inż. Maciej Kopczyński Białystok 2014 Wstęp Wyszukiwanie dokumentów za pomocą słów kluczowych bazujące
SEMANTYCZNE ZNACZNIKOWANIE ARTYKUŁÓW WIKIPEDII SYNSETAMI SŁOWNIKA WORDNETA 1
ZESZYTY NAUKOWE WYDZIAŁU ELEKTRONIKI, TELEKOMUNIKACJI I INFORMATYKI POLITECHNIKI GDAŃSKIEJ Nr 10 Seria:ICT Young 2012 SEMANTYCZNE ZNACZNIKOWANIE ARTYKUŁÓW WIKIPEDII SYNSETAMI SŁOWNIKA WORDNETA 1 Politechnika
ROZKŁAD MATERIAŁU NAUCZANIA KLASA 2, ZAKRES PODSTAWOWY
1 Lekcja organizacyjna. Zapoznanie z programem nauczania i kryteriami wymagań na oceny 2 Trygonometria Funkcje trygonometryczne kąta ostrego w trójkącie prostokątnym 3-4 Trygonometria Funkcje trygonometryczne
W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji.
5 Collocations Związek frazeologiczny (kolokacja), to często używane zestawienie słów. Przykłady: strong tea, weapons of mass destruction, make up. Znaczenie całości wyrażenia, nie zawsze wynika ze znaczeń
Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy
Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy Wykorzystane materiały: Zadanie W dalszej części prezentacji będzie omawiane zagadnienie rozpoznawania twarzy Problem ten można jednak uogólnić
SPIS TREŚCI WSTĘP... 8 1. LICZBY RZECZYWISTE 2. WYRAŻENIA ALGEBRAICZNE 3. RÓWNANIA I NIERÓWNOŚCI
SPIS TREŚCI WSTĘP.................................................................. 8 1. LICZBY RZECZYWISTE Teoria............................................................ 11 Rozgrzewka 1.....................................................
II cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych
II cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych 18-20 maja 2015 roku Politechnika Wrocławska, Centrum Kongresowe,
Analiza dynamiki zjawisk STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 28 września 2018
STATYSTYKA OPISOWA Dr Alina Gleska Instytut Matematyki WE PP 28 września 2018 1 Pojęcie szeregów czasowych i ich składowych SZEREGIEM CZASOWYM nazywamy tablicę, która zawiera ciag wartości cechy uporzadkowanych