Rozdział przedstawia kilka najważniejszych algorytmów rozpoznających znaczenie słów w zależności od użytego kontekstu.
|
|
- Michał Zawadzki
- 8 lat temu
- Przeglądów:
Transkrypt
1 Word Sense Disambiguation I WSTĘP Rozdział przedstawia kilka najważniejszych algorytmów rozpoznających znaczenie słów w zależności od użytego kontekstu. 1. Jaka jest idea rozpoznawania znaczenia słów? - wiele słów ma więcej niż jedno znaczenie - dla słów wieloznacznych, wyjętych z kontekstu, mamy wiele możliwości interpretacji takiego słowa Np angielskie słowo bank : - suchy ląd graniczący z brzegiem rzeki, jeziora lub morza (brzeg) - instytucja finansowa Zadanie: dla danego wieloznacznego słowa w kontekście podjąć decyzję, jakie przypisać mu znaczenie. 2. Typowa konstrukcja problemu w literaturze: - słowo posiada skończoną liczbę znaczeń (źródłem danych może być słownik, tezaurus ) - zadaniem programu jest dokonanie wyboru pomiędzy znaczeniami w przypadku każdorazowego użycia wieloznacznego słowa, w zależności od kontekstu użycia Wady: - brak jednoznaczności definicji słownikowych - słowo bank posiada dwa niezależne znaczenia, co ułatwia zadanie (nie jest to jednak typowy przykład) - słowo title jest typowym przykładem, którego słownikowa definicja zawiera niekonsekwentnie opisane, powiązane ze sobą znaczenia: * Nazwa książki, posągu, sztuki lub utworu muzycznego * Materiał początkowy filmu * Prawo własności (gruntu) *Dokument poświadczający o tym prawie *Wyraz szacunku dodany do nazwiska danej osoby Niekonsekwencje w powyższym opisie: - dwa znaczenia oznaczające prawo własności, rozróżniające to prawo od dokumentu go poświadczającego -z drugiej strony brak rozróżnienia pomiędzy cechą a przedmiotem określającym cechę w pozostałych przypadkach (np. w zdaniu Ten obraz nie ma tytułu. tytuł obrazu może to być jego nazwa nadana przez autora, albo plakietka z nazwą) - oddzielenie znaczenia nazwy filmu od reszty dzieł sztuki (powód: częste występowanie w znaczeniu tytuł filmu )
2 Dla wielu słów, użycie i w związku z tym znaczenie definicji nie są jak pięć kawałków sera, spośród których można wybrać jeden. Bardziej można je porównać do zapiekanki, w której wiele osobnych części da się odróżnić, natomiast mnóstwo z nich tworzy treść nieznanego pochodzenia. BARDZO WAŻNE ZASTOSOWANIE: TRANSLATORY!!!!!!!!!!! - słowo mające wiele różnych znaczeń w jednym języku może w zależności od tych znaczeń mieć różne odpowiedniki w innym języku, co może prowadzić do błędów w tłumaczeniach Np. Bank instytucja finansowa - j. niemiecki: Bank Bank brzeg j. niemiecki: Ufer 3. Inna natura problemu: to samo słowo, inne części mowy. You should butter your toast. (tagging, rozdz. 10) - W pewnym sensie problem rozpoznawania semantycznego słów oraz części mowy należą do tej samej dziedziny. - W praktyce metody stosowane w obu przypadkach są różne: - Lokalna analiza kontekstu sprawdza się w przypadku rozpoznawania części mowy. - Do rozpoznawania znaczenia słów potrzebna jest analiza szerszego kontekstu. 4. Trzy podstawowe podejścia: - supervised disambiguation (na podstawie etykietowanego korpusu) - dictionary-based disambiguation (na podstawie słownika, tezaurusa) - unsupervised disambiguation (na podstawie nieetykietowanego korpusu) II Uwagi wstępne (podstawowe pojęcia) - Nadzorowane i nienadzorowane uczenie (supervised and unsupervised learning) - Nadzorowane: znamy faktyczny status (w tym przypadku etykietę znaczenia) dla każdego kawałka danych, na którym trenujemy program (classification rodział 16) - Nienadzorowane: Nie znamy klasyfikacji danych w treningowej próbce (clustering rozdział 14) - Etykietowane dane są drogie w produkcji. Istnieje potrzeba algorytmu na nieetykietowanych danych. - Rozwiązania hybrydowe: trening startuje od algorytmów dla nadzorowanych danych, następnie przechodzi do nienadzorowanych (semi-supervised learning, bootstraping) - Wykorzystanie tłumaczeń tekstów lub słowników językowych jako etykietowanych danych.
3 - Pseudowords - Ręczne rozróżnianie znaczeń słów w celu stworzenia danych testowych jest trudne i czasochłonne. - Obejście problemu: tworzenie sztucznych wieloznacznych słów poprzez prostą konkatenację Np. wszystkie wystąpienia słowa banana i door łączy się do testów w słowo banana-door - Dolne i górne oszacowanie wyników - W celu oceny jakości algorytmu należy rozpatrywać jego skuteczność w kontekście użycia do pojedynczego słowa. Rozpoznawanie znaczenia słów bardzo bowiem różni się poziomem trudności. - Górna granica: wyniki osiągane przez człowieka - Dolna granica (base rate klasyfikator większościowy): efektywność najprostszego algorytmu (dopasowanie najczęstszego znaczenia) III Supervised Disambiguation (algorytmy oparte na nadzorowanym uczeniu) 1. Gale (1992) - algorytm oparty na klasyfikacji Bayesowskiej - traktuje kontekst zdarzenia jako bag of words - BoW worek ze słowami - zbiera informacje z całego kontekstu (ze wszystkich słów) 2. Brown (1991) - algorytm oparty na teorii informacji - bierze pod uwagę jedynie specjalną cechę, która niesie ze sobą informację o znaczeniu słowa, tzw. informant Manning: 7.1 Ad. 1 Klasyfikator Bayesowski: - Bayes decision rule Sposób na wyliczenie P(sk c) - Pominięcie P(c) - Wyliczenie s Zalety Naive Bayes: efektywność i zdolność szacowania z dużej ilości cech (wielu słów w kontekście) - Naive Bayes Assumption (założenie): wszystkie słowa vj są niezależne Dwie konsekwencje założenia: struktura i porządek słów wewnątrz kontekstu są ignorowane (bag of words); nie jest prawdą, że słowa są niezależne (np. president election > president poet) - Pomimo tego bardzo dobre wyniki (po części z powodu prawidłowych decyzji pomimo błędnej estymacji prawdopodobieństw)
4 - Decision Rule for Naive Bayes P(vj sk) I P(sk) - Cały algorytm Figure 7.1 Ad. 2 Podejście oparte na teorii informacji - Klasyfikator Bayesowiski używał wszystkich słów okna kontekstu w celu znalezienia znaczenia słowa. Algorytm oparty na teorii informacji próbuje znaleźć pojedynczą cechę w kontekście, która wiarygodnie wskazuje, który sens wieloznacznego słowa został użyty ( indicator - wskaźnik). - Przykład: Prendre to take; to make. Prendre une mesure take a measure (mierzyć) Prendre une de cision make a decision (podjąć decyzję) Pozostałe przykłady tabela algorytm Flip-Flop (Figure 7.2) - miara wzajemnej informacji (rozdz ) - przykład z Take i make Odszukanie znaczenia: - Dla zdarzenia wieloznacznego słowa, znajdź wartość xi wskaźnika - Jeśli xi jest w zbiorze Q1, przypisz znaczenie 1, jeśli w Q2, znaczenie 2 - Przykład stworzenia dwóch klas dla tego samego znaczenia (many-to-one mapping from labels to senses) IV Szukanie znaczenia oparte na słownikach 1. Lesk (1986) - bezpośrednie wykorzystanie definicji słownikowych - przykład dla słowa cone (szyszka, stożek) - wyjaśnienie algorytmu - słaba skuteczność (między 50% a 70%) -poprawki: kilkukrotna iteracja algorytmu (zamiast sumy Evj bierze pod uwagę tylko znaczenia wybrane przez poprzednią iterację) 2. Yarowsky (1992) - wykorzystanie tezaurusa Rogeta z 1946 (podział znaczeń na kategorie subject codes) - wykorzystanie Naive Bayes do aktualizacji danych - podstawowa konkluzja w tezaurusowych algorytmach: semantyczna kategoria słów zawartych w danym kontekście rzutuje na semantyczną kategorię całego kontekstu, co pomaga w dobraniu znaczeń poszczególnych słów, jeśli ustalimy kategorię kontekstu -przedstawienie algorytmu -50% trafności, ale dla trudnych słów
5 - wady: kategoryzacja często niewłaściwa dla dziedziny dokumentu (przykład: mysz zwierzę i urządzenie komputerowe); starzenie się tezaurusa - algorytm Yarowskiego dodaje słowa do kategorii Ti jeśli pojawiają się często w danym kontekście (np. Navratilova często pojawia się w kontekście sportowym) - w tym celu algorytm używa założenie Naive Bayes, liczy dla każdej pary kontekst kategoria prawdopodobieństwo P(Tl ci) przedstawienie algorymu Figure problem: topic-independent distinctions 3. Dagan, Itai (1994) algorytm oparty na dwujęzycznym korpusie - omówienie tabelki - wyjaśnienie algorytmu
Word sense disambiguation dokończenie
Word sense disambiguation dokończenie 1. Krótkie przypomnienie: a) Podejście intuicyjne : podział słowa na znaczenia według słownika oraz przypisywanie każdemu wystąpieniu tego słowa jednego ze znaczeń
EmotiWord, semantyczne powiązanie i podobieństwo, odległość znaczeniowa
, semantyczne powiązanie i podobieństwo, odległość Projekt przejściowy ARR Politechnika Wrocławska Wydział Elektroniki Wrocław, 22 października 2013 Spis treści 1 językowa 2, kryteria 3 Streszczenie artykułu
Propensity score matching (PSM)
Propensity score matching (PSM) Jerzy Mycielski Uniwersytet Warszawski Maj 2010 Jerzy Mycielski (Uniwersytet Warszawski) Propensity score matching (PSM) Maj 2010 1 / 18 Badania ewaluacyjne Ocena wpływu
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
Metody probabilistyczne klasyfikatory bayesowskie
Konwersatorium Matematyczne Metody Ekonomii narzędzia matematyczne w eksploracji danych First Prev Next Last Go Back Full Screen Close Quit Metody probabilistyczne klasyfikatory bayesowskie Wykład 8 Marcin
Lokalizacja Oprogramowania
mgr inż. Anton Smoliński anton.smolinski@zut.edu.pl Lokalizacja Oprogramowania 16/12/2016 Wykład 6 Internacjonalizacja, Testowanie, Tłumaczenie Maszynowe Agenda Internacjonalizacja Testowanie lokalizacji
AUTOMATYKA INFORMATYKA
AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław Kowalczuk Inteligentne wydobywanie informacji z internetowych serwisów
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Seminarium przetwarzania języka naturalnego Mateusz Kopeć Instytut Podstaw Informatyki Polskiej Akademii Nauk 6 lutego 2012 Plan 1 Zadanie
Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18
Eksploracja Danych wykład 4 Sebastian Zając WMP.SNŚ UKSW 10 maja 2017 Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja 2017 1 / 18 Klasyfikacja danych Klasyfikacja Najczęściej stosowana (najstarsza)
komputery? Andrzej Skowron, Hung Son Nguyen Instytut Matematyki, Wydział MIM, UW
Czego moga się nauczyć komputery? Andrzej Skowron, Hung Son Nguyen son@mimuw.edu.pl; skowron@mimuw.edu.pl Instytut Matematyki, Wydział MIM, UW colt.tex Czego mogą się nauczyć komputery? Andrzej Skowron,
ALGORYTM RANDOM FOREST
SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM
KATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12:
KATEDRA SYSTEMÓW MULTIMEDIALNYCH Inteligentne systemy decyzyjne Ćwiczenie nr 12: Rozpoznawanie mowy z wykorzystaniem ukrytych modeli Markowa i pakietu HTK Opracowanie: mgr inż. Kuba Łopatka 1. Wprowadzenie
Pattern Classification
Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors
Metody klasyfikacji danych - część 1 p.1/24
Metody klasyfikacji danych - część 1 Inteligentne Usługi Informacyjne Jerzy Dembski Metody klasyfikacji danych - część 1 p.1/24 Plan wykładu - Zadanie klasyfikacji danych - Przeglad problemów klasyfikacji
Stanisław Cichocki Natalia Nehrebecka. Wykład 7
Stanisław Cichocki Natalia Nehrebecka Wykład 7 1 1. Metoda Największej Wiarygodności MNW 2. Założenia MNW 3. Własności estymatorów MNW 4. Testowanie hipotez w MNW 2 1. Metoda Największej Wiarygodności
Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski
Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:
Hierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
Widzenie komputerowe (computer vision)
Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja
SPOTKANIE 2: Wprowadzenie cz. I
Wrocław University of Technology SPOTKANIE 2: Wprowadzenie cz. I Piotr Klukowski Studenckie Koło Naukowe Estymator piotr.klukowski@pwr.edu.pl 17.10.2016 UCZENIE MASZYNOWE 2/27 UCZENIE MASZYNOWE = Konstruowanie
Uniwersytet w Białymstoku Wydział Ekonomiczno-Informatyczny w Wilnie SYLLABUS na rok akademicki 2012/2013 http://www.wilno.uwb.edu.
SYLLABUS na rok akademicki 01/013 Tryb studiów Studia stacjonarne Kierunek studiów Informatyka Poziom studiów Pierwszego stopnia Rok studiów/ semestr /3 Specjalność Bez specjalności Kod katedry/zakładu
9. Praktyczna ocena jakości klasyfikacji
Algorytmy rozpoznawania obrazów 9. Praktyczna ocena jakości klasyfikacji dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Zbiór uczacy i zbiór testowy 1. Zbiór uczacy służy do konstrukcji (treningu)
Kombinacja jądrowych estymatorów gęstości w klasyfikacji - testy na sztucznych danych
Kombinacja jądrowych estymatorów gęstości w klasyfikacji - testy na sztucznych danych Mateusz Kobos, 25.11.2009 Seminarium Metody Inteligencji Obliczeniowej 1/25 Spis treści Dolne ograniczenie na wsp.
Rozdział 5: Zarządzanie testowaniem. Pytanie 1
Pytanie 1 Dlaczego niezależne testowanie jest ważne: A) Niezależne testowanie jest w zasadzie tańsze niż testowanie własnej pracy B) Niezależne testowanie jest bardziej efektywne w znajdywaniu defektów
Wprowadzenie do uczenia maszynowego
Wprowadzenie do uczenia maszynowego Agnieszka Ławrynowicz 12 stycznia 2017 Co to jest uczenie maszynowe? dziedzina nauki, która zajmuje się sprawianiem aby komputery mogły uczyć się bez ich zaprogramowania
Kontekstowe wskaźniki efektywności nauczania - warsztaty
Kontekstowe wskaźniki efektywności nauczania - warsztaty Przygotowała: Aleksandra Jasińska (a.jasinska@ibe.edu.pl) wykorzystując materiały Zespołu EWD Czy dobrze uczymy? Metody oceny efektywności nauczania
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
O czym w Sejmie piszczy? Analiza tekstowa przemówień poselskich
O czym w Sejmie piszczy? Analiza tekstowa przemówień poselskich mgr Aleksander Nosarzewski Szkoła Główna Handlowa w Warszawie pod kierunkiem naukowym dr hab. Bogumiła Kamińskiego, prof. SGH Problem Potrzeba
Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych
Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław
Analiza stanów gry na potrzeby UCT w DVRP
Analiza stanów gry na potrzeby UCT w DVRP Seminarium IO na MiNI 04.11.2014 Michał Okulewicz based on the decision DEC-2012/07/B/ST6/01527 Plan prezentacji Definicja problemu DVRP DVRP na potrzeby UCB Analiza
mgr inż. Magdalena Deckert Poznań, r. Metody przyrostowego uczenia się ze strumieni danych.
mgr inż. Magdalena Deckert Poznań, 30.11.2010r. Metody przyrostowego uczenia się ze strumieni danych. Plan prezentacji Wstęp Concept drift i typy zmian Algorytmy przyrostowego uczenia się ze strumieni
Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,
Klasyfikator Jedną z najistotniejszych nieparametrycznych metod klasyfikacji jest metoda K-najbliższych sąsiadów, oznaczana przez K-NN. W metodzie tej zaliczamy rozpoznawany obiekt do tej klasy, do której
Klasyfikacja naiwny Bayes
Klasyfikacja naiwny Bayes LABORKA Piotr Ciskowski NAIWNY KLASYFIKATOR BAYESA wyjaśnienie Naiwny klasyfikator Bayesa żródło: Internetowy Podręcznik Statystyki Statsoft dane uczące 2 klasy - prawdopodobieństwo
Zastosowanie metod statystycznych do ekstrakcji słów kluczowych w kontekście projektu LT4eL. Łukasz Degórski
Zastosowanie metod statystycznych do ekstrakcji słów kluczowych w kontekście projektu LT4eL Łukasz Degórski LT4eL Language Technology for e-learning Wykorzystanie narzędzi językowych oraz technik sieci
W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji.
5 Collocations Związek frazeologiczny (kolokacja), to często używane zestawienie słów. Przykłady: strong tea, weapons of mass destruction, make up. Znaczenie całości wyrażenia, nie zawsze wynika ze znaczeń
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny
Web page language identification based on URLs. Eda Baykan Monika Henzinger Ingmar Weber EPFL Lab. of Theory And Applications of Algorithms VLDB 08
Web page language identification based on URLs Eda Baykan Monika Henzinger Ingmar Weber EPFL Lab. of Theory And Applications of Algorithms VLDB 08 Plan Korzyści Trudności Powiązane prace Wymagania systemowe
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Elementy nieprzystające Definicja odrzucania Klasyfikacja
Aproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
Tłumaczenie maszynowe. Zasady działania. Autorzy: Josef van Genabith (DFKI), Krzysztof Łoboda (Uniwersytet Jagielloński)
Tłumaczenie maszynowe. Zasady działania Autorzy: Josef van Genabith (DFKI), Krzysztof Łoboda (Uniwersytet Jagielloński) 1 Tłumaczenie maszynowe Zarys prezentacji: Uzasadnienie dla technologii MT: liczba
Numeracja dla rejestrów zewnętrznych
Numeracja dla rejestrów zewnętrznych System ZPKSoft Doradca udostępnia możliwość ręcznego nadawania numerów dla procedur i dokumentów zgodnie z numeracją obowiązującą w rejestrach zewnętrznych, niezwiązanych
Systemy agentowe. Uwagi organizacyjne i wprowadzenie. Jędrzej Potoniec
Systemy agentowe Uwagi organizacyjne i wprowadzenie Jędrzej Potoniec Kontakt mgr inż. Jędrzej Potoniec Jedrzej.Potoniec@cs.put.poznan.pl http://www.cs.put.poznan.pl/jpotoniec https://github.com/jpotoniec/sa
Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej. Adam Żychowski
Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej Adam Żychowski Definicja problemu Każdy z obiektów może należeć do więcej niż jednej kategorii. Alternatywna definicja Zastosowania
Rozpoznawanie obrazów
Rozpoznawanie obrazów Laboratorium Python Zadanie nr 2 κ-nn i Naive Bayes autorzy: M. Zięba, J.M. Tomczak, A. Gonczarek, S. Zaręba, J. Kaczmar Cel zadania Celem zadania jest implementacja klasyfikatorów
Definicja testu psychologicznego
Definicja testu psychologicznego Badanie testowe to taka sytuacja, w której osoba badana uczestniczy dobrowolnie, świadoma celu jakim jest jej ocena. Jest to sytuacja tworzona specjalnie dla celów diagnostycznych,
Trafność egzaminów w kontekście metody EWD
Trafność egzaminów w kontekście metody EWD Aleksandra Jasińska (a.jasinska@ibe.edu.pl) Tomasz Żółtak (t.zoltak@ibe.edu.pl) Instytut Badań Edukacyjnych ul. Górczewska 8 01-180 Warszawa JESIENNA SZKOŁA EWD
w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą
Teoria systemów uczacych się i wymiar Vapnika-Chervonenkisa
Systemy uczace się 2009 1 / 32 Teoria systemów uczacych się i wymiar Vapnika-Chervonenkisa Hung Son Nguyen Wydział Matematyki, Informatyki i Mechaniki Uniwersytet Warszawski email: son@mimuw.edu.pl Grudzień
Psychometria PLAN NAJBLIŻSZYCH WYKŁADÓW. Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. TEN SLAJD JUŻ ZNAMY
definicja rzetelności błąd pomiaru: systematyczny i losowy Psychometria Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. rozkład X + błąd losowy rozkład X rozkład X + błąd systematyczny
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ: GH-P2 KWIECIEŃ 2017 Zadanie 1. (0 1) FP Zadanie 2. (0 1) B Zadanie 3. (0 1)
Analiza danych tekstowych i języka naturalnego
Kod szkolenia: Tytuł szkolenia: ANA/TXT Analiza danych tekstowych i języka naturalnego Dni: 3 Opis: Adresaci szkolenia Dane tekstowe stanowią co najmniej 70% wszystkich danych generowanych w systemach
Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego
Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego Dorota Witkowska Szkoła Główna Gospodarstwa Wiejskiego w Warszawie Wprowadzenie Sztuczne
Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne)
Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne) Tadeusz Pankowski www.put.poznan.pl/~tadeusz.pankowski Klasyfikacja i predykcja. Odkrywaniem reguł klasyfikacji nazywamy proces znajdowania
5. WNIOSKOWANIE PSYCHOMETRYCZNE
5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania
EGZAMIN MATURALNY W ROKU SZKOLNYM 2014/2015
EGZAMIN MATURALNY W ROKU SZKOLNYM 2014/2015 FORMUŁA DO 2014 ( STARA MATURA ) INFORMATYKA POZIOM PODSTAWOWY ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ MIN-P1, P2 MAJ 2015 Uwaga: Akceptowane są wszystkie odpowiedzi
2. Empiryczna wersja klasyfikatora bayesowskiego
Algorytmy rozpoznawania obrazów 2. Empiryczna wersja klasyfikatora bayesowskiego dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Brak pełnej informacji probabilistycznej Klasyfikator bayesowski
Stan dotychczasowy. OCENA KLASYFIKACJI w diagnostyce. Metody 6/10/2013. Weryfikacja. Testowanie skuteczności metody uczenia Weryfikacja prosta
Stan dotychczasowy OCENA KLASYFIKACJI w diagnostyce Wybraliśmy metodę uczenia maszynowego (np. sieć neuronowa lub drzewo decyzyjne), która będzie klasyfikować nieznane przypadki Na podzbiorze dostępnych
RAPORT z diagnozy umiejętności matematycznych
RAPORT z diagnozy umiejętności matematycznych przeprowadzonej w klasach czwartych szkoły podstawowej 1 Analiza statystyczna Wskaźnik Liczba uczniów Liczba punktów Łatwość zestawu Wyjaśnienie Liczba uczniów,
Testowanie modeli predykcyjnych
Testowanie modeli predykcyjnych Wstęp Podczas budowy modelu, którego celem jest przewidywanie pewnych wartości na podstawie zbioru danych uczących poważnym problemem jest ocena jakości uczenia i zdolności
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018
EGZMIN W KLSIE TRZECIEJ GIMNZJUM W ROKU SZKOLNYM 2017/2018 CZĘŚĆ 1. JĘZYK POLSKI ZSDY OCENINI ROZWIĄZŃ ZDŃ RKUSZ GH-P8 KWIECIEŃ 2018 Zadanie 1. (0 1) Zadanie 2. (0 1) C Zadanie 3. (0 1) 3. Świadomość językowa.
Malware + Machine Learning (ML) - czy to ma sens? Kamil Frankowicz
Malware + Machine Learning (ML) - czy to ma sens? Kamil Frankowicz SECURE 2018, Warszawa $whoami Kamil Frankowicz Senior Security Engineer @ CERT.pl Wyszukiwanie & analiza podatności Analiza złośliwego
Ewaluacja w polityce społecznej
Ewaluacja w polityce społecznej Dane i badania w kontekście ewaluacji Dr hab. Ryszard Szarfenberg Instytut Polityki Społecznej UW rszarf.ips.uw.edu.pl/ewalps/dzienne/ Rok akademicki 2018/2019 Główny problem
Elementy kognitywistyki III: Modele i architektury poznawcze
Elementy kognitywistyki III: Modele i architektury poznawcze Wykład VII: Modelowanie uczenia się w sieciach neuronowych Uczenie się sieci i trening nienaruszona struktura sieci (z pewnym ale ) nienaruszone
Jazda autonomiczna Delphi zgodna z zasadami sztucznej inteligencji
Jazda autonomiczna Delphi zgodna z zasadami sztucznej inteligencji data aktualizacji: 2017.10.11 Delphi Kraków Rozwój jazdy autonomicznej zmienia krajobraz technologii transportu w sposób tak dynamiczny,
PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA ANGIELSKIEGO KLASY IV-VI SZKOŁA PODSTAWOWA NR 43 w BIAŁYMSTOKU
PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA ANGIELSKIEGO KLASY IV-VI SZKOŁA PODSTAWOWA NR 43 w BIAŁYMSTOKU I. ZASADY OGÓLNE Przedmiotowy System Nauczania ma na celu: 1) bieżące i systematyczne obserwowanie
I. Raport wykonywalności projektu
Spis treści: " I. " Raport wykonywalności projektu..." str. 2 " II. " Glosariusz projektu... " str. 4 " III. " Diagramy relacji encja-związek..." str. 6 " IV. " Diagramy przepływu danych..." str. 7 " V.
JĘZYK NIEMIECKI liceum
JĘZYK NIEMIECKI liceum Przedmiotowy system oceniania i wymagania edukacyjne Nauczyciel: mgr Teresa Jakubiec 1. Przedmiotem oceniania w całym roku szkolnym są: - wiadomości - umiejętności - wkład pracy,
Wstęp do przetwarzania języka naturalnego. Wykład 13 Podsumowanie i spojrzenie w przyszłość
Wstęp do przetwarzania języka naturalnego Wykład 13 Podsumowanie i spojrzenie w przyszłość Wojciech Czarnecki 22 stycznia 2014 Section 1 Zarys kursu Wyrażenia regularne Zarys kursu Wyrażenia regularne
System oceniania z języka angielskiego w klasach 1-3 szkoły podstawowej
System oceniania z języka angielskiego w klasach 1-3 szkoły podstawowej W klasach 1-3 praca uczniów na lekcjach języka angielskiego jest oceniana opisowo. Za wykonane zadania pisemne i ustne uczeń otrzymuje
1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN. Agenda
Sieci neuropodobne 1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN Agenda Trochę neurobiologii System nerwowy w organizmach żywych tworzą trzy
KRYTERIA OCENIANIA Z JĘZYKA ANGIELSKIEGO DLA KLASY VI
Ocena celująca KRYTERIA OCENIANIA Z JĘZYKA ANGIELSKIEGO DLA KLASY VI Poziom kompetencji językowej ucznia wykracza poza wiadomości i umiejętności przewidziane dla klasy szóstej. - uczeń potrafi przyjąć
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P2 KWIECIEŃ 2016 Zadanie 1. (0 1) 9) wyciąga wnioski wynikające z przesłanek
WYKŁAD 4. Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie. autor: Maciej Zięba. Politechnika Wrocławska
Wrocław University of Technology WYKŁAD 4 Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie autor: Maciej Zięba Politechnika Wrocławska Klasyfikacja Klasyfikacja (ang. Classification):
SZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA WYKŁAD 4. UCZENIE SIĘ INDUKCYJNE Częstochowa 24 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska WSTĘP Wiedza pozyskana przez ucznia ma charakter odwzorowania
Mówienie. Rozumienie ze słuchu
Kryteria oceniania z języka angielskiego Ocena celująca Stopień CELUJĄCY otrzymuje uczeń, który spełnia wszystkie kryteria potrzebne na ocenę bardzo dobrą, ponadto opanował wiadomości i umiejętności wykraczające
W wyniku ewaluacji Wewnątrzszkolnego Systemu Oceniania dokonałyśmy uszczegółowienia rocznej oceny opisowej.
W wyniku ewaluacji Wewnątrzszkolnego Systemu Oceniania dokonałyśmy uszczegółowienia rocznej oceny opisowej. Kl. I Poziom doskonały Uczeń wypowiada się samorzutnie na dany temat, przeczytanego tekstu oraz
Wpływ automatycznego tłumaczenia na wyniki automatycznej identyfikacji cha- rakteru opinii konsumenckich. 1 Wstęp
mgr Katarzyna Wójcik mgr Janusz Tuchowski Uniwersytet Ekonomiczny w Krakowie Wpływ automatycznego tłumaczenia na wyniki automatycznej identyfikacji charakteru opinii konsumenckich. 1 Wstęp Analiza opinii
Metody zbiorów przybliżonych w uczeniu się podobieństwa z wielowymiarowych zbiorów danych
Metody zbiorów przybliżonych w uczeniu się podobieństwa z wielowymiarowych zbiorów danych WMIM, Uniwersytet Warszawski ul. Banacha 2, 02-097 Warszawa, Polska andrzejanusz@gmail.com 13.06.2013 Dlaczego
Klucz do zadań zamkniętych. Cztery pory roku. zadania 1 C 2 B 3 B 4 D 5 A 6 C 7 D 8 B 9 C 10 A 11 D 12 A 13 D 14 B 15 C 16 D 17 A 18 B 19 C 20 D
Klucz do zadań zamkniętych Cztery pory roku za każdą poprawną odpowiedź 1 pkt Odpowiedź 1 C 2 B 3 B 4 D 5 A 6 C 7 D 8 B 9 C 10 A 11 D 12 A 13 D 14 B 15 C 16 D 17 A 18 B 19 C 20 D Warszawa, 03.10.01r. 21
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P8 KWIECIEŃ 2016 Zadanie 1. (0 1) 2) wyszukuje w wypowiedzi potrzebne informacje
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot
Elementy kognitywistyki II: Sztuczna inteligencja. WYKŁAD XI: Sztuczne sieci neuronowe
Elementy kognitywistyki II: Sztuczna inteligencja WYKŁAD XI: Sztuczne sieci neuronowe [pattern associator], PA struktura: Sieci kojarzące wzorce programowanie: wyjście jednostki = aktywacji sieciowej (N)
PRÓBNY EGZAMIN GIMNAZJALNY Z NOWĄ ERĄ 2016/2017 JĘZYK POLSKI
PRÓBNY EGZAMIN GIMNAZJALNY Z NOWĄ ERĄ 2016/2017 JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ Copyright by Nowa Era Sp. z o.o. Zadanie 1. (0 1) 2) wyszukuje w wypowiedzi potrzebne informacje [ ]. PP Zadanie
Algorytmy metaheurystyczne Wykład 11. Piotr Syga
Algorytmy metaheurystyczne Wykład 11 Piotr Syga 22.05.2017 Drzewa decyzyjne Idea Cel Na podstawie przesłanek (typowo zbiory rozmyte) oraz zbioru wartości w danych testowych, w oparciu o wybrane miary,
Advance Design 2015 / SP2
Advance Design 2015 / SP2 Service Pack 2 do ADVANCE Design 2015 przynosi ponad 150 ulepszeń i poprawek. POLSKIE ZAŁĄCZNIKI KRAJOWE DO EUROKODÓW Advance Design 2015 SP2 umożliwia prowadzenie obliczeń z
Porównywanie populacji
3 Porównywanie populacji 2 Porównywanie populacji Tendencja centralna Jednostki (w grupie) według pewnej zmiennej porównuje się w ten sposób, że dokonuje się komparacji ich wartości, osiągniętych w tej
KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona
KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y 2. Współczynnik korelacji Pearsona 3. Siła i kierunek związku między zmiennymi 4. Korelacja ma sens, tylko wtedy, gdy związek między zmiennymi
JĘZYK ANGIELSKI NA CO ZWRACAMY UWAGĘ OCENIAJĄC : 1.UMIEJĘTNOŚĆ WYPOWIEDZI USTNEJ:
JĘZYK ANGIELSKI NA CO ZWRACAMY UWAGĘ OCENIAJĄC : 1.UMIEJĘTNOŚĆ WYPOWIEDZI USTNEJ: zgodność z tematem wkład pracy, przygotowanie poprawność gramatyczna wymowa - poprawność fonetyczna zasób słownictwa i
Przedmiotowy system oceniania z języka angielskiego w klasach I-III gimnazjum
Przedmiotowy system oceniania z języka angielskiego w klasach I-III gimnazjum - Na początku roku szkolnego nauczyciel zapoznaje uczniów z przedmiotowym systemem oceniania. - Kontrola i ocena stopnia materiału
PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA ANGIELSKIEGO W KLASACH I-III SZKOŁY PODSTAWOWEJ
PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA ANGIELSKIEGO W KLASACH I-III SZKOŁY PODSTAWOWEJ 1. Obszary podlegające ocenianiu słuchanie i słownictwo - stopniowe osłuchanie z dźwiękami i intonacją języka angielskiego
Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU
Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów
SPRAWNOŚĆ MÓWIENIA SPRAWNOŚĆ PISANIA GRAMATYKA I SŁOWNICTWO
OCENA CELUJĄCA uczeń w pełni rozumie wszystkie polecenia i wypowiedzi nauczyciela formułowane w języku niemieckim i poprawnie na nie reaguje,, przeczytanego tekstu określa jego główną myśl, sprawnie wyszukuje
Wymagania edukacyjne niezbędne do uzyskania poszczególnych ocen JĘZYK ANGIELSKI ZAWODOWY - INFORMATYKA KLASA 2 LUB 4
Wymagania edukacyjne niezbędne do uzyskania poszczególnych ocen JĘZYK ANGIELSKI ZAWODOWY - INFORMATYKA KLASA 2 LUB 4 Rok szkolny 2015/2016 Podręcznik: English for Information Technology 1 (Wyd. PEARSON)
Liczba zadań a rzetelność testu na przykładzie testów biegłości językowej z języka angielskiego
Ewaluacja biegłości językowej Od pomiaru do sztuki pomiaru Liczba zadań a rzetelność testu na przykładzie testów biegłości językowej z języka angielskiego Tomasz Żółtak Instytut Badań Edukacyjnych oraz
KRYTERIA OCENIANIA KLASA I KLASA II KLASA III
KRYTERIA OCENIANIA II ETAP EDUKACYJNY - JĘZYK ANGIELSKI KLASA I KLASA II KLASA III DOPUSZCZAJĄCY: rozumie proste polecenia nauczyciela, poparte gestem; rozumie proste zwroty grzecznościowe i proste pytania;
CLUSTERING. Metody grupowania danych
CLUSTERING Metody grupowania danych Plan wykładu Wprowadzenie Dziedziny zastosowania Co to jest problem klastrowania? Problem wyszukiwania optymalnych klastrów Metody generowania: k centroidów (k - means
EGZAMIN MATURALNY 2013 JĘZYK ANGIELSKI
Centralna Komisja Egzaminacyjna w Warszawie EGZAMIN MATURALNY 2013 JĘZYK ANGIELSKI POZIOM ROZSZERZONY Kryteria oceniania odpowiedzi MAJ 2013 ZADANIA OTWARTE Zadanie 1. (0,5 pkt) Przetwarzanie tekstu 1.1.
Matlab podstawy + testowanie dokładności modeli inteligencji obliczeniowej
Matlab podstawy + testowanie dokładności modeli inteligencji obliczeniowej Podstawy matlaba cz.ii Funkcje Dotychczas kod zapisany w matlabie stanowił skrypt który pozwalał na określenie kolejności wykonywania
Jarosław Kuchta Dokumentacja i Jakość Oprogramowania. Wymagania jakości w Agile Programming
Jarosław Kuchta Wymagania jakości w Agile Programming Wady klasycznych metod zapewnienia jakości Duży narzut na dokumentowanie Późne uzyskiwanie konkretnych rezultatów Trudność w odpowiednio wczesnym definiowaniu