Uczenie nienadzorowane Uczenie nadzorowane Algorytmy aproksymacji funkcji. uczenia symbolicznego



Podobne dokumenty
Ćwiczenie nr 2 Zbiory rozmyte logika rozmyta Rozmywanie, wnioskowanie, baza reguł, wyostrzanie

I. LOGICZNE STRUKTURY DRZEWIASTE

Podejmowanie decyzji. Piotr Wachowiak

TEST WIADOMOŚCI: Równania i układy równań

JTW SP. Z OO. Zapytanie ofertowe. Zakup i dostosowanie licencji systemu B2B część 1

Automatyka. Etymologicznie automatyka pochodzi od grec.

Uniwersytet Warszawski Teoria gier dr Olga Kiuila LEKCJA 5

PROJEKTOWANIE SYSTEMÓW LOGISTYCZNYCH PROJEKT SYSTEMY LOGISTYCZNE PODSTAWY TEORETYCZNE

Efektywność nauczania w Gimnazjum w Lutyni

ROZWIĄZANIA ZADAŃ Zestaw P3 Odpowiedzi do zadań zamkniętych

Odpowiedzi i schematy oceniania Arkusz 23 Zadania zamknięte. Wskazówki do rozwiązania. Iloczyn dwóch liczb ujemnych jest liczbą dodatnią, zatem

PRZEDMIOTOWY SYSTEM OCENIANIA Z PRZYRODY KLASA CZWARTA, PIĄTA I SZÓSTA

WYŻSZA SZKOŁA INFORMATYKI STOSOWANEJ I ZARZĄDZANIA

Algorytmy graficzne. Podstawy kompresji danych fragment wykładu. Marcin Wilczewski

Strategia rozwoju kariery zawodowej - Twój scenariusz (program nagrania).

Wdrożenie modułu płatności eservice dla systemu Virtuemart 2.0.x

REGULAMIN SAMORZĄDU UCZNIOWSKIEGO GIMNAZJUM W ZABOROWIE UL. STOŁECZNA 182

MATEMATYKA 9. INSTYTUT MEDICUS Kurs przygotowawczy do matury i rekrutacji na studia medyczne Rok 2017/2018 FUNKCJE WYKŁADNICZE, LOGARYTMY

ZASADY WYPEŁNIANIA ANKIETY 2. ZATRUDNIENIE NA CZĘŚĆ ETATU LUB PRZEZ CZĘŚĆ OKRESU OCENY

Automatyczne przetwarzanie recenzji konsumenckich dla oceny użyteczności produktów i usług

Opracował: mgr inż. Marcin Wieczorek

Przykłady wybranych fragmentów prac egzaminacyjnych z komentarzami Technik ochrony fizycznej osób i mienia 515[01]

Projektowanie bazy danych

KONKURSY MATEMATYCZNE. Treść zadań

PROCEDURA EWALUACJI WEWNĘTRZNEJ W SZKOLE PODSTAWOWEJ IM. JANA PAWŁA II W GRZĘDZICACH

TWIERDZENIE PITAGORASA

Organizator badania biegłości ma wdrożony system zarządzania wg normy PN-EN ISO/IEC 17025:2005.

W. Guzicki Zadanie 23 z Informatora Maturalnego poziom rozszerzony 1

Regulamin konkursu Konkurs z Lokatą HAPPY II edycja

Matematyka:Matematyka I - ćwiczenia/granice funkcji

Przedmiotowe zasady oceniania. zgodne z Wewnątrzszkolnymi Zasadami Oceniania. obowiązującymi w XLIV Liceum Ogólnokształcącym.

Zakres pomiaru (Ω) Rozdzielczość (Ω) Dokładność pomiaru

Wniosek o ustalenie warunków zabudowy

Test F- Snedecora. będzie zmienną losową chi-kwadrat o k 1 stopniach swobody a χ

PODSTAWY DZIAŁANIA UKŁADÓW CYFROWYCH

Harmonogramowanie projektów Zarządzanie czasem

Programowanie dynamiczne

ASD - ćwiczenia III. Dowodzenie poprawności programów iteracyjnych. Nieformalnie o poprawności programów:

PRZETWORNIK NAPIĘCIE - CZĘSTOTLIWOŚĆ W UKŁADZIE ILORAZOWYM

Sztuczna inteligencja : Naiwny klasyfikator Bayesa

Pacjenci w SPZZOD w latach

Przykłady wybranych fragmentów prac egzaminacyjnych z komentarzami Technik technologii odzieży 311[34]

Statystyczna analiza danych w programie STATISTICA. Dariusz Gozdowski. Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW

WYMAGANIA EDUKACYJNE SPOSOBY SPRAWDZANIA POSTĘPÓW UCZNIÓW WARUNKI I TRYB UZYSKANIA WYŻSZEJ NIŻ PRZEWIDYWANA OCENY ŚRÓDROCZNEJ I ROCZNEJ

Zasady rekrutacji, kryteria i warunki przyjęć do Przedszkola Samorządowego nr 25 w Kielcach

Automatyka Treść wykładów: Literatura. Wstęp. dr inż. Szymon Surma pok. 202, tel.

Zarządzanie projektami. wykład 1 dr inż. Agata Klaus-Rosińska

RAPORT z diagnozy Matematyka na starcie

Plan połączenia poprzez przejęcie. SYNOPTIS PHARMA Sp. z o.o. oraz BS - SUPLE Sp. z o.o.

ANALOGOWE UKŁADY SCALONE

1 Granice funkcji. Definicja 1 (Granica w sensie Cauchy ego). Mówimy, że liczba g jest granicą funkcji f(x) w punkcie x = a, co zapisujemy.

REGULAMIN WSPARCIA FINANSOWEGO CZŁONKÓW. OIPiP BĘDĄCYCH PRZEDSTAWICIELAMI USTAWOWYMI DZIECKA NIEPEŁNOSPRAWNEGO LUB PRZEWLEKLE CHOREGO

Politechnika Warszawska Wydział Matematyki i Nauk Informacyjnych ul. Koszykowa 75, Warszawa

Zagadnienia transportowe

Przyznanie niemieckiej emerytury

TEORIA GIER W EKONOMII WYKŁAD 1: GRY W POSTACI EKSTENSYWNEJ I NORMALNEJ

Uchwała Nr XXII / 242 / 04 Rady Miejskiej Turku z dnia 21 grudnia 2004 roku

Logika I. Wykład 2. Działania na zbiorach

Wiedza niepewna i wnioskowanie (c.d.)

ZASADY REKLAMOWANIA USŁUG BANKOWYCH

Przedmiotowe Zasady Oceniania

REGULAMIN PRZEPROWADZANIA OCEN OKRESOWYCH PRACOWNIKÓW NIEBĘDĄCYCH NAUCZYCIELAMI AKADEMICKIMI SZKOŁY GŁÓWNEJ HANDLOWEJ W WARSZAWIE

ARKUSZ OCENY OKRESOWEJ DLA STANOWISK PRACOWNICZYCH

CZĘŚĆ A. urodzony(a) w... (miejsce zatrudnienia, stanowisko lub funkcja)

Załącznik nr 2 Testy logiczne służące sprawdzeniu jakości danych uczestników projektów współfinansowanych z EFS

Bazy danych. Andrzej Łachwa, UJ, /15

Tworzenie modelu obiektowego

Przygotowały: Magdalena Golińska Ewa Karaś

Ćwiczenie: "Ruch harmoniczny i fale"

Podstawy programowania

Zawarta w Warszawie w dniu.. pomiędzy: Filmoteką Narodową z siedzibą przy ul. Puławskiej 61, Warszawa, NIP:, REGON:.. reprezentowaną przez:

3. BADA IE WYDAJ OŚCI SPRĘŻARKI TŁOKOWEJ

Regulamin. Rady Nadzorczej Spółdzielni Mieszkaniowej "Doły -Marysińska" w Łodzi

Wolontariat nie ma granic

PROGRAM ZAPEWNIENIA I POPRAWY JAKOŚCI AUDYTU WEWNĘTRZNEGO

Sprawozdanie z działalności Rady Nadzorczej TESGAS S.A. w 2008 roku.

Placówka: Miejskie Przedszkole Nr 35 Miejscowość: Ruda Śląska Data ewaluacji: od do Ankieta dla rodziców

PROGRAM LIFELONG LEARNING ERASMUS

Szkoła Podstawowa nr 1 w Sanoku. Raport z ewaluacji wewnętrznej

POSTANOWIENIE. SSN Jerzy Kwaśniewski

UMOWA SPRZEDAŻY NR. 500 akcji stanowiących 36,85% kapitału zakładowego. AGENCJI ROZWOJU REGIONALNEGO ARES S.A. w Suwałkach

Rekrutacją do klas I w szkołach podstawowych w roku szkolnym 2015/2016 objęte są dzieci, które w roku 2015 ukończą:

Zarządzenie nr 538 Wójta Gminy Zarszyn z dnia 9 czerwca 2014 r.

Wykład 4 Wybrane zagadnienia programowania w C++

Regulamin Zarządu Pogórzańskiego Stowarzyszenia Rozwoju

Wyklad 1. Analiza danych za pomocą pakietu SAS. Obiekty i zmienne. Rodzaje zmiennych

Stowarzyszenie Lokalna Grupa Działania EUROGALICJA Regulamin Rady

Poniżej przedstawiono przykłady zestawień wyników pomiarów i analiz z wartościami granicznymi i dopuszczalnymi: Przykład 1

14.Rozwiązywanie zadań tekstowych wykorzystujących równania i nierówności kwadratowe.

Opis programu do wizualizacji algorytmów z zakresu arytmetyki komputerowej

NOWELIZACJA USTAWY PRAWO O STOWARZYSZENIACH

Temat: Mnożenie liczby całej przez ułamek. Obliczanie ułamka z danej liczby.

Komentarz technik ochrony fizycznej osób i mienia 515[01]-01 Czerwiec 2009

Techniki korekcyjne wykorzystywane w metodzie kinesiotapingu

PRZYGOTOWANIE NAUCZYCIELA DO LEKCJI I. J. P. L.

Lista standardów w układzie modułowym

Standardy i kryteria oceny jakości programów

40. Międzynarodowa Olimpiada Fizyczna Meksyk, lipca 2009 r. ZADANIE TEORETYCZNE 2 CHŁODZENIE LASEROWE I MELASA OPTYCZNA

ZASADY PROWADZENIA CERTYFIKACJI FUNDUSZY EUROPEJSKICH I PRACOWNIKÓW PUNKTÓW INFORMACYJNYCH

Bezpieczny wypoczynek w świetle Ustawy o usługach turystycznych. Katarzyna Hetman, Wielkopolska Izba Turystyczna

Transkrypt:

nienadzorowane nadzorowane Algorytmy aproksymacji funkcji Algorytmy uczenia symbolicznego nadzorowane (np. algorytm propagacji wstecz) polega na podaniu systemowi par wejście-wyjście w postaci zbioru treningowego. nienadzorowane oznacza typ uczenia maszynowego, w którym system nie otrzymuje informacji o poprawnej odpowiedzi. Zamiast par wejściewyjście systemowi przedstawia się zbiór wzorców wejściowych oczekując, że znajdzie wśród nich interesujące wzorce, regularności lub podgrupy (klastry). Algorytmy aproksymacji funkcji Algorytmy uczenia symbolicznego Algorytm aproksymacji funkcji polega na wyznaczeniu funkcji, której argumentami są dane wejściowe z przykładów, a wartościami dane wyjściowe; funkcja ta ma aproksymować zbiór uczący, tak aby obliczać sensowne wartości dla innych danych wejściowych. uczenia symbolicznego Obejmują techniki statystyczne i konekcjonistyczne uczenia maszynowego. oznacza uczenie się z przykładów, instancji lub wzorców uczących, w celu wyznaczenia funkcji, której argumentami są dane wejściowe z przykładów, a wartościami dane wyjściowe. Algorytmy uczenia symbolicznego uczą się pojęć ć za pomocą konstrukcji k wyrażenia symbolicznego (np. drzewo decyzyjne) opisującego klasę (lub klasy) obiektów. Wiele takich algorytmów działa w reprezentacjach równoważnych rachunkowi predykatów. uczą się pojęć za pomocą konstrukcji wyrażenia symbolicznego (np. drzewo decyzyjne) opisującego klasę (lub klasy) obiektów; często działa w reprezentacjach równoważnych rachunkowi predykatów. Zakłada się, że funkcja ta będzie aproksymowała (generalizowała) zbiór uczący, tak aby obliczać sensowne wartości dla innych danych wejściowych. Ich zaletą jest względna intuicyjność zarówno w odniesieniu do reprezentacji, jak i otrzymanego rezultatu. 1

Techniki uczenia maszynowego Ogólny model uczącego się agenta indukcyjne Algorytmy genetyczne sieci neuronowych Ogólny model uczącego się agenta indukcyjne Teoria informacji się ogólnego opisu logicznego Teoria uczenia maszynowego wzorzec działania Krytyk sprzężenie zwrotne Element uczący cele uczenia się Generator problemów Agent zmiany wiedza sensory Element wykonawczy efektory środowisko o Składniki elementu wykonawczego 1. Bezpośrednie odwzorowanie stanu bieżącego na akcje 2. Metody wyprowadzenia odpowiednich własności środowiska d i k z zaobserwowanej sekwencji 3. Informacja o tym jak zmienia się środowisko 4. Informacja o skutkach akcji podejmowanych przez agenta 5. Informacja o użyteczności wskazująca, jakie stany środowiska są pożądane 6. Informacja w postaci akcja-ocena wskazująca opłacalność poszczególnych akcji w określonych sytuacjach 7. Cele, które opisują klasy stanów, których osiągnięcie maksymalizuje użyteczność agenta. Sprzężenie zwrotne nadzorowane nienadzorowane Podsumowanie Każdy składnik elementu wykonawczego może być opisany za pomocą funkcji matematycznej. Zatem w ogólności, proces uczenia się można przedstawić jako uczenie się reprezentacji tej funkcji. 2

indukcyjne Dany jest zbiór uczący zawierający pary (, f()) Indukcja: na podstawie zbioru przykładów funkcji f, znajdź funkcję h aproksymującą f. h() h() h() Drzewo decyzyjne na podstawie zbioru własności obiektu lub sytuacji wejściowej generuje odpowiedź tak lub nie. Każdy węzeł drzewa reprezentuje test jednej z wartości podanych własności obiektu. Najczęściej reprezentują one funkcje boolowskie. y dzielimy na pozytywne (tak) i negatywne (nie). Atrybuty Cel: czekać Alter Bar Pt/Sb Głód Klienci Ceny Deszcz Rezerw Typ Czas X1 Kilku $$$ franc. 0-10 X2 Pełno $ tajska 30-60 X3 Kilku $ fast 0-10 X4 Pełno $ tajska 10-30 X5 Pełno $$$ franc. >60 X6 Kilku $$ włoska 0-10 X7 Pusto $ fast 0-10 X8 Kilku $$ tajska 0-10 X9 Pełno $ fast >60 X10 Pełno $$$ włoska 10-30 X11 Pusto $ tajska 0-10 X12 Pełno $ fast 30-60 Funkcję h nazywa się hipotezą. Atrybuty t Cl Cel: czekać Alter Bar Pt/Sb Głód Klienci Ceny Deszcz Rezerw Typ Czas X1 Kilku $$$ franc. 0-10 X2 Pełno $ tajska 30-60 X3 Kilku $ fast 0-10 X4 Pełno $ tajska 10-30 X5 Pełno $$$ franc. >60 X6 Kilku $$ włoska 0-10 X7 Pusto $ fast 0-10 X8 Kilku $$ tajska 0-10 X9 Pełno $ fast >60 X10 Pełno $$$ włoska 10-30 X11 Pusto $ tajska 0-10 X12 Pełno $ fast 30-60 Bar? Klienci? Pusto Kilku Pełno Czas? >60 30-60 Reser? Altern? Pt/Sb? Typ restauracji i cena nie mają znaczenia 10-30 Głód? Altern? 0-10 Deszcz? Brzytwa Ockhama (William of Ockham 1285-1349) Najbardziej prawdopodobna jest najprostsza hipoteza zgodna ze zbiorem wszystkich obserwacji. Znalezienie najmniejszego drzewa decyzyjnego jest obliczeniowo trudne. 3

Ocena poprawności działania drzew decyzyjnych 1. Jeżeli w zbiorze niesklasyfikowanych y przykładów występują zarówno przykłady pozytywne, jak i negatywne, to znajdź atrybut taki, aby sklasyfikować jak najwięcej przykładów. 2. Jeżeli w zbiorze niesklasyfikowanych przykładów występują tylko przykłady pozytywne lub tylko negatywne, to drzewo jest gotowe - stop. 3. Jeżeli nie ma już niesklasyfikowanych przykładów, to znaczy, że nie zaobserwowano sytuacji wynikających z tej ścieżki, wtedy przydziel wartość zgodną zwiększością ocen w wierzchołku-rodzicu. rodzicu 4. Jeżeli są przykłady pozytywne i negatywne dla tych samych wartości atrybutów, to dane zawierają błąd. Można postąpić jak w kroku 3. Czekaj na tajskie jedzenie tylko w weekendy. Klienci? Pusto Kilku Pełnoł Głód? Typ? franc włoska tajska fast Pt/Sb? testującego ch odpowiedzi dla zbioru t % poprawnyc 100 80 60 40 0 20 40 60 80 100 rozmiar zbioru uczącego happy graphs Różne sformułowania problemu Podstawowe modele polega na wykorzystaniu przez agenta wzmocnienia (nagrody lub kary) do nauczenia się funkcji gwarantującej skuteczne działanie. Środowisko może być dostępne (dla receptorów) lub niedostępne. Agent może posiadać początkowa informację o środowisku i skutkach swoich akcji lub nie. Wzmocnienie może się pojawiać po osiągnięciu stanu końcowego lub po dowolnym stanie. Wzmocnienie może być składnikiem funkcji użyteczności, którą agent stara się zmaksymalizować lub tylko wskazówką. Agent może być bierny (pasywny) lub czynny (aktywny). Agent uczy się funkcji użyteczności na podstawie osiąganych stanów (lub stanów historycznych) i wykorzystuje je do wyboru akcji, które maksymalizują oczekiwaną użyteczność ich skutków. Agent uczy się funkcji akcja-ocena podając oczekiwaną użyteczność danej akcji w danym stanie (Q-learning). 4

y Eksploracja funkcji akcja-ocena bierne w znanym środowisku metoda najmniejszych kwadratów adaptacyjne programowanie dynamiczne metoda różnic czasowych (temporal difference) bierne w nieznanym środowisku czynne w znanym środowisku Kompromis między wyborem akcji przynoszących znane wzmocnienie a akcjami o nieznanej (ale może lepszej) wartości wzmocnienia. U(i) = ma{a: Q(a, i)} Czy lepiej uczyć się modelu i funkcji użyteczności, czy funkcji akcja-ocena bez żadnego modelu? Generalizacja w uczeniu ze wzmocnieniem Postać tablicowa funkcji jest nieskuteczna dla dużych problemów Postać niejawna pozwala podejmować decyzję również w sytuacjach nieznanych poprzez uogólnienie zdobytej wiedzy Algorytmy genetyczne i ewolucyjne Funkcja użyteczności Reprezentacja osobnika Mechanizm selekcji Mechanizm reprodukcji szuka zależności między akcjami i wzmocnieniem, tylko dąży do znalezienia najlepszej akcji. Podsumowanie jest jedną z dziedzin sztucznej inteligencji Modele uczenia obejmują: Modele uczenia maszynowego Algorytmy uczenia symbolicznego nadzorowane Algorytm uczenia drzew decyzyjnych nienadzorowane Odkrywanie regularności w danych Algorytm Hebba Algorytmy Algorytm Algorytm Hebba aproksymacji funkcji backpropagation polega na adaptacji do nowych warunków oraz na odkrywaniu i ekstrapolacji wzorców 5