Uniwersytet Mikołaja Kopernika Wydział Fizyki, Astronomii i Informatyki Stosowanej. Drzewa decyzyjne. Łukasz Bujak
|
|
- Kajetan Osiński
- 9 lat temu
- Przeglądów:
Transkrypt
1 Uniwersytet Mikołaja Kopernika Wydział Fizyki, Astronomii i Informatyki Stosowanej Drzewa decyzyjne Łukasz Bujak Toruń
2 Wstęp W działalności badawczej, a w szczególności w teorii decyzji, drzewa decyzyjne są narzędziami wspomagającymi podejmowanie decyzji. Kozystają one z graficznego przedstawienia decyzji i ich możliwych konsekwencji, w tym zdarzenia losowego wyników, kosztów zasobów, oraz użyteczności. Drzewa decyzji wykorzystuje się do określenia najbardziej prawdopodobnej strategi, tworzenia planu, do osiągnięcia celu. Drzewa decyzyjne są tak skonstruowane aby pomóc w podejmowaniu decyzji. Drzewa decyzyjne mają ustalony porządek: korzeń odpowiada wszystkim możliwym decyzjom każdy wewnętrzny węzeł odpowiada pewnej decyzji, którą możemy podjąć liściom odpowiadają cele Rysunek 1: Przykładowe drzewo decyzji zastosowane do problemu finansowego [7] 2
3 W eksploracji danych i uczeniu maszynowym, drzewa decyzyjne są modelami prognozującymi. Drzewa decyzyjne są często stosowana metodą w data mining. Używane są w kilku przypadkach: redukcja ilości danych, poprzez przekształcenie ich do formy zajmującej mniej miejsca, przy jednoczesnym zachowaniu cech oraz zapewnieniu dokładności rozwiązania problemu sprawdzanie czy dane zawierają oddzielne grupy obiektów, takie że te grupy można sensownie interpretować w kontekście teorii wykrycie mapowania z niezależnych do zależnych zmiennych, które jest użyteczne przy przewidywaniu wartości zależnej zmiennej w przyszłości W data mining na drzewa decyzji składają się, podobnie jak w teorii decyzji, z: korzeń zawiera wszystkie próbki treningowe węzły posiadają pojedyńczą cechę lub kombinacje cech z próbek treningowych liście ostatecznie uszeregowane dane z próbek treningowych wg. pewnych cech 3
4 Przykłady tworzenia drzew decyzyjnych Przykład 1 [8] Student Leszek obudził się 25 minut przed egzaminem. Profesor był formalistą i nawet minuta spóźnienia wykluczała możliwość pisania egzaminu, Leszkowi groziła więc sesja poprawkowa. Sprawa była jednak znacznie bardziej skomplikowana, gdyż Leszek miał zamiar wyjechać do pracy do Stanów Zjednoczonych, zaś wcześniejszy powrót we wrześniu oznaczałby dla niego utratę 4 tys. zł zarobków. Jeżeli jednak zdążyłby dotrzeć na czas, to rodzice w nagrodę za dobre oceny kupiliby mu prezent (zazwyczaj wartości 500 zł). Leszek musiał więc starannie przemyśleć, w jaki sposób dotrzeć do szkoły. Autobus nie wchodził w grę, jazda nim zajmowała co najmniej 40 minut. Pozostawała jeszcze inna możliwość - pożyczyć samochód ojca. Samochód ten jednak był w kiepskim stanie i szanse na dojechanie do szkoły wynosiły 90%, zaś w przypadku awarii Leszek musiałby pokryć część kosztów naprawy, gdyż ojciec od dawna winił go za za zły stan samochodu (3 tys. zł). Oprócz tego musiał zdecydować, czy opłaca się jechać przez miasto szybko, czy wolno. Przy wolnej jeździe dotarłby na czas z prawdopodobieństwem 60 %, natomiast przy szybkiej zdążyłby na pewno (Leszek potrafił naprawdę szybko jeździć). Mógł jednak zostać zatrzymany przez patrol policji, co groziło mandatem w wysokości 500 zł (prawdopodobieństwa trafienia na patrol - 20%). Druga możliwość to wynajęcie taksówki, za którą trzeba będzie zapłacić 30 zł. Jednak taksówkę trzeba będzie znaleźć w ciągu kilku minut, co można wykonać z prawdopodobieństwem sukcesu 80 % (jeżeli nie będzie taksówki w pobliżu, Leszek już nie zdąży). Aby ponaglić kierowcę Leszek może wręczyć napiwek w wysokości 20 zł, co zwiększy szanse na dotarcie na czas do 85 % (w przeciwnym wypadku tylko 70 %). Jaką decyzję powinien podjąć Leszek? 4
5 Rozpatrzmy węzeł samochód. Mamy do czynienia z dwoma stanami natury: samochód zepsuje się lub dojedzie. Sytuacja, w której samochód zepsuje się, jest jednocześnie węzłem końcowym, gdyż Leszek nie ma już żadnego wyboru: Rysunek 2: Pierwszy etap drzewa decyzji do rozwiązania problemu Leszka Rozpatrzmy węzeł samochód. Mamy do czynienia z dwoma stanami natury: samochód zepsuje się lub dojedzie. Sytuacja, w której samochód zepsuje się, jest jednocześnie węzłem końcowym, gdyż Leszek nie ma już żadnego wyboru: Rysunek 3: Drugi etap drzewa decyzji do rozwiązania problemu Leszka 5
6 W ten sposób kontynuujemy konstrukcję całego drzewa: Rysunek 4: Drzewo decyzji do rozwiązania problemu Leszka W prawidłowo skonstruowanym drzewie węzły decyzyjne i stanów natury powinny występować na przemian, zaś każda ścieżka powinna być zakończona węzłem końcowym. Rozwiązywanie problemu przy pomocy drzewa decyzyjnego rozpoczynamy od węzłów końcowych tego drzewa, przypisując im końcowe wypłaty. Przykładowo, dla sekwencji: taksówka - znajdzie - napiwek - zdąży, końcowa wypłata wynosi 4000 zł (zarobek w Stanach) zł (prezent) - 30 zł (koszt taksówki) - 20 zł (napiwek) = 4450 zł. Następnym krokiem jest zaznaczenie przy gałęziach wychodzących ze stanów natury odpowiadających im prawdopodobieństw. Na przykład dla węzła nr 6 prawdopodobieństwa wynoszą: policja , uda się Kolejny krok to wyznaczenie dla każdego węzła - stanu natury wartości oczekiwanej. Np. dla węzła nr 6 wartość oczekiwana wyniesie: 0.20 * (-500) zł * 4500 zł = 3500 zł. Przy każdym węźle decyzyjnym zapisujemy największą wartość z wyznaczonych wartości oczekiwanych (odpowiada to najkorzystniejszej decyzji). 6
7 Teraz cofając się po drzewie do korzenia, wypełniamy kolejno wszystkie węzły: Rysunek 5: Całe drzewo decyzji do rozwiązania problemu Leszka Optymalna ścieżka decyzji jest wyznaczona przez największe wartości oczekiwane. W podanym przykładzie z obliczeń wynika, że Leszek powinien poszukać taksówki i dać taksówkarzowi napiwek. Przykład 2 [9] Dawid jest kierownikiem słynnego klubu golfowego. Niestety ma on pewne problemy. Istnieją dni kiedy każdy chce grać w golfa i wtedy jego pracownicy są przepracowani. Natomiast w inne dni, bez wyraźnej przyczyny, nikt nie chce grać w golfa i jego pracownicy mają zbyt wiele czasu wolnego. Dawid chce tak zoptymalizować dostępność personelu dla graczy. Jednak aby tego dokonać musi zrozumieć jakimi decyzjami kierują się gracze. Założy że pogoda jest ważnym czynnikiem. Także przez kolejne tygodnie zapisywał w tabeli: zachmurzenie(outlook), czy było słonecznie(sunny), pochmurno(overcast), czy deszczowo(raining) temperaturę w stopniach Fahrenheita 7
8 wilgotność względną(humidity) w procentach wietrzność(windy) tak(true) czy nie(false) obecność graczy w klubie (play) Tabela 1: Wyniki obserwacji Dawida Na podstawie zebranych danych Dawid sporządził drzewo decyzyjne, które pomoże mu w rozwiązaniu problemu. Korzeń zawiera wszystkie możliwe sytuacje, a jest ich 14(9 dni gracze grali, a 5 niegrali). Więc podzielmy je na zależne od zachmurzenia na słoneczne (5 dni spośród których 2 grali, 3 niegrali), zachmurzone (4 dni i wszystkie grali), deszczowe (5 dni, spośród których 3 grali, a 2 niegrali). Pierwszy wniosek jaki się nasuwa jest taki, że gdy niebo jest zachmurzone ludzie zawsze grają w golfa. W pozostałych przypadkach jest to już bardziej skomplikowane. Jeżeli jest słonecznie to gracze wybierają się na grę gdy wilgotność nie przekracza 70%. Natomiast gdy jest deszczowo, anatyczni gracze przychodzą grać, jednak tylko w wypadku gdy jest bezwietrznie. Teraz Dawid może podjąć decyzję w celu zoptymalizowania wykorzystania swoich pracowników. Tak więc w dni słoneczne i wilgotne, oraz deszczowe i wietrzne, Dawid może dać wolne większości swoich pracowników, ponieważ i tak prawie nikt nie będzie grać w tych dniach w golfa. Natomiast w pozostałe dni gdy wiele osób będzie grało,musi on wynająć dodatkowych pracowników. 8
9 Wnioski z przykładów Rysunek 6: Drzewo decyzji dla problemu Dawida Jak widać w załączonych przykładach drzewa decyzji maja wiele zalet, m.in.: Są proste do zrozumienia i interpretacji. Większość ludzi jest w stanie zrozumieć na czym polega model podejmowania decyzji na podstawie drzew decyzji po krótkim wyjaśnieniu. Nie wymagają przygotowywania danych. Inne techniki często wymagają normalizacji danych, tworzenia ślepych zmiennych czy usuwania pustych wartości. Drzewa są w stanie obsługiwać zarówno dane numeryczne jak i kategoryczne. Inne techniki są wyspecjalizowane w analizie zestawów danych, które mają tylko jeden typ zmiennych. Przykładowo sieci neuronowe mogą obsługiwać tylko dane numeryczne. Możliwość poprawienia modelu za pomocą metod statystycznych. niezawodność modelu. Co powoduje Są solidne, dobrze i szybko wykonują operacje na dużych ilościach danych. Także duże ilości danych mogą być szybko przetworzone na komputerach osobistych, umożliwiając zainteresowanym podjęcie decyzji. 9
10 Używają modelu białego pudła, jeżeli wyjaśnimy stan w danym modelu, to jest łatwo go wytłumaczyć, gdyż możemy przejść przez całą ścieżkę decyzji. Jest to zupełnieinne podejście niż przy sztucznej sieci neuronowej która jest jak czarne pudło gdzie wrzucamy dane, otrzymujemy wyniki, ale nie wiemy dokładnie jak podjęte zostały decyzje. Tworzenie i optymalizacja drzew decyzyjnych Entropia Entropia w ramach teorii informacji jest definiowana jako średnia ilość informacji (liczba bitów), przypadająca na znak symbolizujący zajście zdarzenia z pewnego zbioru. Zdarzenia w tym zbiorze mają przypisane prawdopodobieństwa wystąpienia. Wzór na entropię: n H(x) = p(i) log 1 n i=1 p(i) = p(i) log p(i) i=1 gdzie p(i) - prawdopodobieństwo zajścia zdarzenia i. Własności entropii: jest nieujemna jest maksymalna, gdy prawdopodobieństwa zajść zdarzeń są takie same jest równa 0, gdy stany systemu przyjmują wartości 0 albo 1 własność superpozycji - gdy dwa systemy są niezależne to entropia sumy systemów równa się sumie entropii. W celu utworzenia drzewa decyzyjnego liczymy entropię dla różnych przypadków. Gdy entropia jest równa 0 to jest to koniec konaru drzewa decyzyjnego. I tak np. dla przykładu drugiego mamy, że średnia informacja I w danym węźle wynosi: Outlook = sunny Outlook = overcast ( 2 I([2, 3]) = H 5, 3 5) ( 2 = 2/5 log 5) 3 ( ) 3 5 log = bits 5 I([4, 0]) = H(1, 0) = 1 log(1) 0 log(0) = 0 bits 10
11 Outlook = rainy ( 3 I([3, 2]) = H 5, 2 = 5) 3 ( ) 3 5 log 2 ( ) log = bits 5 Wartość dla atrybutu: ( ( ( I([3, 2], [4, 0], [3, 2]) = = bits 14) 14) 14) Przyrost informacji(information gain) Przyrost informacji IG jest to różnica ilości informacji przed rozdzieleniem oraz po rozdzieleniu. Dla danych z przykładu 2 wygląda to następująco IG(Outlook) = I([9, 5]) I([2, 3], [4, 0], [3, 2]) = = bits Możemy budować drzewa decyzyjne również w oparciu o zysk informacyjny. Proces budowy drzewa zatrzymujemy gdy dalszy podział nie jest możliwy. Drzewa proste i skośne W celu podjecia decyzji możemy korzystać z drzew decyzji skośnych lub prostych. Rysunek 7: Drzewo decyzji skośne [6] Skośne drzewa decyzji korzystają zazwyczaj ze skomplikowanych warunków co powoduje, że są dokładne jednak nie są optymalne, gdyż podobne wyniki można otrzymać korzystając z drzew prostych. Proste drzewa są częściej wykorzystywane, gdyż z reguły są lepsze. Z powodu małej ilości prostych hipotez jest mniejsza szansa, że pasują do danych przypadkowo. Proste drzewa nie dopasowują się zbytnio do danych. Dzięki prostym drzewom unikamy złej generalizacji, zbytniego przetrenowania złożonych drzew które mogą 11
12 Rysunek 8: Drzewo decyzji proste[6] dostosować się do danych na których uczymy drzewo, natomiast nie będzie ono odpowiadać danym testowym. Stosujemy tutaj tak zwaną brzytwę Ochmana, która to zasada mówi że nie należy mnożyć bytów bez potrzeby. Przycinanie drzew decyzyjnych W trakcie powstawania drzewa decyzyjnego istnieje ryzyko nadmiernego dopasowania do przykładów trenujących. Drzewo decyzyjne może okazać się zbyt złożone i odzwierciedlać przypadkowe zależności występujące w zbiorze przykładów, zwłaszcza, jeśli jest on zaszumiony (zawiera małą ilość błędnych danych), dlatego oprócz samej konstrukcji drzewa używa się też sposobów służących do uproszczenia drzewa w taki sposób, aby zachować jak największą spójność z zbiorem przykładów i zminimalizować błąd rzeczywisty (powstający podczas testowania obiektami nienależącymi do zbioru przykładów). Takie algorytmy noszą potocznie nazwę algorytmów przycinania. Przycinanie jest to czynność polegająca na zastępowaniu wybranych poddrzew liśćmi. Samą implementację algorytmów przycinania drzew decyzyjnych można przeprowadzić na kilka sposobów: Przycinanie w trakcie wzrostu jest to przycinanie podczas konstrukcji drzewa takie mechanizm jest jednak mało precyzyjny gdyż podczas konstrukcji nie znamy jeszcze wyglądu całego drzewa i powoduje to stosunkowo duży błąd rzeczywisty. Przycinanie od środka jest to zastępowanie węzła jednym z jego węzłów potomnych taki algorytm jest bardzo złożony i wymaga reorganizacji struktury poddrzewa jednak daje najbardziej optymalne rezultaty. 12
13 Przycinanie proste - polega na zastąpieniu wybranego węzła węzłem zawierającym etykietę klasy-decyzji. Taki mechanizm jest stosunkowo prosty w implementacji i bardzo często stosowany. Algorytm polega na przejrzeniu całego drzewa i sprawdzeniu czy szacowany błąd rzeczywisty dla każdego z węzłów jest większy niż przedział ufności, jeśli tak to powinno nastąpić zamiana węzła rozgałęzionego na węzeł zawierający etykietę klasy-decyzji, która występuje najczęściej w przykładach dla tego węzła. Sam sposób wyboru na odpowiedniego algorytmu modyfikacji drzewa nie wystarcza, należy jeszcze zdecydować, w jaki sposób szacowany będzie współczynnik błędu rzeczywistego: Przycinanie z oddzielnym zbiorem przycinania do obliczenia współczynnika błędu używany jest oddzielny zestaw przykładów niebiorący udziału w tworzeniu drzewa. Zwykle przy dużej ilości danych przykładowych używa się 2/3 przykładów do algorytmu rekurencyjnego tworzenia drzewa, natomiast pozostała 1/3 służy do wyznaczenia błędów rzeczywistych konkretnych węzłach gotowego już drzewa decyzyjnego. Przycinanie na podstawie przykładów trenujących do obliczania współczynnika błędu wykorzystywany jest ten sam zestaw przykładów. Daje to gorsze efekty jednak przy małym zbiorze przykładów takie rozwiązanie jest konieczne. Algorytm C4.5 C4.5 jest algorytmem do tworzenia drzew decyzyjnych zaproponowanym przez Rossa Quilana. Drzewa decyzyjne wygenerowane algorytmem C4.5 mogą być wykorzystane do klasyfikacji, z tego powodu algorytm ten jest stosowany jako statystyczny klasyfikator. Poszczególne kroki algorytmu można zapisać jako: 1. wybierz atrybut, który najbardziej różnicuje wyjściowe wartości atrybutów 2. stwórz oddzielną gałąź dla każdej wartości wybranego atrybutu 3. podziel przypadki na podgrupy, tak aby odzwierciedlały wartości w wybranym węźle 4. dla każdej podgrupy zakończ proces selekcji jeżeli: wszystkie podgrupy mają taką sama wartość dla wyjściowego atrybutu 13
14 podgrupa zawiera pojedynczy węzeł 5. dla każdej podgrupy stworzonej w 3 punkcie, która nie została określona jako liść powtórz powyższy proces Zastosowanie algorytmu do danych z ZOO Dane zawierają informacje na temat różnych zwierząt, które są w ZOO( tiedeman/ml05/zoo.arff ). Dla każdego zwierzęcia dodano następującą listę atrybutów: futro, pióra, jajka, mleko, latajacy, wodny, drapieżnik, zęby, kręgosłup, breathes, jadowity, pletwy, nogi, ogon, lokalny, catsize, oraz typ (ssak, ptak, gad, ryba, płaz, owad, bezkręgowiec). Mając tak określoną próbkę, możemy spróbować skonstruować drzewo decyzyjne, które pomoże nam w określeniu typu zwierzęcia na podstawie określonych atrybutów. Do znalezienia odpowiedniego drzewa wykorzystam open source owy program WEKA. Jest to program do data miningu napisany w języku Java na Uniwersytecie Waikato. Program utworzył drzewo decyzji z danych treningowych jak na rysunku (9). Drzewo jak widać zostało dobrze utworzone. Rysunek 9: Drzewo decyzji dla zwierząt w ZOO 14
15 Algorytm znalazł zależność, że najprościej jest rozpoznać ptaki, ponieważ tylko one posiadają pióra, natomiast z pozostałych zwierząt tylko ssaki dają mleko, itd. Tylko jedno zwierze zostało źle sklasyfikowane co daje 99, 0099 ± % dobrze sklasyfikowanych zwierząt. Niestety po wprowadzeniu danych testowych program źle rozpoznał 8 z 101 zwierząt co daje 92, 0792 ± % poprawnie sklasyfikowanych zwierząt. Confusion Matrix dla danych testowych wygląda następująco: a b c d e f g classified as a = ssak b = ptak c = gad d = ryba e = płaz f = owad g = bezkregowiec Na podstawie macierzy pomyłek można zobaczyć dokładnie między jakimi typami zwierząt omawiany algorytm ma problemy. W 3 typach zwierząt nie było pomyłek. Mimo tych kilku źle sklasyfikowanych zwierząt można uznać, że dokładność algorytmu jest dobra. 15
16 Literatura [1] Cholewa W., Pedrycz W., Systemy doradcze. Gliwice : Politechnika Śląska, 1987 [2] Mulawka J., Systemy ekspertowe. Warszawa: Wydawnictwo Naukowo-Techniczne, 1996 [3] Cichosz P., Systemy uczące się. Warszawa: Wydawnictwo Naukowo Techniczne, 2000 [4] Bolc L., Zaremba P., Wprowadzenie do uczenia się maszyn. Akademicka Oficyna Wydawnicza, 1993 [5] Witten, I. A., Frank, E., Data Mining. Morgan Kaufmann, 2000 [6] prof. dr hab. Włodzisław Duch, Inteligencja obliczeniowa - wykład [7] [8] decyzyjne [9] tree learning [10] tree 16
SYSTEMY UCZĄCE SIĘ WYKŁAD 3. DRZEWA DECYZYJNE. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 3. DRZEWA DECYZYJNE Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska BUDOWA DRZEW DECYZYJNYCH Drzewa decyzyjne są metodą indukcyjnego
Przykład eksploracji danych o naturze statystycznej Próba 1 wartości zmiennej losowej odległość
Dwie metody Klasyczna metoda histogramu jako narzędzie do postawienia hipotezy, jaki rozkład prawdopodobieństwa pasuje do danych Indukcja drzewa decyzyjnego jako metoda wykrycia klasyfikatora ukrytego
Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów
Eksploracja danych Piotr Lipiński Informacje ogólne Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów UWAGA: prezentacja to nie
Algorytmy klasyfikacji
Algorytmy klasyfikacji Konrad Miziński Instytut Informatyki Politechnika Warszawska 6 maja 2015 1 Wnioskowanie 2 Klasyfikacja Zastosowania 3 Drzewa decyzyjne Budowa Ocena jakości Przycinanie 4 Lasy losowe
Drzewa decyzyjne i lasy losowe
Drzewa decyzyjne i lasy losowe Im dalej w las tym więcej drzew! ML Gdańsk http://www.mlgdansk.pl/ Marcin Zadroga https://www.linkedin.com/in/mzadroga/ 20 Czerwca 2017 WPROWADZENIE DO MACHINE LEARNING CZYM
SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska
SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska DRZEWO REGRESYJNE Sposób konstrukcji i przycinania
ALGORYTM RANDOM FOREST
SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM
Metody klasyfikacji danych - część 1 p.1/24
Metody klasyfikacji danych - część 1 Inteligentne Usługi Informacyjne Jerzy Dembski Metody klasyfikacji danych - część 1 p.1/24 Plan wykładu - Zadanie klasyfikacji danych - Przeglad problemów klasyfikacji
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006
SAS wybrane elementy DATA MINING Część III Seweryn Kowalski 2006 Algorytmy eksploracji danych Algorytm eksploracji danych jest dobrze zdefiniowaną procedurą, która na wejściu otrzymuje dane, a na wyjściu
Co to są drzewa decyzji
Drzewa decyzji Co to są drzewa decyzji Drzewa decyzji to skierowane grafy acykliczne Pozwalają na zapis reguł w postaci strukturalnej Przyspieszają działanie systemów regułowych poprzez zawężanie przestrzeni
Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji
Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji Michał Witczak Data Mining 20 maja 2012 r. 1. Wstęp Dostarczone zostały nam 4 pliki, z których dwa stanowiły zbiory uczące
Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18
Eksploracja Danych wykład 4 Sebastian Zając WMP.SNŚ UKSW 10 maja 2017 Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja 2017 1 / 18 Klasyfikacja danych Klasyfikacja Najczęściej stosowana (najstarsza)
Wprowadzenie do klasyfikacji
Wprowadzenie do klasyfikacji ZeroR Odpowiada zawsze tak samo Decyzja to klasa większościowa ze zbioru uczącego A B X 1 5 T 1 7 T 1 5 T 1 5 F 2 7 F Tutaj jest więcej obiektów klasy T, więc klasyfikator
WYKŁAD 11 Uczenie maszynowe drzewa decyzyjne
WYKŁAD 11 Uczenie maszynowe drzewa decyzyjne Reprezentacja wiedzy w postaci drzew decyzyjnych entropia, przyrost informacji algorytmy ID3, C4.5 problem przeuczenia wyznaczanie reguł rzykładowe drzewo decyzyjne
ALGORYTMY SZTUCZNEJ INTELIGENCJI
ALGORYTMY SZTUCZNEJ INTELIGENCJI Sieci neuronowe 06.12.2014 Krzysztof Salamon 1 Wstęp Sprawozdanie to dotyczy ćwiczeń z zakresu sieci neuronowych realizowanym na przedmiocie: Algorytmy Sztucznej Inteligencji.
SZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA WYKŁAD 4. UCZENIE SIĘ INDUKCYJNE Częstochowa 24 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska WSTĘP Wiedza pozyskana przez ucznia ma charakter odwzorowania
Identyfikacja istotnych atrybutów za pomocą Baysowskich miar konfirmacji
Identyfikacja istotnych atrybutów za pomocą Baysowskich miar konfirmacji Jacek Szcześniak Jerzy Błaszczyński Roman Słowiński Poznań, 5.XI.2013r. Konspekt Wstęp Wprowadzenie Metody typu wrapper Nowe metody
Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań
Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań Anna Manerowska, Michal Kozakiewicz 2.12.2009 1 Wstęp Jako projekt na przedmiot MEUM (Metody Ewolucyjne Uczenia Maszyn)
ZASADY PROGRAMOWANIA KOMPUTERÓW ZAP zima 2014/2015. Drzewa BST c.d., równoważenie drzew, kopce.
POLITECHNIKA WARSZAWSKA Instytut Automatyki i Robotyki ZASADY PROGRAMOWANIA KOMPUTERÓW ZAP zima 204/205 Język programowania: Środowisko programistyczne: C/C++ Qt Wykład 2 : Drzewa BST c.d., równoważenie
Uczenie się maszyn. Dariusz Banasiak. Katedra Informatyki Technicznej Wydział Elektroniki
Dariusz Banasiak Katedra Informatyki Technicznej Wydział Elektroniki Machine Learning (uczenie maszynowe, uczenie się maszyn, systemy uczące się) interdyscyplinarna nauka, której celem jest stworzenie
Zastosowanie metod eksploracji danych (data mining) do sterowania i diagnostyki procesów w przemyśle spożywczym
POLITECHNIKA WARSZAWSKA Instytut Technik Wytwarzania Zastosowanie metod eksploracji danych (data mining) do sterowania i diagnostyki procesów w przemyśle spożywczym Marcin Perzyk Dlaczego eksploracja danych?
Transformacja wiedzy w budowie i eksploatacji maszyn
Uniwersytet Technologiczno Przyrodniczy im. Jana i Jędrzeja Śniadeckich w Bydgoszczy Wydział Mechaniczny Transformacja wiedzy w budowie i eksploatacji maszyn Bogdan ŻÓŁTOWSKI W pracy przedstawiono proces
Złożoność i zagadnienia implementacyjne. Wybierz najlepszy atrybut i ustaw jako test w korzeniu. Stwórz gałąź dla każdej wartości atrybutu.
Konwersatorium Matematyczne Metody Ekonomii Narzędzia matematyczne w eksploracji danych Indukcja drzew decyzyjnych Wykład 3 - część 2 Marcin Szczuka http://www.mimuw.edu.pl/ szczuka/mme/ Plan wykładu Generowanie
Kompresja danych Streszczenie Studia Dzienne Wykład 10,
1 Kwantyzacja wektorowa Kompresja danych Streszczenie Studia Dzienne Wykład 10, 28.04.2006 Kwantyzacja wektorowa: dane dzielone na bloki (wektory), każdy blok kwantyzowany jako jeden element danych. Ogólny
Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne)
Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne) Tadeusz Pankowski www.put.poznan.pl/~tadeusz.pankowski Klasyfikacja i predykcja. Odkrywaniem reguł klasyfikacji nazywamy proces znajdowania
Uwaga: szarych kropek po pokolorowaniu nie uwzględniaj w klasyfikowaniu kolejnych szarych.
Inteligencja obliczeniowa stud. niestac. Laboratorium 4: Zadanie klasyfikacji poznanie trzech algorytmów klasyfikujących: knn, NaiveBayes, drzewo decyzyjne. Przy pomnijmy sobie bazę danych z irysami. Na
Data Mining z wykorzystaniem programu Rapid Miner
Data Mining z wykorzystaniem programu Rapid Miner Michał Bereta www.michalbereta.pl Program Rapid Miner jest dostępny na stronie: http://rapid-i.com/ Korzystamy z bezpłatnej wersji RapidMiner Community
Eksploracja danych. KLASYFIKACJA I REGRESJA cz. 2. Wojciech Waloszek. Teresa Zawadzka.
Eksploracja danych KLASYFIKACJA I REGRESJA cz. 2 Wojciech Waloszek wowal@eti.pg.gda.pl Teresa Zawadzka tegra@eti.pg.gda.pl Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki
Drzewa Decyzyjne, cz.2
Drzewa Decyzyjne, cz.2 Inteligentne Systemy Decyzyjne Katedra Systemów Multimedialnych WETI, PG Opracowanie: dr inŝ. Piotr Szczuko Podsumowanie poprzedniego wykładu Cel: przewidywanie wyniku (określania
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
Metody probabilistyczne klasyfikatory bayesowskie
Konwersatorium Matematyczne Metody Ekonomii narzędzia matematyczne w eksploracji danych First Prev Next Last Go Back Full Screen Close Quit Metody probabilistyczne klasyfikatory bayesowskie Wykład 8 Marcin
Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU
Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów
Tworzenie gier na urządzenia mobilne
Katedra Inżynierii Wiedzy Teoria podejmowania decyzji w grze Gry w postaci ekstensywnej Inaczej gry w postaci drzewiastej, gry w postaci rozwiniętej; formalny opis wszystkich możliwych przebiegów gry z
2. Graficzna prezentacja algorytmów
1. Uczeń: Uczeń: 2. Graficzna prezentacja algorytmów a. 1. Cele lekcji i. a) Wiadomości zna sposoby graficznego przedstawiania algorytmów, wie w jaki sposób skonstruować schemat blokowy w taki sposób aby
Systemy uczące się wykład 1
Systemy uczące się wykład 1 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 5 X 2018 e-mail: przemyslaw.juszczuk@ue.katowice.pl Konsultacje: na stronie katedry + na stronie domowej
Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2
Metody teorii gier ALP520 - Wykład z Algorytmów Probabilistycznych p.2 Metody teorii gier Cel: Wyprowadzenie oszacowania dolnego na oczekiwany czas działania dowolnego algorytmu losowego dla danego problemu.
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
Przedsiębiorczość i Podejmowanie Ryzyka. Zajęcia 1
Przedsiębiorczość i Podejmowanie Ryzyka Zajęcia 1 Zaliczenie Obecność Reguły gry: - Obecność obowiązkowa - kartkówki tylko w nagłych wypadkach (w wypadku niepożądanej aktywności) - Prace domowe (oddawane
Indukowane Reguły Decyzyjne I. Wykład 3
Indukowane Reguły Decyzyjne I Wykład 3 IRD Wykład 3 Plan Powtórka Grafy Drzewa klasyfikacyjne Testy wstęp Klasyfikacja obiektów z wykorzystaniem drzewa Reguły decyzyjne generowane przez drzewo 2 Powtórzenie
Optymalizacja ciągła
Optymalizacja ciągła 5. Metoda stochastycznego spadku wzdłuż gradientu Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 04.04.2019 1 / 20 Wprowadzenie Minimalizacja różniczkowalnej
CLUSTERING. Metody grupowania danych
CLUSTERING Metody grupowania danych Plan wykładu Wprowadzenie Dziedziny zastosowania Co to jest problem klastrowania? Problem wyszukiwania optymalnych klastrów Metody generowania: k centroidów (k - means
Drzewa decyzyjne. Inteligentne Obliczenia. Wydział Mechatroniki Politechniki Warszawskiej. Anna Sztyber
Drzewa decyzyjne Inteligentne Obliczenia Wydział Mechatroniki Politechniki Warszawskiej Anna Sztyber INO (IAiR PW) Drzewa decyzyjne Anna Sztyber / Drzewa decyzyjne w podstawowej wersji algorytm klasyfikacji
Algorytmy klasyfikacji
Algorytmy klasyfikacji Konrad Miziński Politechnika Warszawska Wydział Elektroniki i Technik Informacyjnych Warszawa, Polska k.mizinski@stud.elka.pw.edu.pl Streszczenie Niniejszy dokument opisuje jedna
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria Wykład 5 Anna Skowrońska-Szmer lato 2016/2017 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją jako prawdziwą
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria Wykład 5 dr inż. Anna Skowrońska-Szmer zima 2017/2018 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją
Technologie cyfrowe. Artur Kalinowski. Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15
Technologie cyfrowe Artur Kalinowski Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15 Artur.Kalinowski@fuw.edu.pl Semestr letni 2014/2015 Zadanie algorytmiczne: wyszukiwanie dane wejściowe:
Testowanie modeli predykcyjnych
Testowanie modeli predykcyjnych Wstęp Podczas budowy modelu, którego celem jest przewidywanie pewnych wartości na podstawie zbioru danych uczących poważnym problemem jest ocena jakości uczenia i zdolności
OpenAI Gym. Adam Szczepaniak, Kamil Walkowiak
OpenAI Gym Adam Szczepaniak, Kamil Walkowiak Plan prezentacji Programowanie agentowe Uczenie przez wzmacnianie i problemy związane z rozwojem algorytmów Charakterystyka OpenAI Gym Biblioteka gym Podsumowanie
Drzewa decyzyjne. 1. Wprowadzenie.
Drzewa decyzyjne. 1. Wprowadzenie. Drzewa decyzyjne są graficzną metodą wspomagania procesu decyzyjnego. Jest to jedna z najczęściej wykorzystywanych technik analizy danych. Drzewo składają się z korzenia
Algorytmy metaheurystyczne Wykład 11. Piotr Syga
Algorytmy metaheurystyczne Wykład 11 Piotr Syga 22.05.2017 Drzewa decyzyjne Idea Cel Na podstawie przesłanek (typowo zbiory rozmyte) oraz zbioru wartości w danych testowych, w oparciu o wybrane miary,
Drzewa czerwono-czarne.
Binboy at Sphere http://binboy.sphere.p l Drzewa czerwono-czarne. Autor: Jacek Zacharek Wstęp. Pojęcie drzewa czerwono-czarnego (red-black tree) zapoczątkował Rudolf Bayer w książce z 1972 r. pt. Symmetric
Klasyfikacja. Indeks Gini Zysk informacyjny. Eksploracja danych. Klasyfikacja wykład 2
Klasyfikacja Indeks Gini Zysk informacyjny Klasyfikacja wykład 2 Kontynuujemy prezentacje metod klasyfikacji. Na wykładzie zostaną przedstawione dwa podstawowe algorytmy klasyfikacji oparte o indukcję
OPISU MODUŁU KSZTAŁCENIA (SYLABUS) dla przedmiotu Teoria gier na kierunku Zarządzanie
Poznań, 1.10.2016 r. Dr Grzegorz Paluszak OPISU MODUŁU KSZTAŁCENIA (SYLABUS) dla przedmiotu Teoria gier na kierunku Zarządzanie I. Informacje ogólne 1. Nazwa modułu : Teoria gier 2. Kod modułu : 1 TGw
Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych ELEMENTY SZTUCZNEJ INTELIGENCJI Laboratorium nr 9 PRZESZUKIWANIE GRAFÓW Z
Archipelag Sztucznej Inteligencji
Archipelag Sztucznej Inteligencji Istniejące metody sztucznej inteligencji mają ze sobą zwykle niewiele wspólnego, więc można je sobie wyobrażać jako archipelag wysp, a nie jako fragment stałego lądu.
8. Drzewa decyzyjne, bagging, boosting i lasy losowe
Algorytmy rozpoznawania obrazów 8. Drzewa decyzyjne, bagging, boosting i lasy losowe dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Drzewa decyzyjne Drzewa decyzyjne (ang. decision trees), zwane
Pattern Classification
Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors
Działanie algorytmu oparte jest na minimalizacji funkcji celu jako suma funkcji kosztu ( ) oraz funkcji heurystycznej ( ).
Algorytm A* Opracowanie: Joanna Raczyńska 1.Wstęp Algorytm A* jest heurystycznym algorytmem służącym do znajdowania najkrótszej ścieżki w grafie. Jest to algorytm zupełny i optymalny, co oznacza, że zawsze
Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)
Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2) Ewa Wołoszko Praca pisana pod kierunkiem Pani dr hab. Małgorzaty Doman Plan tego wystąpienia Teoria Narzędzia
mgr inż. Magdalena Deckert Poznań, r. Uczenie się klasyfikatorów przy zmieniającej się definicji klas.
mgr inż. Magdalena Deckert Poznań, 01.06.2010r. Uczenie się klasyfikatorów przy zmieniającej się definicji klas. Plan prezentacji Wstęp Concept drift Typy zmian Podział algorytmów stosowanych w uczeniu
Optymalizacja systemów
Optymalizacja systemów Laboratorium - problem detekcji twarzy autorzy: A. Gonczarek, J.M. Tomczak, S. Zaręba, P. Klukowski Cel zadania Celem zadania jest zapoznanie się z gradientowymi algorytmami optymalizacji
Modelowanie motywów łańcuchami Markowa wyższego rzędu
Modelowanie motywów łańcuchami Markowa wyższego rzędu Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki 23 października 2008 roku Plan prezentacji 1 Źródła 2 Motywy i ich znaczenie Łańcuchy
O badaniach nad SZTUCZNĄ INTELIGENCJĄ
O badaniach nad SZTUCZNĄ INTELIGENCJĄ Jak określa się inteligencję naturalną? Jak określa się inteligencję naturalną? Inteligencja wg psychologów to: Przyrodzona, choć rozwijana w toku dojrzewania i uczenia
Indukcja drzew decyzyjnych
Konwersatorium Matematyczne Metody Ekonomii Narzędzia matematyczne w eksploracji danych Indukcja drzew decyzyjnych Wykład 3 - część 2 Marcin Szczuka http://www.mimuw.edu.pl/ szczuka/mme/ Divide et impera
Ocena ilościowa ryzyka: analiza drzewa błędu (konsekwencji) Zajęcia 6. dr inż. Piotr T. Mitkowski. piotr.mitkowski@put.poznan.pl
Ocena ilościowa ryzyka: Zajęcia 6 analiza drzewa błędu (konsekwencji) dr inż. Piotr T. Mitkowski piotr.mitkowski@put.poznan.pl Materiały dydaktyczne, prawa zastrzeżone Piotr Mitkowski 1 Plan zajęć Metody
Ćwiczenie numer 4 JESS PRZYKŁADOWY SYSTEM EKSPERTOWY.
Ćwiczenie numer 4 JESS PRZYKŁADOWY SYSTEM EKSPERTOWY. 1. Cel ćwiczenia Celem ćwiczenia jest zapoznanie się z przykładowym systemem ekspertowym napisanym w JESS. Studenci poznają strukturę systemu ekspertowego,
Algorytmy sztucznej inteligencji
www.math.uni.lodz.pl/ radmat Przeszukiwanie z ograniczeniami Zagadnienie przeszukiwania z ograniczeniami stanowi grupę problemów przeszukiwania w przestrzeni stanów, które składa się ze: 1 skończonego
Każdy węzeł w drzewie posiada 3 pola: klucz, adres prawego potomka i adres lewego potomka. Pola zawierające adresy mogą być puste.
Drzewa binarne Każdy węzeł w drzewie posiada pola: klucz, adres prawego potomka i adres lewego potomka. Pola zawierające adresy mogą być puste. Uporządkowanie. Zakładamy, że klucze są różne. Klucze leżące
ALHE. prof. Jarosław Arabas semestr 15Z
ALHE prof. Jarosław Arabas semestr 15Z Wykład 5 Błądzenie przypadkowe, Algorytm wspinaczkowy, Przeszukiwanie ze zmiennym sąsiedztwem, Tabu, Symulowane wyżarzanie 1. Błądzenie przypadkowe: Pierwszym krokiem
Metoda tabel semantycznych. Dedukcja drogi Watsonie, dedukcja... Definicja logicznej konsekwencji. Logika obliczeniowa.
Plan Procedura decyzyjna Reguły α i β - algorytm Plan Procedura decyzyjna Reguły α i β - algorytm Logika obliczeniowa Instytut Informatyki 1 Procedura decyzyjna Logiczna konsekwencja Teoria aksjomatyzowalna
PODSTAWY STATYSTYCZNEGO MODELOWANIA DANYCH. Wykład 6 Drzewa klasyfikacyjne - wprowadzenie. Reguły podziału i reguły przycinania drzew.
PODSTAWY STATYSTYCZNEGO MODELOWANIA DANYCH Wykład 6 Drzewa klasyfikacyjne - wprowadzenie. Reguły podziału i reguły przycinania drzew. Wprowadzenie Drzewo klasyfikacyjne Wprowadzenie Formalnie : drzewo
Drzewa klasyfikacyjne Lasy losowe. Wprowadzenie
Wprowadzenie Konstrukcja binarnych drzew klasyfikacyjnych polega na sekwencyjnym dzieleniu podzbiorów przestrzeni próby X na dwa rozłączne i dopełniające się podzbiory, rozpoczynając od całego zbioru X.
Średnie. Średnie. Kinga Kolczyńska - Przybycień
Czym jest średnia? W wielu zagadnieniach praktycznych, kiedy mamy do czynienia z jakimiś danymi, poszukujemy liczb, które w pewnym sensie charakteryzują te dane. Na przykład kiedy chcielibyśmy sklasyfikować,
WYKŁAD 6. Reguły decyzyjne
Wrocław University of Technology WYKŁAD 6 Reguły decyzyjne autor: Maciej Zięba Politechnika Wrocławska Reprezentacje wiedzy Wiedza w postaci reguł decyzyjnych Wiedza reprezentowania jest w postaci reguł
Algorytm - pojęcie algorytmu, sposób zapisu, poziom szczegółowości, czynności proste i strukturalne. Pojęcie procedury i funkcji.
Algorytm - pojęcie algorytmu, sposób zapisu, poziom szczegółowości, czynności proste i strukturalne. Pojęcie procedury i funkcji. Maria Górska 9 stycznia 2010 1 Spis treści 1 Pojęcie algorytmu 3 2 Sposób
Wprowadzenie do programu RapidMiner Studio 7.6, część 4 Michał Bereta
Wprowadzenie do programu RapidMiner Studio 7.6, część 4 Michał Bereta www.michalbereta.pl W tej części: Zachowanie wytrenowanego modelu w celu późniejszego użytku Filtrowanie danych (brakujące etykiety
Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych. Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS
Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS Dyskretyzacja - definicja Dyskretyzacja - zamiana atrybutów
Sposoby przedstawiania algorytmów
Temat 1. Sposoby przedstawiania algorytmów Realizacja podstawy programowej 5. 1) wyjaśnia pojęcie algorytmu, podaje odpowiednie przykłady algorytmów rozwiązywania różnych problemów; 2) formułuje ścisły
Dodatek Solver Teoria Dodatek Solver jest częścią zestawu poleceń czasami zwaną narzędziami analizy typu co-jśli (analiza typu co, jeśli?
Dodatek Solver Teoria Dodatek Solver jest częścią zestawu poleceń czasami zwaną narzędziami analizy typu co-jśli (analiza typu co, jeśli? : Proces zmieniania wartości w komórkach w celu sprawdzenia, jak
Rozkład materiału nauczania
Dział/l.p. Ilość godz. Typ szkoły: TECHNIKUM Zawód: TECHNIK USŁUG FRYZJERSKICH Rok szkolny 2015/2016 Przedmiot: MATEMATYKA Klasa: III 2 godz/tyg 30 = 60 godzin Rozkład materiału nauczania Temat I. LOGARYTMY
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Data Mining Wykład 4. Plan wykładu
Data Mining Wykład 4 Klasyfikacja danych Klasyfikacja poprzez indukcje drzew decyzyjnych Plan wykładu Sformułowanie problemu Kryteria oceny metod klasyfikacji Metody klasyfikacji Klasyfikacja poprzez indukcje
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Kierunek: Informatyka Rodzaj przedmiotu: obowiązkowy w ramach treści kierunkowych, moduł kierunkowy oólny Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK
3.2 Wykorzystanie drzew do generowania pytań
Algorithm 3.2 Schemat prostego przycinania drzewa function przytnij_drzewo( T: drzewo do przycięcia, P: zbiór_przykładów) returns drzewo decyzyjne begin for węzły n drzewa T: T* = w drzewie T zastąp n
Indukowane Reguły Decyzyjne I. Wykład 8
Indukowane Reguły Decyzyjne I Wykład 8 IRD Wykład 8 Plan Powtórka Krzywa ROC = Receiver Operating Characteristic Wybór modelu Statystyka AUC ROC = pole pod krzywą ROC Wybór punktu odcięcia Reguły decyzyjne
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE DIAGNOSTYKĘ MEDYCZNĄ Kierunek: Inżynieria Biomedyczna Rodzaj przedmiotu: obowiązkowy moduł specjalności informatyka medyczna Rodzaj zajęć: wykład, projekt
Eksploracja danych OCENA KLASYFIKATORÓW. Wojciech Waloszek. Teresa Zawadzka.
Eksploracja danych OCENA KLASYFIKATORÓW Wojciech Waloszek wowal@eti.pg.gda.pl Teresa Zawadzka tegra@eti.pg.gda.pl Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika
1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie
Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty
Jazda autonomiczna Delphi zgodna z zasadami sztucznej inteligencji
Jazda autonomiczna Delphi zgodna z zasadami sztucznej inteligencji data aktualizacji: 2017.10.11 Delphi Kraków Rozwój jazdy autonomicznej zmienia krajobraz technologii transportu w sposób tak dynamiczny,
Procesy Markowa zawdzięczają swoją nazwę ich twórcy Andriejowi Markowowi, który po raz pierwszy opisał problem w 1906 roku.
Procesy Markowa zawdzięczają swoją nazwę ich twórcy Andriejowi Markowowi, który po raz pierwszy opisał problem w 1906 roku. Uogólnienie na przeliczalnie nieskończone przestrzenie stanów zostało opracowane
Technologie Informacyjne
Systemy Uczące się Szkoła Główna Służby Pożarniczej Zakład Informatyki i Łączności January 16, 2017 1 Wprowadzenie 2 Uczenie nadzorowane 3 Uczenie bez nadzoru 4 Uczenie ze wzmocnieniem Uczenie się - proces
Algorytmy i struktury danych
Algorytmy i struktury danych ĆWICZENIE 2 - WYBRANE ZŁOŻONE STRUKTURY DANYCH - (12.3.212) Prowadząca: dr hab. inż. Małgorzata Sterna Informatyka i3, poniedziałek godz. 11:45 Adam Matuszewski, nr 1655 Oliver
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji
Listy, kolejki, stosy
Listy, kolejki, stosy abc Lista O Struktura danych składa się z węzłów, gdzie mamy informacje (dane) i wskaźniki do następnych węzłów. Zajmuje tyle miejsca w pamięci ile mamy węzłów O Gdzie można wykorzystać:
Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
Teoretyczne podstawy informatyki
Teoretyczne podstawy informatyki Wykład 4a: Rozwiązywanie rekurencji http://kiwi.if.uj.edu.pl/~erichter/dydaktyka2010/tpi-2010 Prof. dr hab. Elżbieta Richter-Wąs 1 Czas działania programu Dla konkretnych
mgr inż. Magdalena Deckert Poznań, r. Metody przyrostowego uczenia się ze strumieni danych.
mgr inż. Magdalena Deckert Poznań, 30.11.2010r. Metody przyrostowego uczenia się ze strumieni danych. Plan prezentacji Wstęp Concept drift i typy zmian Algorytmy przyrostowego uczenia się ze strumieni
Stan dotychczasowy. OCENA KLASYFIKACJI w diagnostyce. Metody 6/10/2013. Weryfikacja. Testowanie skuteczności metody uczenia Weryfikacja prosta
Stan dotychczasowy OCENA KLASYFIKACJI w diagnostyce Wybraliśmy metodę uczenia maszynowego (np. sieć neuronowa lub drzewo decyzyjne), która będzie klasyfikować nieznane przypadki Na podzbiorze dostępnych
ZeroR. Odpowiada zawsze tak samo Decyzja to klasa większościowa ze zbioru uczącego A B X 1 5 T 1 7 T 1 5 T 1 5 F 2 7 F
ZeroR Odpowiada zawsze tak samo Decyzja to klasa większościowa ze zbioru uczącego A B X 5 T 7 T 5 T 5 F 2 7 F Tutaj jest więcej obiektów klasy T, więc klasyfikator ZeroR będzie zawsze odpowiadał T niezależnie