Klasyfikacja strumieni danych z wykorzystaniem złożonych systemów klasyfikacji
|
|
- Magda Nowakowska
- 8 lat temu
- Przeglądów:
Transkrypt
1 Klasyfikacja strumieni danych z wykorzystaniem złożonych systemów klasyfikacji Dr inż. Konrad Jackowski Politechnika Wrocławska Wydział Elektroniki Katedra Systemów i Sieci Komputerowych
2 Agenda Przetwarzanie strumieni Problem zmienności danych Przykłady Źródła zmian Dynamika Algorytmy przetwarzania zmiennych strumieni danych Typy Algorytmy złożone Algorytm ewolucyjnej adaptacji klasyfikatora Podstawowe założenia Model Algorytm Ewaluacja
3 Data Mining Data Mining techniki odkrywanie informacji z baz danych Proces odkrywania ma na celu wyłowienie nietrywialnych, wcześniej nieznanych i praktycznie użytecznych informacji, wzorców, relacji ukrytych w bazach i niemożliwych do wyłuskania klasycznymi metodami raportowania Identyfikacja nietypowych wzorców - Anomaly Detection Odkrywanie zależności pomiędzy zmiennymi - Association Rule Learning Odkrywanie grup i struktur danych wykazujących podobieństwo - Clustering Identyfikacja wzorców atrybutów wykorzystywana w zadaniach klasyfikacji Classification
4 Strumienie danych Strumień danych sekwencja danych często powiązanych relacjami, generowanych i napływających do systemu w czasie, w stałych lub zmiennych odstępach czasu Problemy z obsługą strumieni dotyczą Dużego zapotrzebowania na przestrzeń do magazynowania danych Zwiększonej mocy obliczeniowej niezbędnej do przetwarzania i analizy danych
5 Strumienie danych Klasyczne algorytmy nie mogą być w sposób prosty wykorzystane do przetwarzania danych strumieniowych Większość z nich wymaga wielokrotnego przeglądu danych archiwalnych Dane mogą być usuwane ze względu na problemy związane z ich przechowywaniem Charakterystyka danych może ulegać zmianom
6 Zmienność w strumieniach danych Concept Drift Concept drift to zjawisko pojawiania się zmian w charakterystyce danych strumieniowych Przykład: W systemach detekcji i filtracji SPAMu bazuje się na analizie treści. Z upływem czasu zmianie mogą ulec: percepcja tego co uznawane jest za SPAM sposoby formułowania wiadomości
7 Concept Drift Ewolucja metod fałszerstw finansowych Zmiana preferencji klientów wynikająca z: Pojawienia się nowej oferty Sezonowości popularności wybranych produktów Zmiany metod ataków na systemy informatyczne Zmiana profilu klienta w systemach rekomendowania usług bankowych Zmiana trendów wybranych wskaźników makroekonomicznych
8 Concept Drift Pojawienie się zmian charakterystyk danych powoduje, że klasyczne (statyczne) algorytmy analizy danych mogą z czasem stać się bezużyteczne W przypadku zadań klasyfikacji efektem może być drastyczne obniżenie poziomu poprawnych rozpoznań accuracy chunk s number
9 Concept Drift Nowe zadania Monitorowanie charakterystyk danych pod kątem pojawiania się w nich zmian Detekcja Dryftu Dostrojenie systemu do nowych warunków Podstawą przy projektowaniu systemów jest zrozumienie natury pojawiających się zmian
10 Concept Drift Źródła zmian charakterystyk W zadaniach klasyfikacji zakłada się probabilistyczny model opisujących charakterystykę obiektów poddawanych analizie Zmiany mogą ujawnić się w jednym lub wielu z następujących parametrów opisujących obiekty Prawdopodobieństwo a-priori pojawiania się obiektów w klasach Warunkowy (klasowy) rozkład atrybutów obiektów w przestrzeni cech Wartość prawdopodobieństwa a-posteriori przynależności obiektu do danej klasy
11 Concept Drift Dynamika zmian Sudden Concept shift Recurring context Incremental (stepwise) Gradual Irregular phenomena Cyclic phenomena
12 Concept Drift Dynamika zmian Możliwa reakcja na pojawienie się zmian zależy od ich dynamiki, np.: W przypadku gwałtownej zmiany charakterystyk (sudden drift), zastąpienie zdezaktualizowanego klasyfikatora nowym pozwoli na błyskawiczne dostrojenie systemu do nowych warunków W przypadku zmian rozciągniętych w czasie bardziej odpowiednia wydaje się stopniowa adaptacja klasyfikatora W przypadku powtarzalności konceptów idealnie byłoby mieć możliwość ponownego wykorzystywania klasyfikatorów stworzonych w przeszłości
13 Concept Drift - Algorytmy Historia STAGGER (Schlimmer i Granger, 1986) IB3 (Aha, 1991) Algorytmy FLORA (Widmer i Kubat, 1996) Klasyfikacja algorytmów Algorytmy detekcji dryftu Online Learners Algorytmy z mechanizmem zapominania Ensemble classifiers
14 Algorytmy detekcji dryftu Detekcja dryftu jest podstawą podjęcia reakcji na pojawienie się zmian Budowa nowego klasyfikatora Adaptacja systemu do nowych warunków Żądanie etykietowania zbioru danych Nie wszystkie systemy przetwarzania danych wymagają detekcji dryftu Niektóre systemu w sposób ciągły adaptują się do nadchodzących danych (Zliobaite:2010)
15 Algorytmy detekcji dryftu Możliwe podejścia Algorytmy nadzorowane Dostępność informacji o klasach udział eksperta Monitorowanie zmian w jakości klasyfikacji Monitorowanie warunkowych rozkładów obiektów w przestrzeni cech + duża precyzja detekcji - konieczność zaangażowanie eksperta - w wielu praktycznych przypadkach nie ma dostępu do etykiet (np. z powodu szybkości przepływu danych w strumieniu) (Kifer:2004)
16 Algorytmy detekcji dryftu Możliwe podejścia
17 Algorytmy detekcji dryftu Możliwe podejścia Algorytmy częściowo nadzorowane (semisupervised) Zakłada się ograniczony dostęp do wiedzy eksperta Tylko część danych jest etykietowana Uwzględnienie kosztów etykietowania w wyborze przykładów do oznaczenia Algorytmy aktywnego uczenia + duża precyzja detekcji +/- ograniczone koszty związane z etykietowaniem
18 Algorytmy detekcji dryftu Możliwe podejścia Detektor dryftu wykorzystujący algorytmy aktywnego uczenia (Kurlej, Woźniak, 2011)
19 Algorytmy detekcji dryftu Możliwe podejścia Algorytmy nienadzorowane Brak etykiet Brak miar jakości klasyfikacji Monitorowanie właściwości obiektów w strumieniu Rozkłady obiektów w przestrzeni cech Rozkład klastrów Testy statystyczne + brak kosztów etykietowania + natychmiastowe przetwarzanie danych - konieczność przyjęcia założeń odnośnie rozkładu obiektów w przestrzeni cech - problemy z detekcją zmian rozkładów warunkowych w klasach
20 Online algorithms Algorytmy przetwarzające przychodzące dane w czasie rzeczywistym. Wymagania (Domingos:2003) Przetwarzanie danych w chwili ich pojawienia się - brak konieczności gromadzenia danych Jednorazowe przetwarzanie każdego przychodzącego obiektu w procesie uczenia brak konieczności ponownego przeglądania danych Przetwarzanie danych w ograniczonym czasie i z wykorzystaniem ograniczonej ilości zasobów W przypadku przerwania procesu przetwarzania danych w dowolnym momencie, jakość klasyfikatora powinna odpowiadać jakości klasyfikatora uczonego wsadowo na podstawie wszystkich dotychczas pojawiających się przykładów
21 Online algorithms - przykłady Zaadaptowane klasyczne algorytmy klasyfikacji Naive Bayes Neural Networks Nearest Neighbour Algorytmy złożone Concept-adapting Very Fast Decision Tree - CVFDT (Hulten, 2001) Generowanie alternatywnych drzew lub gałęzi drzewa decyzyjnego na podstawie nowych danych Dynamiczne zastępowanie zdezaktualizowanych drzew ich nowymi wersjami w przypadku gdy osiągają lepsze wyniki
22 Sliding Window Algorytmy wykorzysujące w procesie uczenia zbiór uczący zawierający jedynie pewną pulę ostatnich (najnowszych) przykładów okno Algorytmy bazujące na założeniu, że najnowsze przykłady w najlepszy sposób opisują bieżący kontekst Rozmiar okna wpływa na dynamikę zachowania klasyfikatora
23 Sliding Window Małe okno duża dynamika (szybka reakcja na zmiany) Większa podatność na zakłócenia Niższa stabilność procesu uczenia Duże okno Wyższa inercja (wolniejsze dostosowywanie się do nowych warunków) Większa odporność na szumy Wyższa stabilność
24 Sliding Window Zaawansowane algorytmy okna Algorytmy o zmiennej szerokości okna FLORA2 (Widmer,1996) ADWIN2 (Bifet,2006) Algorytmy z wieloma oknami (Lazarescu, 2003) Algorytmy ważone (Klinkenberg,1998),(Koychev,2000) Wszystkie obiekty w oknie otrzymują wagi wprost proporcjonalne do ich wieku Algorytmy wykorzystujące bagging i boosting (Bifet,2009),(Chu,2004)
25 Ensembles Algorytmy złożone (Ensemble classifiers) algorytmy wykorzystujące pulę klasyfikatorów elementarnych Fuzja wiedzy podchodzących ze zbioru klasyfikatorów pozwala na istotne podniesienie jakości klasyfikacji
26 Ensembles Warunek sukcesu fuzji klasyfikatorów Wiedza zawarta w klasyfikatorach musi się uzupełniać Klasyfikatory powinny być zróżnicowane
27 Ensembles 8 Banana Set 8 Banana Set Banana Set 6 Banana Set
28 Ensembles Warunek sukcesu fuzji klasyfikatorów Wiedza zawarta w klasyfikatorach musi się uzupełniać Klasyfikatory powinny być zróżnicowane W warunkach statycznych zróżnicowanie puli może wynikać z Różnych modeli klasyfikatorów Losowości wynikającej z modelu klasyfikatora Wykorzystania różnych podzbiorów cech Podziału zbioru uczącego W warunkach dryftu zróżnicowanie może dodatkowo wynikać z reprezentacji różnych konceptów
29 Model fuzji Fuzja odpowiedzi Fuzja odpowiedzi etykiet zwracanych przez klasyfikatory elementarne Głosowanie większościowe Głosowanie ważone + prostota implementacji + możliwość fuzji heterogenicznego zbioru klasyfikatorów + intuicyjność metody - zignorowanie informacji o zaufaniu wobec decyzji poszczególnych klasyfikatorów
30 Model fuzji Fuzja funkcji dyskryminujących Fuzja funkcji dyskryminujących Estymatory prawdopodobieństw a-posteriari Funkcje przejścia w sieciach neuronowych Funkcje dyskryminujące jako miara wsparcia/pewności odnośnie podejmowanej decyzji Klasyfikatory zwracają wartości funkcji dla każdej z możliwych klas
31 Model fuzji Fuzja funkcji dyskryminujących Proste algorytmy agregujące: min, max, avg, prod, + prostota implementacji + brak fazy uczenia klasyfikatora złożonego - ograniczone pole zastosowań - relatywnie niska skuteczność
32 Ważona fuzja funkcji dyskryminujących Ważona fuzja funkcji dyskryminujących Wagi zależne od klasyfikatorów np. wagi wprost proporcjonalne do jakości klasyfikacji klasyfikatora elementarnego Wagi zależne od klasyfikatorów i wartości wektora cech Wagi zależne od klasyfikatorów i klasy Wagi zależne od klasyfikatorów, wektora cech i klasy
33 Ważona fuzja funkcji dyskryminujących Ważona fuzja funkcji dyskryminujących Wagi zależne od klasyfikatorów np. wagi wprost proporcjonalne do jakości klasyfikacji klasyfikatora elementarnego Wagi zależne od klasyfikatorów i wartości wektora cech + Uzależnienie wpływu klasyfikatora na efekt klasyfikacji w zależności od jego jakości + Efektywne przeciwdziałanie negatywnemu wpływowi przetrenowania klasyfikatorów elementarnych - Pracochłonna implementacja algorytmu uczenia
34 Concept Drift Ensembles - Strategie Dynamic combiners Fuzja klasyfikatorów trenowanych w procesie poprzedzającym budowę klasyfikatora złożonego (Littlestone:1994),(Jacobs:1991) Wadą rozwiązania jest konieczność znajomości wszystkich kontekstów w fazie tworzenia puli Inkrementacyjna aktualizacja klasyfikatorów elementarnych w puli (Oza:2000), (Kolter:2007), (Bifet:2011), (Bifet:2009), (Rodriguez:2008) System jest złożony z klasyfikatorów onlinowych Podejście to bywa nazywane Online Ensemble Aktualizacja struktury systemu Wraz z nadejściem nowej porcji danych wszystkie składowe systemu są za ich pomocą oceniane Najsłabszy klasyfikator może być zastąpiony nowym, trenowanym na bieżących danych (Kolter:2003), (Jackowski:2013)
35 Concept Drift Ensembles Przykładowe algorytmy Streaming Ensemble Algorithm - SEA (Street:2001) Accuracy Weighted Ensemble AWE (Wang:2003) Podstawowe założenia Pula klasyfikatorów o stałym rozmiarze Grupowanie nadchodzących danych w blokach Przetwarzanie wsadowe Ocena klasyfikatorów w puli na podstawie dokładności klasyfikacji przykładów z bloku danych Odświeżanie puli zastępowanie klasyfikatorów nowymi SEA - fuzja z wykorzystaniem głosowania większościowego AWE fuzja z wykorzystaniem głosowania ważonego, gdzie waga odpowiada jakości klasyfikatora w klasyfikacji aktualnych danych
36 AWE - pseudokod AWE algorithm 1. Input: 2. S: Data Chank 3. K: Size of comittee 4. C: classifier pool 5. Output: 6. C 7. Begin 8. train C0 on S; 9. compute error rate of C0 via cross validation on S; 10. calculate w0 for C0 using MSEi; 11. for each classifier Ci in C do 12. apply Ci on S to derive MSEi 13. calculate wi based on MSEi; 14. C K of the top weighted classifiers in C {C0}; 15. return C; 16. End
37 Dyskusja Algorytmy oparte na zapominaniu moją ograniczone zastosowanie w przypadku możliwości ponownego pojawienia się konceptu Rozwiązania z pulą klasyfikatorów pozwalają na reprezentację kontekstów w postaci klasyfikatorów elementarnych Możliwość ponownego wystąpienia kontekstu wymusza rezygnację z usuwania starych klasyfikatorów z puli Komitet głosujący nie powinien zawierać nieaktualnych klasyfikatorów Ważenie wkładu klasyfikatorów w podejmowanie decyzji pozwala na uwzględnienie stopnia ich aktualności Ustalenie wag na podstawie jakości klasyfikatora jest intuicyjne i proste w implementacji, ale algorytmy takie mają tendencję do wpadania w minima lokalne Alternatywą jest dobór wag na podstawie tak by zoptymalizować jakość pracy całego systemu
38 Dyskusja Zachowanie wiedzy raz zdobyta wiedza może okazać się przydatna w przypadku ponownego pojawienia się kontekstu Ewolucyjna adaptacja stopniowe dostrajanie systemu pozwala na uniknięcie niestabilności wynikających z naturalnych fluktuacji danych Ważona fuzja funkcji dyskryminujących Uwzględnienie aktualności wiedzy klasyfikatorów Uwzględnienie stopnia pewności decyzji klasyfikatorów Ograniczenie liczebności komitetu głosującego Ograniczenie czasu obliczeń Ograniczenie wpływu słabych/nieaktualnych klasyfikatorów Pewna detekcja dryftu Rozróżnienie dryftu od naturalnych fluktuacji strumienia
39 Założenia systemu EAE Evolutionary Adapted Ensemble System przechowuje wiedzę odnośnie kontekstów w postaci puli dostępnych klasyfikatorów elementarnych Rozmiar puli nie jest ograniczony Składowe puli nie są z niej usuwane Decyzja systemu jest podejmowana kolektywnie Rozmiar komitetu jest stały i graniczony Decyzja jest podejmowana na podstawie ważonej fuzji funkcji dyskryminujących System w sposób ciągły nadzoruje i aktualizuje skład komitetu oraz wagi poszczególnych klasyfikatorów Nowe klasyfikatory są tworzone w przypadku obniżenia jakości klasyfikacji Algorytm uczenia to złożony problem optymalizacyjny mający na celu minimalizację błędu klasyfikacji systemu W procesie uczenia wykorzystano algorytm ewolucyjny
40 EAE Model Pula klasyfikatorów Komitet głosujący Wagi klasyfikatorów Formuła decyzyjna Zbiór uczący { Ψ Ψ } Π Ψ =,..., 1, 2 Ψ K Ξ Ψ = { c, 1 c2,..., c E } Ψ = { w w } W 1, 2,..., Ψ M w E ( x) = arg max w d ( x) i= 1 E e= 1 e e, i {( x j ), ( x, j ),..., ( )} LS = 1, x N, j N Funkcja celu procesu uczenia Q Ψ 1 = N N n= 1 L N E 1 M ( Ψ( x ), j ) = L arg max w d ( x) n n N n= 1 i= 1 e= 1 e C, i e, j n
41 EAE Algorytm optymalizacyjny Uczenie z wykorzystaniem algorytmów ewolucyjnych Model rozwiązania zakodowany w postaci chromosomu Ch W Ξ Ψ = Ψ = [ w1, w2,..., we ] [ c, c,..., c ] 1 Przetwarzanie populacji osobników reprezentujących możliwe rozwiązania Zachowanie całej populacji po ukończeniu procesu uczenia Najlepszy osobnik z populacji jest rozwiązaniem na danym etapie przetwarzania strumienia Proces jest kontynuowany po odebraniu kolejnego zestawu danych ze strumienia 2 E
42 EAE Inicjalizacja populacji Populacja reprezentuje możliwe rozwiązania Sposób inicjalizacji populacji zależy od etapu przetwarzania strumienia danych W przypadku otrzymania pierwszego pakietu danych (początek strumienia) chromosomu osobników populacji są wypełniane wartościami losowymi W przypadku przetwarzania kolejnych pakietów danych, populacja jest wypełniona osobnikami zachowanymi z ostatniego przebiegu algorytmu (uczenie poprzedniego pakietu danych) W przypadku, gdy komitet głosujący nie jest wypełniony, tworzy się nowy klasyfikator elementarny i dodaje go do komitetu z losową wagą
43 EAE Inicjalizacja populacji
44 EAE Funkcja dopasowania Podstawą oceny osobników w populacji jest funkcja dopasowania W przypadku EAE osobniki reprezentujące możliwe konfiguracje złożonego klasyfikatora są oceniane za pomocą funkcji odwrotnie proporcjonalnej do funkcji błędu F = 1 Q Ψ = 1 1 N N L arg max n= 1 i= 1 e= 1 ( x) Wartość dopasowania osobnika jest kluczowa w procesie selekcji osobników do procesów krzyżowania oraz tworzenia populacji potomnej Osobniki o wysokim dopasowaniu mają większe szanse na przekazanie swoich genów osobnikom potomnym w procesie krzyżowania M E w e d C, i e, j n
45 EAE Krzyżowanie W fazie przetwarzania populacji następuje wymiana danych zapisanych w chromosomach dwóch losowo wybranych osobników Celem krzyżowania jest propagowanie cech silnych osobników w populacji potomnej W EAE wykorzystano standardowy operator krzyżowania dwupunktowego Krzyżowanie dotyczy tych samych składowych chromosomu (wagi i indeksy) w obydwu osobnikach Dopuszcza się występowanie jednego klasyfikatora w komitecie wielokrotnie Jeżeli redundancja wpłynie negatywnie na jakość rozwiązania, osobnik taki zostanie wyeliminowany w procesie selekcji
46 EAE Mutacja Mutacja to proces wprowadzania pewnych losowych zmian w kod chromosomu Mutacja zazwyczaj dotyczy znikomej części populacji Ma na celu podtrzymanie pewnego poziomu zróżnicowania populacji Mutacja wag Dodanie szumu Gausowskiego Normalizacja wektora wag Mutacja indeksów składu komitetu Wymiana losowo wybranego indeksu na inny z puli dostępnych Prawdopodobieństwo wylosowania klasyfikatora jest wprost proporcjonalne do jego jakości
47 EAE Mutacja
48 EAE Detekcja przetrenowania Duża elastyczność modelu klasyfikatora EAE sprzyja możliwości jego przetrenowania Utrata zdolności generalizacji w naturalny sposób obniża jakość jego pracy Podstawą działania jest zbiór walidacyjny nie wykorzystywany w procesie uczenia Detekcja przetrenowania ma miejsce w czasie każdej iteracji procesu ewolucyjnego Detektor zapamiętuje ostatnią z populacji, w której nie wykryto przetrenowania Po zakończeniu procesu uczenia, populacja ta jest zwracana jako wynik działania algorytmu uczenia EAE
49 EAE Detekcja przetrenowania
50 EAE Detekcja dryftu konceptu Procedura detekcji dryftu ma za zadanie rozpoznanie momentu pojawienia się zmian Wykorzystano detektor nadzorowany Podstawą oceny jest monitorowanie wartości jakości klasyfikacji Detektor ma za zadanie odróżnić odchylenia w jakości wynikających z chwilowych fluktuacji od pojawienia się prawdziwego dryftu Zdefiniowano dwa poziomy alarmowe odchylenia Poziom dryftu Poziom szumu Pojawienie się szumu może spowodować utworzenie nowego klasyfikatora Pojawienie się dryftu powoduje wymianę całego komitetu głosującego
51 EAE Detekcja dryftu konceptu
52 EAE Główna procedura algorytmu Algorytm jest sterowany zestawem parametrów Rozmiar populacji Frakcja krzyżowania/mutacji Rozmiar elity Warunki zakończenia uczenia Procedura jest uruchomiana po skompletowaniu paczki danych o zadanym rozmiarze Podział zbioru na: Uczący dla klasyfikatorów elementarnych Uczący algorytmu EAE Walidacyjny
53 EAE Główna procedura algorytmu
54 EAE Ewaluacja systemu Cele oceny Ocena zdolności adaptacyjnych Ocena odporności na przetrenowanie Ocena wpływu rozmiaru puli na czas przetwarzania Analiza porównawcza z innymi metodami Środowisko Matlab PRTools
55 EAE Ewaluacja systemu Zbiory danych Zbiory ze sztucznie generowanym dryftem Contexts Drift extent (rotation angle) Chunks per context Ensemble size Chunk size (instances) Series Series Series
56 EAE Ewaluacja systemu Zbiory danych Zbiory ze sztucznie generowanym dryftem Zbiory benchmarkowe (repozytorium UCI) Name Liver Disorders Auto MPG Pima Indians Diabetes Breast Cancer Biomed Electricity demand SPAM Instances Classes Attributes Concept Drift Synthetic Synthetic Synthetic Synthetic Synthetic Real Real
57 Ewaluacja systemu Stabilność i czułość
58 Ewaluacja systemu Odporność na przetrenowanie
59 Ewaluacja systemu Czas procesu uczenia
60 Ewaluacja systemu Czas procesu uczenia
61 Ewaluacja systemu Testy benchmarkowe Dataset AWE AHT LA EAE Electricity demand (90 chunks) SPAM (23 chunks) Average Error Error Variance Average Error Error Variance 0,2673 0,2489 0,2624 0,2342 0,0007 0,0009 0,0009 0,0060 0,1967 0,2006 0,1783 0,1002 0,0031 0,0052 0,0030 0,0154
62 Ewaluacja systemu Propozycje dalszych prac Wykorzystanie innych algorytmów optymalizacyjnych w procesie uczenia EAE Dekompozycja przestrzenie cech na obszary kompetencyjne w celu eksploracji lokalnych specjalizacji klasyfikatorów w puli Wykorzystanie innych modeli fuzji Wykorzystanie innych algorytmów detekcji dryftu
Dariusz Brzeziński. Politechnika Poznańska
Dariusz Brzeziński Politechnika Poznańska Klasyfikacja strumieni danych Algorytm AUE Adaptacja klasyfikatorów blokowych do przetwarzania przyrostowego Algorytm OAUE Dlasze prace badawcze Blokowa i przyrostowa
mgr inż. Magdalena Deckert Poznań, r. Uczenie się klasyfikatorów przy zmieniającej się definicji klas.
mgr inż. Magdalena Deckert Poznań, 01.06.2010r. Uczenie się klasyfikatorów przy zmieniającej się definicji klas. Plan prezentacji Wstęp Concept drift Typy zmian Podział algorytmów stosowanych w uczeniu
mgr inż. Magdalena Deckert Poznań, r. Metody przyrostowego uczenia się ze strumieni danych.
mgr inż. Magdalena Deckert Poznań, 30.11.2010r. Metody przyrostowego uczenia się ze strumieni danych. Plan prezentacji Wstęp Concept drift i typy zmian Algorytmy przyrostowego uczenia się ze strumieni
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska e-mail: bartosz.krawczyk@pwr.wroc.pl Czym jest klasyfikacja
METODY INŻYNIERII WIEDZY
METODY INŻYNIERII WIEDZY WALIDACJA KRZYŻOWA dla ZAAWANSOWANEGO KLASYFIKATORA KNN ĆWICZENIA Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
PLAN WYKŁADU OPTYMALIZACJA GLOBALNA OPERATOR KRZYŻOWANIA ETAPY KRZYŻOWANIA
PLAN WYKŁADU Operator krzyżowania Operator mutacji Operator inwersji Sukcesja Przykłady symulacji AG Kodowanie - rodzaje OPTYMALIZACJA GLOBALNA Wykład 3 dr inż. Agnieszka Bołtuć OPERATOR KRZYŻOWANIA Wymiana
RILL - przyrostowy klasyfikator regułowy uczący się ze zmiennych środowisk
Wprowadzenie RILL - przyrostowy klasyfikator regułowy uczący się ze zmiennych środowisk Magdalena Deckert Politechnika Poznańska, Instytut Informatyki Seminarium ISWD, 21.05.2013 M. Deckert Przyrostowy
Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego
IBS PAN, Warszawa 9 kwietnia 2008 Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego mgr inż. Marcin Jaruszewicz promotor: dr hab. inż. Jacek Mańdziuk,
LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów
LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów Łukasz Piątek, Jerzy W. Grzymała-Busse Katedra Systemów Ekspertowych i Sztucznej Inteligencji, Wydział Informatyki
Multiklasyfikatory z funkcją kompetencji
3 stycznia 2011 Problem klasyfikacji Polega na przewidzeniu dyskretnej klasy na podstawie cech obiektu. Obiekt jest reprezentowany przez wektor cech Zbiór etykiet jest skończony x X Ω = {ω 1, ω 2,...,
Strategie ewolucyjne (ang. evolu4on strategies)
Strategie ewolucyjne (ang. evolu4on strategies) Strategia ewolucyjna (1+1) W Strategii Ewolucyjnej(1 + 1), populacja złożona z jednego osobnika generuje jednego potomka. Kolejne (jednoelementowe) populacje
Kombinacja jądrowych estymatorów gęstości w klasyfikacji wstępne wyniki
Kombinacja jądrowych estymatorów gęstości w klasyfikacji wstępne wyniki Mateusz Kobos, 10.12.2008 Seminarium Metody Inteligencji Obliczeniowej 1/46 Spis treści Działanie algorytmu Uczenie Odtwarzanie/klasyfikacja
Algorytm genetyczny (genetic algorithm)-
Optymalizacja W praktyce inżynierskiej często zachodzi potrzeba znalezienia parametrów, dla których system/urządzenie będzie działać w sposób optymalny. Klasyczne podejście do optymalizacji: sformułowanie
Algorytmy klasyfikacji
Algorytmy klasyfikacji Konrad Miziński Instytut Informatyki Politechnika Warszawska 6 maja 2015 1 Wnioskowanie 2 Klasyfikacja Zastosowania 3 Drzewa decyzyjne Budowa Ocena jakości Przycinanie 4 Lasy losowe
Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU
Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18
Eksploracja Danych wykład 4 Sebastian Zając WMP.SNŚ UKSW 10 maja 2017 Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja 2017 1 / 18 Klasyfikacja danych Klasyfikacja Najczęściej stosowana (najstarsza)
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium MATLAB Zadanie nr 2 κ-nn i Naive Bayes autorzy: M. Zięba, J.M. Tomczak, A. Gonczarek, S. Zaręba Cel zadania Celem zadania jest implementacja klasyfikatorów
Dobór parametrów algorytmu ewolucyjnego
Dobór parametrów algorytmu ewolucyjnego 1 2 Wstęp Algorytm ewolucyjny posiada wiele parametrów. Przykładowo dla algorytmu genetycznego są to: prawdopodobieństwa stosowania operatorów mutacji i krzyżowania.
Systemy uczące się Lab 4
Systemy uczące się Lab 4 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 26 X 2018 Projekt zaliczeniowy Podstawą zaliczenia ćwiczeń jest indywidualne wykonanie projektu uwzględniającego
Rozpoznawanie obrazów
Rozpoznawanie obrazów Laboratorium Python Zadanie nr 2 κ-nn i Naive Bayes autorzy: M. Zięba, J.M. Tomczak, A. Gonczarek, S. Zaręba, J. Kaczmar Cel zadania Celem zadania jest implementacja klasyfikatorów
8. Drzewa decyzyjne, bagging, boosting i lasy losowe
Algorytmy rozpoznawania obrazów 8. Drzewa decyzyjne, bagging, boosting i lasy losowe dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Drzewa decyzyjne Drzewa decyzyjne (ang. decision trees), zwane
Optymalizacja optymalizacji
7 maja 2008 Wstęp Optymalizacja lokalna Optymalizacja globalna Algorytmy genetyczne Badane czasteczki Wykorzystane oprogramowanie (Algorytm genetyczny) 2 Sieć neuronowa Pochodne met-enkefaliny Optymalizacja
Automatyczny dobór parametrów algorytmu genetycznego
Automatyczny dobór parametrów algorytmu genetycznego Remigiusz Modrzejewski 22 grudnia 2008 Plan prezentacji Wstęp Atrakcyjność Pułapki Klasyfikacja Wstęp Atrakcyjność Pułapki Klasyfikacja Konstrukcja
Co to jest grupowanie
Grupowanie danych Co to jest grupowanie 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Szukanie grup, obszarów stanowiących lokalne gromady punktów Co to jest grupowanie
SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006
SAS wybrane elementy DATA MINING Część III Seweryn Kowalski 2006 Algorytmy eksploracji danych Algorytm eksploracji danych jest dobrze zdefiniowaną procedurą, która na wejściu otrzymuje dane, a na wyjściu
S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor
S O M SELF-ORGANIZING MAPS Przemysław Szczepańczyk Łukasz Myszor Podstawy teoretyczne Map Samoorganizujących się stworzył prof. Teuvo Kohonen (1982 r.). SOM wywodzi się ze sztucznych sieci neuronowych.
ALGORYTM RANDOM FOREST
SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM
4.1. Wprowadzenie...70 4.2. Podstawowe definicje...71 4.3. Algorytm określania wartości parametrów w regresji logistycznej...74
3 Wykaz najważniejszych skrótów...8 Przedmowa... 10 1. Podstawowe pojęcia data mining...11 1.1. Wprowadzenie...12 1.2. Podstawowe zadania eksploracji danych...13 1.3. Główne etapy eksploracji danych...15
Widzenie komputerowe (computer vision)
Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja
Pattern Classification
Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors
Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe
Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe Trening jednokierunkowych sieci neuronowych wykład 2. dr inż. PawełŻwan Katedra Systemów Multimedialnych Politechnika Gdańska
IMPLEMENTACJA SIECI NEURONOWYCH MLP Z WALIDACJĄ KRZYŻOWĄ
IMPLEMENTACJA SIECI NEURONOWYCH MLP Z WALIDACJĄ KRZYŻOWĄ Celem ćwiczenia jest zapoznanie się ze sposobem działania sieci neuronowych typu MLP (multi-layer perceptron) uczonych nadzorowaną (z nauczycielem,
Algorytm grupowania danych typu kwantyzacji wektorów
Algorytm grupowania danych typu kwantyzacji wektorów Wstęp Definicja problemu: Typowe, rozważane dotychczas problemy koncentrowały się na nauczeniu na podstawie zbioru treningowego i zbioru etykiet klasyfikacji
Indeksy w bazach danych. Motywacje. Techniki indeksowania w eksploracji danych. Plan prezentacji. Dotychczasowe prace badawcze skupiały się na
Techniki indeksowania w eksploracji danych Maciej Zakrzewicz Instytut Informatyki Politechnika Poznańska Plan prezentacji Zastosowania indeksów w systemach baz danych Wprowadzenie do metod eksploracji
Metody klasyfikacji danych - część 1 p.1/24
Metody klasyfikacji danych - część 1 Inteligentne Usługi Informacyjne Jerzy Dembski Metody klasyfikacji danych - część 1 p.1/24 Plan wykładu - Zadanie klasyfikacji danych - Przeglad problemów klasyfikacji
Algorytmy genetyczne. Paweł Cieśla. 8 stycznia 2009
Algorytmy genetyczne Paweł Cieśla 8 stycznia 2009 Genetyka - nauka o dziedziczeniu cech pomiędzy pokoleniami. Geny są czynnikami, które decydują o wyglądzie, zachowaniu, rozmnażaniu każdego żywego organizmu.
Drzewa decyzyjne i lasy losowe
Drzewa decyzyjne i lasy losowe Im dalej w las tym więcej drzew! ML Gdańsk http://www.mlgdansk.pl/ Marcin Zadroga https://www.linkedin.com/in/mzadroga/ 20 Czerwca 2017 WPROWADZENIE DO MACHINE LEARNING CZYM
Zastosowanie metod eksploracji danych (data mining) do sterowania i diagnostyki procesów w przemyśle spożywczym
POLITECHNIKA WARSZAWSKA Instytut Technik Wytwarzania Zastosowanie metod eksploracji danych (data mining) do sterowania i diagnostyki procesów w przemyśle spożywczym Marcin Perzyk Dlaczego eksploracja danych?
Zastosowania metod odkrywania wiedzy do diagnostyki maszyn i procesów
Zastosowania metod odkrywania wiedzy do diagnostyki maszyn i procesów Wojciech Moczulski Politechnika Śląska Katedra Podstaw Konstrukcji Maszyn Sztuczna inteligencja w automatyce i robotyce Zielona Góra,
Algorytm Genetyczny. zastosowanie do procesów rozmieszczenia stacji raportujących w sieciach komórkowych
Algorytm Genetyczny zastosowanie do procesów rozmieszczenia stacji raportujących w sieciach komórkowych Dlaczego Algorytmy Inspirowane Naturą? Rozwój nowych technologii: złożone problemy obliczeniowe w
SI w procesach przepływu i porządkowania informacji. Paweł Buchwald Wyższa Szkoła Biznesu
SI w procesach przepływu i porządkowania informacji Paweł Buchwald Wyższa Szkoła Biznesu Początki SI John MC Carthy prekursor SI Alan Thuring pomysłodawca testu na określenie inteligencji maszyn Powolny
Algorytmy genetyczne
9 listopada 2010 y ewolucyjne - zbiór metod optymalizacji inspirowanych analogiami biologicznymi (ewolucja naturalna). Pojęcia odwzorowujące naturalne zjawiska: Osobnik Populacja Genotyp Fenotyp Gen Chromosom
Wielokryterialne harmonogramowanie portfela projektów. Bogumiła Krzeszowska Katedra Badań Operacyjnych
Wielokryterialne harmonogramowanie portfela projektów Bogumiła Krzeszowska Katedra Badań Operacyjnych Problem Należy utworzyć harmonogram portfela projektów. Poprzez harmonogram portfela projektów będziemy
Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań
Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań Anna Manerowska, Michal Kozakiewicz 2.12.2009 1 Wstęp Jako projekt na przedmiot MEUM (Metody Ewolucyjne Uczenia Maszyn)
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny
Systemy uczące się wykład 2
Systemy uczące się wykład 2 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 19 X 2018 Podstawowe definicje Fakt; Przesłanka; Konkluzja; Reguła; Wnioskowanie. Typy wnioskowania
PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE
UNIWERSYTET WARMIŃSKO-MAZURSKI W OLSZTYNIE PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE http://matman.uwm.edu.pl/psi e-mail: psi@matman.uwm.edu.pl ul. Słoneczna 54 10-561
Metody zbiorów przybliżonych w uczeniu się podobieństwa z wielowymiarowych zbiorów danych
Metody zbiorów przybliżonych w uczeniu się podobieństwa z wielowymiarowych zbiorów danych WMIM, Uniwersytet Warszawski ul. Banacha 2, 02-097 Warszawa, Polska andrzejanusz@gmail.com 13.06.2013 Dlaczego
Obliczenia ewolucyjne - plan wykładu
Obliczenia ewolucyjne - plan wykładu Wprowadzenie Algorytmy genetyczne Programowanie genetyczne Programowanie ewolucyjne Strategie ewolucyjne Inne modele obliczeń ewolucyjnych Podsumowanie Ewolucja Ewolucja
Prof. Stanisław Jankowski
Prof. Stanisław Jankowski Zakład Sztucznej Inteligencji Zespół Statystycznych Systemów Uczących się p. 228 sjank@ise.pw.edu.pl Zakres badań: Sztuczne sieci neuronowe Maszyny wektorów nośnych SVM Maszyny
Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne)
Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne) Tadeusz Pankowski www.put.poznan.pl/~tadeusz.pankowski Klasyfikacja i predykcja. Odkrywaniem reguł klasyfikacji nazywamy proces znajdowania
1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie
Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty
Metody Rozmyte i Algorytmy Ewolucyjne
mgr inż. Wydział Matematyczno-Przyrodniczy Szkoła Nauk Ścisłych Uniwersytet Kardynała Stefana Wyszyńskiego Podstawowe operatory genetyczne Plan wykładu Przypomnienie 1 Przypomnienie Metody generacji liczb
Algorytm grupowania danych typu kwantyzacji wektorów
Algorytm grupowania danych typu kwantyzacji wektorów Wstęp Definicja problemu: Typowe, problemem często spotykanym w zagadnieniach eksploracji danych (ang. data mining) jest zagadnienie grupowania danych
Podejście memetyczne do problemu DCVRP - wstępne wyniki. Adam Żychowski
Podejście memetyczne do problemu DCVRP - wstępne wyniki Adam Żychowski Na podstawie prac X. S. Chen, L. Feng, Y. S. Ong A Self-Adaptive Memeplexes Robust Search Scheme for solving Stochastic Demands Vehicle
Metody selekcji cech
Metody selekcji cech A po co to Często mamy do dyspozycji dane w postaci zbioru cech lecz nie wiemy które z tych cech będą dla nas istotne. W zbiorze cech mogą wystąpić cechy redundantne niosące identyczną
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Systemy uczące się wykład 1
Systemy uczące się wykład 1 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 5 X 2018 e-mail: przemyslaw.juszczuk@ue.katowice.pl Konsultacje: na stronie katedry + na stronie domowej
Ewelina Dziura Krzysztof Maryański
Ewelina Dziura Krzysztof Maryański 1. Wstęp - eksploracja danych 2. Proces Eksploracji danych 3. Reguły asocjacyjne budowa, zastosowanie, pozyskiwanie 4. Algorytm Apriori i jego modyfikacje 5. Przykład
Strategie ewolucyjne. Gnypowicz Damian Staniszczak Łukasz Woźniak Marek
Strategie ewolucyjne Gnypowicz Damian Staniszczak Łukasz Woźniak Marek Strategie ewolucyjne, a algorytmy genetyczne Podobieństwa: Oba działają na populacjach rozwiązań Korzystają z zasad selecji i przetwarzania
Tomasz Pawlak. Zastosowania Metod Inteligencji Obliczeniowej
1 Zastosowania Metod Inteligencji Obliczeniowej Tomasz Pawlak 2 Plan prezentacji Sprawy organizacyjne Wprowadzenie do metod inteligencji obliczeniowej Studium wybranych przypadków zastosowań IO 3 Dane
Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury. Paweł Kobojek, prof. dr hab. inż. Khalid Saeed
Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury Paweł Kobojek, prof. dr hab. inż. Khalid Saeed Zakres pracy Przegląd stanu wiedzy w dziedzinie biometrii, ze szczególnym naciskiem
Sztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 311
Sztuczne sieci neuronowe Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 311 Wykład 7 PLAN: - Repetitio (brevis) -Algorytmy miękkiej selekcji: algorytmy ewolucyjne symulowane wyżarzanie
KLASYFIKACJA. Słownik języka polskiego
KLASYFIKACJA KLASYFIKACJA Słownik języka polskiego Klasyfikacja systematyczny podział przedmiotów lub zjawisk na klasy, działy, poddziały, wykonywany według określonej zasady Klasyfikacja polega na przyporządkowaniu
Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
Adrian Horzyk
Metody Inteligencji Obliczeniowej Metoda K Najbliższych Sąsiadów (KNN) Adrian Horzyk horzyk@agh.edu.pl AGH Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
Aproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład III 2016/2017
Systemy pomiarowo-diagnostyczne Metody uczenia maszynowego wykład III bogumil.konopka@pwr.edu.pl 2016/2017 Wykład III - plan Regresja logistyczna Ocena skuteczności klasyfikacji Macierze pomyłek Krzywe
Metody i techniki sztucznej inteligencji / Leszek Rutkowski. wyd. 2, 3 dodr. Warszawa, Spis treści
Metody i techniki sztucznej inteligencji / Leszek Rutkowski. wyd. 2, 3 dodr. Warszawa, 2012 Spis treści Przedmowa do wydania drugiego Przedmowa IX X 1. Wstęp 1 2. Wybrane zagadnienia sztucznej inteligencji
Metody klasyfikacji i rozpoznawania wzorców. Najważniejsze rodzaje klasyfikatorów
Metody klasyfikacji i rozpoznawania wzorców www.michalbereta.pl Najważniejsze rodzaje klasyfikatorów Dla określonego problemu klasyfikacyjnego (tzn. dla danego zestawu danych) należy przetestować jak najwięcej
SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska
SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska DRZEWO REGRESYJNE Sposób konstrukcji i przycinania
Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów
Eksploracja danych Piotr Lipiński Informacje ogólne Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów UWAGA: prezentacja to nie
SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO
SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO. Rzeczywistość (istniejąca lub projektowana).. Model fizyczny. 3. Model matematyczny (optymalizacyjny): a. Zmienne projektowania
WYKŁAD 3. Klasyfikacja: modele probabilistyczne
Wrocław University of Technology WYKŁAD 3 Klasyfikacja: modele probabilistyczne Maciej Zięba Politechnika Wrocławska Klasyfikacja Klasyfikacja (ang. Classification): Dysponujemy obserwacjami z etykietami
SZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA WYKŁAD 4. UCZENIE SIĘ INDUKCYJNE Częstochowa 24 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska WSTĘP Wiedza pozyskana przez ucznia ma charakter odwzorowania
Testowanie modeli predykcyjnych
Testowanie modeli predykcyjnych Wstęp Podczas budowy modelu, którego celem jest przewidywanie pewnych wartości na podstawie zbioru danych uczących poważnym problemem jest ocena jakości uczenia i zdolności
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
ALGORYTMY EWOLUCYJNE W OPTYMALIZACJI JEDNOKRYTERIALNEJ
ALGORYTMY EWOLUCYJNE W OPTYMALIZACJI JEDNOKRYTERIALNEJ Zalety: nie wprowadzają żadnych ograniczeń na sformułowanie problemu optymalizacyjnego. Funkcja celu może być wielowartościowa i nieciągła, obszar
ALGORYTMY GENETYCZNE ćwiczenia
ćwiczenia Wykorzystaj algorytmy genetyczne do wyznaczenia minimum globalnego funkcji testowej: 1. Wylosuj dwuwymiarową tablicę 100x2 liczb 8-bitowych z zakresu [-100; +100] reprezentujących inicjalną populację
Zasady organizacji projektów informatycznych
Zasady organizacji projektów informatycznych Systemy informatyczne w zarządzaniu dr hab. inż. Joanna Józefowska, prof. PP Plan Definicja projektu informatycznego Fazy realizacji projektów informatycznych
Algorytmy ewolucyjne optymalizacji wielokryterialnej sterowane preferencjami decydenta
Algorytmy ewolucyjne optymalizacji wielokryterialnej sterowane preferencjami decydenta Dr Janusz Miroforidis MGI Metro Group Information Technology Polska Sp. z o.o. listopad 2010 Wprowadzenie Plan prezentacji
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
Wstęp do Sztucznej Inteligencji
Wstęp do Sztucznej Inteligencji Algorytmy Genetyczne Joanna Kołodziej Politechnika Krakowska Wydział Fizyki, Matematyki i Informatyki Metody heurystyczne Algorytm efektywny: koszt zastosowania (mierzony
Zastosowanie optymalizacji rojem cząstek (PSO) w procesie uczenia wielowarstwowej sieci neuronowej w problemie lokalizacyjnym, kontynuacja badań
Zastosowanie optymalizacji rojem cząstek (PSO) w procesie uczenia wielowarstwowej sieci neuronowej w problemie lokalizacyjnym, kontynuacja badań Jan Karwowski Wydział Matematyki i Nauk Informacyjnych PW
WYKŁAD 6. Reguły decyzyjne
Wrocław University of Technology WYKŁAD 6 Reguły decyzyjne autor: Maciej Zięba Politechnika Wrocławska Reprezentacje wiedzy Wiedza w postaci reguł decyzyjnych Wiedza reprezentowania jest w postaci reguł
Ontogeniczne sieci neuronowe. O sieciach zmieniających swoją strukturę
Norbert Jankowski Ontogeniczne sieci neuronowe O sieciach zmieniających swoją strukturę Warszawa 2003 Opracowanie książki było wspierane stypendium Uniwersytetu Mikołaja Kopernika Spis treści Wprowadzenie
Oferta szkoleniowa Yosi.pl 2012/2013
Oferta szkoleniowa Yosi.pl 2012/2013 "Podróżnik nie posiadający wiedzy, jest jak ptak bez skrzydeł" Sa'Di, Gulistan (1258 rok) Szanowni Państwo, Yosi.pl to dynamicznie rozwijająca się firma z Krakowa.
Mail: Pokój 214, II piętro
Wykład 2 Mail: agnieszka.nowak@us.edu.pl Pokój 214, II piętro http://zsi.tech.us.edu.pl/~nowak Predykcja zdolność do wykorzystania wiedzy zgromadzonej w systemie do przewidywania wartości dla nowych danych,
Algorytmy genetyczne w optymalizacji
Algorytmy genetyczne w optymalizacji Literatura 1. David E. Goldberg, Algorytmy genetyczne i ich zastosowania, WNT, Warszawa 1998; 2. Zbigniew Michalewicz, Algorytmy genetyczne + struktury danych = programy
WYKŁAD 4. Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie. autor: Maciej Zięba. Politechnika Wrocławska
Wrocław University of Technology WYKŁAD 4 Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie autor: Maciej Zięba Politechnika Wrocławska Klasyfikacja Klasyfikacja (ang. Classification):
Odkrywanie algorytmów kwantowych za pomocą programowania genetycznego
Odkrywanie algorytmów kwantowych za pomocą programowania genetycznego Piotr Rybak Koło naukowe fizyków Migacz, Uniwersytet Wrocławski Piotr Rybak (Migacz UWr) Odkrywanie algorytmów kwantowych 1 / 17 Spis
Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Elementy nieprzystające Definicja odrzucania Klasyfikacja
Stan dotychczasowy. OCENA KLASYFIKACJI w diagnostyce. Metody 6/10/2013. Weryfikacja. Testowanie skuteczności metody uczenia Weryfikacja prosta
Stan dotychczasowy OCENA KLASYFIKACJI w diagnostyce Wybraliśmy metodę uczenia maszynowego (np. sieć neuronowa lub drzewo decyzyjne), która będzie klasyfikować nieznane przypadki Na podzbiorze dostępnych
Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,
Klasyfikator Jedną z najistotniejszych nieparametrycznych metod klasyfikacji jest metoda K-najbliższych sąsiadów, oznaczana przez K-NN. W metodzie tej zaliczamy rozpoznawany obiekt do tej klasy, do której
w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą
Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji
Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji Michał Witczak Data Mining 20 maja 2012 r. 1. Wstęp Dostarczone zostały nam 4 pliki, z których dwa stanowiły zbiory uczące
Wprowadzenie do uczenia maszynowego
Wprowadzenie do uczenia maszynowego Agnieszka Ławrynowicz 12 stycznia 2017 Co to jest uczenie maszynowe? dziedzina nauki, która zajmuje się sprawianiem aby komputery mogły uczyć się bez ich zaprogramowania