RILL - przyrostowy klasyfikator regułowy uczący się ze zmiennych środowisk

Podobne dokumenty
mgr inż. Magdalena Deckert Poznań, r. Metody przyrostowego uczenia się ze strumieni danych.

mgr inż. Magdalena Deckert Poznań, r. Uczenie się klasyfikatorów przy zmieniającej się definicji klas.

Dariusz Brzeziński. Politechnika Poznańska

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

WYKŁAD 6. Reguły decyzyjne

Systemy uczące się Lab 4

Algorytmy metaheurystyczne Wykład 11. Piotr Syga

Agnieszka Nowak Brzezińska

Eksploracja danych. KLASYFIKACJA I REGRESJA cz. 2. Wojciech Waloszek. Teresa Zawadzka.

Systemy uczące się wykład 2

Odkrywanie wiedzy w danych

Identyfikacja istotnych atrybutów za pomocą Baysowskich miar konfirmacji

Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych. Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS

Klasyfikacja LDA + walidacja

Automatyczne wyodrębnianie reguł

Elementy modelowania matematycznego

Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji

SZTUCZNA INTELIGENCJA

komputery? Andrzej Skowron, Hung Son Nguyen Instytut Matematyki, Wydział MIM, UW

Wprowadzenie do klasyfikacji

Wybrane zagadnienia uczenia maszynowego. Zastosowania Informatyki w Informatyce W2 Krzysztof Krawiec

Sztuczna Inteligencja Projekt

Określanie ważności atrybutów. RapidMiner

Agnieszka Nowak Brzezińska Wykład III

Wprowadzenie do programu RapidMiner Studio 7.6, część 4 Michał Bereta

Ćwiczenie 6 - Hurtownie danych i metody eksploracje danych. Regresja logistyczna i jej zastosowanie

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Metody Sztucznej Inteligencji II

Algorytmy klasyfikacji

Indeksy w bazach danych. Motywacje. Techniki indeksowania w eksploracji danych. Plan prezentacji. Dotychczasowe prace badawcze skupiały się na

Adrian Horzyk

SYSTEMY UCZĄCE SIĘ WYKŁAD 3. DRZEWA DECYZYJNE. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Uczenie się maszyn. Dariusz Banasiak. Katedra Informatyki Technicznej Wydział Elektroniki

Instytut Mechaniki i Inżynierii Obliczeniowej Wydział Mechaniczny Technologiczny Politechnika Śląska

LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów

KLASYFIKACJA. Słownik języka polskiego

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Agnieszka Nowak Brzezińska Wykład III

ALGORYTMY SZTUCZNEJ INTELIGENCJI

Klasyfikacja publikacji biomedycznych w konkursie JRS 2012 Data Mining Competition - Szkic koncepcji

Spis treści. O autorce. O recenzentach. Wprowadzenie

4.1. Wprowadzenie Podstawowe definicje Algorytm określania wartości parametrów w regresji logistycznej...74

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

Instrukcja wprowadzania i aktualizacji danych dotyczących realizacji wypłat w Oprogramowaniu do obsługi Świadczeń SR/SW/FA

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów

Podstawy sztucznej inteligencji

Stan dotychczasowy. OCENA KLASYFIKACJI w diagnostyce. Metody 6/10/2013. Weryfikacja. Testowanie skuteczności metody uczenia Weryfikacja prosta

Sztuczna inteligencja : Algorytm KNN

Systemy uczące się wykład 1

wykład Organizacja plików Opracował: dr inż. Janusz DUDCZYK

Testowanie oprogramowania. Testowanie oprogramowania 1/34

Eksploracja danych OCENA KLASYFIKATORÓW. Wojciech Waloszek. Teresa Zawadzka.

ALGORYTM RANDOM FOREST


9. Praktyczna ocena jakości klasyfikacji

MODELOWANIE OBCIĄŻEŃ ZIAREN AKTYWNYCH I SIŁ W PROCESIE SZLIFOWANIA

Zadania laboratoryjne i projektowe - wersja β

Wprowadzenie do uczenia maszynowego

Zadania do wykonania. Rozwiązując poniższe zadania użyj pętlę for.

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

Sprzętowo wspomagane metody klasyfikacji danych

Zad. 3: Układ równań liniowych

Asocjacyjna reprezentacja danych i wnioskowanie

WYKŁAD 11 Uczenie maszynowe drzewa decyzyjne

ZeroR. Odpowiada zawsze tak samo Decyzja to klasa większościowa ze zbioru uczącego A B X 1 5 T 1 7 T 1 5 T 1 5 F 2 7 F

Monitoring procesów z wykorzystaniem systemu ADONIS. Krok po kroku

Metody systemowe i decyzyjne w informatyce

TEORETYCZNE PODSTAWY INFORMATYKI

Zaawansowane algorytmy i struktury danych

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

EGZAMIN - Wersja A. ALGORYTMY I STRUKTURY DANYCH Lisek89 opracowanie kartki od Pani dr E. Koszelew

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,

Uwaga: szarych kropek po pokolorowaniu nie uwzględniaj w klasyfikowaniu kolejnych szarych.

Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne)

Badania w zakresie systemów uczących się w Zakładzie ISWD. Politechnika Poznańska Instytut Informatyki

Analiza metod wykrywania przekazów steganograficznych. Magdalena Pejas Wydział EiTI PW

WSPOMAGANIE DECYZJI - MIŁOSZ KADZIŃSKI LAB IV ZBIORY PRZYBLIŻONE I ODKRYWANIE REGUŁ DECYZYJNYCH

Techniki uczenia maszynowego nazwa przedmiotu SYLABUS

ZASADY PROGRAMOWANIA KOMPUTERÓW

Wstęp do programowania

Heurystyki. Strategie poszukiwań

T-Flex Parametric CAD - konstrukcje modułowe

Jacek Skorupski pok. 251 tel konsultacje: poniedziałek , sobota zjazdowa

Metody klasyfikacji danych - część 1 p.1/24

Wykład 1: Wskaźniki i zmienne dynamiczne

Zad. 3: Rotacje 2D. Demonstracja przykładu problemu skończonej reprezentacji binarnej liczb

Text mining w programie RapidMiner Michał Bereta

Komputer i urządzenia cyfrowe

Metody systemowe i decyzyjne w informatyce

ID1SII4. Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

Optymalizacja systemów

bo od managera wymaga się perfekcji

Wykrywanie twarzy na zdjęciach przy pomocy kaskad

Modelowanie i obliczenia techniczne. dr inż. Paweł Pełczyński

Data Mining Wykład 5. Indukcja drzew decyzyjnych - Indeks Gini & Zysk informacyjny. Indeks Gini. Indeks Gini - Przykład

Algorytm. a programowanie -

Testowanie hipotez statystycznych

Reguły decyzyjne, algorytm AQ i CN2. Reguły asocjacyjne, algorytm Apriori.

Transkrypt:

Wprowadzenie RILL - przyrostowy klasyfikator regułowy uczący się ze zmiennych środowisk Magdalena Deckert Politechnika Poznańska, Instytut Informatyki Seminarium ISWD, 21.05.2013 M. Deckert Przyrostowy klasyfikator regułowy RILL 1 / 38

Plan prezentacji Wprowadzenie 1 Wprowadzenie Concept drift i rodzaje zmian Regułowe algorytmy przyrostowe dla zmiennych środowisk FLORA AQ11-PM-WAH FACIL VFDR 2 Motywacje Założenia Ogólny schemat działania algorytmu RILL 3 4 M. Deckert Przyrostowy klasyfikator regułowy RILL 2 / 38

Wprowadzenie Concept drift i rodzaje zmian Regułowe algorytmy przyrostowe dla zmiennych środowisk Statyczny schemat tworzenia klasyfikatorów Klasyfikator Przykłady uczące Algorytm uczący M. Deckert Przyrostowy klasyfikator regułowy RILL 3 / 38

Strumienie danych Wprowadzenie Concept drift i rodzaje zmian Regułowe algorytmy przyrostowe dla zmiennych środowisk Strumienie danych charakteryzują się bardzo dużym rozmiarem danych (nawet nieskończonym). Środowisko, a tym samym problem klasyfikacji, może zmieniać się wraz z upływem czasu. M. Deckert Przyrostowy klasyfikator regułowy RILL 4 / 38

Wprowadzenie Concept drift i rodzaje zmian Regułowe algorytmy przyrostowe dla zmiennych środowisk Concept drift Definicja Concept Drift właściwości klasy decyzyjnej, którą model próbuje przewidzieć, zmieniają się wraz z upływem czasu w nieprzewidziany sposób Problem Trafność klasyfikacji maleje wraz z upływem czasu. M. Deckert Przyrostowy klasyfikator regułowy RILL 5 / 38

Rodzaje zmian Wprowadzenie Concept drift i rodzaje zmian Regułowe algorytmy przyrostowe dla zmiennych środowisk Zmiana nagła stopniowa inne powracające pojęcia blips szum M. Deckert Przyrostowy klasyfikator regułowy RILL 6 / 38

Wprowadzenie Algorytmy przyrostowe Concept drift i rodzaje zmian Regułowe algorytmy przyrostowe dla zmiennych środowisk Przetwarzają dane etykietowane przykład po przykładzie. Powstały znacznie wcześniej niż pojęcie concept drift. Ich wiedza może mieć różne reprezentacje, m.in. reguły decyzyjne. Zdaniem prof. Gamy przyrostowe generowanie reguł decyzyjnych nie jest zbyt popularne w środowisku uczenia się ze zmiennych środowisk. M. Deckert Przyrostowy klasyfikator regułowy RILL 7 / 38

Wprowadzenie Concept drift i rodzaje zmian Regułowe algorytmy przyrostowe dla zmiennych środowisk Regułowe algorytmy przyrostowe dla zmiennych środowisk Istniejące algorytmy FLORA VFDR AQ11- PM-WAH FACIL M. Deckert Przyrostowy klasyfikator regułowy RILL 8 / 38

Wprowadzenie Concept drift i rodzaje zmian Regułowe algorytmy przyrostowe dla zmiennych środowisk Algorytm FLORA Składowe algorytmu FLORA FLORA posiada okno czasowe z zapamiętanymi przykładami uczącymi. Wiedza reprezentowana jest za pomocą nieuporządkowanego zbioru reguł. Z każdą hipotezą związane są 3 zbiory ADES, NDES, PDES. M. Deckert Przyrostowy klasyfikator regułowy RILL 9 / 38

Wprowadzenie Concept drift i rodzaje zmian Regułowe algorytmy przyrostowe dla zmiennych środowisk Algorytm FLORA Rodzaje algorytmu FLORA FLORA ma stały rozmiar okna czasowego. FLORA2 ma możliwość dynamicznego dostosowywania rozmiaru okna czasowego. FLORA3 rozpoznaje powracające opisy pojęć. FLORA4 rozpoznaje zjawisko szumu. M. Deckert Przyrostowy klasyfikator regułowy RILL 10 / 38

Wprowadzenie Algorytm AQ11-PM-WAH Concept drift i rodzaje zmian Regułowe algorytmy przyrostowe dla zmiennych środowisk AQ11-PM-WAH zapamiętuje wybrane przykłady uczące (częściowa pamięć przykładów). Wyznaczają one lub wzmacniają wyindukowane granice opisów pojęć. W każdej fazie uczenia nowe przykłady uczące, które są źle klasyfikowane, łączone są z przykładami przechowywanymi w pamięci i generowany jest aktualny model wiedzy. Na koniec, za pomocą nowego zbioru reguł, uaktualniane są przykłady brzegowe w pamięci. Przykłady, które nie definiują już granic opisów pojęć są usuwane. M. Deckert Przyrostowy klasyfikator regułowy RILL 11 / 38

Algorytm FACIL Wprowadzenie Concept drift i rodzaje zmian Regułowe algorytmy przyrostowe dla zmiennych środowisk Algorytm FACIL posiada podobnie jak AQ11-PM-WAH częściową pamięć przykładów składającą się z przykładów granicznych (osobną dla każdej reguły). Pozwala on na generowanie nieczystych reguł (pokrywają zarówno przykłady pozytywne jak i negatywne). Zapamiętuje 2 przykłady pozytywne na każdy 1 negatywny pokryty przez regułę. Dzięki temu, po przekroczeniu minimalnego progu czystości, nowe reguły generowane są z obu typów przykładów. M. Deckert Przyrostowy klasyfikator regułowy RILL 12 / 38

Algorytm VFDR Wprowadzenie Concept drift i rodzaje zmian Regułowe algorytmy przyrostowe dla zmiennych środowisk Algorytm dedykowany przetwarzaniu strumieni o bardzo dużych rozmiarach, w których nowe przykłady pojawiają się bardzo szybko. Ma on możliwość wygenerowania zarówno nieuporządkowanego jak i uporządkowanego zbioru reguł. Nie ma pamięci przykładów, lecz utrzymuje strukturę danych zawierającą statystyki niezbędne do klasyfikacji nowych przykładów oraz aktualizacji reguł. Każda reguła decyzyjna ma swoją oddzielną strukturę danych. M. Deckert Przyrostowy klasyfikator regułowy RILL 13 / 38

Algorytm VFDR Wprowadzenie Concept drift i rodzaje zmian Regułowe algorytmy przyrostowe dla zmiennych środowisk Algorytm wykorzystuje ograniczenia Hoeffdinga, aby określić liczbę przykładów uczących, po których należy zaktualizować zbiór reguł decyzyjnych. Ponadto określają one także czy pojedyncza reguła wymaga rozszerzenia. Rozszerzenie VFDR-MC pozwala na rozwiązywanie problemów wieloklasowych. VFDR został także dostosowany do zmiennych środowisk. W rozszerzeniu AVFDR każdą regułę powiązano z jawnym detektorem zmian bazującym na detektorze DDM, który śledzi jakość klasyfikacji reguły. M. Deckert Przyrostowy klasyfikator regułowy RILL 14 / 38

Wprowadzenie Porównanie istniejących algorytmów Concept drift i rodzaje zmian Regułowe algorytmy przyrostowe dla zmiennych środowisk Kryterium FLORA AQ11-PM-WAH typ danych nominalne nominalne i numeryczne problem klasyfikacji binarny wieloklasowy typ pamięci okno czasowe pamięć częściowa reprezentacja wiedzy ADES, NDES, PDES nieuporządkowana dane testowe STAGGER Kryterium FACIL VFDR typ danych nominalne i numeryczne problem klasyfikacji wieloklasowy typ pamięci pamięć częściowa brak reprezentacja wiedzy nieuporządkowana nie- i uporządkowana dane testowe hyperplane różne M. Deckert Przyrostowy klasyfikator regułowy RILL 15 / 38

Motywacje Wprowadzenie Motywacje Założenia Ogólny schemat działania algorytmu RILL Eksperymenty związane z BWE i OBWE pokazały, że wprowadzenie elementu przyrostowości może poprawić trafność klasyfikacji. Reguły decyzyjne mogą być łatwo dostosowane do zmian poprzez usunięcie lub modyfikację istniejących reguł. Poprzez pokrywanie fragmentów przestrzeni są bardziej elastyczne niż drzewa - nie ma konieczności przebudowy całego modelu. Ponadto, w uczeniu przyrostowym, drzewo decyzyjne może wymagać większej liczby zmian. Przyrostowa indukcja reguł jest skomplikowana i może powodowac mniejsze zainteresowanie tą tematyką. M. Deckert Przyrostowy klasyfikator regułowy RILL 16 / 38

Założenia 1 Wprowadzenie Motywacje Założenia Ogólny schemat działania algorytmu RILL Nowy algorytm będzie przetwarzał strumienie danych, które zawierają atrybuty nominalne oraz numeryczne. Nowy algorytm będzie rozwiązywał problemy wieloklasowe. Nowy algorytm będzie mógł działać samodzielnie oraz w połączeniu z klasyfikatorem złożonym OBWE. M. Deckert Przyrostowy klasyfikator regułowy RILL 17 / 38

Założenia 2 Wprowadzenie Motywacje Założenia Ogólny schemat działania algorytmu RILL Wiedza klasyfikatora będzie reprezentowana w postaci nieuporządkowanego zbioru reguł decyzyjnych postaci: jeżeli atr-num w [d;g] oraz atr-nom = nominał to klasa. Z każdą regułą zapamiętywane są istotne statytstyki: moment ostatniego użycia liczba poprawnie sklasyfikowanych przykładów liczba niepoprawnie sklasyfikowanych przykładów liczba pokrytych przykładów pozytywnych z okna czasowego liczba pokrytych przykładów negatywnych z okna czasowego M. Deckert Przyrostowy klasyfikator regułowy RILL 18 / 38

Założenia 3 Wprowadzenie Motywacje Założenia Ogólny schemat działania algorytmu RILL Nowy algorytm powinien radzić sobie z dwoma głównymi typami zmian: nagłą i stopniową. Nowy algorytm będzie ewaluowany samodzielnie na następujących miarach oceny: trafności klasyfikacji, czasie przetwarzania oraz zajętości pamięci - ma mieć sensowne wymagania wydajnościowe przy satysfakcjonującej trafności klasyfikacji. M. Deckert Przyrostowy klasyfikator regułowy RILL 19 / 38

Wprowadzenie Motywacje Założenia Ogólny schemat działania algorytmu RILL Ogólny schemat działania algorytmu RILL Dla każdego nowego przykładu możliwe są następujące sytuacje: sprawdzane są reguły wskazujące na klasę przykładu sprawdzane są reguły wskazujące na inną klasę decyzyjną jeśli przykład nie został pokryty przez żadną z reguł wskazujących na klasę przykładu, to sprawdzana jest możliwość generalizacji jeśli przykład nie został pokryty przez żadną z reguł wskazujących na klasę przykładu oraz generalizacja nie powiodła się, to dodawany jest pełen opis przykładu jako nowa reguła decyzyjna istniejący zbiór reguł jest aktualizowany - usuwanie reguł M. Deckert Przyrostowy klasyfikator regułowy RILL 20 / 38

Generalizacja 1 Wprowadzenie Motywacje Założenia Ogólny schemat działania algorytmu RILL Znajdź najbliższą regułę dla danego przykładu za pomocą miary odległości: odleglosc(x, y) = m da 2 (x a, y a ) a=1 1 jeśli wartość jest nieznana d a = 0 lub 1 dla nominalnego x a ya g lub ya d x a dla numerycznego M. Deckert Przyrostowy klasyfikator regułowy RILL 21 / 38

Generalizacja 2 Wprowadzenie Motywacje Założenia Ogólny schemat działania algorytmu RILL Wyszukaj wszystkie atrybuty, na których reguła nie jest dopasowana do przykładu uczącego i zmodyfikuj je wszystkie jednocześnie - możliwe akcje to: usunięcie atrybutu nominalnego, rozszerzenie atrybutu numerycznego oraz usunięcie atrybutu numerycznego (aktualnie niedostępne). Oceń zmodyfikowaną regułę wykorzystując wybraną miarę oceny (połączenie zmiany wsparcia oraz ufności): Ocena = B B (P(H B ) P(H B)) Jeśli uogólniana reguła ma dodatnią wartość miary oceny, to zastąp starą najbliższą regułę jej zmodyfikowaną wersją. M. Deckert Przyrostowy klasyfikator regułowy RILL 22 / 38

Generalizacja 3 Wprowadzenie Motywacje Założenia Ogólny schemat działania algorytmu RILL Zaktualizuj wszystkie statystyki nowo wstawionej reguły: moment ostatniego użycia liczba poprawnie sklasyfikowanych przykładów liczba niepoprawnie sklasyfikowanych przykładów liczba pokrytych przykładów pozytywnych z okna czasowego liczba pokrytych przykładów negatywnych z okna czasowego M. Deckert Przyrostowy klasyfikator regułowy RILL 23 / 38

Usuwanie reguł Wprowadzenie Motywacje Założenia Ogólny schemat działania algorytmu RILL Reguła jest usuwana, gdy: jest stara - nie była używana przez zdefiniowany okres czasu (k okno, gdzie k-parametr) czystość reguły spadła poniżej dopuszczalnego poziomu - minimalny próg czystości określany na podstawie przedziału ufności dla czystości reguł z klasy decyzyjnej wskazywanej przez daną regułę decyzyjną żle klasyfikuje - trafność klasyfikacji spadła poniżej zdefiniowanego progu (aktualnie niedostępne) M. Deckert Przyrostowy klasyfikator regułowy RILL 24 / 38

Eksperymenty Wprowadzenie Struktura eksperymentów Zbiory danych Wyniki eksperymentalne Implementaje znanych przyrostowych algorytmów regułowych są niedostępne. Przetestowano 4 różne klasyfikatory przyrostowe: HoeffdingTree, NaiveBayes, HoeffdingTree z NaiveBayes oraz RILL. Klasyfikatory zaimplementowane są w języku Java i włączone do środowiska Massive Online Analysis. Mierzono następujące miary ewaluacji: trafność klasyfikacji, czas przetwarzania oraz rozmiar zbudowanego modelu wyrażone za pomocą użytego rozmiaru pamięci. M. Deckert Przyrostowy klasyfikator regułowy RILL 25 / 38

Zbiory danych Wprowadzenie Struktura eksperymentów Zbiory danych Wyniki eksperymentalne Zbiór danych Przykłady Atrybuty Klasy Typ zmiany CovType 581012 54 7 nieznany Electricity 45312 8 2 nieznany Poker 829201 11 10 nieznany Hyperplane 100000 10 4 stopniowa RBFGradual 100000 20 4 stopniowa STAGGER 100000 3 2 nagła RBFSudden 100000 20 4 nagła RBFBlips 100000 20 4 blips RBFNoDrift 100000 10 2 N/A M. Deckert Przyrostowy klasyfikator regułowy RILL 26 / 38

Wprowadzenie Struktura eksperymentów Zbiory danych Wyniki eksperymentalne Trafność klasyfikacji dla zbioru danych Electricity M. Deckert Przyrostowy klasyfikator regułowy RILL 27 / 38

Wprowadzenie Struktura eksperymentów Zbiory danych Wyniki eksperymentalne Trafność klasyfikacji dla zbioru danych Poker M. Deckert Przyrostowy klasyfikator regułowy RILL 28 / 38

Wprowadzenie Struktura eksperymentów Zbiory danych Wyniki eksperymentalne Trafność klasyfikacji dla zbioru RBF z nagłą zmianą M. Deckert Przyrostowy klasyfikator regułowy RILL 29 / 38

Wprowadzenie Struktura eksperymentów Zbiory danych Wyniki eksperymentalne Trafność klasyfikacji dla zbioru STAGGER z szybką zmianą M. Deckert Przyrostowy klasyfikator regułowy RILL 30 / 38

Wprowadzenie Struktura eksperymentów Zbiory danych Wyniki eksperymentalne Trafność klasyfikacji dla zbioru z wolną stopniową zmianą M. Deckert Przyrostowy klasyfikator regułowy RILL 31 / 38

Wprowadzenie Struktura eksperymentów Zbiory danych Wyniki eksperymentalne Trafność klasyfikacji dla zbioru z szybką stopniową zmianą M. Deckert Przyrostowy klasyfikator regułowy RILL 32 / 38

Wprowadzenie Struktura eksperymentów Zbiory danych Wyniki eksperymentalne wyników dla trafności klasyfikacji RILL całkiem dobrze radzi sobie z rzeczywistymi zbiorami danych. W 2/3 uzyskuje najwyższą trafność klasyfikacji. Dla zbioru RBF z nagłą zmianą RILL uzyskał najwyższą trafność klasyfikacji. STAGGER jest trudnym zbiorem danych - zmiany są bardzo szybkie i żaden z testowanych klasyfikatorów nie dał dobrego wyniku. Dla zbiorów z blipsami oraz bez zmian RILL uzyskał najwyższą trafność klasyfikacji. RILL nie uzyskał satysfakcjonujących wyników na zbiorach danych ze stopniową zmianą. M. Deckert Przyrostowy klasyfikator regułowy RILL 33 / 38

Wprowadzenie Struktura eksperymentów Zbiory danych Wyniki eksperymentalne Przykładowy wykres zużycia pamięci M. Deckert Przyrostowy klasyfikator regułowy RILL 34 / 38

Wprowadzenie Struktura eksperymentów Zbiory danych Wyniki eksperymentalne Przykładowy wykres czasu przetwarzania M. Deckert Przyrostowy klasyfikator regułowy RILL 35 / 38

Wprowadzenie Dalsze prace Pytania Omówiono istniejące przyrostowe algorytmy indukcji reguł uczące się w zmiennych środowiskach: FLORA, AQ11-PM-WAH, FACIL, VFDR. Przedstawiono wstępną propozycję nowego algorytmu RILL oraz uzyskane wyniki eksperymentalne. M. Deckert Przyrostowy klasyfikator regułowy RILL 36 / 38

Dalsze prace Wprowadzenie Dalsze prace Pytania Analiza zachowania wstępnej propozycji RILL w szczególności dla zbiorów ze stopniową zmianą. Poprawa zachowania RILL dla zbiorów ze stopniową zmianą. Znaczne zmniejszenie wymagań pamięciowych oraz czasowych algorytmu RILL. Propozycja nowej miary oceny jakości generalizacji. Propozycja specjalizacji reguły. Uwzględnienie jakości klasyfikacji reguły - przy generowaniu reguły oraz usuwaniu reguł. M. Deckert Przyrostowy klasyfikator regułowy RILL 37 / 38

Pytania Wprowadzenie Dalsze prace Pytania M. Deckert Przyrostowy klasyfikator regułowy RILL 38 / 38