Laboratorium 11. Regresja SVM.

Podobne dokumenty
Laboratorium 4. Naiwny klasyfikator Bayesa.

Laboratorium 6. Indukcja drzew decyzyjnych.

Laboratorium 7. Support Vector Machines (klasyfikacja).

Laboratorium 5. Adaptatywna sieć Bayesa.

Laboratorium 10. Odkrywanie cech i algorytm Non-Negative Matrix Factorization.

Laboratorium 12. Odkrywanie osobliwości.

Laboratorium 2. Określanie ważności atrybutów.

2. Ocena dokładności modelu klasyfikacji:

Laboratorium 13. Eksploracja danych tekstowych.

Laboratorium 3. Odkrywanie reguł asocjacyjnych.

1. Grupowanie Algorytmy grupowania:

1. Odkrywanie asocjacji

Ćwiczenie 5. Eksploracja danych

Ćwiczenie 12. Metody eksploracji danych

6. Formularze tabelaryczne, obiekty nawigacji - rozgałęzienia

Klasyfikacja i regresja Wstęp do środowiska Weka

1. Przygotowanie danych do analizy. Transformacja danych

Instrukcja konfiguracji urządzenia TL-WA830RE v.1

Przygotowanie urządzenia:

Obserwacje w Agrinavia MOBILE OGÓLNE INFORMACJE

Laboratorium - Monitorowanie i zarządzanie zasobami systemu Windows 7

Laboratorium A: Zarządzanie drukowaniem/klucz do odpowiedzi

Gromadzenie danych. Przybliżony czas ćwiczenia. Wstęp. Przegląd ćwiczenia. Poniższe ćwiczenie ukończysz w czasie 15 minut.

E e-member - Elektroniczny System Obsługi Klientów

Funkcje standardowe. Filtrowanie

Temat: Windows 7 Panel sterowania - Ekran

Metody eksploracji danych Laboratorium 2. Weka + Python + regresja

Instytut Sterowania i Systemów Informatycznych Uniwersytet Zielonogórski SYSTEMY SCADA

Instalacja Moodle na serwerze SBS2000/2003. Opiekun pracowni internetowej SBS

TwinCAT 3 konfiguracja i uruchomienie programu w języku ST lokalnie

Aplikacja do podpisu cyfrowego npodpis

Dane wejściowe. Oracle Designer Generowanie bazy danych. Wynik. Przebieg procesu

Problemy techniczne. Zdejmowanie kontroli konta administratora systemu Windows na czas instalowania programów Optivum

Pracownia internetowa w każdej szkole (edycja Jesień 2007)

Eksploracja danych. KLASYFIKACJA I REGRESJA cz. 2. Wojciech Waloszek. Teresa Zawadzka.

Instalacja. Podłączenie urządzenia. Wyłącz wszystkie urządzenia sieciowe (komputer, modem i router).

KONSOLIDACJA. Cel ćwiczenia: Funkcjonalności:

Problemy techniczne SQL Server

Tablet bezprzewodowy QIT30. Oprogramowanie Macro Key Manager

programu X-lite Spis treści

Laboratorium : Tworzenie partycji w Windows XP Pro

Laboratorium A: Zarządzanie ustawieniami zabezpieczeń/klucz do odpowiedzi

Program Dokumenty zbiorcze dla Subiekta GT.

Microsoft Access materiały pomocnicze do ćwiczeń cz. 1

Laboratorium - Zabezpieczanie kont, danych i komputera w systemie Windows 7

Laboratorium - Zabezpieczanie kont, danych i komputera w systemie Windows XP

Problemy techniczne. Kontrolę konta administratora można z powrotem włączyć po zainstalowaniu programu.

Aplikacja npodpis do obsługi certyfikatu

Ćwiczenie 6 - Hurtownie danych i metody eksploracje danych. Regresja logistyczna i jej zastosowanie

Następnie kliknąć prawym klawiszem myszy na Połączenie sieci bezprzewodowej i wybrać Wyłącz.

Uruchom polecenie z menu Wstaw Wykres lub ikonę Kreator wykresów na Standardowym pasku narzędzi.

Zadanie 2. Tworzenie i zarządzanie niestandardową konsolą MMC

Zmiana parametrów nowej kancelaryjnej skrzynki pocztowej

ADVANCE ELECTRONIC. Instrukcja obsługi aplikacji. Modbus konfigurator. Modbus konfigurator. wersja 1.1

Porównanie systemów automatycznej generacji reguł działających w oparciu o algorytm sekwencyjnego pokrywania oraz drzewa decyzji

WEKA klasyfikacja z użyciem sztucznych sieci neuronowych

Bazy danych Karta pracy 1

Laboratorium - Zabezpieczanie kont, danych i komputera w systemie Windows Vista

Laboratorium - Podgląd informacji kart sieciowych bezprzewodowych i przewodowych

projekt zaliczeniowy Eksploracja Danych

2014 Electronics For Imaging. Informacje zawarte w niniejszej publikacji podlegają postanowieniom opisanym w dokumencie Uwagi prawne dotyczącym tego

Instrukcja instalacji karty Merlin XU870 w systemie operacyjnym Mac OS X

LABORATORIUM 8,9: BAZA DANYCH MS-ACCESS

Laboratorium - Archiwizacja i odzyskiwanie danych w Windows 7

Aplikacja npodpis do obsługi certyfikatu

Jeżeli w komputerze była już zainstalowana inna wersja Javy może pojawić się komunikat

Fiery Remote Scan. Uruchamianie programu Fiery Remote Scan. Skrzynki pocztowe


jest dostępne na różne systemy operacyjne. Niniejsza instrukcja opisuje podstawowe operacje i opcje niezbędne do rozpoczęcia pracy w tym programie.

INFO-NET.wsparcie. pppoe.in.net.pl. Pamiętaj aby nie podawać nikomu swojego hasła! Instrukcja połączenia PPPoE w Windows 7 WAŻNA INFORMACJA

Raytracer. Seminaria. Hotline. początkujący zaawansowani na miejscu

Instrukcja użytkownika

INSTRUKCJA INSTALACJI. Modem Technicolor CGA 4233

2. Podstawy narzędzia Application Builder, budowa strony, kreatory aplikacji

Laboratorium 050. Crystal Reports. Ćwiczenie 1. Otwarte pozycje

Laboratorium A: Zarządzanie mechanizmami odzyskiwania systemu

Rozdział 5. Administracja kontami użytkowników

Obsługa poczty elektronicznej w domenie emeritus.ue.poznan.pl

Aplikacja npodpis do obsługi certyfikatu (instrukcja użytkownika)

Informatyka I : Tworzenie projektu

Systemy operacyjne. Zasady lokalne i konfiguracja środowiska Windows 2000

Ćwiczenie 2. Symulacja przebiegu procesu

Ontogeniczne sieci neuronowe. O sieciach zmieniających swoją strukturę

Laboratorium nr Wyznaczyć podstawowe statystyki (średnia, mediana, IQR, min, max) dla próby:

Aplikacje WWW - laboratorium

Pracownia internetowa w każdej szkole (edycja Jesień 2007)

Laboratorium - Menedżer zadań (zarządzanie procesami) w Windows 7

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

Niestandardowa tabela częstości

TWORZENIE ARKUSZY Z PRZEKROJAMI POPRZECZNYMI

1 Wstęp. 2 Uruchomienie programu

Oracle Data Mining 10g

Laboratorium 1 Wprowadzenie do PHP

Konfiguracja imiennej skrzynki pocztowej Komornika Sądowego

Zapamiętywanie haseł w przeglądarce Internet Explorer (elearning)

Transkrypt:

Laboratorium 11 Regresja SVM. 1. Uruchom narzędzie Oracle Data Miner i połącz się z serwerem bazy danych. 2. Z menu głównego wybierz Activity Build. Na ekranie powitalnym kliknij przycisk Dalej>. 3. Z listy Function Type wybierz Regression. Rozwiń listę Algorithm i wybierz z niej algorytm Support Vector Machines. Kliknij przycisk Dalej>. 4. Wskaż schemat STUDENT i tabelę MINING_DATA_BUILD_V jako źródło danych do eksploracji. Jako klucz podstawowy wskaż atrybut CUST_ID. Kliknij przycisk Dalej>.

5. Jako atrybut decyzyjny zaznacz atrybut YRS_RESIDENCE (pole radiowe w kolumnie Target). Zwróć uwagę, aby wartość atrybutu decyzyjnego została wyłączona z budowy klasyfikatora (pole wyboru Input dla atrybutu YRS_RESIDENCE musi być odznaczone). Upewnij się, że atrybuty CUST_ID i PRINTER_SUPPLIES są wyłączone z eksploracji (są bezwartościowe i nie niosą żadnej informacji). Kliknij przycisk Dalej>. 6. Podaj nazwę i krótki opis procesu eksploracji. Kliknij przycisk Dalej>.

7. Kliknij przycisk Advanced Settings. Upewnij się, że na zakładce Sample opcja próbkowania jest wyłączona (pole wyboru Enable Step jest odznaczone). Przejdź na zakładkę Outlier Treatment. Algorytm SVM jest bardzo czuły na występowanie osobliwości. Oznacz jako osobliwości po 5% wartości z każdego końca przedziału wartości zastępując usuwane osobliwości wartościami brzegowymi. 8. Przejdź na zakładkę Missing Values. Upewnij się, że przetwarzanie brakujących wartości jest włączone (pole wyboru Enable Step musi być zaznaczone). Wartości puste występujące w atrybutach numerycznych zamień na wartość średnią (Mean), a wartości puste występujące w atrybutach kategorycznych zamień na wartość modalną (Mode).

9. Przejdź na zakładkę Normalize. Algorytm SVM wymaga, aby wszystkie atrybuty numeryczne były znormalizowane. Jako metodę normalizacji wybierz wyrażenie wartości w liczbie odchyleń standardowych od średniej (zaznacz pole radiowe Z- Score). 10. Przejdź na zakładkę Split. Dokonaj podziału zbioru wejściowego na zbiór uczący i testujący w proporcjach 60%-40%, podział powinien wykorzystywać tabelę. 11. Przejdź na zakładkę Build. Upewnij się, że algorytm będzie się starał osiągnąć maksymalną średnią dokładność (w polu Accuracy Goal wybierz opcję Maximum Average Accuracy). Kliknij na zakładkę Algorithm Settings. Jako rodzaj funkcji

jądrowej wskaż funkcję liniową. Koniecznie wyłącz opcję aktywnego uczenia (pole radiowe Do you want Active Learning?, opcja No). 12. Kliknij przycisk OK. Upewnij się, że opcja Run upon finish jest włączona. Kliknij przycisk Zakończ.

13. Kliknij na odnośnik Result w bloku Build. Współczynniki przy każdej wartości predyktorów definiują hiperpłaszczyznę najlepiej separującą instancje należące do klas decyzyjnych. Zauważ, że uzyskany wynik w praktyce nie poddaje się naturalnej interpretacji i stanowi rodzaj czarnej skrzynki. 14. Zamknij okno z wynikami budowy klasyfikatora i powróć do głównego okna. Kliknij odnośnik Result w bloku Test Metrics. Na zakładce Predictive Confidence przedstawiona jest dokładność klasyfikatora liczona względem naiwnego klasyfikatora 0-R, który zawsze przewiduje najczęstszą wartość atrybutu decyzyjnego.

15. Powróć do głównego okna programu. Zaobserwuj zmianę jakości wygenerowanego klasyfikatora po korekcie parametrów algorytmu. Kliknij przycisk Reset w bloku Build (spowoduje to zresetowanie tego i wszystkich kolejnych kroków procesu odkrywania wiedzy).

16. Kliknij przycisk Options w bloku Build. Przejdź na zakładkę Algorithm Settings. Zmień rodzaj funkcji jądrowej na Gaussowską. Upewnij się, że opcja aktywnego uczenia się jest wyłączona. 17. Powróć do głównego okna programu. Kliknij przycisk Run Activity (prawy górny okna). Po zakończeniu się procesu odkrywania wiedzy kliknij odnośnik Result w bloku Test Metrics. Czy nowy klasyfikator jest lepszy czy gorszy od poprzedniego? Ćwiczenie samodzielne Wykorzystaj model stworzony za pomocą skryptu svm.reg.plsql do predykcji wieku klientów z Włoch. Jako źródło danych wykorzystaj tabelę MINING_DATA_APPLY_V. Pamiętaj o poddaniu danych źródłowych tym samym transformacjom, jakim były poddane dane, na podstawie których zbudowano model. Wykorzystując narzędzie GnuPlot dokonaj wizualizacji otrzymanych wyników. Postaraj się uzyskać rezultat podobny do zamieszczonego poniżej: