Laboratorium 10. Odkrywanie cech i algorytm Non-Negative Matrix Factorization.



Podobne dokumenty
Laboratorium 12. Odkrywanie osobliwości.

Laboratorium 11. Regresja SVM.

Laboratorium 13. Eksploracja danych tekstowych.

Laboratorium 3. Odkrywanie reguł asocjacyjnych.

Laboratorium 4. Naiwny klasyfikator Bayesa.

Laboratorium 6. Indukcja drzew decyzyjnych.

Laboratorium 2. Określanie ważności atrybutów.

Laboratorium 5. Adaptatywna sieć Bayesa.

1. Grupowanie Algorytmy grupowania:

Laboratorium 7. Support Vector Machines (klasyfikacja).

1. Odkrywanie asocjacji

2. Ocena dokładności modelu klasyfikacji:

Ćwiczenie 5. Eksploracja danych

Oracle Application Express

3. Budowa prostych raportów opartych o bazę danych

Wykład 05 Bazy danych

Microsoft.NET: LINQ to SQL, ASP.NET AJAX

1: 2: 3: 4: 5: 6: 7: 8: 9: 10:

KOMPUTEROWY SYSTEM WSPOMAGANIA OBSŁUGI JEDNOSTEK SŁUŻBY ZDROWIA KS-SOMED

Laboratorium - Zabezpieczanie kont, danych i komputera w systemie Windows XP

Bazy danych TERMINOLOGIA

Widok Connections po utworzeniu połączenia. Obszar roboczy

Dane wejściowe. Oracle Designer Generowanie bazy danych. Wynik. Przebieg procesu

Menu Narzędzia w Edytorze symboli i Edytorze Widoku aparatów

Laboratorium - Zabezpieczanie kont, danych i komputera w systemie Windows 7

Połączenie grzałki ze Smartfonem.

Rozdział 17. Zarządzanie współbieżnością zadania

Laboratorium - Podgląd informacji kart sieciowych bezprzewodowych i przewodowych

Instalacja platformy Magento CE wersja szybka

Laboratorium - Zabezpieczanie kont, danych i komputera w systemie Windows Vista

Założenia do ćwiczeń: SQL Server UWM Express Edition: \SQLEXPRESS. Zapoznaj się ze sposobami użycia narzędzia T SQL z wiersza poleceń.

Ćwiczenie zapytań języka bazy danych PostgreSQL

Cwiczenie 1. Wys wietlanie plano w wykonania polecen SQL

Rozwiązywanie problemów z DNS i siecią bezprzewodową AR1004g v2

Ćwiczenie 2. Opcja przestrzenna bazy danych

Pracownia internetowa w szkole ZASTOSOWANIA

Metody eksploracji danych Laboratorium 2. Weka + Python + regresja

Laboratorium - Monitorowanie i zarządzanie zasobami systemu Windows 7

Aplikacje internetowe - laboratorium

Autor: Joanna Karwowska

Bazy danych. dr inż. Arkadiusz Mirakowski

15. Funkcje i procedury składowane PL/SQL

Instytut Sterowania i Systemów Informatycznych Uniwersytet Zielonogórski SYSTEMY SCADA

5. Integracja stron aplikacji, tworzenie zintegrowanych formularzy i raportów

Ćwiczenie 3. Funkcje analityczne

8. Listy wartości, dodatkowe informacje dotyczące elementów i przycisków

Laboratorium 1 Wprowadzenie do PHP

6. Formularze tabelaryczne, obiekty nawigacji - rozgałęzienia

Instytut Mechaniki i Inżynierii Obliczeniowej Wydział Mechaniczny Technologiczny Politechnika Śląska

Zadania do wykonania na laboratorium

LABORATORIUM 8,9: BAZA DANYCH MS-ACCESS

7. Formularze master-detail

Procedury wyzwalane. (c) Instytut Informatyki Politechniki Poznańskiej 1

2. Podstawy narzędzia Application Builder, budowa strony, kreatory aplikacji

Informatyka I : Tworzenie projektu

SYSTEM INFORMATYCZNY KS-SEW

Przewodnik Google Cloud Print

SERWER DRUKARKI USB 2.0

Memeo Instant Backup Podręcznik Szybkiego Startu

Lista zadań nr 1. Bazy danych laboratorium. dr inż. Grzegorz Bazydło, dr inż. Jacek Tkacz

Bazy danych. Andrzej Łachwa, UJ, /15

Kostki OLAP i język MDX

Ćwiczenie 4. Użytkownicy

Systemy operacyjne. Zasady lokalne i konfiguracja środowiska Windows 2000

startup pfile= '$HOME/admin/pfile/initDBx.ora'; create spfile from pfile= '$HOME/admin/pfile/initDBx.ora';

programu X-lite Spis treści

Temat: Windows 7 Panel sterowania - Ekran

Materiały oryginalne: ZAWWW-2st1.2-l11.tresc-1.0kolor.pdf. Materiały poprawione

Plan. Wyświetlanie n początkowych wartości (TOP n) Użycie funkcji agregujących. Grupowanie danych - klauzula GROUP BY

Systemy baz danych 2 laboratorium Projekt zaliczeniowy

Laboratorium - Monitorowanie i zarządzanie zasobami systemu Windows XP

Multimedialne bazy danych - laboratorium

2. Podstawy narzędzia Application Builder, budowa strony, kreatory aplikacji

Aplikacje WWW - laboratorium

Laboratorium - Monitorowanie i zarządzanie zasobami systemu Windows Vista

Przykładowa baza danych BIBLIOTEKA

Cwiczenie 7. Retrospekcja

Problemy techniczne. Zdejmowanie kontroli konta administratora systemu Windows na czas instalowania programów Optivum

Obsługa poczty elektronicznej w domenie emeritus.ue.poznan.pl

Podzapytania. Rozdział 5. Podzapytania. Podzapytania wyznaczające wiele krotek (1) Podzapytania wyznaczające jedną krotkę

1. Cele eksploracyjnej analizy danych Rapid Miner zasady pracy i wizualizacja danych Oracle Data Miner -zasady pracy.

Ważne: Przed rozpoczęciem instalowania serwera DP-G321 NALEŻY WYŁACZYĆ zasilanie drukarki.

Wykład 7 Implementacja języka SQL w systemach baz danych Oracle sortowanie, funkcje agregujące i podzapytania.

Pracownia internetowa w każdej szkole (edycja jesień 2005)

Windows Server 2008 Standard Str. 1 Ćwiczenia. Opr. JK. I. Instalowanie serwera FTP w Windows Server 2008 (zrzuty ekranowe z maszyny wirtualnej)

PIXMA MG5500. series. Przewodnik konfiguracji

OnLine Analytical Processing (OLAP) Kostki OLAP i zapytania MDX

Wyzwalacz - procedura wyzwalana, składowana fizycznie w bazie, uruchamiana automatycznie po nastąpieniu określonego w definicji zdarzenia

Konfiguracja ROUTERA bezprzewodowego z modemem ADSL 2+, TP-Link TD-W8910G/TDW8920G

Programowanie MSQL. show databases; - pokazanie jakie bazy danych są dostępne na koncie

Załącznik nr 8. do Studium Wykonalności projektu Sieć Szerokopasmowa Polski Wschodniej województwo podkarpackie

Oracle Application Express

Laboratorium - Udostępnianie folderu i mapowanie dysku sieciowego w systemie Windows XP

SQL praca z tabelami 4. Wykład 7

Przewodnik Google Cloud Print

Zmiana rozdzielczości ekranu

Podręcznik użytkownika Platformy Edukacyjnej Zdobywcy Wiedzy (zdobywcywiedzy.pl)

Obserwacje w Agrinavia MOBILE OGÓLNE INFORMACJE

Transkrypt:

Laboratorium 10 Odkrywanie cech i algorytm Non-Negative Matrix Factorization. 1. Uruchom narzędzie Oracle Data Miner i połącz się z serwerem bazy danych. 2. Z menu głównego wybierz Activity Build. Na ekranie powitalnym kliknij przycisk Dalej>. 3. Z listy Function Type wybierz Feature Extraction. Rozwiń listę Algorithm i wybierz z niej algorytm Non-Negative Matrix Factorization. Kliknij przycisk Dalej>. 4. Wskaż schemat STUDENT i tabelę MINING_DATA_BUILD_V jako źródło danych do eksploracji. Jako klucz podstawowy wskaż atrybut CUST_ID. Kliknij przycisk Dalej>.

5. W kolejnym kroku pozostaw domyślne ustawienia atrybutów. Kliknij przycisk Dalej>. 6. W kolejnym kroku podaj nazwę dla procesu eksploracji oraz krótki opis procesu eksploracji. Kliknij przycisk Dalej>.

7. Kliknij przycisk Advanced Settings. Upewnij się, że na zakładce Sample opcja próbkowania jest wyłączona (pole wyboru Enable Step jest odznaczone). Przejdź na zakładkę Outlier Treatement. Upewnij się, czy znajdowanie osobliwości jest włączone (możesz pozostawić domyślne kryterium odległości trzech odchyleń standardowych od średniej jako wyznacznika osobliwości). Przejdź na zakładkę Missing Values i upewnij się, że brakujące wartości będą automatycznie zamieniane na średnią (dla atrybutów numerycznych) lub wartość modalną (dla atrybutów kategorycznych). Przejdź na zakładkę Normalize i upewnij się, że atrybuty numeryczne będą automatycznie normalizowane do przedziału 0-1. Przejdź na zakładkę Build i zmień maksymalną liczbę iteracji przy wyliczaniu macierzy na 100. 8. Kliknij przycisk OK. Upewnij się, że opcja Run upon finish jest włączona. Kliknij przycisk Zakończ.

9. Kliknij na odnośnik Result w bloku Build. Z listy rozwijanej wybierz cechę numer 6. Na każdą cechę składa się liniowa kombinacja wartości oryginalnych atrybutów. Im większa wartość współczynnika przy danej wartości atrybutu, tym bardziej dana wartość atrybutu wpływa na cechę. Przykładowo, cecha numer 6 reprezentuje przede wszystkim mężczyzn mieszkających w Stanach Zjednoczonych posiadających monitor z płaskim ekranem i nie posiadających karty lojalnościowej. Osoby pasujące do tej charakterystyki będą posiadać wysoką wartość liczbową cechy numer 6. 10. Kliknij przycisk Filter. Odznacz pole wyboru Check All. Wskaż jako interesujący Cię atrybut CUST_MARITAL_STATUS. Kliknij przycisk OK.

11. Znajdź cechę opisującą osoby, które nigdy nie wyszły za mąż/ożeniły się. 12. W nawigatorze obiektów rozwiń gałąź Models, następnie gałąź Feature Extraction i sprawdź, jak nazywa się zbudowany przez Ciebie model.

13. Uruchom narzędzie isqlplus i zaloguj się do bazy danych. Odczytaj podstawowe informacje o modelu z repozytorium ODM. SELECT setting_name, setting_value FROM TABLE(DBMS_DATA_MINING.GET_MODEL_SETTINGS('MINING_DATA_B26645_NF')) ORDER BY setting_name; 14. Do wyświetlenia pełnego modelu (wszystkich cech i wszystkich składowych cech) posłuż się poniższym zapytaniem SELECT F.feature_id, A.attribute_name, A.attribute_value, A.coefficient FROM TABLE(DBMS_DATA_MINING.GET_MODEL_DETAILS_NMF('MINING_DATA_B26645_NF')) F, TABLE(F.attribute_set) A ORDER BY feature_id, attribute_name, attribute_value; 15. Wróć do narzędzia Oracle Data Mining. W nawigatorze obiektów rozwiń gałąź Mining Activities, następnie gałąź Feature Extraction. Kliknij odnośnik Output Data w bloku Normalize i sprawdź, jak nazywa się automatycznie skonstruowana perspektywa zawierająca przetransformowane dane.

16. Wróć do narzędzia isqlplus. Wyświetl liczbę klientów opisanych poszczególnymi cechami. Wykorzystaj poniższe zapytanie SQL. FEATURE_ID() to funkcja zwracająca identyfikator cechy zgodnie z podanym modelem. Klauzula USING umożliwia ograniczenie modelu tylko do podanej listy atrybutów. SELECT FEATURE_ID(MINING_DATA_B26645_NF USING *) AS feat, COUNT(*) AS cnt FROM dm4j$vmining_data_755066777 GROUP BY FEATURE_ID(MINING_DATA_B26645_NF USING *) ORDER BY cnt DESC;

17. Wyświetl dziesięciu klientów którzy są najlepiej dopasowani do cechy numer 3. Wykorzystaj poniższe zapytanie SQL. SELECT * FROM ( SELECT dmr$case_id, FEATURE_VALUE(MINING_DATA_B26645_NF, 3 USING *) AS match_quality FROM dm4j$vmining_data_755066777 ORDER BY match_quality DESC) WHERE ROWNUM < 11;

Ćwiczenie samodzielne W Twoim schemacie znajduje się tabela ZOO o następującym schemacie: SQL> desc zoo Nazwa Wartość NULL? Typ ----------------------- -------- ---------------- NAME VARCHAR2(10) HAIR FEATHERS EGGS MILK AIRBORNE AQUATIC PREDATOR TOOTHED BACKBONE BREATHES VENOMOUS FINS LEGS NUMBER TAIL DOMESTIC CATSIZE TYPE VARCHAR2(12) Zbuduj model identyfikujący dominujące cechy w zbiorze zwierząt. Wyświetl uzyskane cechy i spróbuj dokonać ich ręcznej ewaluacji. Następnie zastosuj uzyskany model do zawartości tabeli ZOO. Napisz następujące zapytania SQL: wyświetl 3 dominujące cechy opisujące lwa wyświetl 10 zwierząt najlepiej opisanych przez cechę reprezentującą zwierzęta jadowite wyświetl 10 zwierząt opisywanych przez cechę wyrażającą zdolność do latania wyświetl rozkład cech opisujących ptaki Do wykonania zadania możesz wykorzystać przykładowy skrypt nnmf.plsql