Określanie ważności atrybutów. OracleData Miner

Podobne dokumenty
Laboratorium 2. Określanie ważności atrybutów.

Laboratorium 12. Odkrywanie osobliwości.

Laboratorium 13. Eksploracja danych tekstowych.

Laboratorium 5. Adaptatywna sieć Bayesa.

Laboratorium 4. Naiwny klasyfikator Bayesa.

Laboratorium 6. Indukcja drzew decyzyjnych.

Laboratorium 3. Odkrywanie reguł asocjacyjnych.

Tworzenie tabeli przez select CREATE TABLE PRAC2 AS SELECT P.NAZWISKO, Z.NAZWA FROM PRAC P NATURAL JOIN ZESP Z

Język SQL, zajęcia nr 1

Wykład 05 Bazy danych

Określanie ważności atrybutów. RapidMiner

Wykład 8. SQL praca z tabelami 5

ORACLE. System Zarządzania Bazą Danych Oracle. Oracle Advanced SQL

Ćwiczenie 5. Eksploracja danych

Laboratorium 11. Regresja SVM.

strukturalny język zapytań używany do tworzenia i modyfikowania baz danych oraz do umieszczania i pobierania danych z baz danych

Bazy Danych i Usługi Sieciowe

KOLEKCJE - to typy masowe,zawierające pewną liczbę jednorodnych elementów

Bazy danych. Bazy danych. Podstawy języka SQL. Dr inż. Paweł Kasprowski.

Instrukcja podwaja zarobki osób, których imiona zaczynają się P i dalsze litery alfabetu zakładamy, że takich osbób jest kilkanaście.

Język SQL. Rozdział 8. Język manipulowania danymi DML

Bazy danych i usługi sieciowe

Bazy danych - Materiały do laboratoriów VIII

Modelowanie wymiarów

ACESS- zadania z wykorzystaniem poleceń SQL

1: 2: 3: 4: 5: 6: 7: 8: 9: 10:

Widok Connections po utworzeniu połączenia. Obszar roboczy

Zarządzanie danymi przestrzennymi. Rozwiązywanie problemów przestrzennych

Oracle PL/SQL. Paweł Rajba.

Nauczycielem wszystkiego jest praktyka Juliusz Cezar. Nauka to wiara w ignorancję ekspertów Richard Feynman

Wykład 5. SQL praca z tabelami 2

Tworzenie tabel. Bazy danych - laboratorium, Hanna Kleban 1

Paweł Rajba

BAZY DANYCH. CREATE TABLE dbo.wydzialy (ID INT, Akronim VARCHAR(4) NOT NULL, Wydzial VARCHAR(30) NOT NULL, CONSTRAINT Kluczyk PRIMARY KEY(ID) )

BAZA DANYCH SIECI HOTELI

Język SQL. Rozdział 9. Język definiowania danych DDL, część 2.

3 Przygotowali: mgr inż. Barbara Łukawska, mgr inż. Maciej Lasota

Blaski i cienie wyzwalaczy w relacyjnych bazach danych. Mgr inż. Andrzej Ptasznik

Laboratorium 10. Odkrywanie cech i algorytm Non-Negative Matrix Factorization.

Aby uruchomić program klienta i połączyć się z serwerem, należy komendę:

Odkrywanie reguł asocjacyjnych. Rapid Miner

Język SQL, zajęcia nr 2

UPDATE Studenci SET Rok = Rok + 1 WHERE Rodzaj_studiow =' INŻ_ST'; UPDATE Studenci SET Rok = Rok 1 WHERE Nr_albumu IN ( '111345','100678');

PRZESTRZENNE BAZY DANYCH WYKŁAD 2

Obiektowe bazy danych Ćwiczenia laboratoryjne (?)

Bazy danych. dr inż. Arkadiusz Mirakowski

Część 1: OLAP. Raport z zajęć laboratoryjnych w ramach przedmiotu Hurtownie i eksploracja danych

Podstawy języka SQL. SQL Structured Query Languagestrukturalny

Przestrzenne bazy danych. Analizy przestrzenne

LAB 6 BEGIN TRANSACTION, COMMIT, ROLLBACK, SET TRANSACTION ISOLATION LEVEL,

I. Język manipulowania danymi - DML (Data Manipulation Language). Polecenia INSERT, UPDATE, DELETE

Pakiety podprogramów Dynamiczny SQL

Komunikacja z bazą danych psql

Język SQL. Rozdział 10. Perspektywy Stosowanie perspektyw, tworzenie perspektyw prostych i złożonych, perspektywy modyfikowalne i niemodyfikowalne.

Ogólny plan przedmiotu. Strony WWW. Literatura BAZY DANYCH. Materiały do wykładu:

SIECI KOMPUTEROWE I BAZY DANYCH

Instytut Mechaniki i Inżynierii Obliczeniowej fb.com/groups/bazydanychmt/

2. Podstawy języka SQL

Bazy danych. Plan wykładu. Diagramy ER. Podstawy modeli relacyjnych. Podstawy modeli relacyjnych. Podstawy modeli relacyjnych

PODSTAWY BAZ DANYCH Wykład Partycjonowanie tabel i indeksów

Ćwiczenia laboratoryjne nr 11 Bazy danych i SQL.

1 Zaznacz poprawne stwierdzenia dotyczące grup plików (filegroup) możemy określić do której grupy plików trafi

PL/SQL. Zaawansowane tematy PL/SQL. Piotr Medoń

15. Funkcje i procedury składowane PL/SQL

PODSTAWY BAZ DANYCH. 10. Partycjonowanie tabel i indeksów. 2009/ Notatki do wykładu "Podstawy baz danych"

Cwiczenie 7. Retrospekcja

BAZY DANYCH Cz III. Transakcje, Triggery

Informatyka (6) Widoki. Indeksy

Język SQL. instrukcja laboratoryjna. Politechnika Śląska Instytut Informatyki. laboratorium Bazy Danych

SELECT * FROM tabela WHERE warunek wybiera dane spełniające podany warunek

Aspekty aktywne baz danych

Autor: Joanna Karwowska

Zbiór pytań nr 2. 1 Tabela DEPARTMENTS ma następującą strukturę:

Jerzy Nawrocki, Wprowadzenie do informatyki

77. Modelowanie bazy danych rodzaje połączeń relacyjnych, pojęcie klucza obcego.

Projektowanie systemów baz danych

Wstęp do relacyjnych baz danych. Jan Bartoszek

bazy danych - heterogeniczność producenci funkcjonalność modele danych protokoły komunikacyjne

Zarzadzanie transakcjami. Transakcje

Grupowanie i funkcje agregujące

Informatyka sem. III studia inżynierskie Transport 2018/19 LAB 2. Lab Backup bazy danych. Tworzenie kopii (backup) bazy danych

Generowanie dokumentów XML z tabel relacyjnych - funkcje SQLX

Plan bazy: Kod zakładający bazę danych: DROP TABLE noclegi CASCADE; CREATE TABLE noclegi( id_noclegu SERIAL NOT NULL,

PODSTAWY BAZ DANYCH. 17. Obiektowość w Oracle. 2009/2010 Notatki do wykładu "Podstawy baz danych"

DMX DMX DMX DMX: CREATE MINING STRUCTURE. Tadeusz Pankowski

Bazy danych 10. SQL Widoki

Bazy danych wykład szósty Więzy i wyzwalacze. Konrad Zdanowski ( Uniwersytet Kardynała Stefana Bazy danych Wyszyńskiego, wykładwarszawa)

SQL> startup pfile=./admin/pfile/initdbx.ora. SQL> create spfile from pfile='$home/admin/pfile/initdbx.ora' create user bolek identified by bolek;

Bazy danych. Dr inż. Paweł Kasprowski

Wprowadzenie do BD Operacje na bazie i tabelach Co poza zapytaniami? Algebra relacji. Bazy Danych i Systemy informacyjne Wykład 2.

Laboratorium nr 4. Temat: SQL część II. Polecenia DML

Zadania do wykonania na laboratorium

BAZY DANYCH. Wykład 1: Wprowadzenie do baz danych. Marcin Czajkowski. Przygotowanie wykładu: Małgorzata Krętowska

Baza danych dla potrzeb zgłębiania DMX

Bazy danych 6. Klucze obce. P. F. Góra

Plan ćwiczenia. Rozdział 16 Uwierzytelnianie i autoryzacja w bazie danych. Użytkownicy i schematy (1) Użytkownicy i schematy (2) baza danych: ZESP99

Bazy danych. Andrzej Łachwa, UJ, /15

Wykład V. Indeksy. Struktura indeksu składa się z rekordów o dwóch polach

Transkrypt:

Określanie ważności atrybutów OracleData Miner

Algorytm MDL (intuicja) (1) William of Ockham (1285-1349): Nie należy mnożyć bytów ponad potrzebę Reguła minimalnej długości opisu (Minimum DescriptionLengthMDL) Najlepsza jest najkrótsza(najprostsza) hipoteza Formalnie, należy minimalizować: długość(hipoteza)+długość(błędy) Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 84/633

Algorytm MDL (intuicja) (2) Podobnie jak w OneRkażdy atrybut tworzy osobny klasyfikator. A B C 1 2 5 7 K L M T 2 (1) F 2 (0) T 1 (1) F 2 (1) T 1(0) F 1(0) F 3(0) A B C X 1 1 5 K T 2 1 7 L T 3 2 5 M F 4 1 7 M F 5 2 7 M F Opis modelu i błędów Długość opisu A 1T 2F 4F 10 znaków B 5T 7F 2T,3F 13 znaków C KT L,MF 10 znaków Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 85/633

Opis tabeli mining_build_text Tabela z wynikami ankiet Kolumna Opis CUST_ID Id klienta CUST_GENDER Płeć klienta AGE Wiek klienta CUST_MARITAL_STATUS Stan cywilny COUNTRY_NAME Nazwa kraju klienta CUST_INCOME_LEVEL Poziom dochodów OCCUPATION Aktualnie zatrudniony jako HOUSEHOLD_SIZE Wielkość rodziny YRS_RESIDENCE Liczba lat zamieszkania pod danym adresem AFFINITY_CARD Czy posiada kartę zniźkową BULK_PACK_DISKETTES Czy zakupił kiedyś paczkę dyskietek Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 86/633

Opis tabeli mining_build_text Kolumna FLAT_PANEL_MONITOR HOME_THEATER_PACKAGE Opis Czy posiada płaski monitor Czy posiada zestaw kina domowego BOOKKEEPING_APPLICATION Czy zarządza finansamidomowymi za pomocą programu komputerowego PRINTER_SUPPLIES Y_BOX_GAMES OS_DOC_SET_KANJI COMMENTS Czy zakupił kiedyś materiały do drukarki Czy posiada konsolę do gier Czy systemoperacyjny ma zainstalowane japoński/chiński IME Dodatkowy komentarz na ankiecie Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 87/633

Przygotowanie Zrób kopię tabeli mining_build_text CREATE TABLE attribute_importance_test AS SELECT * FROM dmdata.mining_build_text; Usuń kolumnę commentsz kopii ALTER TABLE attribute_importance_test DROP COLUMN comments; Usuń model, jeżeli wcześniej wykonywałeś ćwiczenie BEGIN DBMS_DATA_MINING.DROP_MODEL( 'Attribute_Importance'); END; / Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 88/633

Budowa modelu Nazwa tworzonego modelu Rodzaj (algorytm) tworzenia modelu BEGIN DBMS_DATA_MINING.CREATE_MODEL( model_name => 'Attribute_Importance', mining_function => DBMS_DATA_MINING.ATTRIBUTE_IMPORTANCE, data_table_name => 'attribute_importance_test', case_id_column_name => 'cust_id', target_column_name => 'affinity_card'); END; / Analizowana tabela Klucz tabeli Atrybut decyzyjny Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 89/633

Uzyskany ranking Nazwa zbudowanego modelu SELECT * FROM TABLE(DBMS_DATA_MINING. GET_MODEL_DETAILS_AI('Attribute_Importance')) ORDER BY RANK; Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 90/633

Eksperyment 1 Dodaj atrybut losowy i sprawdź jego ocenę Dodanie atrybutu ALTER TABLE attribute_importance_test ADD a1 NUMBER; Wypełnienie losowymi danymi UPDATE attribute_importance_test SET a1 = DBMS_RANDOM.RANDOM(); -- [-2^^31, 2^^31) Usuń model Attribute_Importance Zbuduj ponownie model Obejrzyj wyniki Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 91/633

Eksperyment 2 Dodaj atrybut liniowo skorelowany i sprawdź jego ocenę: Dodanie atrybutu ALTER TABLE attribute_importance_test ADD a2 NUMBER; Wypełnienie danymi UPDATE attribute_importance_test SET a2 = 5*affinity_card; Usuń model Attribute_Importance Zbuduj ponownie model Obejrzyj wyniki Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 92/633

Eksperyment 3a Dodaj atrybut częściowo skorelowany Dodanie atrybutu ALTER TABLE attribute_importance_test ADD a3 NUMBER; Wypełnienie danymi UPDATE attribute_importance_test SET a3 = 3*affinity_card + DBMS_RANDOM.NORMAL(); Usuń model Attribute_Importance Zbuduj ponownie model Obejrzyj wyniki Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 93/633

Eksperyment 3b Dodaj atrybut częściowo skorelowany Dodanie atrybutu ALTER TABLE attribute_importance_test ADD a4 NUMBER; Wypełnienie danymi UPDATE attribute_importance_test SET a4 = 3*affinity_card + round(dbms_random.normal()); Usuń model Attribute_Importance Zbuduj ponownie model Obejrzyj wyniki Uzasadnij obserwacje z eksperymentów Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 94/633

Zadanie (1) Obejrzyj tabele sh.sales, sh.customers i sh.countries. Przygotuj perspektywę z kolumnami: CUST_ID CUST_LAST_NAME CUST_GENDER CUST_YEAR_OF_BIRTH CUST_MARITAL_STATUS CUST_CITY CUST_STATE_PROVINCE CUST_INCOME_LEVEL COUNTRY_NAME COUNTRY_SUBREGION COUNTRY_REGION FLAG 1 jeżeli klient dokonał 100 lub więcej zakupów, 0 w przeciwnym wypadku Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 95/633

Zadanie (2) Zastanów się, które atrybuty mogą mieć największy wpływ na przewidywanie wartości atrybutu flag Sprawdź jaki ranking generuje Oracle. Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 96/633