Baza danych dla potrzeb zgłębiania DMX



Podobne dokumenty
DMX DMX DMX DMX: CREATE MINING STRUCTURE. Tadeusz Pankowski

Język SQL, zajęcia nr 1

Wykład 05 Bazy danych

Systemy GIS Tworzenie zapytań w bazach danych

strukturalny język zapytań używany do tworzenia i modyfikowania baz danych oraz do umieszczania i pobierania danych z baz danych

ACESS- zadania z wykorzystaniem poleceń SQL

Data Mining podstawy analizy danych Część druga

Indukowane Reguły Decyzyjne I. Wykład 3

Bazy danych. dr inż. Arkadiusz Mirakowski

Wyk lad 8: Leniwe metody klasyfikacji

Wykład 8. SQL praca z tabelami 5

Informatyka (5) SQL. dr inż. Katarzyna Palikowska Katedra Transportu Szynowego p. 4 Hydro

Język SQL. Rozdział 10. Perspektywy Stosowanie perspektyw, tworzenie perspektyw prostych i złożonych, perspektywy modyfikowalne i niemodyfikowalne.

Paweł Rajba

Język SQL, zajęcia nr 2

Bazy Danych i Usługi Sieciowe

Wykład 5. SQL praca z tabelami 2

Programowanie MSQL. show databases; - pokazanie jakie bazy danych są dostępne na koncie

3 Przygotowali: mgr inż. Barbara Łukawska, mgr inż. Maciej Lasota

Wprowadzenie do BD Operacje na bazie i tabelach Co poza zapytaniami? Algebra relacji. Bazy Danych i Systemy informacyjne Wykład 2.

Relacyjne bazy danych. Podstawy SQL

WYKŁAD 11 Uczenie maszynowe drzewa decyzyjne

Przykłady najlepiej wykonywać od razu na bazie i eksperymentować z nimi.

Plan bazy: Kod zakładający bazę danych: DROP TABLE noclegi CASCADE; CREATE TABLE noclegi( id_noclegu SERIAL NOT NULL,

Bazy danych i usługi sieciowe

P o d s t a w y j ę z y k a S Q L

Ćwiczenia laboratoryjne nr 11 Bazy danych i SQL.

Perspektywy Stosowanie perspektyw, tworzenie perspektyw prostych i złożonych, perspektywy modyfikowalne i niemodyfikowalne, perspektywy wbudowane.

Język SQL. Rozdział 8. Język manipulowania danymi DML

Relacyjne bazy danych. Podstawy SQL

Widok Connections po utworzeniu połączenia. Obszar roboczy

Systemy internetowe. Wykład 4 mysql. West Pomeranian University of Technology, Szczecin; Faculty of Computer Science

Hurtownia Świętego Mikołaja projekt bazy danych

Języki programowania wysokiego poziomu. PHP cz.4. Bazy danych

Bazy danych 10. SQL Widoki

Laboratorium 4. Naiwny klasyfikator Bayesa.

BAZA DANYCH SIECI HOTELI

Blaski i cienie wyzwalaczy w relacyjnych bazach danych. Mgr inż. Andrzej Ptasznik

Bazy Danych - Instrukcja do Ćwiczenia laboratoryjnego nr 8

Wykład 6. SQL praca z tabelami 3

SELECT * FROM tabela WHERE warunek wybiera dane spełniające podany warunek

Przestrzenne bazy danych Podstawy języka SQL

Odnawialne Źródła Energii I rok. Tutorial PostgreSQL

Ref. 7 - Język SQL - polecenia DDL i DML

Modelowanie wymiarów

Intro. I.Wojnicki, ZTB:XML ZTB: XML. Igor Wojnicki. Katedra Informatyki Stosowanej, Akademia Górniczo-Hutnicza w Krakowie.

a) ile wynosiła populacja najbardziej i najmniej ludnego z województw (oraz jakie były ich nazwy)

Struktura bazy danych

Podstawy języka SQL. SQL Structured Query Languagestrukturalny

Bazy danych. Bazy danych. Podstawy języka SQL. Dr inż. Paweł Kasprowski.

Podstawy języka SQL. standardy SQL formułowanie zapytań operacje na strukturach danych manipulowanie danymi. Bazy danych s.5-1

Metody indukcji reguł

Wstęp do relacyjnych baz danych. Jan Bartoszek

UPDATE Studenci SET Rok = Rok + 1 WHERE Rodzaj_studiow =' INŻ_ST'; UPDATE Studenci SET Rok = Rok 1 WHERE Nr_albumu IN ( '111345','100678');

Bazy danych 7. SQL podstawy

CREATE TABLE logika (p BOOLEAN); INSERT INTO logika VALUES(true); INSERT INTO logika VALUES(false); INSERT INTO logika VALUES(NULL);

Laboratorium 6. Indukcja drzew decyzyjnych.

Bazy danych 6. Klucze obce. P. F. Góra

Bazy danych dla producenta mebli tapicerowanych. Bartosz Janiak Marcin Sikora Wrocław r.

77. Modelowanie bazy danych rodzaje połączeń relacyjnych, pojęcie klucza obcego.

Bazy danych SQL Server 2005

Zarządzanie danymi przestrzennymi. Analizy przestrzenne

SQL (ang. Structured Query Language)

Przestrzenne bazy danych. Analizy przestrzenne

Bazy danych. Dr inż. Paweł Kasprowski

Bazy danych. Bazy danych. Zapytania SELECT. Dr inż. Paweł Kasprowski.

Analiza danych DRZEWA DECYZYJNE. Drzewa decyzyjne. Entropia. test 1 dopełnienie testu 1

Ćwiczenie zapytań języka bazy danych PostgreSQL

Oracle PL/SQL. Paweł Rajba.

KOLEKCJE - to typy masowe,zawierające pewną liczbę jednorodnych elementów

Pakiety podprogramów Dynamiczny SQL

Tworzenie tabeli przez select CREATE TABLE PRAC2 AS SELECT P.NAZWISKO, Z.NAZWA FROM PRAC P NATURAL JOIN ZESP Z

Jerzy Nawrocki, Wprowadzenie do informatyki

Tworzenie raportów XML Publisher przy użyciu Data Templates

Język SQL podstawy zapytań

Data Mining techniki, algorytmy i. 18 listopada Warszawa

Projektowanie systemów baz danych

Wykład IV Modelowanie danych, projektowanie systemu informatycznego Modelowanie konceptualne implementacyjne Modelowanie pojęciowe na encjach

Programowanie w SQL procedury i funkcje. UWAGA: Proszę nie zapominać o prefiksowaniu nazw obiektów ciągiem [OLIMP\{nr indeksu}] Funkcje użytkownika

Komunikacja z bazą danych psql

Instytut Mechaniki i Inżynierii Obliczeniowej Wydział Mechaniczny Technologiczny Politechnika Śląska

PRZESTRZENNE BAZY DANYCH WYKŁAD 2

Modelowanie hierarchicznych struktur w relacyjnych bazach danych

Informatyka sem. III studia inżynierskie Transport 2018/19 LAB 2. Lab Backup bazy danych. Tworzenie kopii (backup) bazy danych

Ile rekordów będzie zawierała tabela przy założeniu, że na początku była pusta?

Drzewa decyzyjne. Nguyen Hung Son. Nguyen Hung Son () DT 1 / 34

PLAN WYKŁADU BAZY DANYCH PODSTAWOWE KWESTIE BEZPIECZEŃSTWA OGRANICZENIA DOSTĘPU DO DANYCH

LAB 3 (część 1 Projektu)

Grupowanie i funkcje agregujące

DECLARE VARIABLE zmienna1 typ danych; BEGIN

Przydatne sztuczki - sql. Na przykładzie postgres a.

Bazy danych. Wykład IV SQL - wprowadzenie. Copyrights by Arkadiusz Rzucidło 1

Bazy danych. Andrzej Łachwa, UJ, /15

SID Wykład 10 Systemy uczace się

Fizyczna struktura bazy danych w SQL Serwerze

TEMP BÓL WYSYPKA GARDŁO DIAGNOZA

Bazy Danych. SQL Podstawy języka III: powtórzenie. Krzysztof Regulski WIMiIP, KISiM, B5, pok. 408

Zadania z SQLa (MS SQL Server)

Transkrypt:

Baza danych dla potrzeb zgłębiania DMX ID Outlook Temperature Humidity Windy PLAY 1 sunny hot high false N 2 sunny hot high true N 3 overcast hot high false T 4rain mild high false T 5rain cool normal false T 6rain cool normal true N 7 overcast cool normal true T 8 sunny mild high false N 9 sunny cool normal false T 10 rain mild normal false T 11 sunny mild normal true T 12 overcast mild high true T 13 overcast hot normal false T 14 rain mild high true N

SQL Server 2005 zapytania DMX

Tworzenie Struktury zgłębiania DROP MINING STRUCTURE [mstenis]; GO CREATE MINING STRUCTURE [mstenis] ( [ID] LONG KEY, [OUTLOOK] TEXT DISCRETE, [TEMPERATURE] TEXT DISCRETE, [HUMIDITY] TEXT DISCRETE, [WINDY] TEXT DISCRETE, [PLAY] TEXT DISCRETE );

Tworzenie modelu zgłębiania drzewa decyzyjne ALTER MINING STRUCTURE [mstenis] ADD MINING MODEL [TenisDT] ( [ID], [OUTLOOK], [TEMPERATURE], [HUMIDITY], [WINDY], [PLAY] PREDICT )USING Microsoft_Decision_Trees WITH DRILLTHROUGH;

Tworzenie modelu zgłębiania zmiana parametrów na różne od domyślnych ALTER MINING STRUCTURE [mstenis] ADD MINING MODEL [TenisDT1] ( [ID], [OUTLOOK], [TEMPERATURE], [HUMIDITY], [WINDY], [PLAY] PREDICT )USING Microsoft_Decision_Trees (MINIMUM_SUPPORT =1, SCORE_METHOD=1) WITH DRILLTHROUGH ;

Tworzenie modelu zgłębiania zmiana parametrów na różne od domyślnych ALTER MINING STRUCTURE [mstenis] ADD MINING MODEL [TenisDT1] ( [ID], [OUTLOOK], [TEMPERATURE], [HUMIDITY], [WINDY], [PLAY] PREDICT )USING Microsoft_Decision_Trees MAXIMUM_INPUT_ATTRIBUTES MAXIMUM_OUTPUT_ATTRIBUTES SCORE_METHOD SPLIT_METHOD MINIMUM_SUPPORT COMPLEXITY_PENALTY FORCED_REGRESSOR (MINIMUM_SUPPORT =1, SCORE_METHOD=1) WITH DRILLTHROUGH ; Maksymalna liczba parametrów wejściowych. Domyślnie 255. Maksymalna liczba parametrów wyjściowych. Domyślnie 255. Metoda budowania drzewa Entropia (1), Bayes z predykcją K2 (2), or Bayes z predykcją Dirichleta (3). Domyślnie 3. Metoda dzielenia drzewa. Binarna (1), Całkowita (2), Obie (3). Domyślnie 3. Minimalna liczba przypadków pozwalająca na dalszy podział węzła. Domyślnie 10 Funkcja kary kontrolująca komplikacje drzewa małe wartości powodują wzrost Wymusza aby użyć kolumny jako regresowa.

DELETE * FROM TenisDT1; GO INSERT INTO MINING STRUCTURE [mstenis] ( [ID], [OUTLOOK], [TEMPERATURE], [HUMIDITY], [WINDY], [PLAY] ) OPENQUERY ([Zglebianie], 'SELECT [ID], [OUTLOOK], [TEMPERATURE], [HUMIDITY], [WINDY], [PLAY] FROM dbo.tennis' ); Zasilanie modelu danymi To jest nazwa tabeli, a nie źródła danych (DataSource)

DELETE * FROM TenisDT1; GO INSERT INTO MINING STRUCTURE [mstenis] ( [ID], [OUTLOOK], [TEMPERATURE], [HUMIDITY], [WINDY], [PLAY] ) OPENQUERY ([Zglebianie], 'SELECT [ID], [OUTLOOK], [TEMPERATURE], [HUMIDITY], [WINDY], [PLAY] FROM dbo.tennis WHERE ID < 10' ); Zasilanie modelu danymi Warunek ograniczający zbiór treningowy

Zbiór treningowy - CASES SELECT * FROM [TenisDT1].CASES;

Zawartość wymiaru dimmension_content Select * From [TenisDT1].Dimension_Content;

Zawartość wymiaru content Select * From [TenisDT1]. Content;

Wyświetlenie zawartości węzła Select * from [TenisDT1].Cases WHERE IsInNode('00000000400');

Wyświetlenie zawartości węzłów potomnych SELECT * FROM [TenisDT1].CONTENT WHERE ISDESCENDANT('00000000402'); SELECT * FROM [TenisDT1].CONTENT WHERE ISDESCENDANT('000000004');

SELECT [PLAY] AS [Czy zagra], PredictProbability ([PLAY], 1) AS [Prawdopodobienstwo], PredictNodeId([PLAY]) AS [Węzeł], PredictHistogram([PLAY]) AS [Statystyka], TopCount (PredictHistogram([PLAY]), $AdjustedProbability,3) AS [najwyższe po], PredictSupport([PLAY], 1) AS [Liczba], PredictStdev([PLAY]) AS [StDev], PredictVariance([PLAY]) AS [Warjancja] FROM [TenisDT1] NATURAL PREDICTION JOIN ( SELECT 'normal' AS [HUMIDITY], 'Sunny' AS [OUTLOOK] ) AS test Testowanie modelu

Testowanie modelu SELECT FLATTENED [PLAY] AS [Czy zagra], PredictProbability ([PLAY], 1) AS [Prawdopodobienstwo], PredictNodeId([PLAY]) AS [Węzeł], PredictHistogram([PLAY]) AS [Statystyka], TopCount (PredictHistogram([PLAY]), $AdjustedProbability,3) AS [najwyższe po], PredictSupport([PLAY], 1) AS [Liczba], PredictStdev([PLAY]) AS [StDev], PredictVariance([PLAY]) AS [Warjancja] FROM [TenisDT1] NATURAL PREDICTION JOIN ( SELECT 'normal' AS [HUMIDITY], 'Sunny' AS [OUTLOOK] ) AS test

SELECT TOP 4 test.humidity, test.windy, test.temperature, TenisDT1.PLAY, PredictProbability(TenisDT1.PLAY) AS PO From TenisDT1 PREDICTION JOIN OPENQUERY(zglebianie, 'SELECT HUMIDITY, WINDY, TEMPERATURE, OUTLOOK FROM dbo.tennis WHERE [ID]>10 ') AS test ON TenisDT1.HUMIDITY=test.HUMIDITY AND TenisDT1.WINDY=test.WINDY AND TenisDT1.TEMPERATURE=test.TEMPERATURE AND TenisDT1.OUTLOOK=test.OUTLOOK ORDER BY PredictProbability(PLAY) DESC Testowanie algorytmu częścią danych z tabeli

Testowanie algorytmu SELECT [PLAY] AS [Czy zagra], PredictProbability ([PLAY], 1) AS [PO], PredictNodeId([PLAY]) AS [Węzeł], PredictHistogram([PLAY]) AS [Statystyka], TopCount (PredictHistogram([PLAY]), $AdjustedProbability,3) AS [najwyższe po], PredictSupport([PLAY], 1) AS [Liczba], PredictStdev([PLAY]) AS [StDev], PredictVariance([PLAY]) AS [Warjancja] FROM [TenisDT1] PREDICTION JOIN OPENQUERY(zglebianie, 'SELECT HUMIDITY, WINDY, TEMPERATURE, OUTLOOK FROM dbo.tennis WHERE [ID]>10 ') AS test ON TenisDT1.HUMIDITY=test.HUMIDITY AND TenisDT1.WINDY=test.WINDY AND TenisDT1.TEMPERATURE=test.TEMPERATURE AND TenisDT1.OUTLOOK=test.OUTLOOK częścią danych z tabeli

Testowanie algorytmu SELECT [PLAY] AS [Czy zagra], PredictProbability ([PLAY], 1) AS [PO], PredictNodeId([PLAY]) AS [Węzeł], PredictHistogram([PLAY]) AS [Statystyka], TopCount (PredictHistogram([PLAY]), $AdjustedProbability,3) AS [najwyższe po], PredictSupport([PLAY], 1) AS [Liczba], PredictStdev([PLAY]) AS [StDev], PredictVariance([PLAY]) AS [Warjancja] FROM [TenisDT1] PREDICTION JOIN OPENQUERY(zglebianie, 'SELECT HUMIDITY, WINDY, TEMPERATURE, OUTLOOK FROM dbo.tennis WHERE [ID]>10 ') AS test ON TenisDT1.HUMIDITY=test.HUMIDITY AND TenisDT1.WINDY=test.WINDY AND TenisDT1.TEMPERATURE=test.TEMPERATURE AND TenisDT1.OUTLOOK=test.OUTLOOK częścią danych z tabeli