OLAP i hurtownie danych c.d.



Podobne dokumenty
Rozszerzenia grupowania

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach.

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

Microsoft SQL Server Podstawy T-SQL

Modele danych - wykład V

Wstęp do Business Intelligence

Operacja PIVOT w języku SQL w środowisku Oracle

SQL do zaawansowanych analiz danych część 1.

Bazy danych - Materiały do laboratoriów IV

SQL w 24 godziny / Ryan Stephens, Arie D. Jones, Ron Plew. Warszawa, cop Spis treści

Informatyka sem. III studia inżynierskie Transport 2018/19 LAB 2. Lab Backup bazy danych. Tworzenie kopii (backup) bazy danych

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Hurtownie danych. Przetwarzanie zapytań. ZAPYTANIA NA ZAPLECZU

Podstawy języka T-SQL : Microsoft SQL Server 2016 i Azure SQL Database / Itzik Ben-Gan. Warszawa, Spis treści

Spis tre±ci. Przedmowa... Cz ± I

Hurtownie danych - przegląd technologii

Grupowanie danych klauzula GROUP BY

Klasyczna Analiza Danych

Hurtownie danych a transakcyjne bazy danych

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

Systemy GIS Tworzenie zapytań w bazach danych

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Plan. Wyświetlanie n początkowych wartości (TOP n) Użycie funkcji agregujących. Grupowanie danych - klauzula GROUP BY

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

opisuje nazwy kolumn, wyrażenia arytmetyczne, funkcje nazwy tabel lub widoków warunek (wybieranie wierszy)

Tworzenie zapytań do Microsoft SQL Server

T-SQL dla każdego / Alison Balter. Gliwice, cop Spis treści. O autorce 11. Dedykacja 12. Podziękowania 12. Wstęp 15

Oracle11g: Wprowadzenie do SQL

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

Część 1: OLAP. Raport z zajęć laboratoryjnych w ramach przedmiotu Hurtownie i eksploracja danych

Hurtownie danych. Ładowanie, integracja i aktualizacja danych. INTEGRACJA DANYCH ETL

1 DML - zapytania, część II Grupowanie Operatory zbiorowe DML - modyfikacja 7. 3 DCL - sterowanie danymi 9.

Hurtownie danych wykład 3

Wybór wszystkich danych: SELECT * FROM employee Wybór określonych kolumn lub wyrażeń: SELECT first_name, last_name, salary FROM employee

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

DECLARE VARIABLE zmienna1 typ danych; BEGIN

Microsoft Excel 2013: Budowanie modeli danych przy użyciu PowerPivot

Krzysztof Dembczyński. Inteligentne Systemy Wspomagania Decyzji Studia magisterskie, semestr I Semestr letni 2007/08

Bazy danych. Plan wykładu. Rodzaje baz. Rodzaje baz. Hurtownie danych. Cechy hurtowni danych. Wykład 14: Hurtownie danych

Grupowanie i funkcje agregacji. Grupowanie z użyciem rollup

Blaski i cienie wyzwalaczy w relacyjnych bazach danych. Mgr inż. Andrzej Ptasznik

OnLine Analytical Processing (OLAP) Zapytania SQL

Część I Istota analizy biznesowej a Analysis Services

Grupowanie i funkcje agregacji

4. Znaczenie czasu w modelowaniu i strukturalizacji danych

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Modelowanie wymiarów

SQL praca z tabelami 4. Wykład 7

Hurtownia danych. Załącznik Nr 1 do SIWZ. Opis przedmiotu zamówienia. Lp. FUNKCJONALNOŚĆ/PARAMETRY WYMAGANE

Język SQL. Rozdział 2. Proste zapytania

BD2 BazyDanych2. dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego

ORACLE. System Zarządzania Bazą Danych Oracle. Oracle Advanced SQL

Opis spełnienia wymagań (PSBD)

Autor: Joanna Karwowska

Szkolenie autoryzowane. MS Tworzenie zapytań do Microsoft SQL Server Strona szkolenia Terminy szkolenia Rejestracja na szkolenie Promocje

Hurtownie danych w praktyce

Zasady transformacji modelu DOZ do projektu tabel bazy danych

Wielowymiarowy model danych

3. Podzapytania, łączenie tabel i zapytań

Integracja i Eksploracja Danych

Oracle PL/SQL. Paweł Rajba.

DECLARE <nazwa_zmiennej> typ [(<rozmiar> )] [ NOT NULL ] [ { := DEFAULT } <wartość> ];

PODZAPYTANIE (SUBSELECT)

Bazy danych 6. Klucze obce. P. F. Góra

Rady i porady użytkowe

Tworzenie aplikacji bazodanowych w delphi dla dużych baz danych FRAMEWORK IMPET

Relacyjne bazy danych a XML

Hurtownie danych. Metadane i czynniki jakości. BAZA METADANYCH. Centralna hurtownia danych. Metadane

Wprowadzenie do języka SQL

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

OdświeŜanie hurtownie danych - wykład IV. Zagadnienia do omówienia. Wprowadzenie

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Integracja systemów transakcyjnych

Procedury wyzwalane. (c) Instytut Informatyki Politechniki Poznańskiej 1

PODSTAWY BAZ DANYCH 13. PL/SQL

Relacyjne bazy danych. Podstawy SQL

Cel przedmiotu. Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji 1 Język angielski 2 Inżynieria oprogramowania

Proces ETL. Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska {kris,

Szkolenie Oracle SQL podstawy. Terminy lutego 2010 First Minute! 1100zł!

Systemy OLAP II. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

KARTA PRZEDMIOTU. Hurtownie i eksploracja danych D1_5

Bazy danych 8. Podzapytania i grupowanie. P. F. Góra

Proces ekstrakcji, transformacji i ładowania danych (Proces ETL)

Oracle PL/SQL. Paweł Rajba.

Wprowadzenie do hurtowni danych

Tabela SPRZEDAŻ WYCIECZEK

Opracowanie: Izabela Czepil i Andrzej Solski

SQL Server i T-SQL w mgnieniu oka : opanuj język zapytań w 10 minut dziennie / Ben Forta. Gliwice, Spis treści

Przestrzenne bazy danych Podstawy języka SQL

Generowanie dokumentów XML z tabel relacyjnych - funkcje SQLX

"Kilka słów" o strojeniu poleceń SQL w kontekście Hurtowni Danych wprowadzenie. Krzysztof Jankiewicz

Administracja i programowanie pod Microsoft SQL Server 2000

Wykład 7 Implementacja języka SQL w systemach baz danych Oracle sortowanie, funkcje agregujące i podzapytania.

SQL, LIKE, IN, CASE, EXISTS. Marcin Orchel

SQL do zaawansowanych analiz danych część 1.

BUSINESS INTELLIGENCE DEVELOPMENT Tego Cię nauczymy:

Model relacyjny. Wykład II

Transkrypt:

OLAP i hurtownie danych c.d. Przypomnienie OLAP -narzędzia analizy danych Hurtownie danych -duże bazy danych zorientowane tematycznie, nieulotne, zmienne w czasie, wspierjące procesy podejmowania decyzji Anna Pankowska - I&E 2

Hurtownie danych a OLAP Anna Pankowska - I&E 3 Implementacja i pielęgnacja Ekstrakcja danych Czyszczenie danych Transformacja danych Ładowanie danych Monitorowanie zmian Odświeżanie danych Metadane i ich repozytorium Anna Pankowska - I&E 4

Implementacja i pielęgnacja Ekstrakcja Czyszczenie Transformacja Ładowanie Monitorowanie Odświeżanie Pobieranie danych ze źródeł danych - bramki, standardowe interfejsy, procedury własne - identyfikacja pól w tabelach źródłowych, z których czerpane będą dane Anna Pankowska - I&E 5 Implementacja i pielęgnacja Ekstrakcja Czyszczenie Transformacja Ładowanie Monitorowanie Odświeżanie Zapewnienie poprawnościijakości danych w hurtowni - detekcja i korekcja błędów: niekompletne dane błędne dane informacje niezrozumiałe niekonsekwencja w danych konflikty strukturalne Anna Pankowska - I&E 6

Implementacja i pielęgnacja Ekstrakcja Czyszczenie Transformacja Ładowanie Monitorowanie Odświeżanie Konwersja danych z formatu wykorzystywanego w źródle do formatu wykorzystywanego w hurtowni - analiza tematyczna danych - ustalenie wspólnego formatu danych - rozdzielanie i łączenie kolumn, konwersja typów, agregaty - określenie zbioru reguł sterujących tą transformacją Anna Pankowska - I&E 7 Implementacja i pielęgnacja Ekstrakcja Czyszczenie Transformacja Ładowanie Monitorowanie Odświeżanie Integracja i umieszczanie nowych danych w hurtowni - sprawdzanie ograniczeń integralnościowych, sortowanie, podsumowywanie, budowaine indeksów, itp. - problemy: wstrzymanie ładowania, wznowienie, ładowanie sekwencyjne/równoległe Anna Pankowska - I&E 8

Implementacja i pielęgnacja Ekstrakcja Czyszczenie Transformacja Ładowanie Monitorowanie Odświeżanie Monitorowanie zmian zachodzących w źródłach danych - mechanizm wyzwalaczy (triggers) - analiza pliku logu - procedury własne - polling (zapytania do źródeł) Anna Pankowska - I&E 9 Implementacja i pielęgnacja Ekstrakcja Czyszczenie Transformacja Ładowanie Monitorowanie Odświeżanie Propagowanie zmian zachodzących w źródłach do - kiedy odświeżać: nabieżąco, periodycznie, zależnie od źródła -jakodświeżać: ladowanie pełne, odświeżanie inkrementalne - mechanizm pielęgnacji replik: transfer danych, transfer transakcji Anna Pankowska - I&E 10

Metadane Dane o danych Integralna część hurtowni danych Określają znaczenie i kontekst informacji zawartej w hurtowni Jakie dane są dostępne, gdzie zlokalizowane, w jaki sposób dostępne Anna Pankowska - I&E 11 Metadane Metadane fizyczne Metadane logiczne Metadane operacyjne Metadane historyczne Metadane administracyjne Metadane personalizacyjne Anna Pankowska - I&E 12

Operacje w modelu wielowymierowym Agregacja Pivoting wyznaczanie punktu centralnego wskazanie miary, która nas interesuje, i wybranie 2 wymiarów, w których ma być prezentowana Roll up zwijanie dla wskazanego wymiaru następuje nawigacja wzdłuż hierarchii w górę,w celu prezentacji większych agregatów Drill down rozwijanie nawigacja w dół wzdłuż hierarchii danego wymiaru w celu rozbicia agregatu a agregaty składowe Anna Pankowska - I&E 13 Operacje w modelu wielowymierowym Slice_and_dice wycinanie następuje projekcja danych na wybranym podzbiorze wymiarów dla wybranych wartości innych wymiarów Rotating obracanie umożliwia prezentowanie danych w różnych układach Ranking wybór pierwszych n elementów Anna Pankowska - I&E 14

Operacje w modelu wielowymierowym Anna Pankowska - I&E 15 Przykład TOWARY DNI # Data NrDnia NrTygodnia NrMca Kwartal Rok SPRZEDAZ # idtow # idkli # Data wartosc koszt # idtow Producent Marka KLIENCI # idkli Miasto Wojewodztwo StanCywilny Plec Anna Pankowska - I&E 16

Operatory ROLLUP i CUBE polecenie ROLLUP jest rozszerzeniem klauzuli GROUP BY, które pozwala wyliczać podsumowania częściowe i ogólne; konstruuje pół-kostki danych select idtow, idkli, sum(wartosc) suma from sprzedaz group by idtow, idkli with rollup Anna Pankowska - I&E 17 Operatory ROLLUP i CUBE idtow idkli suma ----------- ----------- --------- 11 101 60000.0 11 201 32000.0 11 NULL 92000.0 12 102 20000.0 12 202 22000.0 12 NULL 42000.0 21 103 35000.0 21 203 36000.0 21 205 36000.0 21 NULL 107000.0 22 101 120000.0 22 201 58000.0 22 204 60000.0 22 NULL 238000.0 31 205 31000.0 31 NULL 31000.0 NULL NULL 510000.0 Anna Pankowska - I&E 18

Operatory ROLLUP i CUBE operator CUBE tworzy podsumowania dla wszystkich możliwych kombinacji grupowania kolumn. W terminologii analiz wielowymiarowych CUBE generuje podsumowania częściowe i ogólne tabeli faktów dla wszystkich możliwych wymiarów select idtow, idkli, sum(wartosc) suma from sprzedaz group by idtow, idkli with cube Anna Pankowska - I&E 19 Operatory ROLLUP i CUBE idtow idkli suma ----------- ----------- ------------ 11 101 60000.0 11 201 32000.0 11 NULL 92000.0 12 102 20000.0 12 202 22000.0 12 NULL 42000.0 21 103 35000.0 21 203 36000.0 21 205 36000.0 21 NULL 107000.0 22 101 120000.0 22 201 58000.0 22 204 60000.0 22 NULL 238000.0 31 205 31000.0 31 NULL 31000.0 c.d. idtow idkli suma ----------- ----------- ------------ NULL NULL 510000.0 NULL 101 180000.0 NULL 102 20000.0 NULL 103 35000.0 NULL 201 90000.0 NULL 202 22000.0 NULL 203 36000.0 NULL 204 60000.0 NULL 205 67000.0 Anna Pankowska - I&E 20

Operatory ROLLUP i CUBE puste wartości kolumn w przypadku zapytań z funkcjami ROLLUP i CUBE mogą oznaczać operacje podsumowania lub standardową wartość pustą kolumny, np.: select plec, sum(wartosc) 'suma' from sprzedaz s, klienci k where s.idkli = k.idkli group by plec with rollup wartość pusta podsumowanie plec suma ---- --------- NULL 67000.0 K 173000.0 M 270000.0 NULL 510000.0 Anna Pankowska - I&E 21 GROUPING funkcja GROUPING pozwala rozróżnić wiersze z wartościami pustymi od wierszy podsumowań;jeżeli wartość pusta oznacza podsumowanie, funkcja ta zwraca wartość 1, w przeciwnym przypadku 0 Anna Pankowska - I&E 22

GROUPING przykład select plec, sum(wartosc) 'suma', grouping(plec) 'p' from sprzedaz s, klienci k where s.idkli = k.idkli group by plec with rollup plec suma p ---- ----------- ---- NULL 67000.0 0 K 173000.0 0 M 270000.0 0 NULL 510000.0 1 Anna Pankowska - I&E 23 GROUPING przykład 2 select case when (grouping(plec)=1) then 'ALL' else isnull(plec, '?') end as plec, sum(wartosc) 'suma' from sprzedaz s, klienci k where s.idkli = k.idkli group by plec with rollup plec suma ---- ---------? 67000.0 K 173000.0 M 270000.0 ALL 510000.0 Anna Pankowska - I&E 24