Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

Podobne dokumenty
Modele danych - wykład V

Hurtownie danych wykład 3

Hurtownie danych. 31 stycznia 2017

Wielowymiarowy model danych

Hurtownie danych a transakcyjne bazy danych

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach.

Wstęp do Business Intelligence

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Bazy danych. Plan wykładu. Rodzaje baz. Rodzaje baz. Hurtownie danych. Cechy hurtowni danych. Wykład 14: Hurtownie danych

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Hurtownie danych. Rola hurtowni danych w systemach typu Business Intelligence

Spis tre±ci. Przedmowa... Cz ± I

OLAP i hurtownie danych c.d.

Hurtownie danych - przegląd technologii

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Hurtownie danych. Przetwarzanie zapytań. ZAPYTANIA NA ZAPLECZU

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

BD2 BazyDanych2. dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego

Schematy logiczne dla hurtowni danych

Część I Istota analizy biznesowej a Analysis Services

Bazy analityczne (hurtownie danych, bazy OLAP)

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

PODSTAWY BAZ DANYCH Wykład Partycjonowanie tabel i indeksów

Pierwsze wdrożenie SAP BW w firmie

Plan wykładu. Hurtownie danych. Problematyka integracji danych. Cechy systemów informatycznych

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Informatyzacja przedsiębiorstw

4. Znaczenie czasu w modelowaniu i strukturalizacji danych

PODSTAWY BAZ DANYCH. 10. Partycjonowanie tabel i indeksów. 2009/ Notatki do wykładu "Podstawy baz danych"

Business Intelligence

Projektowanie hurtowni danych

Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence

Systemy OLAP II. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Modelowanie hurtowni danych

Hurtownie danych - przegląd technologii

Zaawansowane systemy baz danych - ZSBD. Hurtownie danych 1. Problematyka hurtowni danych. Wykład przygotował: Robert Wrembel. ZSBD wykład 12 (1)

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Ćwiczenia z Zaawansowanych Systemów Baz Danych

OdświeŜanie hurtownie danych - wykład IV. Zagadnienia do omówienia. Wprowadzenie

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Porównanie wydajności hurtowni danych ROLAP i MOLAP w Oracle 10g

Microsoft Excel 2013: Budowanie modeli danych przy użyciu PowerPivot

Plan. Inteligencja bisnesowa (Bussiness Intelligence) Hurtownia danych OLAP

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Projektowanie hurtowni danych i modelowanie wielowymiarowe

Model logiczny SZBD. Model fizyczny. Systemy klientserwer. Systemy rozproszone BD. No SQL

Opracowanie: Izabela Czepil i Andrzej Solski

SQL w 24 godziny / Ryan Stephens, Arie D. Jones, Ron Plew. Warszawa, cop Spis treści

Projektowanie hurtowni danych i modelowanie wielowymiarowe

Ewolucja technik modelowania hurtowni danych

Wprowadzenie do hurtowni danych

Systemy OLAP. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

PROJEKT WSPÓŁFINANSOWANY ZE ŚRODKÓW UNII EUROPEJSKIEJ W RAMACH EUROPEJSKIEGO FUNDUSZU SPOŁECZNEGO OPIS PRZEDMIOTU. Rozproszone Systemy Baz Danych

Matematyka kodem nowoczesności. Zaproszenie do składania ofert

Procesowanie i partycjonowanie Analysis Services od podszewki (300) Adrian Chodkowski Adrian.Chodkowski@outlook.com

Kostki OLAP i język MDX

Bazy danych i ich aplikacje

"Kilka słów" o strojeniu poleceń SQL w kontekście Hurtowni Danych wprowadzenie. Krzysztof Jankiewicz

KARTA PRZEDMIOTU. Hurtownie i eksploracja danych D1_5

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Rady i porady użytkowe

Modelowanie koncepcyjne hurtowni danych

INTERNETOWE BAZY DANYCH materiały pomocnicze - wykład X

Modelowanie wielowymiarowe hurtowni danych

SAS OLAP Cube Studio Wprowadzenie

JPivot & Mondrian. 16 maja Krukar, Lewandowska (BiHD) JPivot & Mondrian 16 maja / 42

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA realizacja w roku akademickim 2016/17

ORACLE. System Zarządzania Bazą Danych Oracle. Oracle Advanced SQL

Wydajność hurtowni danych opartej o Oracle10g Database

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

Normalizacja relacyjnych baz danych. Sebastian Ernst

Projektowanie Systemów Informacyjnych

Opis spełnienia wymagań (PSBD)

Projektowanie hurtowni danych i modelowanie wielowymiarowe

Cel przedmiotu. Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji 1 Język angielski 2 Inżynieria oprogramowania

Hurtownie danych w praktyce

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

Rozszerzenia grupowania

JPivot & Mondrian. inż. Urszula Krukar, inż. Agnieszka Lewandowska,

Spis treści. Przedmowa

Co ciekawego w EURECE pojawiło się w wersji 2.4, a być może nie zdążyliście tego odkryć?

Migracja Business Intelligence do wersji

Usługi analityczne podstawy budowy kostki analitycznej Część druga - zarządzanie

Baza danych. Modele danych

Procesy ETL - wykład V. Struktura. Wprowadzenie. 1. Wprowadzenie. 2. Ekstrakcja 3. Transformacja 4. Ładowanie 5. Studium przypadków.

Usługa archiwizacji danych w systemie Eureca. Marek Jelenik CONTROLLING SYSTEMS sp. z o.o.

1. Ewolucja systemów opartych na bazach danych 2. Czym się rożni modelowanie od strukturalizacji danych? Model danych Struktury (danych)

PODSTAWOWE POJECIA ZWIAZANE Z HURTOWNIAMI DANYCH Najczęściej decyzja o stworzeniu hurtowni nadchodzi, gdy dana organizacja upora się z informatyzacją

Ramowy plan kursu. Lp. Moduły Wyk. Lab. Przekazywane treści

Modelowanie wymiarów

HURTOWNIE DANYCH. Krzysztof Goczyła. Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska. kris@eti.pg.gda.pl. K.

KONCEPTUALNE MODELOWANIE STRUKTUR BAZ MOLAP DLA E-BIZNESU

Transkrypt:

Modele danych - wykład V Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006 Zagadnienia 1. Wprowadzenie 2. MOLAP modele danych 3. modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE 1

Wprowadzenie PODSTAWOWE MODELE REPREZENTACJI I PRZECHOWYWANIA DANYCH (ang. Relational OLAP) rozszerzony relacyjny model danych, przekształcenie operacji wielowymiarowych na standardowe relacyjne (często wspomagane narzędziami) MOLAP (ang. Multidimensional OLAP) wykorzystanie wielowymiarowych baz danych (MDB) tablice wielowymiarowe zamiast klasycznych, Wprowadzenie AGREGACJA - wstępne wyliczenie pewnych miar (podsumowanie), np.: Dla bazy OLTP Dla bazy OLAP nie przechowujemy miesięcznych operacji z danym kontrahentem, gdyż można je wyliczyć z Faktur VAT wyliczamy raz i przechowujemy sumę operacji z danym kontrahentem (skoro takie dane są używane np. w 80% analiz) Wprowadzenie PODZIAŁ NA PARTYCJE - zapis tabeli w częściach np. na różnych dyskach w celu zmniejszenia ilości danych lub zrównoleglenia operacji 2

Wprowadzenie Oracle przykłady: 1) Zrównoleglenie operacji na tabeli: CREATE TABLE SPRZEDAZ ( ) PARALLEL (DEGREE 6); - maksymalnie 6 procesów serwera do obsługi tej tabeli 2) Utworzenie tabeli z podziałem na partycje (części): CREATE Klienci (, Kraj char(2), ) PARTITION BY RANGE (Kraj) (PARTITION p1 VALUES LESS THAN ( C ) TABLESPACE Data01; PARTITION p2 VALUES LESS THAN ( K ) TABLESPACE Data02; PARTITION p6 VALUES LESS THAN MAXVALUE TABLESPACE Data06; Utworzenie indeksu dla tego podziału: CREATE INDEX indeks_kliencji_kraj ON Klienci (kraj) LOCAL; Wprowadzenie Rodzaje danych analitycznych FAKTY (wielkości analizowane) dane ilościowe opisujące zaistniałe zdarzenia (fakty), np. wartość sprzedaży, ilość towaru, zysk WYMIARY (wielkości klasyfikujące) dane cechy, atrybuty faktów, tzw. dane klasyfikujące np. czas, miejsce, pracownik, klient, dane klasyfikujące mogą być układane w hierarchie Wprowadzenie ŚCIEŻKI PODSUMOWAŃ - definiują poziomy ogólności wymiarów (hierarchie) Przykłady: gałąź przemysłu kategoria towar opakowanie kraj region miasto sklep rok kwartał miesiąc dzień tydzień UWAGA: Hierarchie nie muszą być jednoznaczne, np. towar może należeć do dwóch kategorii. 3

Wprowadzenie Hurtownie tematyczne (ang. data marts) - zbiory danych (zwykle perspektywy zmaterializowane) w których agregacje i podziały definiujemy pod kątem konkretnej grupy użytkowników podejmujących decyzje (np. pod kątem działu firmy) (ang. Relational OLAP) - modele danych 1. Technika implementacji w postaci tabel. 2. Schemat: a) gwiazda jedna tabela faktów w środku oraz tabele wymiarów po bokach (po jednej dla każdego wymiaru), b) płatek śniegu powstaje po zastosowaniu normalizacji do tabeli wymiarów schematu gwiazdy c) inne odmiany np. z wielokrotną tabelą faktów 4

Schemat gwiazdy przykład. Fragment schematu płatka śniegu przykład. Schematu wielogwiaździsty 2 tabele faktów. 5

Schemat z dwoma tabelami faktów. Schemat z dwoma tabelami faktów. Schemat z dwoma tabelami faktów. Druga tabela jako tabela asocjacyjna (przypisanie towaru do grupy). 6

MOLAP (ang. Multidimensional OLAP) - modele danych MOLAP 1. Fakty jako punkty wielowymiarowej przestrzeni. Przechowywanie w tzw. tablicach wielowymiarowych 2. Schemat w postaci wielowymiarowej kostki. 3. Reprezentacja szczegółowości (hierarchii) - za pomocą podkostek (ang. subcube). Reprezentacja punktu (pojedynczego elementu kostki przy pomocy innej kostki wielowymiarowej). 4. Arkusz (ang. spreadsheet) tworzą dwa wymiary (pozostałe mają ustaloną wartość). 5. Komórka miara z wszystkimi ustalonymi wymiarami. MOLAP Przykład kostki danych (ang. data cube). 7

MOLAP Przykład tablicy wielowymiarowej (działanie operatora CUBE). MOLAP 4. Analiza materiałów ksero. PODSUMOWANIE 8

PODSUMOWANIE Podsumowanie: schematy /MOLAP dopasowane do sposobu wykorzystania danych (wyraźnie pokazane fakty i wymiary), uproszczony sposób nawigacji po danych (zapytania analityczny), zastosowanie hierarchii umożliwia uzyskanie wyników na różnym poziomie szczegółowości (tzw. drążenie danych, operacje roll-up/ drill-down) PODSUMOWANIE Podsumowanie: wada: nadmiarowość danych, duże rozmiary oraz to co jest związane z brakiem normalizacji problem dołączania, aktualizacji, usuwania, wspomaganie zapytań analitycznych oraz modelowania /MOLAP przez narzędzia hurtowni danych, źle dobrana struktura (schemat) danych może wpływać na znaczne pogorszenie wydajności - analiza materiałów konferencyjnych ZADANIE FAJNE Jakie będą dla danych z laboratorium: - ścieżki podsumowań - model - model MOLAP 9