Modele danych - wykład V

Podobne dokumenty
Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

Hurtownie danych wykład 3

Hurtownie danych. 31 stycznia 2017

Wielowymiarowy model danych

Hurtownie danych a transakcyjne bazy danych

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Wstęp do Business Intelligence

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach.

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Bazy danych. Plan wykładu. Rodzaje baz. Rodzaje baz. Hurtownie danych. Cechy hurtowni danych. Wykład 14: Hurtownie danych

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

Spis tre±ci. Przedmowa... Cz ± I

Hurtownie danych. Rola hurtowni danych w systemach typu Business Intelligence

Hurtownie danych. Przetwarzanie zapytań. ZAPYTANIA NA ZAPLECZU

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Schematy logiczne dla hurtowni danych

OLAP i hurtownie danych c.d.

BD2 BazyDanych2. dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego

Hurtownie danych - przegląd technologii

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Bazy analityczne (hurtownie danych, bazy OLAP)

Plan wykładu. Hurtownie danych. Problematyka integracji danych. Cechy systemów informatycznych

Część I Istota analizy biznesowej a Analysis Services

Business Intelligence

4. Znaczenie czasu w modelowaniu i strukturalizacji danych

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

Informatyzacja przedsiębiorstw

PODSTAWY BAZ DANYCH Wykład Partycjonowanie tabel i indeksów

Pierwsze wdrożenie SAP BW w firmie

Systemy OLAP II. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

PODSTAWY BAZ DANYCH. 10. Partycjonowanie tabel i indeksów. 2009/ Notatki do wykładu "Podstawy baz danych"

Modelowanie hurtowni danych

Projektowanie hurtowni danych

Ćwiczenia z Zaawansowanych Systemów Baz Danych

Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence

Zaawansowane systemy baz danych - ZSBD. Hurtownie danych 1. Problematyka hurtowni danych. Wykład przygotował: Robert Wrembel. ZSBD wykład 12 (1)

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Porównanie wydajności hurtowni danych ROLAP i MOLAP w Oracle 10g

Plan. Inteligencja bisnesowa (Bussiness Intelligence) Hurtownia danych OLAP

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

OdświeŜanie hurtownie danych - wykład IV. Zagadnienia do omówienia. Wprowadzenie

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Procesowanie i partycjonowanie Analysis Services od podszewki (300) Adrian Chodkowski Adrian.Chodkowski@outlook.com

Systemy OLAP. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Matematyka kodem nowoczesności. Zaproszenie do składania ofert

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Microsoft Excel 2013: Budowanie modeli danych przy użyciu PowerPivot

Projektowanie hurtowni danych i modelowanie wielowymiarowe

Model logiczny SZBD. Model fizyczny. Systemy klientserwer. Systemy rozproszone BD. No SQL

Opracowanie: Izabela Czepil i Andrzej Solski

SQL w 24 godziny / Ryan Stephens, Arie D. Jones, Ron Plew. Warszawa, cop Spis treści

Projektowanie hurtowni danych i modelowanie wielowymiarowe

Ewolucja technik modelowania hurtowni danych

PROJEKT WSPÓŁFINANSOWANY ZE ŚRODKÓW UNII EUROPEJSKIEJ W RAMACH EUROPEJSKIEGO FUNDUSZU SPOŁECZNEGO OPIS PRZEDMIOTU. Rozproszone Systemy Baz Danych

Kostki OLAP i język MDX

Bazy danych i ich aplikacje

"Kilka słów" o strojeniu poleceń SQL w kontekście Hurtowni Danych wprowadzenie. Krzysztof Jankiewicz

Wprowadzenie do hurtowni danych

Modelowanie koncepcyjne hurtowni danych

Usługi analityczne podstawy budowy kostki analitycznej Część druga - zarządzanie

INTERNETOWE BAZY DANYCH materiały pomocnicze - wykład X

Modelowanie wielowymiarowe hurtowni danych

SAS OLAP Cube Studio Wprowadzenie

1. Ewolucja systemów opartych na bazach danych 2. Czym się rożni modelowanie od strukturalizacji danych? Model danych Struktury (danych)

JPivot & Mondrian. 16 maja Krukar, Lewandowska (BiHD) JPivot & Mondrian 16 maja / 42

HURTOWNIE DANYCH. Krzysztof Goczyła. Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska. kris@eti.pg.gda.pl. K.

Wydajność hurtowni danych opartej o Oracle10g Database

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

KARTA PRZEDMIOTU. Hurtownie i eksploracja danych D1_5

KONCEPTUALNE MODELOWANIE STRUKTUR BAZ MOLAP DLA E-BIZNESU

Normalizacja relacyjnych baz danych. Sebastian Ernst

Projektowanie Systemów Informacyjnych

Opis spełnienia wymagań (PSBD)

PROJEKT HURTOWNI DANYCH DLA PRZEDSIĘBIORSTWA PRODUKCYJNO-HANDLOWEGO W ŚRODOWISKU MS SQL SERVER

Projektowanie hurtowni danych i modelowanie wielowymiarowe

Cel przedmiotu. Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji 1 Język angielski 2 Inżynieria oprogramowania

Hurtownie danych w praktyce

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

Rady i porady użytkowe

JPivot & Mondrian. inż. Urszula Krukar, inż. Agnieszka Lewandowska,

PODSTAWOWE POJECIA ZWIAZANE Z HURTOWNIAMI DANYCH Najczęściej decyzja o stworzeniu hurtowni nadchodzi, gdy dana organizacja upora się z informatyzacją

Spis treści. Przedmowa

Co ciekawego w EURECE pojawiło się w wersji 2.4, a być może nie zdążyliście tego odkryć?

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA realizacja w roku akademickim 2016/17

ORACLE. System Zarządzania Bazą Danych Oracle. Oracle Advanced SQL

Migracja Business Intelligence do wersji

Baza danych. Modele danych

Procesy ETL - wykład V. Struktura. Wprowadzenie. 1. Wprowadzenie. 2. Ekstrakcja 3. Transformacja 4. Ładowanie 5. Studium przypadków.

Usługa archiwizacji danych w systemie Eureca. Marek Jelenik CONTROLLING SYSTEMS sp. z o.o.

Hurtownie Danych. Dariusz Dymek

Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

Transkrypt:

Modele danych - wykład V Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006

Zagadnienia 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne

WPROWADZENIE

Wprowadzenie PODSTAWOWE MODELE REPREZENTACJI I PRZECHOWYWANIA DANYCH ROLAP (ang. Relational OLAP) rozszerzony relacyjny model danych, przekształcenie operacji wielowymiarowych na standardowe relacyjne (często wspomagane narzędziami) MOLAP (ang. Multidimensional OLAP) wykorzystanie wielowymiarowych baz danych (MDB) tablice wielowymiarowe zamiast klasycznych,

Wprowadzenie AGREGACJA - wstępne wyliczenie pewnych miar (podsumowanie), np.: Dla bazy OLTP Dla bazy OLAP nie przechowujemy miesięcznych operacji z danym kontrahentem, gdyż można je wyliczyć z Faktur VAT wyliczmy raz i przechowujemy sumę operacji z danym kontrahentem (skoro takie dane są używane np. w 80% analiz)

Wprowadzenie PODZIAŁ NA PARTYCJE - zapis tabeli w częściach np. na różnych dyskach w celu zmniejszenia ilości danych lub zrównoleglenia operacji

Wprowadzenie Oracle przykłady: 2) Zrównoleglenie operacji na tabeli: CREATE TABLE SPRZEDAZ ( ) PARALLEL (DEGREE 6); - maksymalnie 6 procesów serwera do obsługi tej tabeli 3) Utworzenie tabeli z podziałem na partycje (części): CREATE Klienci (, Kraj char(2), ) PARTITION BY RANGE (Kraj) (PARTITION p1 VALUES LESS THAN ( C ) TABLESPACE Data01; PARTITION p2 VALUES LESS THAN ( K ) TABLESPACE Data02; PARTITION p6 VALUES LESS THAN MAXVALUE TABLESPACE Data06; Utworzenie indeksu dla tego podziału: CREATE INDEX indeks_kliencji_kraj ON Klienci (kraj) LOCAL;

Wprowadzenie Rodzaje danych analitycznych FAKTY (wielkości analizowane) dane ilościowe opisujące zaistniałe zdarzenia (fakty), np. wartość sprzedaży, ilość towaru, zysk WYMIARY (wielkości klasyfikujące) dane cechy, atrybuty faktów, tzw. dane klasyfikujące np. czas, miejsce, pracownik, klient, dane klasyfikujące mogą być układane w hierarchie

np. towar może należeć do dwóch kategorii. Wprowadzenie ŚCIEŻKI PODSUMOWAŃ - definiują poziomy ogólności wymiarów (hierarchie) Przykłady: gałąź przemysłu kategoria towar opakowanie kraj region miasto sklep rok kwartał miesiąc dzień tydzień UWAGA: Hierarchie nie muszą być jednoznaczne,

Wprowadzenie Hurtownie tematyczne (ang. data marts) - zbiory danych (zwykle perspektywy zmaterializowane) w których agregacje i podziały definiujemy pod kątem konkretnej grupy użytkowników podejmujących decyzje (np. pod kątem działu firmy)

ROLAP (ang. Relational OLAP) - modele danych

ROLAP 1. Technika implementacji w postaci tabel. 2. Schemat: a) gwiazda jedna tabela faktów w środku oraz tabele wymiarów po bokach (po jednej dla każdego wymiaru), b) płatek śniegu powstaje po zastosowaniu normalizacji do tabeli wymiarów schematu gwiazdy c) inne odmiany np. z wielokrotną tabelą faktów

ROLAP Schemat gwiazdy przykład.

ROLAP Fragment schematu płatka śniegu przykład.

ROLAP Schematu wielogwiaździsty 2 tabele faktów.

ROLAP Schemat z dwoma tabelami faktów.

ROLAP Schemat z dwoma tabelami faktów.

ROLAP Tabelami faktów jako tabela asocjacyjna (przypisanie towaru do grupy).

MOLAP (ang. Multidimensional OLAP) - modele danych

ROLAP 1. Fakty jako punkty wielowymiarowej przestrzeni. Przechowywanie w tzw. tablicach wielowymiarowych 2. Schemat w postaci wielowymiarowej kostki. 3. Reprezentacja szczegółowości (hierarchii) - za pomocą podkostek (ang. subcube). Reprezentacja punktu (pojedynczego elementu kostki przy pomocy innej kostki wielowymiarowej). 4. Arkusz (ang. spreadsheet) tworzą dwa wymiary (pozostałe mają ustaloną wartość). 5. Komórka miara z wszystkimi ustalonymi wymiarami.

ROLAP Przykład kostki danych (ang. data cube).

ROLAP Przykład tablicy wielowymiarowej (działanie operatora CUBE).

ROLAP 4. Analiza materiałów ksero.

PODSUMOWANIE

PODSUMOWANIE Podsumowanie: schematy ROLAP/MOLAP dopasowane do sposobu wykorzystania danych (wyraźnie pokazane fakty i wymiary), uproszczony sposób nawigacji po danych (zapytania analityczny), zastosowanie hierarchii umożliwia uzyskanie wyników na różnym poziomie szczegółowości (tzw. drążenie danych, operacje roll-up/ drill-down)

PODSUMOWANIE Podsumowanie: wada: nadmiarowość danych, duże rozmiary oraz to co jest związane z brakiem normalizacji problem dołączania, aktualizacji, usuwania, wspomaganie zapytań analitycznych oraz modelowania ROLAP/MOLAP przez narzędzia hurtowni danych, źle dobrana struktura (schemat) danych może wpływać na znaczne pogorszenie wydajności - analiza materiałów konferencyjnych

ZADANIE FAJNE Jakie będą dla danych z laboratorium: - ścieżki podsumowań - model ROLAP - model MOLAP