Modelowanie koncepcyjne hurtowni danych



Podobne dokumenty
Hurtownie danych. 31 stycznia 2017

Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

Modele danych - wykład V

Wstęp do Business Intelligence

Informatyzacja przedsiębiorstw

Hurtownie danych a transakcyjne bazy danych

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Hurtownie danych. Rola hurtowni danych w systemach typu Business Intelligence

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence

Bazy analityczne (hurtownie danych, bazy OLAP)

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

Bazy danych. Plan wykładu. Rodzaje baz. Rodzaje baz. Hurtownie danych. Cechy hurtowni danych. Wykład 14: Hurtownie danych

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

Projektowanie hurtowni danych

Hurtownie danych wykład 3

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach.

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2018/2019

HURTOWNIE DANYCH. Krzysztof Goczyła. Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska. kris@eti.pg.gda.pl. K.

Wprowadzenie do Hurtowni Danych

Schematy logiczne dla hurtowni danych

Zaawansowane systemy baz danych - ZSBD. Hurtownie danych 1. Problematyka hurtowni danych. Wykład przygotował: Robert Wrembel. ZSBD wykład 12 (1)

Model logiczny SZBD. Model fizyczny. Systemy klientserwer. Systemy rozproszone BD. No SQL

HARMONOGRAM: DZIEŃ GODZINA MIEJSCE PROWADZĄCY TEMAT OPIS

Business Intelligence

Hurtownie danych. Przetwarzanie zapytań. ZAPYTANIA NA ZAPLECZU

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Wielowymiarowy model danych

4. Znaczenie czasu w modelowaniu i strukturalizacji danych

PROJEKT WSPÓŁFINANSOWANY ZE ŚRODKÓW UNII EUROPEJSKIEJ W RAMACH EUROPEJSKIEGO FUNDUSZU SPOŁECZNEGO OPIS PRZEDMIOTU. Rozproszone Systemy Baz Danych

Bazy Danych. Bazy Danych i SQL Podstawowe informacje o bazach danych. Krzysztof Regulski WIMiIP, KISiM,

Wprowadzenie do projektowania i wykorzystania baz danych Relacje i elementy projektowania baz

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

SAS wybrane elementy. DATA MINING Część I. Seweryn Kowalski 2006

Wprowadzenie do hurtowni danych

Adam Cankudis IFP UAM

Ewolucja technik modelowania hurtowni danych

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Hurtownie danych - przegląd technologii

Ż Ł Ń

Ń ć ć ć

Plan. Inteligencja bisnesowa (Bussiness Intelligence) Hurtownia danych OLAP

SAS OLAP Cube Studio Wprowadzenie

Pierwsze wdrożenie SAP BW w firmie

Plan wykładu. Hurtownie danych. Problematyka integracji danych. Cechy systemów informatycznych

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

1. Ewolucja systemów opartych na bazach danych 2. Czym się rożni modelowanie od strukturalizacji danych? Model danych Struktury (danych)

Baza danych. Baza danych to:

BD2 BazyDanych2. dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego

Terminologia baz danych

Projektowanie hurtowni danych i modelowanie wielowymiarowe

Business Intelligence (BI) Hurtownie danych, Eksploracja danych. Business Intelligence (BI) Mnogość pojęć z okolic BI

Problematyka hurtowni danych

PROJEKT Z BAZ DANYCH

Bazy danych i usługi sieciowe

Zasady projektowania hurtowni cd.

Projektowanie hurtowni danych i modelowanie wielowymiarowe

Hurtownie danych - przegląd technologii

Ś ć Ś Ę Ś Ś Ś Ś Ę Ę

Hurtownie Danych. Dariusz Dymek

Co to jest Business Intelligence?

Hurtownie danych. Metadane i czynniki jakości. BAZA METADANYCH. Centralna hurtownia danych. Metadane

Baza danych. Modele danych

Informatyka I BAZY DANYCH. dr inż. Andrzej Czerepicki. Politechnika Warszawska Wydział Transportu 2017

Systemy baz danych i hurtowni danych

Informatyzacja przedsiębiorstw

Hurtownie danych czyli jak zapewnić dostęp do wiedzy tkwiącej w danych

Więzy integralności referencyjnej i klucze obce. PYTANIE NA EGZAMIN LICENCJACKI

Ł

ć ć ć ź ć ć ć ć Ł ź Ź ć ć ć

ć Ć ć Ż ć ć ć ć Ń ć ć ć ć ć

Kostki OLAP i język MDX

ć ź ź ź ź ć ć

ń ń ń Ł Ł Ź ń Ż Ż ń ń ń ń Ż ń

Część I Istota analizy biznesowej a Analysis Services

ń ń ń Ń ń ń ń ń ń Ł

ć ć ć ź ć ć ć ć

Ń Ą Ą Ą

ZARZĄDZANIE WYMAGANIAMI ARCHITEKTONICZNYMI

Ź Ń Ń ź Ą Ł Ń Ń Ł Ń Ń Ą

ż ż Ń Ś ż Ł Ł Ł ż ź

ń ć ń ć ń Ć ć Ć ź

ć ć Ść

Baza danych to zbiór wzajemnie powiązanych ze sobą i zintegrowanych danych z pewnej dziedziny.

Dr inż. Andrzej KAMIŃSKI Instytut Informatyki i Gospodarki Cyfrowej Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa w Warszawie

Ń

Wprowadzenie do hurtowni danych

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski

PROJEKT HURTOWNI DANYCH DLA PRZEDSIĘBIORSTWA PRODUKCYJNO-HANDLOWEGO W ŚRODOWISKU MS SQL SERVER

Modelowanie hurtowni danych

Microsoft Excel 2013: Budowanie modeli danych przy użyciu PowerPivot

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

Technologia informacyjna

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

ż ż Ż Ł Ż Ś ć ż ć ż Ś

Transkrypt:

Modelowanie koncepcyjne hurtowni danych Izabela Szczę ch Instytut Informatyki, Politechnika Poznań ska

Modele przetwarzania danych Dwa podstawowe modele przetwarzania danych: OLTP (On-Line Transaction Processing) celem jest wiarygodne i efektywne przetwarzanie dużych ilości transakcji i zapewnianie spó jności danych OLAP (On-Line Analytical Processing) celem jest efektywne wielowymiarowe przetwarzanie dużych wolumenó w danych Po co hurtownie danych? zbierają informacje z różnych źró deł (różnych baz danych), aby dostarczać spó jne źró dło danych dla zapytań wspomagających decyzje aplikacje wspierające decyzje działają poza systemem transakcyjnym (on-line), nie hamują jego działania

OLTP vs. OLAP OLTP OLAP users Clerk, IT professional Knowledge worker function day to day operations decision support DB design application-oriented subject-oriented data current, up-to-date historical, summarized detailed, flat relational isolated multidimensional integrated, consolidated usage repetitive ad-hoc access read/write, lots of scans inde/hash on prim. key unit of work short, simple transaction comple query # records accessed tens millions #users thousands hundreds DB size 100MB-GB 100GB-TB metric transaction throughput query throughput, response

Architektura hurtowni danych Eternal data sources Etract Transform Load Refresh Data Warehouse Operational databases Metadata repository Serves Data marts OLAP server Reports OLAP Data mining

Schematy logiczne hurtowni danych Trzy podstawowe schematy logiczne hurtowni danych: schemat gwiazdy schemat płatka śniegu schemat konstelacji faktó w (=schemat wielokrotnych tabel faktó w) Schemat gwiazdy: pojedyncza tablica (tablica faktó w) w centrum połączona z wieloma tablicami wymiaró w. Schemat płatka śniegu: rozwinięcie schematu gwiazdy poprzez normalizację relacji wymiaró w. Schemat konstelacji faktó w: wiele tablic faktó w współdzieli tablice wymiaró w.

Schemat gwiazdy Schemat gwiazdy: pojedyncza tablica faktó w w centrum połączona z wieloma tablicami wymiaró w Data ID_daty Dzień Miesiąc Rok Sklep Nr_sklepu Miasto Województwo Kraj Sprzedaż tabela faktów Data Produkt Sklep Klient ilość_sprzedana zysk_w_pln Produkt Nr_produktu Nazwa_produktu Kategoria_produktu Klient Nr_klienta Nazwa_klienta Miasto_klienta Kraj_klienta miary

Schemat gwiazdy Data ID Dzień Miesiąc Rok D1 16 marzec 2005 D2 17 marzec 2005 D3 20 luty 2004 Produkt Nr_produktu Nazwa_produktu Kategoria_produktu P1 ser bia ły nabia ł P2 mleko nabia ł P3 czekolada słodycze Sprzeda ż ID_sprzedaż y ID_daty Nr_sklepu Nr_produktu Nr_klienta Ilość_sprz Zysk_PLN 100 D1 S2 P1 K2 10 100 200 D1 S3 P1 K1 20 200 300 D2 S1 P3 K1 15 30 Sklep Nr_sklepu Miasto Województwo Kraj S1 Poznań Wlkp PL S2 Koszalin Zach-pom PL S3 Wrocław Dolnoś l PL Klient Nr_klienta Nazwa_klienta Miasto_klienta Kraj_klienta K1 Kowalski Pozna ń PL K2 Nowak Warszawa PL K3 Kowalski&Sons Rzeszów UK

Hierarchie wymiaró w Dla każdego wymiaru, zbió r opisujących go atrybutó w może być ułożony w hierarchiczną strukturę kraj wojewó dztwo miasto klient kategoria_produktu nazwa_produktu Tworząc hierarchie wymiaró w, przekształcamy schemat gwieździsty w schemat płatka śniegu

Schemat płatka śniegu Rok Rok Miesiąc Miesiąc Rok Data Dzień Miesiąc Sprzedaż tabela faktów Data Produkt Produkt Nr_produktu Nazwa_produktu Kategoria Kategoria Nr_kategorii Nazwa_kategorii Info_dodatkowe Sklep Nr_sklepu Miasto Województwo Kraj Sklep Klient ilość_sprzedana zysk_w_pln Klient Nr_klienta Nazwa_klienta Miasto_klienta Kraj_klienta miary

Schemat konstelacji faktó w Schemat konstelacji faktó w (czyli schemat wielokrotnych tablic faktó w): wiele tablic faktó w współdzieli relacje wymiaró w takie schematy pojawiają się przy projektowaniu hurtowni danych dla dużych i złożonych problemó w

Korporacyjna i tematyczna hurtownia danych Korporacyjna hurtownia danych (Data Warehouse) Odpytywalne źró dło danych o przedsiębiorstwie. Suma logiczna wszystkich składowych hurtowni tematycznych. Tematyczna hurtownia danych(data Mart) Logiczna część składowa korporacyjnej hurtowni danych. Zawężenie hurtowni korporacyjnej do pojedynczego procesu biznesowego lub grupy powiązanych ze sobą procesó w skierowanych do konkretnej grupy biznesowej użytkownikó w. Tabele wymiaró w lub faktó w współdzielone pomiędzy różnymi hurtowniami tematycznymi muszą mieć jedną definicję obowiązującą w całej hurtowni korporacyjnej (conformed dimensions, facts). Macierz procesó w biznesowych i wymiaró w (Bus Architecture)

Macierz procesó w biznesowych i wymiaró w W procesie projektowania korporacyjnej hurtowni pomocne jest zastosowanie macierzy identyfikującej: procesy biznesowe wymiary Przecięcia w macierzy wskazują, któ re procesy biznesowe korzystają z któ rych wymiaró w.

Macierz procesó w biznesowych i wymiaró w Rodzaj usterki Product Pracownik Organizacja Producent Linia serwisowa # Kanał sprzedaży Plan taryfowy Numer telefonu Klient Data Rachunki miesięczne Naprawy Zakupy Fragment macierzy procesó w i wymiaró w dla firmy telekomunikacyjnej

Współdzielone wymiary Wymiary współdzielone przez różne tablice faktó w muszą utrzymywać tę samą definicję we wszystkich hurtowniach tematycznych, któ re z nich korzystają. Odpowiednie zaprojektowanie, zbudowanie i utrzymanie współdzielonych wymiaró w to bardzo istotny aspekt pracy nad hurtownia korporacyjną. Wspó łdzielenie wymiaró w pozwala na: oszczędzanie fizycznego miejsca na dysku (nie składujemy redundantnych tabel) spó jną i jednoznaczną interpretację atrybutó w znajdujących się w wymiarach, a co za tym idzie spó jną interpretację wszelkich podsumowań w różnych hurtowniach tematycznych.