Hurtownie danych. Rola hurtowni danych w systemach typu Business Intelligence

Podobne dokumenty
Proces ETL. Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska {kris,

Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence

HURTOWNIE DANYCH. Krzysztof Goczyła. Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska. kris@eti.pg.gda.pl. K.

Wstęp do Business Intelligence

Ewolucja technik modelowania hurtowni danych

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Modele danych - wykład V

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Hurtownie danych. 31 stycznia 2017

Hurtownie danych a transakcyjne bazy danych

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2018/2019

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach.

Informatyzacja przedsiębiorstw

Hurtownia danych praktyczne zastosowania

Bazy analityczne (hurtownie danych, bazy OLAP)

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Hurtownie danych wykład 3

Bazy danych. Plan wykładu. Rodzaje baz. Rodzaje baz. Hurtownie danych. Cechy hurtowni danych. Wykład 14: Hurtownie danych

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Business Intelligence

Zasady projektowania hurtowni cd.

Hurtownie danych. Przetwarzanie zapytań. ZAPYTANIA NA ZAPLECZU

Część I Istota analizy biznesowej a Analysis Services

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Wielowymiarowy model danych

Projektowanie hurtowni danych

Migracja Comarch ERP Altum Business Intelligence do wersji 2019

Systemy baz danych i hurtowni danych

Pierwsze wdrożenie SAP BW w firmie

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Bazy Danych. Bazy Danych i SQL Podstawowe informacje o bazach danych. Krzysztof Regulski WIMiIP, KISiM,

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Baza danych to zbiór wzajemnie powiązanych ze sobą i zintegrowanych danych z pewnej dziedziny.

Hurtownie danych czyli jak zapewnić dostęp do wiedzy tkwiącej w danych

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Hurtownie danych - przegląd technologii

Plan wykładu. Hurtownie danych. Problematyka integracji danych. Cechy systemów informatycznych

Wprowadzenie do hurtowni danych

Hurtownie danych w praktyce

Wprowadzenie do Hurtowni Danych

Dr inż. Andrzej KAMIŃSKI Instytut Informatyki i Gospodarki Cyfrowej Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa w Warszawie

Ewolucja systemów baz danych

Rozumie istotę i znacznie procesów ekstrakcji, transformacji i ładowania danych (ETL), zna wybrany język ETL oraz odpowiednie narzędzia.

Migracja XL Business Intelligence do wersji

Schematy logiczne dla hurtowni danych

Wprowadzenie do hurtowni danych

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

BD2 BazyDanych2. dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego

Informatyzacja przedsiębiorstw

Spis tre±ci. Przedmowa... Cz ± I

ANALIZA DANYCH SYSTEMU ERP WYKORZYSTANIE KONCEPCJI BUSINESS INTELLIGENCE

Integracja systemów transakcyjnych

Co to jest Business Intelligence?

Zaawansowane bazy danych i hurtownie danych Wydział Informatyki Politechnika Białostocka

1Executive summary Comarch ERP XLBI Wersja:

Migracja Business Intelligence do wersji

A posteriori wsparcie w podejmowaniu decyzji biznesowych.

Zaawansowane systemy baz danych - ZSBD. Hurtownie danych 1. Problematyka hurtowni danych. Wykład przygotował: Robert Wrembel. ZSBD wykład 12 (1)

Projektowanie hurtowni danych i modelowanie wielowymiarowe

Migracja Business Intelligence do wersji

SAS OLAP Cube Studio Wprowadzenie

ORACLE. System Zarządzania Bazą Danych Oracle. Oracle Advanced SQL

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

Problematyka hurtowni danych

Matryca pokrycia efektów kształcenia. Efekty kształcenia w zakresie wiedzy (cz. I)

Sylabus modułu kształcenia na studiach wyższych. Nazwa Wydziału. Nazwa jednostki prowadzącej moduł Nazwa modułu kształcenia.

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

KARTA PRZEDMIOTU. Hurtownie i eksploracja danych D1_5

Baza danych. Modele danych

1.1 Matryca pokrycia efektów kształcenia. Efekty kształcenia w zakresie wiedzy. Efekty kształcenia w zakresie umiejętności

PRZEDMIOTY REALIZOWANE W RAMACH KIERUNKU INFORMATYKA I STOPNIA STUDIA STACJONARNE

Paweł Gołębiewski. Softmaks.pl Sp. z o.o. ul. Kraszewskiego Bydgoszcz kontakt@softmaks.pl

Projektowanie hurtowni danych i modelowanie wielowymiarowe

Projektowanie hurtowni danych i modelowanie wielowymiarowe

Migracja Business Intelligence do wersji

Plan. Inteligencja bisnesowa (Bussiness Intelligence) Hurtownia danych OLAP

Modelowanie koncepcyjne hurtowni danych

SAS wybrane elementy. DATA MINING Część I. Seweryn Kowalski 2006

Migracja Business Intelligence do wersji 11.0

OLAP i hurtownie danych c.d.

Procesowanie i partycjonowanie Analysis Services od podszewki (300) Adrian Chodkowski Adrian.Chodkowski@outlook.com

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Razem godzin w semestrze: Plan obowiązuje od roku akademickiego 2014/15 - zatwierdzono na Radzie Wydziału w dniu r.

Rozdział 1616 Wspomaganie zarządzania uczelnią. Rozdział przy użyciu metod analitycznych hurtowni. metod analitycznych hurtowni danych

SYSTEMY WSPOMAGAJĄCE PODEJMOWANIE DECYZJI W PRZEDSIĘBIORSTWIE

Migracja Business Intelligence do wersji Aktualizacja dokumentu:

Analityka danych & big data

POLITECHNIKA LUBELSKA Wydział Elektrotechniki Kierunek: INFORMATYKA II stopień niestacjonarne i Informatyki. Część wspólna dla kierunku

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Cel przedmiotu. Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji 1 Język angielski 2 Inżynieria oprogramowania

HARMONOGRAM: DZIEŃ GODZINA MIEJSCE PROWADZĄCY TEMAT OPIS

Transkrypt:

Hurtownie danych Rola hurtowni danych w systemach typu Business Intelligence Krzysztof Goczyła Teresa Zawadzka Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska {kris, tegra}@eti.pg.gda.pl - 1 - Podstawowa architektura rozwiązań typu BI Proces ETL Prezes/Analityk Hurtownia danych Źródła danych - 2-2 1

Hurtownia danych (ang. data warehouse) Tematyczny (ang. subject-oriented), zintegrowany (ang. integrated), zależny od czasu (ang. time-variant), trwały (ang. non-volatile) zbiór danych, ukierunkowany na wspomaganie procesów podejmowania decyzji. Bill Inmon Kopia danych transakcyjnych zapisanych w strukturach ukierunkowanych na zapytania analityczne. Ralph Kimball - 3 - Cechy hurtowni danych (1) Zbiór danych Hurtownia danych to bardzo duży zbiór danych / baza danych (setki GB, pojedyncze TB). Taka baza danych optymalizowana jest pod kątem przetwarzania analitycznego, a nie transakcyjnego. - 4-2

Cechy hurtowni danych (2) Tematyczny zbiór danych Hurtownia danych może być używana do analizy konkretnego obszaru tematycznego np.: sprzedaży. Zbiór danych zależny od czasu Hurtownia danych przechowuje dane historyczne. Trwały zbiór danych Dane zapisane w hurtowni danych pozostają niezmienione. - 5 - Cechy hurtowni danych (3) Zintegrowany zbiór danych Dane pochodzące z wielu różnych systemów baz danych i innych źródeł danych i są zbierane do jednego miejsca: zintegrowanej bazy danych - hurtowni danych. Proces ETL Extract Transform Load Hurtownia danych - 6 - Źródła danych 3

Cechy hurtowni danych (4) Struktury ukierunkowane na zapytania analityczne wymiaru 1 wymiaru 2 faktów wymiaru 3 RDBMS Model wielowymiarowy - 7 - Wielowymiarowy model danych Zasadnicze dane hurtowni przechowywane są w postaci faktów zdarzeń, mogących być przedmiotem analiz ilościowych. Z faktami kojarzone są miary o charakterze numerycznym. Wymiary o charakterze nienumerycznym stanowiące kategorie informacji służących do agregowania faktów względem różnych kryteriów (warunków określonych na wymiarach). Jeden wymiar posiada kilka atrybutów wymiarów stanowiących konkretne kryterium. Elementy wymiarów są tekstowymi etykietami opisującymi fakty. - 8-4

Przykład modelu wielowymiarowego S k l e p C z a s d2 s5 s4 s3 s2 s1 d1 d4 d3 p1 p2 p3 p4 p5 p6 Produkt kostka (cube) Produkt Sklep Czas wymiary (p i, s j, d k ) fakt sprzedaży produktu p i w sklepie s j dnia d k Możliwe miary: ilość sprzedanego produktu przychód ze sprzedaży koszt sprzedaży - 9 - Przykład analiz wielowymiarowych Wycinanie C z a s d4 d3 d2 d1 s5 S s4 k l s3 e s2 p s1 p1 p2 p3 p4 p5 p6 Produkt C z a s d2 s3 d1 d4 d3 p1 p2 p3 p4 p5 p6 Produkt Efekt: (p i, s 3, d k ) - wszystkie fakty sprzedaży w sklepie s 3-10 - 5

Przykład analiz wielowymiarowych Wycinanie C z a s d4 d3 d2 d1 s5 S s4 k l s3 e s2 p s1 p1 p2 p3 p4 p5 p6 Produkt d3 d2 s3 s4 p2 p3 p4 Efekt: (p i, s j, d k ) - fakty sprzedaży w sklepie s 3 i s 4 produktów p 2, p 3, p 4 w dniach d 2, d 3-11 - Agregacje Dla wyciętego zbioru faktów wyliczane są agregacje. Miary mają przypisane funkcje agregujące. Funkcja agregująca określa jaka operacja matematyczna jest wykonywana na wartościach miar. Prawidłową funkcją agregującą dla miar: ilość sprzedanego produktu, przychód ze sprzedaży i koszt sprzedaży jest funkcja SUM. - 12-6

Schemat gwiazdy wymiaru produkt Miary faktów sprzedaży wymiaru czas wymiaru sklep - 13 - Schemat gwiazdy Tablica wymiarów 1 1 1 Tablica wymiarów 3 n n Tablica faktów n n... Tablica wymiarów 2 1 1 Tablica wymiarów k Tablica faktów, z atrybutami liczbowymi (miarami, ang. measures) Tablice wymiarów, z atrybutami opisowymi (elementami wymiarów, ang. dimension members) - 14-7

Model wielowymiarowy a model gwiazdy (1) Atrybuty wymiary Produkt: - NAZWA PRODUKTU - KATEGORIA PRODUKTU - DZIAŁ PRODUKTU Atrybuty wymiary Sklep: - NAZWA SKLEPU - WOJEWÓDZTWO - MIASTO Miary Atrybuty wymiaru Czas: - DATA - ROK - MIESIĄC - DZIEŃ - 15 - Wymiary kategoryjne i hierarchiczne Wymiary: - PRODUKT - CZAS - SKLEP Wymiary hierarchiczne: - CZAS: - LOKALIZACJA SKLEPU - PRODUKT ROK WOJEWÓDZTWO DZIAŁ PRODUKTU MIESIĄC MIASTO KATEGORIA PRODUKTU DZIEŃ NAZWA SKLEPU NAZWA PRODUKTU - 16-8

Powrót do architektury Podstawowa architektura rozwiązań typu BI Proces ETL Prezes/Analityk Hurtownia danych Źródła danych - 17 - Podejście z góry do dołu (1) Tematyczny (ang. subject-oriented), zintegrowany (ang. integrated), zależny od czasu (ang. time-variant), trwały (ang. non-volatile) zbiór danych, ukierunkowany na wspomaganie procesów podejmowania decyzji. Bill Inmon Zaczerpnięte z: http://searchbusinessintelligence.techtarget.in/tip/inmon-vs-kimball-which-approach-is-suitable-for-your-data-warehouse - 18-9

Podejście z dołu do góry Kopia danych transakcyjnych zapisanych w strukturach ukierunkowanych na zapytania analityczne. Ralph Kimball - 19 - Zaczerpnięte z: http://searchbusinessintelligence.techtarget.in/tip/inmon-vs-kimball-which-approach-is-suitable-for-your-data-warehouse Minihurtownia (ang. data mart) Tematyczna hurtownia danych Gdy dane w hurtowni obejmują tylko pewien wycinek danych zintegrowanych: minihurtownia (podhurtownia, zbiorcza baza danych, ang. data mart) Bill Inmon - 20 - Ralph Kimball 10

Co każdy student wiedzieć powinien 1. Znać definicje hurtowni danych i rozumieć między nimi różnicę? 2. Rozumieć pojęcia modelu wielowymiarowego. 3. Rozumieć pojęcie schematu gwiazdy. 4. Znać architekturę B. Inmona i Ralpha Kimballa. 5. Umieć wyjaśnić różnice pomiędzy podejściem z góry do dołu i z dołu do góry. - 21-11