Ewolucja technik modelowania hurtowni danych

Podobne dokumenty
Hurtownie danych. 31 stycznia 2017

Hurtownie danych. Rola hurtowni danych w systemach typu Business Intelligence

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Hurtownie danych a transakcyjne bazy danych

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Bazy danych. Plan wykładu. Rodzaje baz. Rodzaje baz. Hurtownie danych. Cechy hurtowni danych. Wykład 14: Hurtownie danych

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Hurtownie danych w praktyce

Pierwsze wdrożenie SAP BW w firmie

Rola analityki danych w transformacji cyfrowej firmy

Hurtownia danych praktyczne zastosowania

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Hurtownie danych. Przetwarzanie zapytań. ZAPYTANIA NA ZAPLECZU

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

Szkolenie autoryzowane. MS Wdrażanie hurtowni danych w Microsoft SQL Server 2012

Wstęp do Business Intelligence

Analityka danych w środowisku Hadoop. Piotr Czarnas, 5 czerwca 2017

Analityka danych w środowisku Hadoop. Piotr Czarnas, 27 czerwca 2017

Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

Modele danych - wykład V

Projektowanie hurtowni danych

BD2 BazyDanych2. dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego

Prezentacja firmy WYDAJNOŚĆ EFEKTYWNOŚĆ SKUTECZNOŚĆ.

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Część I Istota analizy biznesowej a Analysis Services

Co to jest Business Intelligence?

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach.

Systemy Business Intelligence w praktyce. Maciej Kiewra

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Wprowadzenie do Hurtowni Danych

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

4. Znaczenie czasu w modelowaniu i strukturalizacji danych

IBM DATASTAGE COMPETENCE CENTER

Bazy danych i ich aplikacje

Schematy logiczne dla hurtowni danych

BUSINESS INTELLIGENCE DEVELOPMENT Tego Cię nauczymy:

Architektura bezpieczeństwa informacji w ochronie zdrowia. Warszawa, 29 listopada 2011

Migracja Business Intelligence do wersji

Projektowanie hurtowni danych i modelowanie wielowymiarowe

Ewolucja systemów baz danych

Baza danych to zbiór wzajemnie powiązanych ze sobą i zintegrowanych danych z pewnej dziedziny.

Projektowanie hurtowni danych i modelowanie wielowymiarowe

Cel przedmiotu. Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji 1 Język angielski 2 Inżynieria oprogramowania

1.1 Matryca pokrycia efektów kształcenia. Efekty kształcenia w zakresie wiedzy. Efekty kształcenia w zakresie umiejętności

Projektowanie hurtowni danych i modelowanie wielowymiarowe

HURTOWNIE DANYCH. Krzysztof Goczyła. Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska. kris@eti.pg.gda.pl. K.

Hurtownie danych wykład 3

Praktyczne wykorzystanie elementów raportowania Microsoft Project 2010 /Project Server 2010 Sesja 5 PowerPivot & PowerView Bartłomiej Graczyk

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

Marcin Adamczak Jakub Gruszka MSP. Business Intelligence

Migracja Business Intelligence do wersji

CONTROLLING POD KONTROLĄ

Migracja XL Business Intelligence do wersji

Rozumie istotę i znacznie procesów ekstrakcji, transformacji i ładowania danych (ETL), zna wybrany język ETL oraz odpowiednie narzędzia.

OLAP i hurtownie danych c.d.

COMARCH DATA WAREHOUSE MANAGER 6.2

Informatyzacja przedsiębiorstw

Hurtownie danych. Metadane i czynniki jakości. BAZA METADANYCH. Centralna hurtownia danych. Metadane

Błędy procesu tworzenia oprogramowania (Badania firmy Rational Software Corporation)

Monitoring procesów z wykorzystaniem systemu ADONIS

Bazy Danych. Bazy Danych i SQL Podstawowe informacje o bazach danych. Krzysztof Regulski WIMiIP, KISiM,

Hurtownie danych - przegląd technologii

Business Intelligence (BI) Hurtownie danych, Eksploracja danych. Business Intelligence (BI) Mnogość pojęć z okolic BI

Ramowy plan kursu. Lp. Moduły Wyk. Lab. Przekazywane treści

Migracja Comarch ERP Altum Business Intelligence do wersji 2019

Stawiamy na specjalizację. by CSB-System AG, Geilenkirchen Version 1.1

Migracja Business Intelligence do wersji

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

Spis tre±ci. Przedmowa... Cz ± I


Etapy życia oprogramowania

Definicja bazy danych TECHNOLOGIE BAZ DANYCH. System zarządzania bazą danych (SZBD) Oczekiwania wobec SZBD. Oczekiwania wobec SZBD c.d.

Tabele przestawne jako narzędzie analizy biznesowej

Normalizacja baz danych

Etapy życia oprogramowania. Modele cyklu życia projektu. Etapy życia oprogramowania. Etapy życia oprogramowania

Platforma Cognos. Agata Tyma CMMS Department Marketing & Sales Specialist atyma@aiut.com.pl AIUT Sp. z o. o.

SPIS TREŚCI PRZEDMOWA... 11

Analityka danych & big data

HARMONOGRAM: DZIEŃ GODZINA MIEJSCE PROWADZĄCY TEMAT OPIS

Informacja o firmie i oferowanych rozwiązaniach

One Size Doesn t Fit All, czyli case study stworzenia BI dostosowanego do strategicznych, operacyjnych oraz analitycznych potrzeb

OdświeŜanie hurtownie danych - wykład IV. Zagadnienia do omówienia. Wprowadzenie

VI Kongres BOUG Praktyczne aspekty wykorzystania Business Intelligence w przemyśle wydobywczym węgla kamiennego

Bazy analityczne (hurtownie danych, bazy OLAP)

Proces ETL. Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska {kris,

Usługa archiwizacji danych w systemie Eureca. Marek Jelenik CONTROLLING SYSTEMS sp. z o.o.

Bazy danych. Zenon Gniazdowski WWSI, ITE Andrzej Ptasznik WWSI

Uniwersytet Zielonogórski Instytut Sterowania i Systemów Informatycznych Bazy Danych - Projekt. Zasady przygotowania i oceny projektów

Migracja Comarch ERP Altum Business Intelligence do wersji

Transkrypt:

Baza wiedzy JPro Ewolucja technik modelowania hurtowni Porównanie technik modelowania hurtowni podsumowanie: Strona 1/6 Nazwa podejścia Corporate Information Factory Kimball Bus Architecture Data Vault Typ podejścia Z góry na dół Z dołu do góry Z góry na dół Normalizacja Znormalizowane, trzecia postać normalna (3PN) Dane zdenormalizowane Znormalizowane, trzecia postać normalna (3PN) Podstawowe informacje Redundancja Brak Tak Brak Autor Ramy czasowe William Harvey (Bill) Inmon (1945) W latach 70-tych Inmon rozpoczyna formułowanie definicji hurtowni. wypracowane w latach 90-tych ubiegłego stulecia. Ralph Kimball (1944) wypracowane w latach 90-tych ubiegłego stulecia. Daniel E. Linstedt Pierwotnie zaprojektowane już w 1990 roku. Data Vault 1.0 wydane w 2000 roku jako metodologia modelowania. Data Vault 2.0 wydane w 2013 roku.

Strona 2/6 Filozofia Rozumienie hurtowni Hurtownia to tematyczny, zintegrowany, zależny od czasu, trwały zbiór, ukierunkowany na wspomaganie procesów podejmowania decyzji. Hurtownia przechowuje dane atomowe na najniższym poziomie szczegółowości. Data marty tworzone są dopiero po utworzeniu pełnej hurtowni. Hurtownia stanowi kopię transakcyjnych zapisanych w strukturach ukierunkowanych na zapytania analityczne. Mając na uwadze najważniejsze aspekty biznesowe lub działy, data marty są tworzone w pierwszej kolejności. Zapewniają one wąski widok organizacyjnych i, gdy jest to wymagane, można je połączyć w większą hurtownię. Hurtownia jest zaprojektowana tak, aby zapewnić przechowywanie historycznych z wielorakich systemów źródłowych. Data Vault oznacza również, obok aspektu modelowania, sposób patrzenia na dane historyczne, który zapewnia audytowalność, śledzenie, szybkość ładowania oraz odporność na zmiany biznesowe. Główni aktorzy Specjaliści IT Użytkownicy końcowi Użytkownicy końcowi Cel Dostarczenie kompletnego rozwiązania technicznego opartego na udowodnionych metodach i technologiach. Dostarczenie rozwiązania, które ułatwia bezpośrednie odpytywanie przez użytkowników końcowych. Dostarczenie kompletnego rozwiązania opartego na udowodnionych metodach.

Strona 3/6 Obszar przejściowy Tak Tak Tak Architektura Hurtowniane dane na najniższym poziomie granulacji są źródłem dla wydziałowych data martów. Zestaw data martów tworzy hurtownię. Data Vault dostarcza dane dla data martów. Układ Dane relacyjne (3PN) Dane relacyjne (płatek śniegu, gwiazda lub konstelacja faktów) Dane relacyjne (3PN) Metodologia i architektura Elementy charakterystyczne modelu Brak Wymiar, tabela faktów Złożoność techniki Dość złożona Prosta Prosta Metodologia wytwarzania Inspirowane przez model spiralny Czterokrokowy proces: 1. Wybranie procesu biznesowego 2. Określenie granulacji 3. Identyfikacja wymiarów 4. Identyfikacja faktów Hub, link, satelita Oparte na metodyce zwinnej Koszty wdrożenia Koszty początkowe wyższe, dalsze koszty niższe Początkowe koszty niższe, każdy kolejny krok kosztuje tyle samo Koszty projektu niższe niż w dwóch poprzednich podejściach Czas wytworzenia Długi Krótki Krótki

Strona 4/6 Integracja pochodzących z wielu źródeł Transformacje muszą zostać zaplanowane w procesie ETL. Transformacje muszą zostać zaplanowane w procesie ETL. Separacja satelitów i kluczy biznesowych redukuje złożoność. Integracja, procesy ETL Złożoność procesów ETL Transformacje proste, jeśli model jest podobny do modelu źródeł. Transformacje pomiędzy modelem OLTP a modelem wielowymiarowym są złożone. Transformacje są proste do załadowania hubów, linków i satelitów. Orientacja Oparte na Oparte na procesach Oparte na i procesach Narzędzia Klasyczne narzędzia modelowania (ERD, DIS) Modelowanie wymiarowe Modelowanie hubów, linków i satelitów Zaangażowanie użytkowników końcowych Słabe Mocne Mocne

Strona 5/6 Elastyczność na zmiany w źródle Potrzeba zmian w tabelach. Częste zmiany w modelu źródłowym oddziaływują na model hurtowni. Zmiany w źródle nie wpływają na model hurtowni. Jedyna możliwa zmiana to dodanie odpowiedniej satelity. Elastyczność na nowe wymagania biznesowe Model zmienia się tylko gdy potrzebne dane nie istnieją w hurtowni. Nowe wymagania mają wpływ na model. Brak zmian w modelu, wymagane dostarczenie do data martów. Zarządzanie cyklem życia Łatwość zmiany modelu Audytowalność Dane historyczne muszą być zmigrowane w niektórych przypadkach. Dane historyczne są przechwytywane poprzez wstawianie nowych rekordów (dotyczy każdej zmiany). Refactoring niektórych tabel jest potrzebny w pewnych przypadkach. Wykorzystywanie koncepcji wymiarów wolnozmiennych (ang. SCD = Slowly Changing Dimension) w celu zapisania zmian historycznych. Jedyna zmiana to dodanie odpowiednich satelit. Dane historyczne mogą być przechwycone poprzez dodanie odpowiednich satelit. Natywna obsługa pełnej historyzacji. Wydajność zapytań Słaba wydajność ze względu na strukturę w 3PN. Model zaprojektowany w celu optymalizacji zapytań. Bardzo wysoka standaryzacja jest powodem słabej wydajności. Wymagane marty w celach analizy i raportowania.

Strona 6/6 Wykorzystanie modelu Dostosowanie do prezentacji Odpytywanie modelu Nie dostarcza warstwy końcowej użytkownika. Optymalna liczba złączeń dla wsparcia oszczędnego przechowywania (mniejsza redundancja). Schemat gwiazdy/ płatka śniegu idealny pod raportowanie. Mało złączeń, trudne do rozwiązania problemy z różnymi poziomami ziarnistości. Nie dostarcza warstwy prezentacyjnej dla użytkownika. Idealny do eksploracji, wymiary mogą być wygenerowane automatycznie. Potrzeba bardzo wielu złączeń. Autor: Piotr Ziuziański Senior Business Intelligence Specialist, JCommerce Certyfikowany specjalista technologii Business Intelligence firmy Microsoft. Tworzy rozwiązania dla klientów, począwszy od etapu modelowania hurtowni, projektowania i wdrażania procesów ETL, po implementację modelu i wdrożenie wizualnej warstwy raportowej. Autor bloga poświęconego tematyce rozwiązań klasy Business Intelligence. JCommerce SA ul. Tadeusza Kościuszki 227, 40-600 Katowice Strony internetowe: www.jcommerce.eu www.nearshore-it.eu Telefon: +48 32 201 15 32 E-mail: office@jcommerce.pl