Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Podobne dokumenty
Hurtownia danych praktyczne zastosowania

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Marcin Adamczak Jakub Gruszka MSP. Business Intelligence

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

Bazy danych. Plan wykładu. Rodzaje baz. Rodzaje baz. Hurtownie danych. Cechy hurtowni danych. Wykład 14: Hurtownie danych

Problematyka hurtowni danych

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Ewolucja technik modelowania hurtowni danych

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2018/2019

Systemy Business Intelligence w praktyce. Maciej Kiewra

COMARCH DATA WAREHOUSE MANAGER 6.2

Rola analityki danych w transformacji cyfrowej firmy

Opis spełnienia wymagań (PSBD)

Pierwsze wdrożenie SAP BW w firmie

Wstęp do Business Intelligence

Procesy ETL. 10maja2009. Paweł Szołtysek

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Analityka danych w środowisku Hadoop. Piotr Czarnas, 5 czerwca 2017

Co to jest Business Intelligence?

OLAP i hurtownie danych c.d.

Security Master Class

Integracja danych ubezpieczeniowych w czasie rzeczywistym. Łukasz Szewczyk Solution Architect

Prezentacja firmy WYDAJNOŚĆ EFEKTYWNOŚĆ SKUTECZNOŚĆ.

Hurtownie danych. Rola hurtowni danych w systemach typu Business Intelligence

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych - przegląd technologii

OdświeŜanie hurtownie danych - wykład IV. Zagadnienia do omówienia. Wprowadzenie

Wprowadzenie do Hurtowni Danych

Budowa modeli wymagań dla Regionalnych Systemów Informacji Medycznej opartych o hurtownie danych

Portale raportowe, a narzędzia raportowe typu self- service

IBM DATASTAGE COMPETENCE CENTER

Hurtownie danych. 31 stycznia 2017

BD2 BazyDanych2. dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego

Analityka danych w środowisku Hadoop. Piotr Czarnas, 27 czerwca 2017

Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence

Spojrzenie na systemy Business Intelligence

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Business Intelligence

Analityka danych & big data

Innovation Planet System Inteligentne zarządzanie miastami. Pomiar, prognozowanie i komunikowanie pyłu PM10 i hałasu

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych. Ładowanie, integracja i aktualizacja danych. INTEGRACJA DANYCH ETL

IMPLEMENTATION OF WDROŻENIE COMARCHW MINISTERSTWIE FINANSÓW SINDBAD RAPORTY ANALIZY BADANIA PROGNOZY CASE STUDY 1

Proces ETL. Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska {kris,

Baza danych to zbiór wzajemnie powiązanych ze sobą i zintegrowanych danych z pewnej dziedziny.

VII Kongres BOUG 03 października 2012

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

Rozumie istotę i znacznie procesów ekstrakcji, transformacji i ładowania danych (ETL), zna wybrany język ETL oraz odpowiednie narzędzia.

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Modernizacja systemu gromadzenia i przetwarzania informacji hydrogeologicznych

Część I Istota analizy biznesowej a Analysis Services

Nowe narzędzia do gromadzenia i udostępniania danych o jakości powietrza wytwarzanych w ramach Państwowego Monitoringu Środowiska

Architektury i technologie integracji danych

CELE I ZAKRES DZIAŁALNOŚCI

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

System INTEGRYB jako zintegrowane repozytorium danych umożliwiające zaawansowaną analitykę badawczą

Asseco CMR Comprehensive Mandatory Reporting. asseco.pl

Hurtownie danych a transakcyjne bazy danych

Usługa archiwizacji danych w systemie Eureca. Marek Jelenik CONTROLLING SYSTEMS sp. z o.o.


Automatyzacja Procesów Biznesowych. Systemy Informacyjne Przedsiębiorstw

ZARZĄDZENIE NR 986/2012 PREZYDENTA MIASTA KRAKOWA Z DNIA

Skoordynowanie i integracja dotychczasowych systemów wykorzystywanych przez placówki ochrony zdrowia z nowo tworzonymi systemami informatycznymi

Jarosław Żeliński analityk biznesowy, projektant systemów

ARCHITEKTURA MAZOWIECKIEGO SYSTEMU INFORMACJI PRZESTRZENNEJ

Business Intelligence jako narzędzie do walki z praniem brudnych pieniędzy

Integracja systemów transakcyjnych

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach.

Opis wymagań i program szkoleń dla użytkowników i administratorów

EasyLoad BI zarządzanie wczytywaniem danych do hurtowni przez użytkowników biznesowych. Prezentacja rozwiązania

Platforma informacyjna dla samorządów System Raportowania Zarządczego. Małgorzata Szlachetka

Maciej Kiewra Quality Business Intelligence Consulting

BUSINESS INTELLIGENCE for PROGRESS BI4PROGRESS

Comarch BI Point Standalone ulotka. Wersja: 6.2

Multi-wyszukiwarki. Mediacyjne Systemy Zapytań wprowadzenie. Architektury i technologie integracji danych Systemy Mediacyjne

Wprowadzenie do Hurtowni Danych

Hurtownie danych - przegląd technologii

Szkolenie autoryzowane. MS Wdrażanie hurtowni danych w Microsoft SQL Server 2012

BPM vs. Content Management. Jarosław Żeliński analityk biznesowy, projektant systemów

Korzyści z integracji danych klienta. Seminarium PIU Jakość danych w systemach informatycznych ZU Warszawa Przygotowała Ewa Galas

Asseco CMR Comprehensive Mandatory Reporting.

Trendy BI z perspektywy. marketingu internetowego

SYSTEMY WSPOMAGAJĄCE PODEJMOWANIE DECYZJI W PRZEDSIĘBIORSTWIE

ROLA CONTROLLERA I ROZWÓJ TECHNOLOGII

Zasady sprawnego i efektywnego sterowania przepływami materiałów i wyrobów

SI-Consulting Sp. z o. o.

SAS Access to Hadoop, SAS Data Loader for Hadoop Integracja środowisk SAS i Hadoop. Piotr Borowik

Paweł Gołębiewski. Softmaks.pl Sp. z o.o. ul. Kraszewskiego Bydgoszcz kontakt@softmaks.pl

The Binder Consulting

Struktura prezentacji

Transkrypt:

Wprowadzenie do Hurtowni Danych Mariusz Rafało mariusz.rafalo@hotmail.com

WPROWADZENIE DO HURTOWNI DANYCH

Co to jest hurtownia danych? Hurtownia danych jest zbiorem danych zorientowanych tematycznie, zintegrowanych, przeznaczonych tylko do odczytu, wersjonowanych czasem, zorganizowanych dla wspierania celów zarządczych. - William H. Inmon

y wspomagania decyzji wspomagania decyzji SWD (Decision Support DSS) -, którego zadaniem jest dostarczenie użytkownikowi informacji umożliwiających przeanalizowanie sytuacji i podjęcie decyzji.

Business Intelligence (BI) Business Intelligence includes concepts and methodologies for improvement of business decisions using facts and information from supporting systems H.Dresner, 1989

y wspomagania decyzji Management Information s Decission Support s Executive Information s Business Intelligence Data Warehouse Big Data 1968 - Morton and McCosh 1979 - Rockart 1989 - Dresner 1992- Inmon 2010

Business Intelligence a Hurtownia Danych Business Intelligence czerpie wiedzę z systemów funkcjonujących w przedsiębiorstwie, następnie wykorzystuje tą wiedzę do wspomagania decyzji Hurtowania danych jest miejscem przechowującym dane z systemów funkcjonujących w przedsiębiorstwie Business Intelligence nie musi korzystać z Hurtowni Danych Hurtownia Danych jest zawsze elementem Business Intelligence

Specyfika danych w hurtowni danych(1) Dane muszą być zorientowane tematycznie dane są zorganizowane według tematów mających kluczowe znaczenie dla organizacji, a nie według funkcjonalności, czy też podziału organizacyjnego wynika to z faktu, że analiza funkcjonowania organizacji i jej otoczenia wymaga globalnego spojrzenia na dane Dane muszą być zintegrowane dane gromadzone w hurtowni danych integrują informacje o poszczególnych tematach pochodzące z wielu źródeł, tak aby dawać w miarę pełny opis sytuacji Dane muszą być nieulotne dane przechowywane w hurtowni są przeznaczone tylko do odczytu nie usuwamy danych historycznych

Specyfika danych w hurtowni danych(2) Dane muszą być wersjonowane wg czasu powstania zawartość hurtowni danych stanowią nie tylko dane obrazujące obecną sytuację, ale również - lub przede wszystkim - dane historyczne gromadzenia danych historycznych umożliwia badanie nie tylko sytuacji obecnej, ale również trendów, zmian otoczenia, pozwala odpowiedzieć na pytanie dlaczego? oraz dokonywać prognoz Dane muszą być zorganizowane pod kątem działalności zarządczej, analitycznej działalność zarządcza i analityczna polega między innymi na analizowaniu sytuacji, trendów, zmian, wzorców oraz prognozowaniu

ARCHITEKTURA HURTOWNI DANYCH

Architektura HD Warstwa Eksploatacji Narzędzia Raportowo Analityczne Portal BI Administracyjna Warstwa Danych Repozytorium Dane Detaliczne Zarządzanie Metadanymi Ładowanie a ODS Zasilania Data Staging Area Transformacja Zarządzanie Hurtownią Ekstrakcja Pliki danych y Źródłowe

y źródłowe Warstwa Eksploatacji Narzędzia Raportowo Analityczne Portal BI Administracyjna Warstwa Danych Repozytorium Dane Detaliczne Zarządzanie Metadanymi Ładowanie a ODS Zasilania Data Staging Area Transformacja Zarządzanie Hurtownią Ekstrakcja Pliki danych y Źródłowe

Charakterystyka danych operacyjnych (źródłowych) Ściśle określone zapytania dotyczące danych na detalicznym poziomie Często brak danych historycznych Brak organizacji tematycznej Brak integracji pojęć pomiędzy systemami Sztuczne klucze Typowo dane są silnie znormalizowane

Ekstrakcja Warstwa Eksploatacji Narzędzia Raportowo Analityczne Portal BI Administracyjna Warstwa Danych Repozytorium Dane Detaliczne Zarządzanie Metadanymi Ładowanie a ODS Zasilania Data Staging Area Transformacja Zarządzanie Hurtownią Ekstrakcja Pliki danych y Źródłowe

Ekstrakcja danych Pobieranie danych z systemów źródłowych dane trafiają do obszaru danych tymczasowych (ang. Data Staging Area) Różne modele pull odpytywanie systemów źródłowych push systemy źródłowe same wysyłają dane Ekstrakcja Pełna Przyrostowa Metody określania przyrostu danych Timestamp Sekwencja Replikacja Log Migawka Dedykowane rozwiązania Change Data Capture(CDC)

Obszar danych tymczasowych Warstwa Eksploatacji Narzędzia Raportowo Analityczne Portal BI Administracyjna Warstwa Danych Repozytorium Dane Detaliczne Zarządzanie Metadanymi Ładowanie a ODS Zasilania Data Staging Area Transformacja Zarządzanie Hurtownią Ekstrakcja Pliki danych y Źródłowe

Obszar Danych Tymczasowych (Data Staging Area) Gromadzi dane przetwarzane w procesie zasilania Dane pobrane z systemów źródłowych (przyrost) Dane pomocnicze wykorzystywane w zasilaniu Słowniki Tabele look-up Parametry W tym obszarze działają procesy Transformacji Czyszczenia Poprawy jakości

Transformacja Warstwa Eksploatacji Narzędzia Raportowo Analityczne Portal BI Administracyjna Warstwa Danych Repozytorium Dane Detaliczne Zarządzanie Metadanymi Ładowanie a ODS Zasilania Data Staging Area Transformacja Zarządzanie Hurtownią Ekstrakcja Pliki danych y Źródłowe

Transformacja danych Przekształcanie danych do postaci pożądanej w Hurtowni Danych Czyszczenie (braki, błędy, uzupełnianie) Usuwanie duplikatów Łączenie Integracja Kalkulacje Agregacje Standaryzacja

Ładowanie Warstwa Eksploatacji Narzędzia Raportowo Analityczne Portal BI Administracyjna Warstwa Danych Repozytorium Dane Detaliczne Zarządzanie Metadanymi Ładowanie a ODS Zasilania Data Staging Area Transformacja Zarządzanie Hurtownią Ekstrakcja Pliki danych y Źródłowe

Ładowanie danych Ładowanie gotowych danych do baz danych Hurtowni Danych Wykorzystanie specjalnych trybów ładowania danych Bulk Ładowanie do różnych partycji Ładowanie on-line / off-line Ładowanie równoległe Ekstrakcja, transformacja i ładowanie danych są elementami procesu ETL(Extract, Transform, Load)

Warstwa danych Warstwa Eksploatacji Narzędzia Raportowo Analityczne Portal BI Administracyjna Warstwa Danych Repozytorium Dane Detaliczne Zarządzanie Metadanymi Ładowanie a ODS Zasilania Data Staging Area Transformacja Zarządzanie Hurtownią Ekstrakcja Pliki danych y Źródłowe

Warstwa Danych Gromadzi dane Hurtowni Danych Czasem nazywana warstwą prezentacji lub dostępu, gdyż udostępnia dane klientom Zazwyczaj występują dwie warstwy danych Dane detaliczne zintegrowane i zorganizowane tematycznie na detalicznym poziomie gromadzone w modelach znormalizowanych nacisk na elastyczność modelu Dane analityczne (zagregowane) zbudowane poprzez przekształcenie danych detalicznych często zagregowane występuje redundancja danych dostosowane dla konkretnych analiz Analityczne Analityczne Dane Detaliczne Analityczne Operacyjne Operacyjne Operacyjne

Operacyjny magazyn danych - Operational Data Store Warstwa Eksploatacji Narzędzia Raportowo Analityczne Portal BI Administracyjna Warstwa Danych Repozytorium Dane Detaliczne Zarządzanie Metadanymi Ładowanie a ODS Zasilania Data Staging Area Transformacja Zarządzanie Hurtownią Ekstrakcja Pliki danych y Źródłowe

Warstwa eksploatacyjna Warstwa Eksploatacji Narzędzia Raportowo Analityczne Portal BI Administracyjna Warstwa Danych Repozytorium Dane Detaliczne Zarządzanie Metadanymi Ładowanie a ODS Zasilania Data Staging Area Transformacja Zarządzanie Hurtownią Ekstrakcja Pliki danych y Źródłowe

Warstwa eksploatacyjna Udostępnia narzędzia i usługi dostępu do danych gromadzonych w Hurtowni Danych Narzędzia raportowo-analityczne Portale BI Narzędzia dla administratora danych Narzędzia dostępu do danych z poziomu innych systemów

Raportowanie i wizualizacja (XIXw) http://en.wikipedia.org/wiki/charles_joseph_minard

Raportowanie i wizualizacja (XXIw) https://www.youtube.com/watch?v=uqj1x2hak70

Metadane Warstwa Eksploatacji Narzędzia Raportowo Analityczne Portal BI Administracyjna Warstwa Danych Repozytorium Dane Detaliczne Zarządzanie Metadanymi Ładowanie a ODS Zasilania Data Staging Area Transformacja Zarządzanie Hurtownią Ekstrakcja Pliki danych y Źródłowe

Metadane Hurtowni Danych Metadane, to dane o danych Opisują gromadzone dane oraz procesy realizowane i wspierane przez Hurtownię Danych Metadane są używane: Podczas eksploatacji Hurtowni Danych Podczas utrzymania i rozwoju Aplikacja Aplikacja Metadane dzielimy na: Biznesowe Techniczne Procesowe Repozytorium Zarządzanie Metadanymi Zasilanie BD Aplikacja Analityczna

Metadane Biznesowe Definicyjne Opis zawartość Hurtowni z punktu widzenia użytkownika Informacje o tym jak używać danych, jaki jest ich kontekst Kto jest właścicielem danych Nawigacyjne Opis gdzie szukać danych Jakie są związki pomiędzy danymi Jakość Opis jakości danych Pochodzenie Opis skąd pochodzą dane, jakim podlegają przemianom

Metadane Techniczne Źródła danych Modele danych w Hurtowni Metody i procesy zasilania, transformacji i czyszczenia Opis przetwarzania danych Mapowanie danych źródłowych bezpieczeństwa Audyt wykorzystania(data Lineage)

Metadane Procesowe Historia przetwarzania danych Kto, co, kiedy, dlaczego? Wynik i efekt przetwarzania Logi przetwarzania Błędy Statystyki Dane dotyczące wskaźników wydajności i wykorzystania infrastruktury Historia zmian modeli danych Hurtowni Danych Historia zmian uprawnień i użycia Hurtowni Danych Obciążenie przez systemy zewnętrzne i użytkowników

Dziękuję za uwagę