Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Podobne dokumenty
Część I Istota analizy biznesowej a Analysis Services

Praktyczne aspekty pozyskiwania wiedzy z danych z perspektywy matematyka w bankowości (VI zajęcia) Jakub Jurdziak

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Prezentacja firmy WYDAJNOŚĆ EFEKTYWNOŚĆ SKUTECZNOŚĆ.

Portale raportowe, a narzędzia raportowe typu self- service

Integracja i Eksploracja Danych

Pierwsze wdrożenie SAP BW w firmie

VI Kongres BOUG Praktyczne aspekty wykorzystania Business Intelligence w przemyśle wydobywczym węgla kamiennego

WIZUALNA EKSPLORACJA DANYCH I RAPORTOWANIE W SAS VISUAL ANALYTICS ORAZ WSTĘP DO SAS VISUAL STATISTICS

BUSINESS INTELLIGENCE DEVELOPMENT Tego Cię nauczymy:

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

PREZENTACJA FUNKCJONALNA SYSTEMU PROPHIX

Hurtownie danych. 31 stycznia 2017

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

Analityka danych w środowisku Hadoop. Piotr Czarnas, 27 czerwca 2017

Analityka danych w środowisku Hadoop. Piotr Czarnas, 5 czerwca 2017

Spectrum Spatial. Dla systemów BI (Business Intelligence)

Hurtownia danych. Załącznik Nr 1 do SIWZ. Opis przedmiotu zamówienia. Lp. FUNKCJONALNOŚĆ/PARAMETRY WYMAGANE

Hurtownie danych - przegląd technologii

Business Intelligence

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Opis spełnienia wymagań (PSBD)

temat prelekcji.. Power w analizie danych prowadzący Dr inż. Jacek Markus

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Specjalizacja magisterska Bazy danych

Rola analityki danych w transformacji cyfrowej firmy

Praktyczne wykorzystanie elementów raportowania Microsoft Project 2010 /Project Server 2010 Sesja 5 PowerPivot & PowerView Bartłomiej Graczyk

TOPWEB Microsoft Excel 2013 i PowerBI Przygotowanie danych, analiza i efektowna prezentacja wyników raportów

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Co to jest Business Intelligence?

Hurtownia danych praktyczne zastosowania

1 Wprowadzenie do koncepcji Microsoft Office BI 1 Zakres ksiąŝki 2 Cel ksiąŝki 3 Wprowadzenie do tematu 3 Zawartość rozdziałów 4

business intelligence

Wstęp do Business Intelligence

Ramowy plan kursu. Lp. Moduły Wyk. Lab. Przekazywane treści

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2018/2019

HARMONOGRAM: DZIEŃ GODZINA MIEJSCE PROWADZĄCY TEMAT OPIS

Tabele przestawne jako narzędzie analizy biznesowej

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

Hurtownie danych i przetwarzanie analityczne - projekt

Kostki OLAP i język MDX

Kasy Fiskalne Lublin Analityk

Nowości w 3.1. Andrzej Solski. CONTROLLING SYSTEMS sp. z o.o.

VII Kongres BOUG 03 października 2012

System INTEGRYB jako zintegrowane repozytorium danych umożliwiające zaawansowaną analitykę badawczą

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017


Business Intelligence Odkryj szerszą perspektywę dla swojego biznesu

Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

Bartłomiej Graczyk MCT,MCITP,MCTS

Asseco CMR Comprehensive Mandatory Reporting.

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

CZĘŚĆ I ZASTOSOWANIE PROGRAMU EXCEL DO ANALIZ BUSINESS INTELLIGENCE

Wprowadzenie do Hurtowni Danych

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Hurtownie danych w praktyce

Ewolucja technik modelowania hurtowni danych

Microsoft Excel 2013: Budowanie modeli danych przy użyciu PowerPivot

Spis tre±ci. Przedmowa... Cz ± I

nr sprawy: BZP ML Wrocław, dn. 29 stycznia 2014 r. INFORMACJA DLA WYKONAWCÓW NR 6

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Platforma Cognos. Agata Tyma CMMS Department Marketing & Sales Specialist atyma@aiut.com.pl AIUT Sp. z o. o.

LITERATURA. C. J. Date; Wprowadzenie do systemów baz danych WNT Warszawa 2000 ( seria Klasyka Informatyki )

Asseco CMR Comprehensive Mandatory Reporting. asseco.pl

Systemy Business Intelligence w praktyce. Maciej Kiewra

Poznaj potencjał Excela w zakresie BI! Zbuduj doskonały kokpit menedżera!

Oracle11g: Wprowadzenie do SQL

Wprowadzenie do Hurtowni Danych

Funkcje systemu infokadra

Modele danych - wykład V

Oferta szkoleniowa Yosi.pl 2012/2013

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:

Warto pamiętać, że to, jak bardzo dane

OLAP i hurtownie danych c.d.

A posteriori wsparcie w podejmowaniu decyzji biznesowych.

Narzędzie do pozyskiwania, analizy i prezentowania informacji.

OPIS PRZEDMIOTU ZAMÓWIENIA

Wybór Discoverer 10g czy BI Beans

Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych

Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence

Maciej Kiewra Quality Business Intelligence Consulting

Samodzielny Business Intelligence in memory duże i małe. Paweł Gajda Business Solution Architect

Szkolenie autoryzowane. MS Wdrażanie hurtowni danych w Microsoft SQL Server 2012

TABELE PRZESTAWNE W CONTROLLINGU I ANALIZIE SPRZEDAŻY SZKOLENIE OTWARTE KRAKÓW 8 GODZIN DYDAKTYCZNYCH. Controlling Node Próchnicki Wojciech

Usługa archiwizacji danych w systemie Eureca. Marek Jelenik CONTROLLING SYSTEMS sp. z o.o.

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

Marcin Adamczak Jakub Gruszka MSP. Business Intelligence

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

KARTA SZKOLENIA 1/5. Po ukończeniu szkolenia uczestnik będzie potrafił:

Plan wykładu. Hurtownie danych. Problematyka integracji danych. Cechy systemów informatycznych

COMARCH DATA WAREHOUSE MANAGER 6.2

Stawiamy na specjalizację. by CSB-System AG, Geilenkirchen Version 1.1

LITERATURA. Wprowadzenie do systemów baz danych C.J.Date; WNT Warszawa 2000

1Executive summary Comarch ERP XLBI Wersja:

Transkrypt:

Wprowadzenie do Hurtowni Danych Mariusz Rafało mrafalo@sgh.waw.pl

WARSTWA PREZENTACJI HURTOWNI DANYCH

Wykorzystanie hurtowni danych - aspekty Analityczne zbiory danych (ADS) Zbiór danych tematycznych (Data Marts) Zbiór danych detalicznych (DETAIL) ODS Metadane Użytkownicy hurtowni danych Narzędzia dostępu Wykorzystanie danych Zbiór danych tymczasowych (STAGE) Hurtownia danych System 1 System 2 System n Systemy źródłowe

UŻYTKOWNICY HURTOWNI DANYCH

Użytkownicy hurtowni danych Analityk Analizy trendów, prawidłowości biznesowych, sprawozdawczość, itp. Użytkownik biznesowy Różne profile i typy wykonywanych analiz Data scientist Analizy statystyczne Administrator Analiza logów, monitorowanie jakości danych, monitorowanie ETL, itp. Projektant Rozwój hurtowni danych: nowe źródła danych, poprawa jakości danych, itp. Specjalizowane systemy informatyczne

Użytkownicy hurtowni danych analityk data scientist biznes Systemy specjalizowane administrator Analityczne zbiory danych (ADS) Zbiór danych tematycznych (Data Marts) Zbiór danych detalicznych (DETAIL) ODS Metadane projektant Zbiór danych tymczasowych (STAGE) Hurtownia danych

NARZĘDZIA DOSTĘPU DO HURTOWNI DANYCH

Dostęp do hurtowni danych SQL System data mining Analizy wizualne Raporty predefiniowane Kostki OLAP Specjalizowany interfejs Narzędzia Business Intelligence Narzędzia deweloperskie Analityczne zbiory danych (ADS) Zbiór danych tematycznych (Data Marts) Zbiór danych detalicznych (DETAIL) ODS Metadane Konsola metadanych Zbiór danych tymczasowych (STAGE) Hurtownia danych

BI Platforms Gartner 2017 9

Platformy BI- przegląd Microsoft Tableau Qlik SAP Lumira BO IBM Cognos Watson Nastawienie na samodzielną pracę z danymi Prostota i ergonomia pracy Dominują lekkie narzędzia (PowerBI, SAP Lumira, Qlikview, Tableau) Enterprise reporting platforms ustępują miejsca bardziej elastycznym rozwiązaniom Silna reprezentacja platform BI w chmurze 10

Raporty statyczne (predefiniowane) Zbudowane przez projektanta w oparciu o przyjęte założenia (wymagania) Zestawienia tabelaryczne Czyli proste wybranie danych z jednej lub więcej tabel Zestawienia w formie tabel przestawnych Czyli funkcjonalność analogiczna do MS Excel Umieszczenie wymiarów w osi X i Y, miar na przecięciu Wykresy 2D, 3D, kołowe, słupkowe, liniowe, powierzchniowe, mapy, itp. Warstwa biznesowa (świat obiektów)

Raporty: SAP Business Objects Komercyjna platforma raportowa Kokpity, raporty predefiniowane, analizy on-line, harmonogramowanie, alarmy Dostęp poprzez przeglądarkę internetową

Raporty: Pentaho Profesjonalna platforma raportowa open-source Pełna funkcjonalność kokpitów, raportów i analiz wielowymiarowych

Analizy wielowymiarowe (OLAP) Kostki wielowymiarowe zbudowane przez projektanta, w oparciu o określone wymagania: Miary Wymiary Hierarchie Dostępność miar w wymiarach Zasady agregowania danych Dostęp za pomocą przeglądarki WWW i/lub arkuszy MS Excel Możliwa prezentacja danych (faktów) w różnych ujęciach (wymiarach)

Analizy wizualne Umożliwiają połączenie ze źródłem danych Baza danych Kostki OLAP Świat obiektów Pozwalają na wizualną pracę z danymi w środowisku graficznym Budowa kilku raportów na jednym ekranie (dashboard) Łączenie ze sobą wykresów Parametryzacja Służą identyfikacji nieoczywistych zależności w danych

Raportowanie i wizualizacja (XIXw) http://en.wikipedia.org/wiki/charles_joseph_minard

Raportowanie i wizualizacja (XXIw) http://whatnext.pl/wykres-strumieniowy-przeplywu-swiatowej-energii/

Analizy wizualne: Tableau

Analizy statystyczne Specjalizowane narzędzia statystyczne, języki programowania oraz zintegrowane platformy data mining Pozwalają na pracę z danymi: Eksploracja danych Analiza danych za pomocą algorytmów statystycznych Projektowanie procesu przetwarzania danych Budowa modeli ekonometrycznych Operacjonalizacja modeli Zintegrowane z narzędziami BI i ETL

Metadane Zarządzanie procesami przetwarzania Zarządzanie jakością danych Monitorowanie czasu dostarczania danych Zarządzanie dostępem użytkowników po poszczególnych obszarów hurtowni danych

Aplikacje specjalistyczne Hurtownia może być źródłem danych dla innych systemów Może udostępniać dane w różnych trybach Dane on-line (np. z ODS) Dane zagregowane Dane detaliczne Interfejs wymiany danych może pracować w trybie push lub pull

Rozwój hurtowni danych Wykorzystanie specjalizowanych narzędzi deweloperskich Budowa/modyfikacja struktury bazy danych Rozbudowa/modyfikacja procesów ETL Projektowanie i zmiany w raportach predefiniowanych, kostkach Zarządzanie warstwą biznesową (światem obiektów)

Dostęp bezpośredni SQL/MDX Dostęp dla zaawansowanych analityków Elastyczny dostęp do wszystkich obiektów hurtowni danych Wymaga znajomości modelu danych Wymaga znajomości SQL/MDX Wymaga znajomości zagadnień wydajności zapytań SQL

JĘZYK MDX

Geneza języka MDX MDX (ang. Multidimensional Expressions) jest językiem pozwalającym na komunikowanie się z wielowymiarowymi strukturami danych Jest on językiem analogicznym do SQL, nie operuje jednak na strukturach relacyjnych a na kostkach OLAP (strukturach wielowymiarowych) Natywny MDX pozwala na dostęp do dowolnej kostki wielowymiarowej, niezależnie od dostawcy bazy danych (np. Oracle, Microsoft, Pentaho, Essbase) Poszczególni dostawcy platform wielowymiarowych rozbudowują język MDX o dodatkowe możliwości

Budowa zapytania (WITH SELECT FROM WHERE ) Zapytanie MDX składa się z następujących elementów: WITH określa kalkulacje(klauzula nieobowiązkowa) SELECT pobranie wskazanych elementów FROM określenie źródła danych (kostka lub perspektywa) WHERE zawężenie prezentowanych wyników Zapytanie to odpowiada analogicznemu zapytaniu w języku SQL Wynikiem zapytania MDX jest pewien zawężony zakres kostki (subcube) Tabela przestawna (pivot table) pozwala w graficzny sposób prezentować zapytanie MDX

Zapytania: klauzula WITH Nie jest to obowiązkowy składnik zapytania Pozwala na zdefiniowanie wyliczanych wartości jeszcze przed wykonaniem zapytania Np. zapytanie: Pozwala na zdefiniowanie miary Średnia wartość, wraz ze sposobem jej wyliczania oraz formatem prezentacji Zapytanie zwraca następujący wynik:

Zapytania: klauzula SELECT Wynik zwracany jest dla n-osi: dla dwóch wymiarów są to wiersze i kolumny: W klauzuli SELECT deklaruje się przecięcia wymiarów (funkcja CROSSJOIN): Domyślnie zwracane są WSZYSTKIE przecięcia. Aby ograniczyć zbiór do niepustych przecięć należy skorzystać ze składni SELECT NON EMPTY Wynik bez SELECT NON EMPTY Wynik z wykorzystaniem SELECT NON EMPTY

Zapytania: klauzula WHERE Klauzula służy do zawężania wyników zapytania, Zmniejszenie zakresu pobieranych danych wpływa na wydajność zapytania, Zawężenie dotyczyć może: Wskazanego elementu wymiaru: Wskazanego zakresu danych:

Dziękuję za uwagę