BI: przegląd, ETL, raportowanie i analizy



Podobne dokumenty
Hurtownie danych i przetwarzanie analityczne - projekt

Portale raportowe, a narzędzia raportowe typu self- service

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Bartłomiej Graczyk MCT,MCITP,MCTS

Analityka danych w środowisku Hadoop. Piotr Czarnas, 5 czerwca 2017

Co to jest Business Intelligence?

Platforma Cognos. Agata Tyma CMMS Department Marketing & Sales Specialist atyma@aiut.com.pl AIUT Sp. z o. o.

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:

VI Kongres BOUG Praktyczne aspekty wykorzystania Business Intelligence w przemyśle wydobywczym węgla kamiennego

Business Intelligence Odkryj szerszą perspektywę dla swojego biznesu

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Analityka danych & big data

VII Kongres BOUG 03 października 2012

Analityka danych w środowisku Hadoop. Piotr Czarnas, 27 czerwca 2017

W książce omówiono: SAP zostań ekspertem w 24 godziny!

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Integracja danych ubezpieczeniowych w czasie rzeczywistym. Łukasz Szewczyk Solution Architect

SAP w 24 godziny / Michael Missbach, George Anderson. Gliwice, cop Spis treści

COMARCH DATA WAREHOUSE MANAGER 6.2

Rola analityki danych w transformacji cyfrowej firmy

Praktyczne wykorzystanie elementów raportowania Microsoft Project 2010 /Project Server 2010 Sesja 4 Performance Point Services Bartłomiej Graczyk

Praktyczne wykorzystanie elementów raportowania Microsoft Project 2010 /Project Server 2010 Sesja 5 PowerPivot & PowerView Bartłomiej Graczyk

REKOMENDACJE DOTYCZĄCE PLATFORMY ZARZĄDZANIA KOMPETENCJAMI

WIZUALNA EKSPLORACJA DANYCH I RAPORTOWANIE W SAS VISUAL ANALYTICS ORAZ WSTĘP DO SAS VISUAL STATISTICS

Paweł Gołębiewski. Softmaks.pl Sp. z o.o. ul. Kraszewskiego Bydgoszcz kontakt@softmaks.pl

Samodzielny Business Intelligence in memory duże i małe. Paweł Gajda Business Solution Architect

Online Sales Support. - nowoczesne platforma do raportowania i komunikacji

Nowoczesne i praktyczne metody wdrażania optymalnie działających procesów i zarządzania dokumentami elektronicznymi w narzędziach BPMS/DMS

Usługi analityczne budowa kostki analitycznej Część pierwsza.

STRATEG podstawowe informacje

1 Wprowadzenie do koncepcji Microsoft Office BI 1 Zakres ksiąŝki 2 Cel ksiąŝki 3 Wprowadzenie do tematu 3 Zawartość rozdziałów 4

HP Service Anywhere Uproszczenie zarządzania usługami IT

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownia danych praktyczne zastosowania

Część I Rozpoczęcie pracy z usługami Reporting Services

Procesy ETL - wykład V. Struktura. Wprowadzenie. 1. Wprowadzenie. 2. Ekstrakcja 3. Transformacja 4. Ładowanie 5. Studium przypadków.

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Pierwsze wdrożenie SAP BW w firmie

Praktyczne aspekty pozyskiwania wiedzy z danych z perspektywy matematyka w bankowości (VI zajęcia) Jakub Jurdziak

Maciej Kiewra Quality Business Intelligence Consulting

Stawiamy na specjalizację. by CSB-System AG, Geilenkirchen Version 1.1

Mateusz Kurleto NEOTERIC. Analiza projektu B2B Kielce, 18 października 2012

Gemini Cloud Project Case Study

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Część I Istota analizy biznesowej a Analysis Services

Hurtownie danych - przegląd technologii

Hurtownie danych - przegląd technologii

TOPWEB Microsoft Excel 2013 i PowerBI Przygotowanie danych, analiza i efektowna prezentacja wyników raportów

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych

PERFORMANCE POINT SERVICE NIE TYLKO DLA ORŁÓW

Trendy BI z perspektywy. marketingu internetowego

PREZENTACJA FUNKCJONALNA SYSTEMU PROPHIX

Misja. Strategia. Cele UNIT4 TETA BI CENTER. Plan prezentacji. Grupa UNIT4 TETA. Grupa kapitałowa UNIT4 UNIT4 TETA BI CENTER

CASE STUDIES TEST FACTORY

HARMONOGRAM: DZIEŃ GODZINA MIEJSCE PROWADZĄCY TEMAT OPIS

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

Adam Dolega Architekt Rozwiązań Biznesowych Microsoft

Metodyka Sure Step. Agenda:

Spectrum Spatial. Dla systemów BI (Business Intelligence)

Oferta szkoleniowa Yosi.pl 2012/2013

Bezbolesna migracja SAP ERP do SAP ERP on HANA

Katedra Inżynierii Oprogramowania Tematy prac dyplomowych inżynierskich STUDIA NIESTACJONARNE (ZAOCZNE)

Bazy danych i ich aplikacje

Proces zarządzania zasobami na przykładzie sektora utilities. Tivoli Day, Warszawa,

CLOUD ADOPTION PROGRAM

III Edycja ITPro 16 maja 2011

Platforma informacyjna dla samorządów System Raportowania Zarządczego. Małgorzata Szlachetka

The Binder Consulting

Szkolenie autoryzowane. MS Zaawansowany użytkownik programu SharePoint 2016

System Center 2012 Katalog usług IT dla organizacji w oparciu o System Center Service Manager typowe wyzwania przy wdrożeniach

Deduplikacja danych. Zarządzanie jakością danych podstawowych

System INTEGRYB jako zintegrowane repozytorium danych umożliwiające zaawansowaną analitykę badawczą

Automatyzacja procesów biznesowych Andrzej Sobecki. ESB Enterprise service bus

Zarządzanie i realizacja projektów systemu Microsoft SharePoint 2010

MODUŁY WEBOWE I APLIKACJE MOBILNE COMARCH ERP EGERIA. Platforma szerokiej komunikacji

System Profesal. Zarządzanie przez fakty

Jak przeprowadzić transformację biznesu i nie stracić nerwów, czyli bezbolesna migracja SAP ERP do SAP ERP on HANA

Migracja Comarch ERP Altum Business Intelligence do wersji

Nowoczesne aplikacje mobilne i ich rola w podnoszeniu jakości danych

BUSINESS INTELLIGENCE DEVELOPMENT Tego Cię nauczymy:

VALIO Sp. z o.o. Załącznik nr 1 do Zapytania ofertowego dotyczącego zakupu licencji części systemu B2B oraz wykonania Warstwy Prezentacyjnej.

Przetwarzanie danych w chmurze

EasyLoad BI zarządzanie wczytywaniem danych do hurtowni przez użytkowników biznesowych. Prezentacja rozwiązania

Migracja Business Intelligence do wersji

Tematy projektów Edycja 2019

Jakich liderów i jakich technologii potrzebuje biznes w dobie cyfrowej transformacji?

Procesy ETL. 10maja2009. Paweł Szołtysek

ERDAS ADE Suite edytor baz danych Oracle Spatial

Monitoring procesów z wykorzystaniem systemu ADONIS

Założenia projektowe dla zapytania ofertowego EAK_ZA_01/2015

Ewolucja technik modelowania hurtowni danych


TOPWEB SPSall Budowanie portalu intranetowego

Digitize Your Business

IBM DATASTAGE COMPETENCE CENTER

e_talent innowacyjna aplikacja webowa do zarządzania rozwojem pracowników w organizacji Zespół ForUnit

Wzrost przychodów i optymalne koszty sprzedaży. Zarządzanie terytorium sprzedaży z iq GIS

dr inż. Maciej Kiewra Prezentacja wygłoszona na konferencji BI vs Big Data podczas Kongresu GigaCon Warszawa, r.

Transkrypt:

BI: przegląd, ETL, raportowanie i analizy 2013-04-12 Krzysztof Bokiej, Łukasz Limanowski, Mariusz Pyka Roche Wstęp 2013-04-12 Krzysztof Bokiej, Roche

Architektura typowego środowisko DW/BI Systemy Źródłowe Hurtownia Danych Warstwa prezentacji Extract Transform Load Trendy w DW / BI Self Service BI i warstwa semantyczna Urządzenia mobilne HTML5 i JavaScript In Memory Analysis (SAP Hana, Oracle Times ten, Qlick View, ) Big Data i Cloud Computing (Hadoop, Google Big Query) Exadata i bazy kolumnowe

Innowacja i nowe technologie Monitorowanie rynku i trzymanie ręki na pulsie Testowanie nowych narzędzi Proof of Concept Przydatność z punktu widzenia korporacji BI BACKEND: ETL czyli Extract Transform - Load w praktyce 2013-04-12 Łukasz Limanowski, Roche

GODW czyli Global Oracle Data Warehouse - hurtownia danych w Roche Hurtownia zawartość ( wybrane przykłady ) badania kliniczne ( historia, stan aktualny + prognozy ) planowanie projektow farmaceutycznych, projekty zwiazane z developmentem, badaniami klinicznymi itp., ( historia, stan aktualny ) finanse: zmienne koszta badań klinicznych ( historia, stan aktualny + prognozy ) CRM m.in. aktywność przedstawicieli handlowych dane o lekach (użycie, percepcja itp. ) i inne DECYZJE

Hurtownia liczby (ETL) > 50 data martów > 90 folderów tematycznych > 5 TB danych > 32 000 dziennych sesji ETL na PROD 9 Proces zasilania: SRC - MART (1) 10

ETL dostępne narzędzia (1) 1. Rozwiązania hardcore: skrypty / procedury SQL Zalety: dostępność, brak dodatkowych kosztów Wady: czasochłonna, prymitywna metoda, kody w postaci tekstowej, trudne w serwisowaniu, analizie, bardzo utrudniony dostęp do funkcji dodatkowych (parsowanie XML, FTP, Java, bash itp.), bardzo trudne monitorowanie, współdzielenie kodu itp. Uwagi: raz zaimplementowane i wygrzane rozwiązanie cechuje się wyjątkową żywotnością i często wielokrotnie przekracza planowany czas migracji na nowo zakupione i bardzo drogie narzędzie ETL. Sama migracja dostarcza wielu zmartwień osobom, które się jej podjęły. 11 ETL dostępne narzędzia (2) 2. Profesjonalne narzędzia ETL, m.in.: Informatica PowerCenter, AbInitio, Oracle Warehouse Builder, MS Integration Services Wady: koszt Zalety: szybkość implementacji, kod obrazkowy łatwy w serwisowaniu i analizie, mnogość dodatkowych funkcji, predefiniowane połączenia do różnych źródeł, np.: Facebook, Twitter, LinkedIn, SAP, DB2, pliki binarne itd. Gotowe rozwiązania dla wersjonowania, monitorowania, migracji pomiędzy środowiskami, współdzielenia kodu. 12

ETL dostępne narzędzia (2 - c.d.) Uwagi: u niektórych osób zaobserwowano nieodpartą pokusę implementacji rozwiązań hardcore w narzędziach ETL. Najczęściej takie przypadki są bezlitośnie zwalczane przez architektów. 13 ETL w Roche Informatica Power Center Obecnie niezwykle popularne narzędzie (w przeciwieństwie np. do AbInitio): 2000+ klientów (80% z listy Fortune 100), partnerstwo strategiczne z IBM, HP, Accenture, SAP stale rozwijane, często kosztem konkurencyjnych firm (przejęcia), szybko reagujące na najnowsze trendy np. Big Data 14

ETL w Roche role 2. DEWELOPER testy jednostkowe 1. ANALITYK określenie wymagań 3. TESTER testy systemowe 4. UŻYTKOWNIK akceptacja 5. PRODUKCJA raporty 15 ETL w Roche agile 16

Przykładowa implementacja ETL: SCD2 1. full outer join porównujący nowy wsad (CLEANSE) ze stanem z poprzedniego zasilania (CORE) 17 Przykładowa implementacja ETL: SCD2 2. Lookup y dodają dane referencyjne oraz numer aktualnej wersji - będzie nam potrzebny do ewentualnej aktualizacji danych w tabeli wersji. CHANGE_TRACKER w nim wyliczane są flagi: insert / update / delete na podstawie danych otrzymanych z full outer join. 18

Przykładowa implementacja ETL: SCD2 3. Router na podstawie flag wyliczonych w kroku 2 rozdziela strumień danych na 3 ścieżki: insert / update / delete. 19 Przykładowa implementacja ETL: SCD2 4. Ścieżka insert (rekord istnieje w CLEANSE, brak w CORE): rekord zostaje dodany do tabeli CURR (dane bieżące) oraz VERS (dane historyczne). Mplt_% dodaje do rekordu klucze hurtowniane (surrogate keys), które odtąd będą używane do złączeń z wykorzystaniem tych tabel. 20

Przykładowa implementacja ETL: SCD2 5. Ścieżka update (rekord istnieje w CLEANSE i CORE, porównanie rekordów CLS-CO wykazało różnicę dane zostały zaktualizowane w systemie źródłowym): Tabela CURR zostaje zaktualizowana. Tabela VERS: stara wersja zostaje zamknięta przez aktualizację pola VALID_TO(date), pozostałe wartości bez zmian. Zostaje otwarta nowa wersja (jak insert) z VALID_TO=9999-12-31 21 Przykładowa implementacja ETL: SCD2 6. Ścieżka delete (rekord istnieje w CORE, brak w CLEANSE, rekord został usunięty z systemu źródłowego): Aktualizacja flagi: deleted=y w tabeli CURR. Tabela VERS: stara wersja zostaje zamknięta przez aktualizację pola VALID_TO(date), pozostałe wartości bez zmian. Zostaje otwarta nowa wersja (jak insert) z VALID_TO=9999-12-31 oraz deleted=y 22

Raportowanie i analizy 2013-04-12 Mariusz Pyka, Roche Agenda Typowy model dystrybucji raportów i analiz Zdefiniowanie problemów Docelowy model dystrybucji raportów i analiz Rola warstwy semantycznej Komponenty platformy analitycznej (SAP Business Objects) Scenariusze wykorzystania (Prezentacja Live) Raportowanie i analizy - trendy

Model dystrybucji raportów i analiz Zdefiniowanie problemów Wykorzystanie wielu niespójnych narzędzi / formatów raportów Konieczność manualnej integracji / agregacji danych na raportach Brak zunifikowanego modelu dystrybucji raportów Uzależnienie wiedzy na temat procesów od wiedzy użytkownika Wykorzystanie metod podatnych na błędy Przywiązanie użytkowników do narzędzi " 42% 47% "90% arkuszy użytkowników menadżerów kalkulacyjnych używa błędnej systemów naszych informacji Klientów IT nie ma zawierało zaufania przynajmniej do błędy. otrzymywanych raz w informacji. tygodniu. PriceWaterhouseCoopers PriceWaterhouseCoopers

Model dystrybucji raportów i analiz ERP CRM Aplikacje dedykowane Pliki płaskie Systemy IT Integracja Hurtownia danych Raportowanie, wizualizacja i dystrybucja Koncepcja świata obiektów Użytkownicy biznesowi Świat obiektów Hurtownia danych

IT jednorazowo tłumaczy strukturę bazy na słowa Użytkownik przeciąga dane na raport Określia filtry raportu i jego właściwości Platforma SAP BusinessObjects - komponenty

Prezentacja Live Przedstawiciel Handlowy Odpowiedzialność Prowadzenie działań terenowych Szybki dostęp do bieżącej informacji na temat własnych działań/wyników Systemy ewidencyjne Sprzedaż CRM Metody dostępu Urządzenia mobilne E-mail Wersje offline Dyrektor Regionalny Odpowiedzialność Zarządzanie codziennym funkcjonowaniem działu handlowego Szybki dostęp do bieżącej skonsolidowanej informacji na temat działań/wyników działu Systemy ewidencyjne Sprzedaż Planowanie/budżetowanie CRM Metody dostępu Urządzenia mobilne Portal BI E-mail Kadra Zarządzająca Odpowiedzialność Ustalanie strategii przedsiębiorstwa Szybki dostęp do skonsolidowanej informacji na temat wyników przedsiębiorstwa Systemy ewidencyjne Finanse/Controlling Sprzedaż Planowanie/budżetowanie CRM Metody dostępu Urządzenia mobilne E-mail Raportowanie i analizy - trendy Urządzenia mobilne Wizualizacja na mapach Self-service BI Analizy predykcyjne Rozwiązania w chmurze

Projekt: Standaryzacja rozwiązania raportowego do wizualizacji na mapach Cel Stworzenie uniwersalnego rozwiązania raportowego pozwalającego na wizualizację danych biznesowych na interaktywnych mapach geograficznych Projekt: Standaryzacja rozwiązania raportowego do wizualizacji na mapach Zadania Zdefiniowanie konfiguracji POI w MDMS i/lub Saleforce.com Stworzenie analitycznego modelu danych Stworzenie modułu integracji (zasilenie modelu danych na podstawie konfiguracji) Integracja z wybranym procesem biznesowym Stworzenie modułu raportowego (świat obiektów, raporty i kokpity) Narzędzia/Technologie Oracle DB, Saleforce.com, MDMS SAP Business Objects (Designer, Web Intelligence, SAP Mobile, Dashboard Design)

Doing now what patients need next