Analityka danych w środowisku Hadoop. Piotr Czarnas, 5 czerwca 2017

Podobne dokumenty
Analityka danych w środowisku Hadoop. Piotr Czarnas, 27 czerwca 2017

Rola analityki danych w transformacji cyfrowej firmy

Co to jest Business Intelligence?

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Hurtownia danych praktyczne zastosowania

Paweł Gołębiewski. Softmaks.pl Sp. z o.o. ul. Kraszewskiego Bydgoszcz kontakt@softmaks.pl


DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:

Analityka danych & big data

System INTEGRYB jako zintegrowane repozytorium danych umożliwiające zaawansowaną analitykę badawczą

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

VI Kongres BOUG Praktyczne aspekty wykorzystania Business Intelligence w przemyśle wydobywczym węgla kamiennego

dr inż. Maciej Kiewra Prezentacja wygłoszona na konferencji BI vs Big Data podczas Kongresu GigaCon Warszawa, r.

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

IBM DATASTAGE COMPETENCE CENTER

Praktyczne aspekty pozyskiwania wiedzy z danych z perspektywy matematyka w bankowości (VI zajęcia) Jakub Jurdziak

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

TECHNOLOGIE BIG DATA A BEZPIECZEŃSTWO INFORMATYCZNE WE KNOW YOU KNOW. silmine.com

Triki i dobre praktyki

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Wprowadzenie do Hurtowni Danych

Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych

Konferencja. Business Intelligence Trends 24 czerwca 2014 r.

Trendy BI z perspektywy. marketingu internetowego

One Size Doesn t Fit All, czyli case study stworzenia BI dostosowanego do strategicznych, operacyjnych oraz analitycznych potrzeb

Pierwsze wdrożenie SAP BW w firmie

Usługi analityczne budowa kostki analitycznej Część pierwsza.

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2018/2019

Prezentacja firmy WYDAJNOŚĆ EFEKTYWNOŚĆ SKUTECZNOŚĆ.

Field Service Management Najczęściej spotykane problemy

Systemy Business Intelligence w praktyce. Maciej Kiewra

ROLA CONTROLLERA I ROZWÓJ TECHNOLOGII

Hurtownie danych w praktyce

Odkryj w danych to, co najważniejsze

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Hadoop i Spark. Mariusz Rafało

Ewolucja technik modelowania hurtowni danych

Spojrzenie na systemy Business Intelligence

Analityka internetowa w Polsce A.D Trendy i prognozy na najbliższe miesiące wybrane przez ekspertów Bluerank

Automatyzacja Procesów Biznesowych. Systemy Informacyjne Przedsiębiorstw

Big Data w strategii przedsiębiorstwa. Warszawa,

Architecture Best Practices for Big Data Deployments

Platforma Cognos. Agata Tyma CMMS Department Marketing & Sales Specialist atyma@aiut.com.pl AIUT Sp. z o. o.

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

Marcin Adamczak Jakub Gruszka MSP. Business Intelligence

Portale raportowe, a narzędzia raportowe typu self- service

SAS Access to Hadoop, SAS Data Loader for Hadoop Integracja środowisk SAS i Hadoop. Piotr Borowik

Jak skutecznie budować i wdrażać zabezpieczenia do walki z wyłudzeniami?

Praktyczne wdrożenie RODO w systemie informatycznym uczelni na przykładzie one4all RODO dla systemów Microsoft Dynamics 365 / AX

Szkolenie: Jak mieć więcej czasu na wyciąganie wniosków

Big Data & Analytics

Samodzielny Business Intelligence in memory duże i małe. Paweł Gajda Business Solution Architect

Część I Istota analizy biznesowej a Analysis Services

PREZENTACJA FUNKCJONALNA SYSTEMU PROPHIX

Zastosowania narzędzi analitycznych w komunikacji społecznej

KONCEPCJA 1. BI w Polpharmie Case Study. Julian Głowniak Szef Systemów Wsparcia Biznesu Grupy Polpharma

Base all your decisions on Data, not Instinct.

PureSystems zautomatyzowane środowisko aplikacyjne. Emilia Smółko Software IT Architect

Dane Klienta: Draszba S.A. Al. Gen. Józefa Hallera 233a Gdańsk

możliwości analizy i optymalizacji działalności kancelarii weryfikacja wydajności pracowników i rentowności spraw

Spis treści. Wstęp... 9

Usługa archiwizacji danych w systemie Eureca. Marek Jelenik CONTROLLING SYSTEMS sp. z o.o.

X ZJAZD UŻYTKOWNIKÓW SYSTEMU EURECA

BI: przegląd, ETL, raportowanie i analizy

Modernizacja systemów zarządzania i obsługi klienta w Kasie Rolniczego Ubezpieczenia Społecznego

Open Source biznes i bezpieczeństwo w oprogramowaniu. Comp S.A. Open Source Day 2016

Microsoft SQL Server Analiza wdrożenia w LPP S.A.

Przetwarzanie danych z wykorzystaniem technologii NoSQL na przykładzie serwisu Serp24

Business Intelligence Odkryj szerszą perspektywę dla swojego biznesu

E-logistyka Redakcja naukowa Waldemar Wieczerzycki

SAP w 24 godziny / Michael Missbach, George Anderson. Gliwice, cop Spis treści

Migracja XL Business Intelligence do wersji

Spectrum Spatial. Dla systemów BI (Business Intelligence)

VII Kongres BOUG 03 października 2012

Comarch BI Point Standalone ulotka. Wersja: 6.2

Obywatel 360 Narzędzia do zarządzania danymi

Aurea BPM. Lepsze procesy, lepsze wyniki Warszawa, 24 lipca 2013

Online Sales Support. - nowoczesne platforma do raportowania i komunikacji

Opis wymagań i program szkoleń dla użytkowników i administratorów

CZĘŚĆ I ZASTOSOWANIE PROGRAMU EXCEL DO ANALIZ BUSINESS INTELLIGENCE

Zastosowania aplikacji B2B dostępnych na rynku zalety aplikacji online

Spis treści. Wstęp... 11

CZY TWOJE ŚRODOWISKO PLIKOWE RÓWNIEŻ ROŚNIE SZYBCIEJ NIŻ BAZODANOWE?

Analityka i BigData w służbie cyberbezpieczeństa

LIDERZY DATA SCIENCE CENTRUM TECHNOLOGII ICM CENTRUM TECHNOLOGII ICM ICM UW TO NAJNOWOCZEŚNIEJSZY OŚRODEK DATA SCIENCE W EUROPIE ŚRODKOWEJ.

Nowoczesne aplikacje mobilne i ich rola w podnoszeniu jakości danych

Integracja danych ubezpieczeniowych w czasie rzeczywistym. Łukasz Szewczyk Solution Architect

Dni: 2. Partner merytoryczny. Opis: Adresaci szkolenia

COMARCH DATA WAREHOUSE MANAGER 6.2

Rozszerzona analiza i obraz rynku. Wizualizacja przestrzenna z iq GIS

Adam Dolega Architekt Rozwiązań Biznesowych Microsoft

System Profesal. Zarządzanie przez fakty

Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family

WIZUALNA EKSPLORACJA DANYCH I RAPORTOWANIE W SAS VISUAL ANALYTICS ORAZ WSTĘP DO SAS VISUAL STATISTICS

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

NALITYKA IZNESOWA WYDZIAŁ ORGANIZACJI I ZARZĄDZANIA POLITECHNIKA ŚLĄSKA NOWY KIERUNEK STUDIÓW.

Transkrypt:

Analityka danych w środowisku Hadoop Piotr Czarnas, 5 czerwca 2017

Pytania stawiane przez biznes 1 Jaka jest aktualnie sytuacja w firmie? 2 Na czym jeszcze możemy zarobić? Które procesy możemy usprawnić? 3 Failure rate 6-9m 4 Gdzie ponosimy straty?

Wyzwania przy wdrożeniu procesów analityki danych Biznes oczekuje odpowiedzi na wczoraj Dużo źródeł danych Długi czas przygotowania danych Koszty narzędzi i środowiska Ochrona danych osobowych (RODO)

Wyzwania przy wdrożeniu procesów analityki danych Biznes oczekuje odpowiedzi na wczoraj Nie wszystkie dane potrzebne do raportu są dostępne Dane dostępne w hurtowni najwcześniej po kilku dniach Raport wykonuje się długo na obecnej infrastrukturze Biznes oczekuje danych w czasie rzeczywistym

Wyzwania przy wdrożeniu procesów analityki danych Dużo źródeł danych Analityk musi znaleźć potrzebne dane Tabele w hurtowni danych nie są opisane Nowe źródła danych (Google Analytics, plik z danymi rynkowymi, etc.) wymagają załadowania

Wyzwania przy wdrożeniu procesów analityki danych Długi czas przygotowania danych Analityk biznesowy jest uzależniony od IT Dane trzeba załadować Ładowanie danych do Hadoop-a nie jest proste:

Wyzwania przy wdrożeniu procesów analityki danych Koszty narzędzi i środowiska Tradycyjne bazy danych są kosztowne Narzędzia wizualizacyjne (jak QlikView) tylko dla wybranych Brak powszechnego dostępu do raportów dla wszystkich użytkowników $$$

Wyzwania przy wdrożeniu procesów analityki danych Ochrona danych osobowych Regulacja RODO / GDPR wchodzi w życie 25 maja 2018 Ewidencja źródeł z danymi personalnymi Zapewnienie kontroli dostępu i audyt dostępu

Obraz klienta 360 Obszary raportowania ad-hoc Profilowanie klientów na podstawie dodatkowych źródeł informacji (Google Analytics, Facebook, etc.) Łączenie danych CRM, ERP i rynkowych Logistyka Monitorowanie łańcucha dostaw i dystrybucji Analiza danych od partnerów handlowych

Proces przygotowania danych do raportu Zamówienie raportu Biznes prosi o przygotowanie raportu Znalezienie danych Analityk szuka i analizuje źródła danych Przygotowanie danych Analityk prosi IT o załadowanie danych do hurtowni Budowa raportu Analityk buduje model danych oraz wizualizację

Dostęp do danych dowolnym narzędziem Brak wpływu na obecne środowisko Wirtualna baza danych wspomagana przez Apache Spark Łatwe uruchamianie środowiska analitycznego Big Data Dostęp do wszystkich źródeł danych Progresywne wdrażanie analityki Big Data w firmie

Zwinny process analityki danych Zamówienie raportu Biznes może sam pobrać dane do Excela Znalezienie danych Analityk łatwo znajduje dostępne dane Przygotowanie danych Analityk sam może podłączyć lub przeładować dane Budowa raportu Model danych raportu zostaje opublikowany na przyszość

Apache Spark w analityce Najpopularniejszy silnik Big Data Open source Skalowalny Pełne wsparcie SQL Nastawiony na przetwarzanie ad-hoc Działa w każdym środowisku

Spark vs Hadoop Spark Wykonywanie zapytań SQL Analityka w czasie rzeczywistym Równoległa obsługa wielu użytkowników Hadoop Zarządzanie klastrem Bezpieczeństwo komunikacji Definicja metadanych Przechowywanie danych (HDFS)

Tradycyjne ładowanie danych do Hadoop-a (push) 1 Przygotowanie plików Napisanie skryptów ładujących 2 3 Podpięcie skryptów ładujących pod harmonogramy

Samoobsługowe odwrócone ładowanie danych (pull) 1 Podpięcie źródeł danych Wskazanie danych do załadowania Spark sam pobierze dane ze źródła 2 3 Wskazanie harmonogramu ładowania

Demo

Klasyczne środowisko Business Intelligence Narzędzia BI: Źródła danych Warstwa wizualna CRM ERP Baza danych Pliki tekstowe Model danych Silnik ekstraktów Procesy ETL Modele danych do raportów Dane dostępne tylko w ramach narzędzia BI Ekstrakty danych Rozmiar ograniczony wielkością serwera Hurtowni a

Wyzwania w dostępie do danych Gdzie znajdę dane do raportu? Czy dane są zabezpieczone? Kiedy dane rynkowe lub od partnera będą raportowalne? Czy mogę użyć danych z raportu w Excelu? Czy są tam dane personalne? Czy hurtownia danych jest wystarczająco szybka?

Środowisko ze współdzielonym modelem danych Narzędzia BI: Logiczna hurtownia danych Źródła danych Warstwa wizualna Inne narzędzia Model danych Definicja źródeł danych Centralna definicja uprawnień Warstwa utrzymania danych CRM ERP Baza danych Pliki tekstowe Opcjonalne procesy ETL System harmonogramów Zarządzanie cyklem życia cache Hurtowni a

Zalety centralizacji modelu danych Dostęp do danych z dowolnego narzędzia Wszystkie źródła danych opisane Mniejsza zależność analityków od zespołu IT Pełny obraz źródeł danych na potrzeby regulacji RODO Łatwe i krokowe wdrażanie platformy Big Data do analityki Nieograniczone możliwości skalowania

Dziękuję za uwagę Piotr Czarnas CEO Querona Ltd. piotr.czarnas@querona.com +48 536 133 114 www.querona.com