Analityka danych w środowisku Hadoop. Piotr Czarnas, 27 czerwca 2017

Podobne dokumenty
Analityka danych w środowisku Hadoop. Piotr Czarnas, 5 czerwca 2017

Rola analityki danych w transformacji cyfrowej firmy

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Co to jest Business Intelligence?

Hurtownia danych praktyczne zastosowania


System INTEGRYB jako zintegrowane repozytorium danych umożliwiające zaawansowaną analitykę badawczą

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

VI Kongres BOUG Praktyczne aspekty wykorzystania Business Intelligence w przemyśle wydobywczym węgla kamiennego

Analityka danych & big data

Praktyczne aspekty pozyskiwania wiedzy z danych z perspektywy matematyka w bankowości (VI zajęcia) Jakub Jurdziak

Wprowadzenie do Hurtowni Danych

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:

Paweł Gołębiewski. Softmaks.pl Sp. z o.o. ul. Kraszewskiego Bydgoszcz kontakt@softmaks.pl

Szkolenie: Jak mieć więcej czasu na wyciąganie wniosków

Konferencja. Business Intelligence Trends 24 czerwca 2014 r.

Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych

IBM DATASTAGE COMPETENCE CENTER

PREZENTACJA FUNKCJONALNA SYSTEMU PROPHIX

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Samodzielny Business Intelligence in memory duże i małe. Paweł Gajda Business Solution Architect

Prezentacja firmy WYDAJNOŚĆ EFEKTYWNOŚĆ SKUTECZNOŚĆ.

Koncepcja wirtualnej pracowni GIS w oparciu o oprogramowanie open source

ROLA CONTROLLERA I ROZWÓJ TECHNOLOGII

Platforma Cognos. Agata Tyma CMMS Department Marketing & Sales Specialist atyma@aiut.com.pl AIUT Sp. z o. o.

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

Część I Istota analizy biznesowej a Analysis Services

Architecture Best Practices for Big Data Deployments

One Size Doesn t Fit All, czyli case study stworzenia BI dostosowanego do strategicznych, operacyjnych oraz analitycznych potrzeb

Ewolucja technik modelowania hurtowni danych

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

TECHNOLOGIE BIG DATA A BEZPIECZEŃSTWO INFORMATYCZNE WE KNOW YOU KNOW. silmine.com

Przetwarzanie danych z wykorzystaniem technologii NoSQL na przykładzie serwisu Serp24

Analityka i BigData w służbie cyberbezpieczeństa

Analityka internetowa w Polsce A.D Trendy i prognozy na najbliższe miesiące wybrane przez ekspertów Bluerank

Modelowanie Data Mining na wielką skalę z SAS Factory Miner. Paweł Plewka, SAS

Praktyczne wdrożenie RODO w systemie informatycznym uczelni na przykładzie one4all RODO dla systemów Microsoft Dynamics 365 / AX

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Pierwsze wdrożenie SAP BW w firmie

Big Data & Analytics

Instalacja SQL Server Express. Logowanie na stronie Microsoftu

Hadoop i Spark. Mariusz Rafało

Praktyczne wykorzystanie elementów raportowania Microsoft Project 2010 /Project Server 2010 Sesja 5 PowerPivot & PowerView Bartłomiej Graczyk

Migracja XL Business Intelligence do wersji

Hurtownie danych w praktyce

Obywatel 360 Narzędzia do zarządzania danymi

TOPWEB Microsoft Excel 2013 i PowerBI Przygotowanie danych, analiza i efektowna prezentacja wyników raportów

Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family

Jak skutecznie budować i wdrażać zabezpieczenia do walki z wyłudzeniami?

Jak powstaje model biznesowy? Co to jest? Modelowanie biznesowe. Model biznesowy. Jak powstaje model biznesowy? Jak firma generuje przychody?

Przetwarzanie danych w chmurze

Big Data w strategii przedsiębiorstwa. Warszawa,

Migracja Business Intelligence do wersji

Odkryj w danych to, co najważniejsze

Spojrzenie na systemy Business Intelligence

dr inż. Maciej Kiewra Prezentacja wygłoszona na konferencji BI vs Big Data podczas Kongresu GigaCon Warszawa, r.

Triki i dobre praktyki

Szkolenie autoryzowane. MS Wdrażanie hurtowni danych w Microsoft SQL Server 2012

Migracja Business Intelligence do wersji 11.0

Business Intelligence Odkryj szerszą perspektywę dla swojego biznesu

COMARCH DATA WAREHOUSE MANAGER 6.2

Trendy BI z perspektywy. marketingu internetowego

BigData rewolucja czy ewolucja w świecie rozwiązań analityki biznesowej. Grzegorz Oleś Big Data Sales Executive

Base all your decisions on Data, not Instinct.

Opis wymagań i program szkoleń dla użytkowników i administratorów

SAS Access to Hadoop, SAS Data Loader for Hadoop Integracja środowisk SAS i Hadoop. Piotr Borowik

Agenda. Charakterystyka Business Intelligence. Architektura systemu. Prezentacja funkcjonalności. Podsumowanie

PureSystems zautomatyzowane środowisko aplikacyjne. Emilia Smółko Software IT Architect

Dni: 2. Partner merytoryczny. Opis: Adresaci szkolenia

SAP w 24 godziny / Michael Missbach, George Anderson. Gliwice, cop Spis treści

Portale raportowe, a narzędzia raportowe typu self- service

III Edycja ITPro 16 maja 2011

Makeitright Power Farm RPA

Migracja Business Intelligence do wersji

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2018/2019

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

Firma Informatyczna ASDER. Prezentacja. Serwer danych lokalnych. Przemysław Kroczak ASDER

Informacja o firmie i oferowanych rozwiązaniach

Migracja Business Intelligence do wersji

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

Kraków Wrocław Poznań Warszawa Gdańsk CLOUD SERVICES & DATA CENTER

Gemini Cloud Project Case Study

CZĘŚĆ I ZASTOSOWANIE PROGRAMU EXCEL DO ANALIZ BUSINESS INTELLIGENCE

Tematy prac dyplomowych inżynierskich

SiR_13 Systemy SCADA: sterowanie nadrzędne; wizualizacja procesów. MES - Manufacturing Execution System System Realizacji Produkcji

Open Source biznes i bezpieczeństwo w oprogramowaniu. Comp S.A. Open Source Day 2016

Migracja XL Business Intelligence do wersji

trendów, które zmieniają IT (technologię informatyczną)

Marcin Adamczak Jakub Gruszka MSP. Business Intelligence

Spis treści. Wstęp... 9

Field Service Management Najczęściej spotykane problemy

IBM Business Analytics

FORMULARZ OFERTY CENOWEJ. Future Processing Sp. z o.o. ul. Bojkowska 37A Gliwice NIP: NIP:

LIDERZY DATA SCIENCE CENTRUM TECHNOLOGII ICM CENTRUM TECHNOLOGII ICM ICM UW TO NAJNOWOCZEŚNIEJSZY OŚRODEK DATA SCIENCE W EUROPIE ŚRODKOWEJ.

Transkrypt:

Analityka danych w środowisku Hadoop Piotr Czarnas, 27 czerwca 2017

Hadoop i Business Intelligence - wyzwania 1 Ładowane danych do Hadoop-a jest trudne 2 Niewielu specjalistów dostępnych na rynku Dostęp do danych wymaga sterowników 3 Failure rate 6-9m 4 Data Governance i bezpieczeństwo

Analityka w środowisku Hadoop - potrzeby Niski koszt nauki Łatwość uruchomienia środowiska Prostota ładowania danych Wszechstronna dostępność danych Bezpieczeństwo danych

Wyzwania przy wdrożeniu procesów analityki danych Biznes oczekuje odpowiedzi na wczoraj Dużo źródeł danych Długi czas przygotowania danych Koszty narzędzi i środowiska Ochrona danych osobowych (RODO)

Wyzwania przy wdrożeniu procesów analityki danych Biznes oczekuje odpowiedzi na wczoraj Nie wszystkie dane potrzebne do raportu są dostępne Dane dostępne w hurtowni najwcześniej po kilku dniach Biznes oczekuje danych w czasie rzeczywistym

Wyzwania przy wdrożeniu procesów analityki danych Dużo źródeł danych Analityk musi znaleźć potrzebne dane Tabele w hurtowni danych nie są opisane Nowe źródła danych (Google Analytics, plik z danymi rynkowymi, etc.) wymagają załadowania

Wyzwania przy wdrożeniu procesów analityki danych Długi czas przygotowania danych Analityk biznesowy jest uzależniony od IT Dane trzeba załadować Ładowanie danych do Hadoop-a nie jest proste:

Wyzwania przy wdrożeniu procesów analityki danych Koszty narzędzi i środowiska Tradycyjne bazy danych są kosztowne Narzędzia wizualizacyjne (jak QlikView) tylko dla wybranych Brak powszechnego dostępu do raportów dla wszystkich użytkowników $$$

Wyzwania przy wdrożeniu procesów analityki danych Ochrona danych osobowych Regulacja RODO / GDPR wchodzi w życie 25 maja 2018 Ewidencja źródeł z danymi personalnymi Zapewnienie kontroli dostępu i audyt dostępu

QUERONA

Co to jest Querona Samoobsługowa logiczna hurtownia danych Obsługa około 100 typów źródeł danych (ERP, CRM, bazy danych) Dostęp z dowolnego narzędzia jako wirtualny SQL Server 2012 Ładowanie danych do hurtowni w kilku kliknięciach Dostęp i łączenie danych z róźnych źródeł w czasie rzeczywistym Łatwy interfejs webowy do wyszukiwania i zarządzania danymi Wbudowany silnik Big Data do przetwarzania dużych zbiorów danych

Klasyczny proces przygotowania danych do raportu Zamówienie raportu Biznes prosi o przygotowanie raportu Znalezienie danych Analityk szuka i analizuje źródła danych Przygotowanie danych Analityk prosi IT o załadowanie danych do hurtowni Budowa raportu Analityk buduje model danych oraz wizualizację

Jak Querona adresuje problem Dostęp do danych dowolnym narzędziem Brak wpływu na obecne środowisko Wirtualna baza danych wspomagana przez Apache Spark Łatwe uruchamianie środowiska analitycznego Big Data Dostęp do wszystkich źródeł danych Progresywne wdrażanie analityki Big Data w firmie Kompleksowa Logiczna Hurtownia Danych: bez ETL-a, samoobsługowa, gotowa na wyzwania Big Data

Querona - zwinny process analityki danych Zamówienie raportu Biznes może sam pobrać dane do Excela Znalezienie danych Analityk łatwo znajduje dostępne dane Przygotowanie danych Analityk sam może podłączyć lub przeładować dane Budowa raportu Model danych raportu zostaje opublikowany na przyszość

Apache Spark w analityce Najpopularniejszy silnik Big Data Open source Skalowalny Pełne wsparcie SQL Nastawiony na przetwarzanie ad-hoc Działa w każdym środowisku

Spark vs Hadoop Spark Hadoop Wykonywanie zapytań SQL Analityka w czasie rzeczywistym Równoległa obsługa wielu użytkowników Zarządzanie klastrem Bezpieczeństwo komunikacji Definicja metadanych Przechowywanie danych (HDFS)

Tradycyjne ładowanie danych do Hadoop-a (push) 1 Przygotowanie plików Napisanie skryptów ładujących 2 3 Podpięcie skryptów ładujących pod harmonogramy

Samoobsługowe odwrócone ładowanie danych (pull) 1 Podpięcie źródeł danych Wskazanie danych do załadowania Spark sam pobierze dane ze źródła 2 3 Wskazanie harmonogramu ładowania

Demo

Klasyczne środowisko Business Intelligence Narzędzia BI: Źródła danych Warstwa wizualna CRM ERP Baza danych Pliki tekstowe Model danych Silnik ekstraktów Procesy ETL Modele danych do raportów Dane dostępne tylko w ramach narzędzia BI Ekstrakty danych Rozmiar ograniczony wielkością serwera Hurtownia

Wyzwania w dostępie do danych Gdzie znajdę dane do raportu? Czy dane są zabezpieczone? Kiedy dane rynkowe lub od partnera będą raportowalne? Czy mogę użyć danych z raportu w Excelu? Czy są tam dane personalne? Czy hurtownia danych jest wystarczająco szybka?

Środowisko ze współdzielonym modelem danych Narzędzia BI: Logiczna hurtownia danych Źródła danych Warstwa wizualna Model danych Definicja źródeł danych Centralna definicja uprawnień CRM ERP Baza danych Pliki tekstowe Inne narzędzia Warstwa utrzymania danych Opcjonalne procesy ETL System harmonogramów Zarządzanie cyklem życia cache Hurtownia

Zalety centralizacji modelu danych Dostęp do danych z dowolnego narzędzia Wszystkie źródła danych opisane Mniejsza zależność analityków od zespołu IT Pełny obraz źródeł danych na potrzeby regulacji RODO Łatwe i krokowe wdrażanie platformy Big Data do analityki Nieograniczone możliwości skalowania

Piotr Czarnas CEO Querona Ltd. piotr.czarnas@querona.com +48 536 133 114 www.querona.com