Szkolenie: Jak mieć więcej czasu na wyciąganie wniosków

Podobne dokumenty
Analityka danych w środowisku Hadoop. Piotr Czarnas, 27 czerwca 2017

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Szkolenia SAS Cennik i kalendarz 2017

VI Kongres BOUG Praktyczne aspekty wykorzystania Business Intelligence w przemyśle wydobywczym węgla kamiennego

Analityka danych w środowisku Hadoop. Piotr Czarnas, 5 czerwca 2017

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Samodzielny Business Intelligence in memory duże i małe. Paweł Gajda Business Solution Architect

Architecture Best Practices for Big Data Deployments

SAS Access to Hadoop, SAS Data Loader for Hadoop Integracja środowisk SAS i Hadoop. Piotr Borowik

Trendy BI z perspektywy. marketingu internetowego

Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family

O mnie

Hadoop i Spark. Mariusz Rafało

Tematy prac dyplomowych inżynierskich

Wprowadzenie do Hurtowni Danych

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Doradzamy, projektujemy, tworzymy, wdrażamy i utrzymujemy dedykowane rozwiązania i systemy informatyczne w oparciu o potrzeby zamawiającego.

Analityka danych & big data

Praktyczne aspekty pozyskiwania wiedzy z danych z perspektywy matematyka w bankowości (VI zajęcia) Jakub Jurdziak

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

Rola analityki danych w transformacji cyfrowej firmy

Hurtownia danych szansa na nowe życie (starej idei) Jakub Skuratowicz Technical Sales

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Modelowanie Data Mining na wielką skalę z SAS Factory Miner. Paweł Plewka, SAS

Szybkość instynktu i rozsądek rozumu$

Nowe podejście do składowania danych

SZKOLENIA SAS. ONKO.SYS Kompleksowa infrastruktura inforamtyczna dla badań nad nowotworami CENTRUM ONKOLOGII INSTYTUT im. Marii Skłodowskiej Curie

Witamy na konferencji SUSE Expert Days Warszawa, 17 kwietnia 2018 r.

Mariusz Dzieciątko. Krótko o sobie / Personal Overview/

Hurtownie danych i przetwarzanie analityczne - projekt

Hbase, Hive i BigSQL

Cloud Transcoding Nowe Paradygmaty, Wysoka Dostępność i Wskaźniki ROI. Maj 2017

Minimum programowe dla studentów MIĘDZYWYDZIAŁOWYCH INDYWIDUALNYCH STUDIÓW SPOŁECZNO-HUMANISTYCZNYCH - studia magisterskie II stopnia

Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych

Integracja danych ubezpieczeniowych w czasie rzeczywistym. Łukasz Szewczyk Solution Architect

TECHNOLOGIE BIG DATA A BEZPIECZEŃSTWO INFORMATYCZNE WE KNOW YOU KNOW. silmine.com

EXPERIENCE IS THE KING

Oracle Log Analytics Cloud Service

Tematy projektów HDiPA 2015

Inteligentny system generowania leadów

BIG DATA DLA KAŻDEGO. Radosław Łebkowski, Sławomir Strzykowski - Microsoft Piotr Zacharek - Hewlett Packard

LIDERZY DATA SCIENCE CENTRUM TECHNOLOGII ICM CENTRUM TECHNOLOGII ICM ICM UW TO NAJNOWOCZEŚNIEJSZY OŚRODEK DATA SCIENCE W EUROPIE ŚRODKOWEJ.

Sisense. Opis produktu.

Zastosowania narzędzi analitycznych w komunikacji społecznej

Witamy na konferencji SUSE Expert Days Kraków, 16 października 2018 r.

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Odkryj w danych to, co najważniejsze

Wprowadzenie do Apache Spark. Jakub Toczek

Opis Rozwiązania SAP SAP HANA. Zmieniaj swoją przyszłość lepiej rozumiejąc biznes dzięki analityce predykcyjnej

Instalacja SQL Server Konfiguracja SQL Server Logowanie - opcje SQL Server Management Studio. Microsoft Access Oracle Sybase DB2 MySQL

BigData. Czy zawsze oznacza BigProblem? Artur Górnik, SAP Polska Piotr Zacharek, HP Polska 14 kwietnia, 2015

BigData & Cloud Wprowadzenie

Marek Sokołowski / Oracle Polska. Konsolidacja i centralizacja: ważne pytania i szczere odpowiedzi

NALITYKA IZNESOWA WYDZIAŁ ORGANIZACJI I ZARZĄDZANIA POLITECHNIKA ŚLĄSKA NOWY KIERUNEK STUDIÓW.

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Baza danych in-memory. DB2 BLU od środka Artur Wrooski

Część I Istota analizy biznesowej a Analysis Services

think big 1 icon DNA made by Freepik from

YOUR SOFTWARE CHALLENGE IS OUR MISSION. Case Study

Nad rozwojem platformy pracują: Allegro.pl to największa w Polsce platforma e-commerce.

Wybór rozwiązania. Konkurencyjne ceny

Przetwarzanie danych z wykorzystaniem technologii NoSQL na przykładzie serwisu Serp24

dziennik Instrukcja obsługi

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Narzędzia do analizy działań marketingowych w internecie: Google Analytics & Webmaster Tools, analityka social media

Stawiamy na specjalizację. by CSB-System AG, Geilenkirchen Version 1.1

Narzędzia i trendy Big Data

Firebird Alternatywa dla popularnych darmowych systemów bazodanowych MySQL i Postgres

Jak znaleźć prawdziwe zagrożenia w infrastrukturze IT

Rozumie istotę i znacznie procesów ekstrakcji, transformacji i ładowania danych (ETL), zna wybrany język ETL oraz odpowiednie narzędzia.

*Odniesienie - kształcenia EFEKT KSZTAŁCENIA. Absolwent studiów drugiego stopnia na kierunku Informatyka: symbol Wiedza 1 AI_W01

Specjalizacja magisterska Bazy danych

z kapitałem polskim Zatrudnienie 1 10 osób osób 2,27% osób 11,36% osób osób powyżej osób 20,45% 50,00% 13,64%

Informatyczne fundamenty

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Prezentacja firmy WYDAJNOŚĆ EFEKTYWNOŚĆ SKUTECZNOŚĆ.

PLAN STUDIÓW STACJONARNYCH I NIESTACJONARNYCH WIECZOROWYCH II STOPNIA (od roku akademickiego 2015/2016)

Maciej Kiewra Quality Business Intelligence Consulting

Oferta prowadzenia działań reklamowych w Internecie

Kompetencje niezbędne do pracy w e-commerce

Ciągłe dostarczanie oprogramowania : kompletny przewodnik / Eberhard Wolff. Gliwice, cop Spis treści

WIZUALNA EKSPLORACJA DANYCH I RAPORTOWANIE W SAS VISUAL ANALYTICS ORAZ WSTĘP DO SAS VISUAL STATISTICS

Zarządzanie procesami biznesowymi przedsiębiorstwa z wykorzystaniem systemu Teamcenter

Plan studiów niestacjonarnych pierwszego stopnia Kierunek: ANALITYKA I BADANIA EKONOMICZNE A. Moduły międzykierunkowe obligatoryjne

Rynek IT w Polsce Prognozy rozwoju na lata

Subskrypcyjne platformy IT

Metody automatyzacji sprawozdawczości w systemie asist. Agnieszka Hołownia-Niedzielska

Harmonogram szkoleń: Marzec 2011r./Kwiecień 2011r.

Plan studiów stacjonarnych pierwszego stopnia Kierunek: ANALITYKA I BADANIA EKONOMICZNE A. Moduły międzykierunkowe obligatoryjne

Web GIS. Adam Kuran ESRI Polska

Narzędzia IT we współczesnych strategiach utrzymaniowych

BI: przegląd, ETL, raportowanie i analizy

II SPOTKANIE PRAKTYKÓW DATA SCIENCE ZAAWANSOWANA ANALITYKA W SŁUŻBIE ORGANIZACJI HOT TOPICS

Podstawy analizy danych numerycznych w języku Python

Learn SAS. Training Certification Coaching. Grow With Us. Szkolenia Certyfikaty Mentoring Analiza potrzeb szkoleniowych

SQL Server 2016 w świecie Big Data

Hurtownia danych praktyczne zastosowania

Ramowy plan kursu. Lp. Moduły Wyk. Lab. Przekazywane treści

PLANOWANIE I BUDŻETOWANIE Z WYKORZYSTANIEM NARZĘDZI CYFROWYCH

Transkrypt:

Szkolenie: Jak mieć więcej czasu na wyciąganie wniosków 14 listopada 2018 r 8:45-12:45 Warszawa https://alterdata.evenea.pl "Dzisiaj praca analityka składa się w 15% z analizowania. Cała reszta czynności wiąże się z dostępem do danych, ich przygotowaniem, czyszczeniem, przetwarzaniem, kod rabatowy dla uczestników Big Data Day czy wizualizacją. Dobranie właściwych narzędzi może zmienić te proporcje z 15% nawet na 50%" - Marcin Kolenda BigDataDay2018 `

strategia biznesowa i cyfrowa transformacja w oparciu o dane zaawansowana analityka i machine learning projektowanie, tworzenie i wdrażanie rozwiązań do analityki danych

O mnie i o tym dlaczego zajmują mnie duże dane Początki 2002 - sql server visual basic ado technology warehouse data (nie DWH) Doświadczenie 2006 Era (T-mobile), Oracle + SAS największa w tym czasie hurtownia danych w Polsce analizy behawioralne klientów telekomu optymalizacja pricing-u konsulting data rozwiązania do w obszarze engineering przetwarzania danych & science i analizy danych Big Data startupy BigData 2012 Vertica Google Big Query współzałozyciel Alterdata.io Kontakt: Marcin.Kolenda@alterdata.io M: +48 601 135 066 szkolenia www.alterdata.io

Jak radzić sobie z dużymi set-ami danych? punkt widzenia analityka

Co robi analityk? pozyskuje dane, opanowuje i łączy źródła najróżniejszych typów i formatów przygotowuje, czyści, przegląda i transformuje dane, aby były gotowe do analizy tworzy i przechowuje zbiory danych do analizy eksploruje dane, analizuje, poszukuje wniosków avg 15%-20% czasu * Forbes Gil Press wizualizuje wnioski, prezentuje wyniki, tworzy i publikuje raporty, dashboardy

Dylematy i trudne wybory? narzędzia komercyjne Open Source? chmura OPS własna infrastruktura no OPS

Dylematy i trudne wybory? narzędzia komercyjne Open Source? chmura OPS własna infrastruktura no OPS

Odczarujmy python & R ops open source cloud & not cloud Percepcja 1. 2. 3. Podstawowe narzędzie a. analizy danych b. budowy modeli machine learning mnogość dostępnych a. szkoleń & kursów b. dostępnych bibliotek (analityka, machine learning) intelektualnie niska bariera wejścia (python) Rzeczywistość 1. 2. 3. 4. wygoda pracy na małych subsetach danych (interaktywność, czytelność, prostota) współpraca (integracja) z bardzo szerokim zakresem narzędzi: m.in. chmurowych, open source (hadoop, spark, hive, beam), etc. nośnik procesu i/lub algorytmu ideał do oskryptowania i automatyzacja innych narzędzi Konsekwencje 1. 2. nie przeniesiemy tak po prostu na duże środowisko produkcyjne 500GB czy 500 TB Musimy zintegrować się z innymi narzędziami (wiedza & czas) `

Dylematy i trudne wybory? narzędzia komercyjne Open Source? chmura OPS własna infrastruktura no OPS

no ops pay as you go cloud only Google Cloud 1. 2. 3. 4. API Skalowalność Rozdzielenie przechowania od obliczania web UI Cloud Console command line (bash) Cloud SDK python Cloud SDK inne języki Cloud SDK & API no ops bariera wejścia brak hardware ops mniej data engineering wiedza (sql only) opex zamiast capex `

no ops pay as you go cloud only Co robi analityk? pozyskuje dane, opanowuje i łączy źródła najróżniejszych typów i formatów Google Big Query storage (import) przygotowuje, czyści, przegląda i transformuje dane, aby były gotowe do analizy Google Big Query analysis (SQL) tworzy i przechowuje zbiory danych do analizy Cloud Dataprep (preparation) eksploruje dane, analizuje, poszukuje wniosków Cloud Storage Google Big Query (buckets) storage (tables) wizualizuje wnioski, prezentuje wyniki, tworzy i publikuje raporty, dashboardy Google Big Query Google DataStudio analysis (SQL) Looker other BI tools

Dylematy i trudne wybory? narzędzia komercyjne Open Source? chmura OPS własna infrastruktura no OPS

Vertica - analityczna baza danych do big data half ops commercial & community cloud & not cloud MPP Baza kolumnowa kompresja i kodowanie Szybkość 5-1000 x szybsza odpowiedź na zapytania do bazy Skalowalność ExaBajt* zwerfikowana skalowalność * 1PB = 1 000 000 000 GB `

Vertica - analityczna baza danych do big data User-Defined Functions R Java Geospatial Messaging Time series SQL Python Real-Time Event Series User Defined Loads ETL C++ BI & Visualization Text Analytics Pattern Matching Machine Learning Regression ODBC, JDBC, OLEDB Data Transformation half ops commercial & community cloud & not cloud User Defined Storage Security External tables to analyze in place `

Co robi analityk? pozyskuje dane, opanowuje i łączy źródła najróżniejszych typów i formatów przygotowuje, czyści, przegląda i transformuje dane, aby były gotowe do analizy Kafka flex tables CSV parsers SQL ANSI 99, 92 SQL extension tworzy i przechowuje zbiory danych do analizy export CSV pełna integracja Hadoop (Parquet, ORC) wydajna kompresja half ops commercial & community cloud & not cloud eksploruje dane, analizuje, poszukuje wniosków wizualizuje wnioski, prezentuje wyniki, tworzy i publikuje raporty, dashboardy SQL ANSI 99, 92 SQL extension embedded Machine Learning ODBC, JDBC integracja Tableau, PowerBI, Looker i wiele innych

Dylematy i trudne wybory? narzędzia komercyjne 300$ na start 1 TB / mc za darmo Open Source OPS chmura własna infrastruktura no OPS 1 TB za darmo Community License

Skontaktuj się z nami i znajdź wartość w swoich danych