Big Data / in search of business value

Podobne dokumenty
TECHNOLOGIE BIG DATA A BEZPIECZEŃSTWO INFORMATYCZNE WE KNOW YOU KNOW. silmine.com

Hadoop i Spark. Mariusz Rafało

Rola analityki danych w transformacji cyfrowej firmy

Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family

Wprowadzenie do Hurtowni Danych

Architecture Best Practices for Big Data Deployments

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Analityka danych w środowisku Hadoop. Piotr Czarnas, 5 czerwca 2017

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

SAS Access to Hadoop, SAS Data Loader for Hadoop Integracja środowisk SAS i Hadoop. Piotr Borowik

One Size Doesn t Fit All, czyli case study stworzenia BI dostosowanego do strategicznych, operacyjnych oraz analitycznych potrzeb

Szybkość instynktu i rozsądek rozumu$

Szkolenia SAS Cennik i kalendarz 2017

Projektowanie i implementacja wysokowydajnych aplikacji w języku

SYSTEM VILM ZARZĄDZANIE CYKLEM ŻYCIA ŚRODOWISK WIRTUALNYCH. tel: +48 (032)

Asseco HOME: obniżenie kosztów operacyjnych telekomów dzięki rozwiązaniu Big Data.

Analityka danych & big data

Analityka danych w środowisku Hadoop. Piotr Czarnas, 27 czerwca 2017

IBM DATASTAGE COMPETENCE CENTER

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

Digitize Your Business

Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family

CZY TWOJE ŚRODOWISKO PLIKOWE RÓWNIEŻ ROŚNIE SZYBCIEJ NIŻ BAZODANOWE?

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2018/2019

EXPERIENCE IS THE KING

Zintegrowany System Informatyczny (ZSI)

Problemy niezawodnego przetwarzania w systemach zorientowanych na usługi

Paweł Gołębiewski. Softmaks.pl Sp. z o.o. ul. Kraszewskiego Bydgoszcz kontakt@softmaks.pl

Narzędzia IT we współczesnych strategiach utrzymaniowych

Krzysztof Wawrzyniak Quo vadis BS? Ożarów Mazowiecki, styczeń 2014

Integracja danych ubezpieczeniowych w czasie rzeczywistym. Łukasz Szewczyk Solution Architect

Splunk w akcji. Radosław Żak-Brodalko Solutions Architect Linux Polska Sp. z o.o.

Rozwiązania i usługi SAP

Mateusz Kurleto NEOTERIC. Analiza projektu B2B Kielce, 18 października 2012

Analityka i BigData w służbie cyberbezpieczeństa

Asseco IAP Integrated Analytical Platform. asseco.pl

z kapitałem polskim Zatrudnienie 1 10 osób osób 2,27% osób 11,36% osób osób powyżej osób 20,45% 50,00% 13,64%

enxoo properto Kompleksowy system do zarządzania sprzedażą i wynajmem nieruchomości

Co to jest Business Intelligence?

Opracowanie systemu monitorowania zmian cen na rynku nieruchomości

DLA SEKTORA INFORMATYCZNEGO W POLSCE

Jak nie tylko być zgodnym z regulacją, ale wyciągnąć korzyści biznesowe z lepszego dopasowania oferty

Automatyzacja Procesów Biznesowych. Systemy Informacyjne Przedsiębiorstw

WDROŻENIE RSA NETWITNESS SUITE W BRANŻY E-COMMERCE

Dopasowanie IT/biznes

SAP Field Service Management Jakość obsługi serwisowej pod lupą

StatSoft profesjonalny partner w zakresie analizy danych

INŻYNIERIA ZARZADZANIA,

Skuteczna Strategia CRM - wyzwanie dla organizacji. Artur Kowalski Prometriq

1. Wybór systemu ERP. 2. Wzajemne relacje systemów ERP i BPMS.

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Klient Medousa sp. z o.o. (Grupa Digital Avenue S.A.) Branża IT serwis społecznościowy. Okres realizacji Stale od początków istnienia Fotosik.

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

HP Service Anywhere Uproszczenie zarządzania usługami IT

Trwałość projektów 7 osi PO IG

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Wprowadzenie do technologii Business Intelligence i hurtowni danych

BIG DATA w SM WARSZAWA

SAP w 24 godziny / Michael Missbach, George Anderson. Gliwice, cop Spis treści

Oracle Log Analytics Cloud Service

Kompleksowe Przygotowanie do Egzaminu CISMP

Szczególne problemy projektowania aplikacji internetowych. Jarosław Kuchta Projektowanie Aplikacji Internetowych

W książce omówiono: SAP zostań ekspertem w 24 godziny!

ZAŁĄCZNIK NR 3 OPIS PRZEDMIOTU ZAMÓWIENIA DOTYCZĄCY WDROŻENIA PLATFORMY ZAKUPOWEJ

WSTĘP PARADYGMATY I DETERMINANTY ROZWOJU SPOŁECZEŃSTWA INFORMACYJNEGO I GOSPODARKI OPARTEJ NA WIEDZY... 17

Mariusz Dzieciątko. Krótko o sobie / Personal Overview/

Odkryj w danych to, co najważniejsze

Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych

Zastosowania aplikacji B2B dostępnych na rynku zalety aplikacji online

Big Data & Analytics

firmy produkty intranet handel B2B projekty raporty notatki

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Architektura oraz testowanie systemu DIADEM Firewall Piotr Piotrowski

Big Data Summit, Warszawa, Jak dopasować się do potrzeb klienta? BigData narzędziem do wsparcia biznesowych decyzji

dr inż. Maciej Kiewra Prezentacja wygłoszona na konferencji BI vs Big Data podczas Kongresu GigaCon Warszawa, r.

Big Data MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE ORAZ NA SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE. Agenda

produkować, promować i sprzedawać produkty, zarządzać i rozliczać przedsięwzięcia, oraz komunikować się wewnątrz organizacji.

Laboratorium Chmur obliczeniowych. Paweł Świątek, Łukasz Falas, Patryk Schauer, Radosław Adamkiewicz

Szczegółowy opis przedmiotu umowy. 1. Środowisko SharePoint UWMD (wewnętrzne) składa się z następujących grup serwerów:

Tematy prac dyplomowych inżynierskich

Przetwarzanie danych z wykorzystaniem technologii NoSQL na przykładzie serwisu Serp24

Platformy ezdrowie jako narzędzie dla efektywnej opieki zdrowotnej w Polsce

Efektywne przetwarzanie informacji

AUMS Digital. aums.asseco.com

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Trendy BI z perspektywy. marketingu internetowego

IBM POWER8 dla SAP HANA

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

III Etap konkursu TWOJA FIRMA TWOJA SZANSA NA SUKCES

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Dopasowanie IT/biznes

Wpływ kompetencji pracowników administracji publicznej na wdrożenie i utrzymanie systemów teleinformatycznych

Rozwiązania kognitywne to nie tylko software...

OPCJA KOMPLEKSOWE USŁUGI INTERNETOWE

Eniro wyciąga lepsze wnioski i podejmuje bardziej świadome decyzje. dzięki Google Analytics 360, Google Tag Manager i BigQuery

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Data Governance jako część ładu korporacyjnego

Wdrożenie technologii procesowej IBM BPM w EFL

Prezentacja kierunku Analityka biznesowa. Instytut Ekonomii i Informatyki

Transkrypt:

Big Data / in search of business value

Big Data / in search of business value 2 Sieć średniej wielkości sklepów obsługuje w Polsce około 50 milionów transakcji rocznie, przy czym generowane jest ponad 400 milionów pozycji paragonowych. Ogólnopolski bank obsługuje 3 mln klientów. Zachowanie i historia każdego klienta opisywane są przez kilka tysięcy atrybutów. W skali banku wymaga to analizy ponad 3 mld danych. Internetowy kanał sprzedaży w modelu B2C obsługuje 250 tys. odwiedzających dziennie. Przy średniej ilości 6 do 7 odsłon na odwiedzającego oraz prezentowaniu około 100 produktów na stronie, generowane są miliony zdarzeń ( clickstreamów ) zawierające informacje o jakości kanału sprzedaży i preferencjach kupujących. Analiza tych danych w czasie rzeczywistym pozwala budować efektywne modele rekomendacji. Współczesny świat generuje coraz więcej danych. Są to dane mocno zróżnicowane, nieustrukturyzowane i zmienne, np. dane z systemów operacyjnych i transakcyjnych, z systemów skanowania i zarządzania obiektami, maile, wiadomości na stronach WWW, wpisy w portalach społecznościowych. Jeszcze parę lat temu przetwarzanie tych danych technologicznie nie było możliwe. Obecnie dzięki platformom Big Data takim jak Hadoop możliwe i efektywne kosztowo jest przetwarzanie nawet petabajtów danych. Dlaczego więc, zgodnie z badaniem Forrester Research, tylko 12% danych gromadzonych przez organizacje jest przez nie analizowanych w poszukiwaniu wartości biznesowej? 2,5 tryliona bajtów dziennie WYZWANIA Zaplecze sprzętowe Ciągły przyrost danych Efektywne przetwarzanie? 12% Wartość biznesowa Technologia już dzisiaj pozwala organizacjom nie tylko gromadzić każdy bajt danych, ale co ważniejsze, zrozumieć wielkie zbiory danych i wykorzystać ich wartość do podejmowania lepszych decyzji biznesowych. Most businesses have made slow progress in extracting value from big data. And some companies attempt to use traditional data management practices on big data, only to learn that the old rules no longer apply. Dan Briody, Big Data: Harnessing a Game-Changing Asset, Economist Intelligence Unit, 2011

Co to jest Big Data? 3 Termin big data został sformułowany w 2001 roku w raporcie ośrodka analitycznego Gartner. Według przyjętej wtedy definicji, big data to duża ilość (volume), zmienność (velocity) oraz różnorodność (variety) danych. Big Data jest pojęciem względnym, opisującym sytuację, w której ilość, zmienność i różnorodność danych przekracza możliwości analityczne dla danej organizacji, uniemożliwiając terminowe podejmowanie dobrych decyzji. Big Data Meets Big Data Analytics, SAS White Paper 2012 BIG DATA wykorzystanie danych Narzędzia analityczne Oprogramowanie dedykowane Oprogramowanie pudełkowe Przechowywanie i przetwarzanie danych HADOOP Relacyjne bazy danych Hurtownie danych NoSQL Integracja Dostęp do danych Zarządzanie danymi Bezpieczeństwo Zarządzanie Monitorowanie Źródła danych Systemy OLTP, ERP, CRM Dokumenty, Emaile Logi systemowe Aktywności użytkownika Sieci społecznościowe Dane procesowe Urządzenia pomiarowe Systemy geolokacyjne Platforma Hadoop może być uzupełnieniem heterogenicznej infrastruktury informatycznej przedsiębiorstwa, pozwalając w efektywny sposób gromadzić i przetwarzać duże ilości różnorodnych i zmiennych danych.

Zastosowanie w biznesie 4 Zaawansowanie rozwiązania Jak najlepiej postępować? Optimize Rozwiązania innowacyjne Big Data Co się stanie w przyszłości? Czego możemy się spodziewać? Dlaczego coś się dzieje? Statistical Analysis Forecast Predict Query drill down Alerts Jakie akcje należy wykonać? Gdzie dokładnie jest problem? Rozwiązania typowe Clean data Standard reports Ad hoc reports Jak dużo, jak często i gdzie? Co się stało? Raw data Wraz z lawinowym wzrostem generowanych, gromadzonych i przetwarzanych przez przedsiębiorstwa danych, nastąpił dynamiczny rozwój analityki biznesowej. Przykładowe zastosowania w biznesie Customer Intelligence Wczesna identyfikacja i zarządzanie cyklem życia szansy sprzedażowej Podniesienie konwersji sprzedaży Segmentacja klientów Profilowany marketing Strategie i operacje Spójne doświadczenia klienta bez względu na kanał kontaktu Obraz 360 stopni klienta Budowa programu lojalnościowego Aktywna dosprzedaż produktów Rozliczanie prowizji w sieci sprzedaży Zarządzanie efektywnością Identyfikacja i reakcja na zagrożenia oraz szanse Monitorowanie skuteczności marketingu ATL Poprawa konkurencyjności Wykrywanie nadużyć, np. kontrola kosztów Zarządzanie ryzykiem Testowanie hipotez Identyfikacja zależności

Technologia Hadoop 5 Hadoop został zaprojektowany jako środowisko rozproszone w formie klastra, który pełni dwie podstawowe funkcje: gromadzenie (przechowywanie) danych, efektywne przetwarzanie danych. Ze względu na ciągły przyrost danych w klastrze niezwykle ważna jest jego skalowalność, polegająca na dokładaniu kolejnych maszyn, które w założeniu wcale nie muszą być high-endowymi serwerami. Istotne jest również bezpieczeństwo danych, które w przypadku klastra hadoopowego dotyczy zarówno dostępu do danych, jak i odpowiedniego ich zabezpieczenia przed utratą w przypadku awarii infrastruktury sprzętowej. Hadoop jako kluczowy komponent BI i analityki następnej generacji dla innowacyjnych zastosowań biznesowych. Ewaluacja/ monitoring wyników Przygotowanie danych Eksploracja danych Walidacja modelu Transformacja, wybór Budowa modelu The new technologies and new best practices are fascinating, even mesmerizing, and there s a certain macho coolnes to working with dozens of terabytes. But don t do it for the technology. Put big data and discovery analytics together for the new insights they give the business. Philip Russom, Director of Data Management Research, TDWI Big Data Analytics, TDWI Best Practices Report, Fourth Quarter 2011 3Soft i netology są partnerami

Szczegółowy wykaz kompetencji 3Soft i netology 6 Projektowanie architektury i sizing klastra pod kątem wymagań klienta Zdefiniowanie i opisanie wymagań pod kątem Zaprojektowanie architektury klastra Sizing klastra Zapewnienia wydajności (przetwarzanie batch owe, strumieniowe, agregaty danych, itp.) Polityki bezpieczeństwa (grupy użytkowników, poziom dostępu do danych, narzędzia analityczne i kwestie bezpieczeństwa, itp.) Standardów technologicznych i architektonicznych Na poziomie fizycznym (konfiguracja sprzętowa serwerów, architektura sieci) Na poziomie logicznym (podział ról komponentów - Name Node ów, Data Node ów, Edge Node ów oraz rozmieszczenie komponentów plastra Hadoop) Rozbudowa pojemności klastra Projektowanie i implementacja mechanizmów przetwarzania danych w ramach klastra MapReduce Hive technologie Pig Spark Storm Narzędzia analityczne (np. SAS, w tym 4GL) Dedykowane rozwiązania Projektowanie i implementacja mechanizmów integracji i zasilania klastra danymi Określenie sposobu pobierania danych z systemów dziedzinowych ETL Zaprojektowanie i implementacja interfejsów komunikacyjnych z systemami zewnętrznymi Migracja danych archiwalnych Kolumnowe (HBase) Modele danych Full-text search (Solr, Elasticsearch) Key-value, in-memory (Redis) Niestrukturalne (HDFS) Kanoniczne modele danych Flume Data Ingesting Sqoop Logstash Dedykowane rozwiązania

Szczegółowy wykaz kompetencji 3Soft i netology 7 Administracja klastrem Hadoop Administracja komponentami klastra HDFS, YARN, Zookeeper, Ambari, Hive, Pig, Storm, Solr, Knox, Ranger, Oozie Mechanizmy zarządzania zasobami (Fair Scheduler, Capacity Scheduler) Patchowanie i upgrade wersji komponentów (także kompleksowo na poziomie dystrybucji Hortonworks, Cloudera) Uprawnienia i grupy użytkowników (dostęp do danych na HDFS, integracja z AD, LDAP, itp.) Zasady przetwarzania danych (work flow) Aktualizacje systemu operacyjnego Administracja na poziomie systemu operacyjnego węzłów klastra Zarządzanie woluminami dyskowymi w oparciu o LVM Zarządzanie logami systemowymi, w tym transfer logów do odległych lokalizacji Instalacja dodatkowych komponentów i modułów nie będących częścią klastra Projektowanie architektury bezpieczeństwa danych Aspekty security Knox (tzw. perimeter security) Ranger (dawniej XA Secure) integracja z AD, LDAP Hardware (procesory, pamięć operacyjna, dyski twarde, zasoby sieciowe) Monitoring klastra Wykorzystanie systemów monitorujących System operacyjny (zgodność z OSG, patchowanie, utrzymywanie spójności, itp.) Komponenty Hadoop (HDFS, MapReduce, Oozie, Hue, HBase, Flume, itp.) Dedykowane aplikacje uruchamiane na platformie Hadoop (taski, joby) Ambari Ganglia Nagios Integracja z zewnętrznymi systemami monitorującymi Warsztaty z użytkownikami technicznymi i biznesowymi Burze mózgów (nowe use case y) Optymalizacja lub przeniesienie istniejących rozwiązań na platformę Hadoop Wypracowanie architektury klastra i rozwiązań na nim realizowanych Dokumentacja architektury klastra Big data technologies describe a new generation of technologies and architectures, designed to economicall extract value from very large volumes of a wide variety of data by enabling high-velocity capture, discovery and/or analysis. Philip Carter, Associate Vice President of IDC Asia Pacific Big Data Analytics: Future Architectures, Skills and Roadmaps for the CIO, September 2011

Interdyscyplinarny zespół kluczem w realizacji projektów Big Data 8 Wiedza dziedzinowa Klient Znajomość rynku Znajomość potrzeb i możliwości Dostęp do danych Budowa środowisk opartych o ekosystem Hadoop (Big Data) Budowa rozwiązań BI (SAS) 3Soft/Netology Integracja systemów informatycznych Dedykowane rozwiązania informatyczne dla firm Optymalizacja procesów biznesowych (BPM/ECM) Projektowanie i budowa kompleksowej infrastruktury IT Umiejętność dostarczania najlepszych praktyk z różnych branż SAS Institute Doświadczenie w budowaniu platform analitycznych Dopasowanie oferty do aktualnych potrzeb klienta

Projektujemy, wykonujemy i uruchomiamy oraz utrzymujemy architektury Big Data. Czy Big Data ma sens w moim biznesie? POMOGĄ ODPOWIEDZIEĆ NA TO PYTANIE Michał Ząbkowski Account Manager E: michal.zabkowski@netology.com.pl M: +48 601 785 805 Robert Górecki Account Manager E: robert.gorecki@netology.com.pl M: +48 601 149 013 Za stronę merytoryczną opracowania odpowiada dr inż. Kamil Folkert Członek Zarządu ds. R&D w 3Soft S.A. E: kamil.folkert@3soft.pl M: +48 666 305 320 www.3soft.pl www.netology.com.pl Porcelanowa 23, 40-246 Katowice T: +48 32 204 27 86, E: biuro@3soft.pl T: +48 32 355 82 70, E: info@netology.com.pl