Hurtownia danych szansa na nowe życie (starej idei) Jakub Skuratowicz Technical Sales



Podobne dokumenty
Informacja na żądanie, czyli rozwiązania sprzętowej akceleracji analityki biznesowej

Rola infrastruktury w analityce

Big Data MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE ORAZ NA SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE. Agenda

Jak wiedzieć więcej i szybciej - Analizy in-memory

Baza danych in-memory. DB2 BLU od środka Artur Wrooski

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

SAS Access to Hadoop, SAS Data Loader for Hadoop Integracja środowisk SAS i Hadoop. Piotr Borowik

Rola analityki danych w transformacji cyfrowej firmy

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

BigData. Czy zawsze oznacza BigProblem? Artur Górnik, SAP Polska Piotr Zacharek, HP Polska 14 kwietnia, 2015

Analityka danych w środowisku Hadoop. Piotr Czarnas, 27 czerwca 2017

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Nowe podejście do składowania danych

DB2 with BLU acceleration rozwiązanie in-memory szybsze niż pamięć operacyjna&

Analityka danych w środowisku Hadoop. Piotr Czarnas, 5 czerwca 2017

Wprowadzenie do Hurtowni Danych

BigData & Cloud Wprowadzenie

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Nowoczesne bazy danych, czyli przetwarzanie in-memory

BIG DATA DLA KAŻDEGO. Radosław Łebkowski, Sławomir Strzykowski - Microsoft Piotr Zacharek - Hewlett Packard

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Szkolenie: Jak mieć więcej czasu na wyciąganie wniosków

Wstęp do Business Intelligence

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Samodzielny Business Intelligence in memory duże i małe. Paweł Gajda Business Solution Architect

Co to jest Business Intelligence?

Wprowadzenie do Hurtowni Danych

Analityka danych & big data

BigData rewolucja czy ewolucja w świecie rozwiązań analityki biznesowej. Grzegorz Oleś Big Data Sales Executive

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Digitize Your Business

PureSystems zautomatyzowane środowisko aplikacyjne. Emilia Smółko Software IT Architect

Szybkość instynktu i rozsądek rozumu$

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Hurtownie danych. 31 stycznia 2017

Przyspiesz swój biznes i obniż koszty dzięki IBM FlashSystems. Artur Król Artur.Krol@pl.ibm.com Senior Storage Sales Consultant

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Przyszłość w rękach Big Data -wizje i technologie dziś. Artur Wroński Information Management Technical Team Leader

Architecture Best Practices for Big Data Deployments

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Konsolidacja wysokowydajnych systemów IT. Macierze IBM DS8870 Serwery IBM Power Przykładowe wdrożenia

Hurtownie danych. Przetwarzanie zapytań. ZAPYTANIA NA ZAPLECZU

Welcome to the waitless world. Inteligentna infrastruktura systemów Power S812LC i S822LC

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Tematy projektów Edycja 2014

Technologia informacyjna

Hbase, Hive i BigSQL

Hurtownie danych. Rola hurtowni danych w systemach typu Business Intelligence

Informatyka I BAZY DANYCH. dr inż. Andrzej Czerepicki. Politechnika Warszawska Wydział Transportu 2017

Iwona Milczarek, Małgorzata Marcinkiewicz, Tomasz Staszewski. Poznań,

Przetwarzanie danych z wykorzystaniem technologii NoSQL na przykładzie serwisu Serp24

Modelowanie Data Mining na wielką skalę z SAS Factory Miner. Paweł Plewka, SAS

Szkolenia SAS Cennik i kalendarz 2017

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Rozwiązanie Compuware Data Center - Real User Monitoring

Instalacja SQL Server Konfiguracja SQL Server Logowanie - opcje SQL Server Management Studio. Microsoft Access Oracle Sybase DB2 MySQL

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

Zapytania z ograniczeniem czasowym w Oracle

Integracja danych ubezpieczeniowych w czasie rzeczywistym. Łukasz Szewczyk Solution Architect

Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family

Tuning SQL Server dla serwerów WWW

Hurtownie Danych i Business Intelligence: przegląd technologii

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Analityka i BigData w służbie cyberbezpieczeństa

Trendy BI z perspektywy. marketingu internetowego

OLAP i hurtownie danych c.d.

Co to jest Baza Danych

Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence

Oracle11g: Wprowadzenie do SQL


Współczesne systemy baz danych

Praktyczne aspekty pozyskiwania wiedzy z danych z perspektywy matematyka w bankowości (II zajęcia) Jakub Jurdziak

Odkryj Sekrety Efektywnego Business Intelligence

Tematy prac dyplomowych inżynierskich

Wydajność hurtowni danych opartej o Oracle10g Database

JDBC w LoXiMie. Interfejs Java Database Connectivity dla systemu LoXiM. Adam Michalik 2008

Spis treści. O autorach... 12

Pierwsze wdrożenie SAP BW w firmie

Systemy GIS Tworzenie zapytań w bazach danych

DOKUMENTACJA BI SOW PFRON. Powykonawcza. dla BI INSIGHT S.A. UL. WŁADYSŁAWA JAGIEŁŁY 4 / U3, WARSZAWA. Strona 1 z 23

COMARCH DATA WAREHOUSE MANAGER 6.2

Infrastruktura jako fundament efektownego gromadzenia, przechowywania i zarządzania danymi

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

Asseco HOME: obniżenie kosztów operacyjnych telekomów dzięki rozwiązaniu Big Data.

Chmura Krajowa milowy krok w cyfryzacji polskiej gospodarki

One Size Doesn t Fit All, czyli case study stworzenia BI dostosowanego do strategicznych, operacyjnych oraz analitycznych potrzeb

HARMONOGRAM: DZIEŃ GODZINA MIEJSCE PROWADZĄCY TEMAT OPIS

Infrastruktura jako fundament efektownego gromadzenia, przechowywania i zarządzania danymi#

HURTOWNIE DANYCH. Krzysztof Goczyła. Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska. kris@eti.pg.gda.pl. K.

PRZESTRZENNE BAZY DANYCH WYKŁAD 2

Ekspert MS SQL Server Oferta nr 00/08

Hadoop i Spark. Mariusz Rafało

Wprowadzenie do systemów baz danych. Wykład 1

Bazy danych. Plan wykładu. Rodzaje baz. Rodzaje baz. Hurtownie danych. Cechy hurtowni danych. Wykład 14: Hurtownie danych

Rozwiązania kognitywne to nie tylko software...

Część I Istota analizy biznesowej a Analysis Services

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Hurtownie danych w praktyce

Transkrypt:

Hurtownia danych szansa na nowe życie (starej idei) Jakub Skuratowicz Technical Sales

Rys Historyczny

Idealna(kiedyś) architektura Data Quality MDM

Enterprise Data Warehouse okazał się mitem Ma zawierać wszystkie istotne informacje Jedna wersja prawdy...cel (Niemal) nierealizowany Złożony i trudny w uzytkowaniu Powolny w modyfikacji Finalnie kolejny silos

Wciąż pozostają stare problemy Tempo rozszerzania hurtowni Systemy podbiurkowe Operational Data Store Wydajność!

Świat się skomplikował

Zalew danych 80% 2020 35 zettabytes 2009 800,000 petabytes

Nowe technologie Data Warehouse Appliance In-database analytics In-memory Real-time Hadoop

PureData Appliance Rewolucja w jakości pracy z hurtownią ü Dedykowane urządzenie ü Zintegrowana baza danych, serwer i macierz ü Standardowe interfejsy ü Niski koszt posiadania Prędkość: 10-100x szybsze niż tradycyjne systemy Prostota: Znikoma potrzeba administracji Skalowalność: Możliwość obsługi do Petabajtów Inteligencja: Superwydajna zaawansowana analityka 10

Architektura PureData System for Analytics AMPP Field Programmable Gate Array = procesor programowalny CPU FPGA Memory Złożona analityka CPU Memory FPGA Lekki Host (IBM xseries, Red Hat Linux) BI ETL CPU FPGA Dyski twarde Memory S-Blade Warstwa sieciowe PureData System for Analytics Appliance Ładowanie Aplikacje

Raczej niezwykła metoda akceleracji zapytań select DISTRICT, PRODUCTGRP, sum(nrx) from MTHLY_RX_TERR_DATA where MONTH = '20091201' and MARKET = 509123 and SPECIALTY = 'GASTRO' FPGA CPU Slice of table MTHLY_RX_TERR_DATA (compressed) Dekompresja Projekcja kolumn Ograniczenie wierszy Złożone, Złączenia, Agregacje, itp. sum(nrx) select DISTRICT, PRODUCTGRP, sum(nrx) where MONTH = '20091201' and MARKET = 509123 and SPECIALTY = 'GASTRO'

Zaawansowana analiza danych Analityka Data Warehouse Data Analytics Grid SQL ETL ETL Prognozy SQL ETL SQL C/C++, Java, Python, Fortran, Detekcje nadużyć

Zaawansowana analiza danych Analityka Data Warehouse Data Analytics Grid SQL ETL ETL Prognozy SQL ETL SQL SQL C/C++, Java, Python, Fortran, Detekcje nadużyć

NYSE Euronext usprawniła swoją hurtownię używając Netezzy Potrzeba Elastyczność Potrzeba skrócenia czasu dostępu do danych co zajmowało 26h Benefits Błyskawiczne przeszukiwanie 650TB danych; Łącznie ponad 1PB danych na Netezza Czas dostępu zredukowany z 26h do 2min Rozwiązanie działało w przeciągu kilku tygodni 15

In-memory In Memory Database Dojrzały produkt Architektura równoległa 7 1 6 2 Ekstremalnie szybka 5 4 3 Wydajna Kompresja Optymalizacja wykorzystania RAM Kolumnowy zapis wierszy Informix Warehouse Accelerator

Walmart analizuje sprzedaż towarów promocyjnych Potrzeba: Kierownicy sklepów potrzebowali analizować sprzedaż produktów promowanych Obecna baza nie nadążała z przetwarzaniem Zysk Zdolność reakcji na wahania sprzedaży produktów i skuteczność promocji Średnio mniej niż 10 sek. Na generacje raportu 500 współbieżnych użytkowników 1/10 ceny systemu konkurencyjnego 6-10 razy szybciej 17

NoSQL -> HiveQL + PIG -> SQL

Analiza w czasie rzeczywistym à Ciągły przypływ danych Filter / Sample à Ciągła analiza Transform Annotate Correlate Classify

Duży operator telefonii komórkowej z USA Środowisko do analizy CDR w czasie rzeczywistym Analizuje rozmowy, ruch data, smsy w celu wykrycia źle funkcjonujacych nadajników Wykorzystano Streams oraz IBM Netezza Zysk 90% oszczędności czasu ładowania i obróbki danych Ponad 90% oszczędności na dyskach Poprawa jakości sieci, zwiększone zadowolenie klientów, mniej rezygnacji

Dokąd zmierzamy

Wiele technologii w jednym rozwiązaniu IBM DB2 Analytics Accelerator OLTP Wynik OLAP Małe zapytanie Duże Trudne zapytanie

Logiczna hurtownia danych Real Time Scoring and Response Streaming Data IBM Streams Exploration/Discovery Unstructured Data Analytics Unstructured Data Shared Analytics Traditional and Non Traditional Sources, TBs to PBs Unstructured Data Queryable Archive IBM BigInsights Deep analytics and high scaleability reporting Structured Data Shared Analytics IBM Netezza TBs to PBs Structured Data 23

Problem dużych danych spowszednieje Logiczna hurtownia danych Hadoop jako samodzielna hurtownia danych Upowszechnienie metod używanych w big data Zaszywanie ich w nowo powstających produktach