INFORMACJA Sebastian Pawlak Chief Technologist & Presales Manager
Czym jest informacja? = 2
Dane są wartością, Informacja jest złotem In Data There is Gold 3
Ludzie generują informacje 70% informacji jest generowana przez jednostki Prawdopodobnie 40 zetabajtów w 2020 97,000 tweets w każdej sekundzie 12 million sms w każdej minucie 294 billion wiadomości e-mail każdego dnia * IDC, 2011 Digital Universe Study: Extracting Value from Chaos 4
Wyobrażasz sobie zetabajt (ZB) dzisiaj? 1,000,000,000,000,000,000,000 bajtów = 1000 7 bajtów = 10 21 bajtów =1 trylion gigabajtów =1 bilion terabajtów =1 milion petabajtów 5
Czy to jest Big Data? : Micro-transakcje 20 TB x 2 x 6 x 28,537 x 365 20 TB informacji per jeden silnik Dwa silniki Boeing 6h lot z NYC do Los Angeles Dzienna ilość lotów w USA Ilość dni w roku na godzinę = 2,499,841,200 TB 6
Czym jest Big Data? 7
Definicje Big Data HP s definition: Big Data is a class of data challenges, due to increasing volume, velocity, variety, and complexity, that are beyond the capabilities of the traditional software, architecture, and processes to effectively manage and utilize. Gartner "Big Data" is a popular term generally used to acknowledge the exponential growth, availability and use of information in the data-rich landscape of the emerging information economy era. McKinsey Report Big Data refers to datasets whose size is beyond the ability of typical database software tools to capture, store, manage, and analyze. 8
Czy my możemy zdefiniować Big Data? 9
Czy my możemy zdefiniować Big Data? Czy mam problem z brakiem przestrzeni dyskowej? Czy umiem go zaadresować? Czy wyobrażam sobie/znam urządzenie które byłoby w stanie te potrzeby zaspokoić? Czy wyobrażam sobie przechowywanie zetabajtów danych? 10
Z czego ten Big DEAL? USTRUKTURYZOWANE DANE NIEUSTRUKTURYZOWANE DANE Analytical environment NIE ROZMAWIAJĄ ZE SOBĄ? Web content Audio i Video Telemetryka 11
Czy możemy połączyć zmysły? 12
Kto jest najbardziej zainteresowany? computer & electronic products 4% manufacturing real estate & rental information professional services wholesale trade utilities finance & insurance Historical Productivity Improvements 0% retail trade accommodation & food healthcare government Big data potential education - 3.5% construction 13 Source : McKinsey : Big Data The next frontier for innovation, competition and productivity,
Informacja - Wyzwania IT Wielkość, Szybkość, Różnorodność, Złożoność 90% Danych wytworzonych do 2015 roku będzie nieustrukturyzowana 75% aktualnie wdrożonych hurtowni danych nie będzie w stanie przechowywać danych nieustrukturyzowanych ze względu na różnorodność oraz złożoność 48% wzrost ilości danych w postaci cyfrowej rok do roku 86% firm nie jest w stanie dostarczyć odpowiednich informacji w odpowiednim czasie ¹Source: IDC Predictions 2012: Competing for 2020 ²Source: Gartner - The State of Data Warehousing in 2012 ¹Source: IDC Predictions 2012: Competing for 2020 ³Source: Coleman Parkes Survey Nov 2012 14
Informacja to nowa waluta w biznesie 15
Jak się odnaleźć? & 2.) Przetwarzać, wykorzystywać, udostępniać - ROI 1.) Gromadzić i przechowywać & 3.) Zabezpieczać & 16
1.) Gromadzić i przechowywać
2.) Przetwarzać
Social Media 360: Nascar Autonomy, with the power of its IDOL engine, takes fan data, collects, it stores, and stitches it together that helps us understand what is being talked about across the ecosystem of the sport. - Senior Director of IT, NASCAR 19
Klienci 360 : Marketing Personalizowany 20 20 Picture : GUESS
Sprzedaż 360 : Sieci handlowe 21 21 Picture : US Navy
Kradzież danych 360 : Instytucje Finansowe 22 22 Picture : US Navy
Bezpieczeństwo 360 23 23 Picture : Metropolitan Police, London
I wiele innych. 24
3.) Zabezpieczać
85% danych gromadzących dzisiaj to dane nieustrukturyzowane i w większości są niewykorzystywane. Dziękuje 85% 26