Gorączka danych czas pionierów!

Podobne dokumenty
z kapitałem polskim Zatrudnienie 1 10 osób osób 2,27% osób 11,36% osób osób powyżej osób 20,45% 50,00% 13,64%

Szybkość instynktu i rozsądek rozumu$

Internet wszechrzeczy W KIERUNKU REALLY BIG DATA

Projektowanie informatycznych systemów zarządzania produkcją

One Size Doesn t Fit All, czyli case study stworzenia BI dostosowanego do strategicznych, operacyjnych oraz analitycznych potrzeb

Internet Rzeczy w Smart Cities. prof. dr hab. inż. Cezary Orłowski IBM Centre for Advanced Studies Wyższa Szkoła Bankowa w Gdańsku

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Kształcenie na poziomie akademickim w świecie technologii i powszechnego dostępu do informacji

Projekt SIMMO. System for Intelligent Maritime MOnitoring

Prezentacja Grupy Atende

Big Data MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE ORAZ NA SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE. Agenda


Prezentacja Grupy Atende 2017

dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych

Scoring w oparciu o Big Data. 8 kwietnia 2014 roku

Szkolenia SAS Cennik i kalendarz 2017

Wykorzystanie wieloagentowych systemów w optymalizacji operacji łańcucha dostaw

Chmura prywatna i publiczna sposób na efektywniejsze wykorzystanie środowisk IT

BigData rewolucja czy ewolucja w świecie rozwiązań analityki biznesowej. Grzegorz Oleś Big Data Sales Executive

Wykrywanie potencjalnych zagrożeń w ruchu morskim na podstawie danych AIS. Milena Stróżyna, Witold Abramowicz

Industry 4.0. Kolejny etap rozwoju epoki przemysłowej

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Problemy i wyzwania analizy obszaru ICT

Relacja zakresu nauk humanistyczno-społecznych z Krajową Inteligentną Specjalizacją

Jan Kleczkowski Academic Program Manager

Model funkcjonowania MPTI

PRZEWODNIK PO PRZEDMIOCIE. stacjonarne. I stopnia III. Leszek Ziora, Tomasz Turek. ogólnoakademicki. kierunkowy

Rozwiązania kognitywne to nie tylko software...

PRZEŁOMOWA INNOWACJA CYFROWA KLUCZ DO SPECJALIZACJI PRZEMYSŁOWEJ ISTOTA ROZWOJU CYFROWEGO INFRASTRUKTURY I PRZEMYSŁU

IBM DATASTAGE COMPETENCE CENTER

Jakich liderów i jakich technologii potrzebuje biznes w dobie cyfrowej transformacji?

CO MOZ NA WYCISNA C Z SAMOOBSŁUGI CZYLI SPRZEDAZ W KANAŁACH SELF CARE? Bartosz Szkudlarek

Przemysł co jest do zrobienia? Prof. dr hab. Wojciech Paprocki Katedra Transportu Warszawa, 28 czerwca 2017 r.

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski

Przetwarzanie i zabezpieczenie danych w zewnętrznym DATA CENTER

PRZEDSIĘWZIĘCIA MORSKIE W KRAJOWYM PROGRAMIE KOSMICZNYM

BIG DATA w SM WARSZAWA

Matryca pokrycia efektów kształcenia. Efekty kształcenia w zakresie wiedzy (cz. I)

Bazy danych na co dzień

1.1 Matryca pokrycia efektów kształcenia. Efekty kształcenia w zakresie wiedzy. Efekty kształcenia w zakresie umiejętności

Wstęp Technologie informacyjne wpływające na doskonalenie przedsiębiorstwa

Dolnośląskie Inteligentne Specjalizacje gdzie jesteśmy? Agata Zemska Dyrektor Wydziału Gospodarki Urząd Marszałkowski Województwa Dolnośląskiego

Oferta dla firm ROZWIĄZANIA DLA BIZNESU I MARKETINGU

SMART OFFICE - NOWOCZESNE PODEJŚCIE DO FUNKCJONOWANIA FIRMY

SAMOCHÓD ELEKTRYCZNY EFEKT EWOLUCJI I REWOLUCJI ODPOWIEDŹ NA POTRZEBY - REALIZACJA MOŻLIWOŚCI

Laboratorium demonstrator bazowych technologii Przemysłu 4.0 przykład projektu utworzenia laboratorium przez KSSE i Politechnikę Śląską

WYDZIAŁ NAUK EKONOMICZNYCH. rekrutacja 2018/2019

Projekt ElGrid a CO2. Krzysztof Kołodziejczyk Doradca Zarządu ds. sektora Utility

Analityka i BigData w służbie cyberbezpieczeństa

Kim jesteśmy Co robimy Nasza oferta Doświadczenie Klienci Kontakt SPIS TREŚCI

BIOGOSPODARKA. Inteligentna specjalizacja w Województwie Zachodniopomorskim SZCZECIN 20 \06 \ 2013

Lista przedmiotów przewidzianych do uruchomienia w semestrze zimowym 2017/2018 na studiach niestacjonarnych sobotnio-niedzielnych Sygnatura

UCHWAŁA NR 50 Senatu Zachodniopomorskiego Uniwersytetu Technologicznego w Szczecinie z dnia 28 maja 2012 r.

Kierunki REKRUTACJA 2017/2018 WYDZIAŁ NAUK EKONOMICZNYCH EKONOMIA ZARZĄDZANIE ZARZĄDZANIE I INŻYNIERIA PRODUKCJI. Nowa oferta specjalności!!!

Industry 4.0. Costs. Virtual. Networking. Internet of Things. Electrification Innovation Cyber physical systems

Analityka danych w środowisku Hadoop. Piotr Czarnas, 5 czerwca 2017

Nowe trendy w analizie danych

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Archiwum Cyfrowe jako usługa w modelu Cloud Computing

Antyk w kulturze popularnej

BUDOWANIE RELACJI Z KLIENTEM NARZĘDZIA KOMUNIKACJI

6 Metody badania i modele rozwoju organizacji

Informatyczne wspomaganie decyzji logistycznych

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2018/2019

Nowe, super ciekawe specjalizacje dla studentów PJWSTK

Wprowadzenie do Hurtowni Danych

Polska Platforma Medyczna: portal zarządzania wiedzą i potencjałem badawczym projekt bibliotek medycznych

Digitize Your Business

Uslugi chmurowe dla nauki na podstawie BonFIRE

Działanie 2.3: Inwestycje związane z rozwojem infrastruktury informatycznej nauki

Wydział Inżynierii Produkcji i Logistyki Faculty of Production Engineering and Logistics

Big data. a regulacje prawne. Dr Arwid Mednis, radca prawny 26 listopada 2014 r.

Trendy BI z perspektywy. marketingu internetowego

Zespół do spraw Transformacji Przemysłowej Departament Innowacji

14 LISTOPADA Analizy GIS w biznesie Imagis S.A.

Obszary badawcze w projekcie Ekonomia w obliczu Nowej Gospodarki

Id: B28-41F7-A3EF-E67F59287B24. Projekt Strona 1

Minima programowe - WYDZIAŁ NAUK EKONOMICZNYCH UW

epolska XX lat później Daniel Grabski Paweł Walczak

Platforma Cognos. Agata Tyma CMMS Department Marketing & Sales Specialist atyma@aiut.com.pl AIUT Sp. z o. o.

PLANY I PROGRAMY STUDIÓW

Kierunek EKONOMIA WYDZIAŁ NAUK EKONOMICZNYCH. rekrutacja 2017/2018

PLAN STUDIÓW. stacjonarnych, drugiego stopnia. Obowiązuje studentów rozpoczynających kształcenie w roku akademickim 2012/2013

Samodzielny Business Intelligence in memory duże i małe. Paweł Gajda Business Solution Architect

AKADEMIA MORSKA W GDYNI Kierunek: Innowacyjna Gospodarka Wydział Przedsiębiorczości i Towaroznawstwa Specjalność: Internet w Transporcie i Handlu

TRANSFER WIEDZY I TECHNOLOGII W BEZPIECZEŃSTWIE IT

Wybierz specjalność. dla siebie. ezit.ue.wroc.pl

dr inż. Maciej Kiewra Prezentacja wygłoszona na konferencji BI vs Big Data podczas Kongresu GigaCon Warszawa, r.

Asseco HOME: obniżenie kosztów operacyjnych telekomów dzięki rozwiązaniu Big Data.

PLANY STUDIÓW II 0 NIESTACJONARNYCH 4 SEMESTRY 720 godz punktów ECTS I ROK STUDIÓW ( od roku akademickiego 2012/2013) studia 2 letnie

Załącznik 2. Macierz pokrycia kierunkowych efektów kształcenia przez efekty przedmiotowe Strona 1

Kierunki REKRUTACJA 2019/2020 WYDZIAŁ NAUK EKONOMICZNYCH EKONOMIA ZARZĄDZANIE ZARZĄDZANIE I INŻYNIERIA PRODUKCJI

Załącznik 2. Macierz pokrycia kierunkowych efektów kształcenia przez efekty przedmiotowe Strona 1

Comarch: Profil firmy 2008

Efekty kształcenia dla kierunku Ekonomia stopnia II

Kierunek: Informatyka Społeczna Poziom studiów: Studia I stopnia Forma studiów: Stacjonarne. audytoryjne. Wykład Ćwiczenia

OPIS ZAKŁADANYCH EFEKTÓW KSZTAŁCENIA DLA KIERUNKU STUDIÓW: ZINTEGROWANE PLANOWANIE ROZWOJU

PureSystems zautomatyzowane środowisko aplikacyjne. Emilia Smółko Software IT Architect

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

Transkrypt:

Gorączka danych czas pionierów! Witold@Abramowicz.pl

Lilith (1977 1984) ETH 128 kb RAM 5 MB dysk Konkurencja Apple II max 48 kb (1977) IBM PC premiera 12. 8.1981 2

ATHENE SDI System ETH Filtrowanie informacji na podstawie profili użytkowników wyrażających stałe potrzeby informacyjne Cel dostarczanie opisów bibliograficznych natychmiast po opublikowaniu Volume 2MB brak sieci dane na taśmach magnetycznych! Konkurencja: drukowanie fiszek z opisami bibliograficznymi 3

Hipergrafowy model hipertekstu 90 HUB Modelowanie dokumentów i powiązań pomiędzy nimi w sieciach komputerowych hipergraf Volume wszystkie dokumenty dostępne w sieci Variety niestrukturalizowane teksty Konkurencja: 12.11.1991 opublikowanie projektu WWW prostota! Źródło przykładowego hipergrafu http://people.cs.uchicago.edu/~xiaofei/research.html 4

Filtrowanie informacji z Sieci zasilające hurtownie danych 2002 System transakcyjny zasilający hurtownie danych analizy mikroekonomiczne Profil hurtowni podstawą do filtrowania informacji wzbogacających dane w hurtowni analizy makroekonomiczne Volume wybrane źródła dostępne w Sieci Variety dane strukturalizowane i niestrukturalizowane 5

Początek wieku rok 2001 Nagroda Nobla Joseph E. Stiglitz asymetria informacji Jakość podejmowanych decyzji Przesyt informacyjny Ilość informacji 6

Początek wieku Sukces informatyki ekonomicznej dziedziny badań naukowych, kształcenia akademickiego oraz praktyki gospodarczej, wyodrębnionej z informatyki i poświęconej metodyce i pragmatyce zastosowania w ekonomii środków i narzędzi techniki komputerowej. ekonomia informatyka matematyka

Początek wieku rok 2003 Sukces informatyki ekonomicznej Nagroda Nobla Daniel Kahneman ekonomia behawioralna Adam Smith Teoria uczuć moralnych Jeremy Bentham (1748-1832) decyzje ekonomiczne wynikają z uwarunkowań psychologicznych: homo oeconomicus człowiek podejmujący racjonalne ekonomiczne decyzje, zawsze mający na względzie interes własny John Maynard Keynes i Laszlo Garai (XX wiek) wpływ zdarzeń przypadkowych i nawyków konsumentów na ich decyzje Daniel Kahneman i Amos Tversky - Analiza podejmowania decyzji w sytuacji zagrożenia (1979) Herbert Simon - Ograniczona racjonalność (1980)

Początek wieku Prawo Kryder s Law of Mass Digital Storage wolumen gromadzonych danych podwaja się co roku czynniki sprzyjające Prawo Moore a Moc obliczeniowa komputerów podwaja się co 18 miesięcy (teraz częściej twierdzi się: co 24 miesiące) Podobna relacja stosunku mocy obliczeniowej (pamięci) do jej kosztu Prawo Metcalfe a użyteczność systemu teleinformatycznego rośnie proporcjonalnie do kwadratu liczby podłączonych użytkowników

Filtrowanie informacji rok 2008 Uwarunkowanie Gwałtowny wzrost wolumenu informacji, którymi można się wymieniać zwiększając ich wartość Podejmowanie decyzji w warunkach asymetrii informacji i jej nadmiaru Ekonomia behawioralna warunkowana egoistyczną racjonalnością oraz zależna od przypadkowości i sytuacji wyjątkowych 10

Filtrowanie informacji rok 2008 Filtrowanie a wyszukiwanie Volume Internet płytki a głęboki Variety informacja hetorogenna analizowana syntaktycznie w nadziei poprawności semantycznej 11

Big Data = 1xV: Volume Niedawno Athene 2MB Hipergrafy < 100 GB Dzisiaj Każdej minuty 1 W Google 2 mln. zapytań 30 godzin nowych filmów na YouTube 204 mln. nowych e-mails 10 000 tweets Google dziennie 24 PB CERN 70 PB danych naukowych W historii ludzkości wypowiedziano 42 ZB 1megabajt 10 6 bajtów 1 gigabajt 10 9 bajtów 1 terabajt 10 12 bajtów 1 petabajt 10 15 bajtów 1 eksabajt 10 18 bajtów 1 zettabajt 10 21 bajtów UE próbuje określić wielkość Big Data BIG DATA << Internet 1 S. Fischer, Big Data: Herausforderungen Informatik Spetrum 2/2014 12

Źródła Big Data % firm zainteresowanych http://www.silicon.de/41599384/pac-und-barc-dach-cxp-group/ 13

Źródła Big Data Linked Open Data 2007 14

Źródła Big Data Linked Open Data 15

Projekt LOD 2 16

Big Data = 2xV: Variety Kryterium struktury Strukturalizowane Semistrukturalizowane Niestrukturalizowane Kryterium zasobu Płytki a głęboki Internet Różnorodność źródeł Repozytoria a strumienie 17

Big Data = 3xV: Veracity Data Quality Spójność meta danych Prawdziwość Aktualność Wiarygodność Obiektywność a subiektywność Użyteczność i relewancja Kognitywna Lokalizacyjna Czasowa Interpersonalna Ekonomiczna Technologiczna 18

Big Data = 3xV: Veracity Data Quality Spójność meta danych Prawdziwość Aktualność Wiarygodność Obiektywność a subiektywność Użyteczność i relewancja Kognitywna Lokalizacyjna Czasowa Interpersonalna Ekonomiczna Technologiczna Dane a powiązania pomiędzy danymi Atrybuty powiązań podobne do atrybutów danych Jakość danych a jakość źródeł danych Atrybuty źródeł podobne do atrybutów danych Częściowe dziedziczenie atrybutów danych od atrybutów źródeł Pamiętanie źródeł danych Wiedzieć a móc wiedzieć a móc wykorzystać 19

Big Data = 4xV: Velocity Zmienność w czasie atrybutów źródeł, danych i ich powiązań, np. relewancji Strumienie a zdolność do szybkości analizy Analiza prawie w czasie rzeczywistym Analiza w czasie rzeczywistym Analiza syntaktyczna a semantyczna Dane zasobem stałym ale skalowalnym (Prawo Kryder s Law of Mass Digital Storage) cel analizy chyży zakres analizowanych danych chyży zdolność do koncentracji na analizie danych istotnych 20

Projekt EGO identyfikacja tożsamości 21

Big Data = 4xV: Velocity Zmienność w czasie atrybutów źródeł, danych i ich powiązań, np. relewancji Strumienie a zdolność do szybkości analizy Analiza prawie w czasie rzeczywistym Analiza w czasie rzeczywistym Analiza syntaktyczna a semantyczna Dane zasobem stałym ale skalowalnym (Prawo Kryder s Law of Mass Digital Storage) cel analizy chyży zakres analizowanych danych chyży zdolność do koncentracji na analizie danych istotnych 22

SIMMO System for Intelligent Maritime Monitoring Dane o ruchach statków na oceanach i morzach > 100 tys. obiektów wzbogacające z baz danych z Internetu Cele zmieniające się w zależności od analizy danych identyfikacja nowych, nieznanych źródeł danych identyfikacja nowych, nieznanych przedmiotów analizy sytuacji gospodarczej i politycznej 23

Big Data = 4xV: Velocity wyzwania Gromadzenie, np. cloud, i przetwarzanie, np. in-memory computing Danych Powiązań pomiędzy danymi Ochrona danych i prywatności podmiotów, których dotyczą dane Bezpieczeństwo danych właściciela Big Data przetwarzającego np. w cloud Udostępnienie i wizualizacja Wykorzystanie w procesach biznesowych Wydzielenie z Big Data Smart Data 24

Projekt usługi masowe intensywność kontaktów pomiędzy klientami wykrywanie influencer 25

Big Data = 4xV: Velocity wyzwania Gromadzenie, np. cloud, i przetwarzanie, np. in-memory computing Danych Powiązań pomiędzy danymi Ochrona danych i prywatności podmiotów, których dotyczą dane Bezpieczeństwo danych właściciela Big Data przetwarzającego np. w cloud Udostępnienie i wizualizacja Wykorzystanie w procesach biznesowych Wydzielenie z Big Data Smart Data 26

Energetyka BIG DATA Przykłady naszych projektów w HPI Future SOC Lab (Lipsk) Quasi Real-Time Individual Customer Based Forecasting of Energy Load Demand Using In Memory Computing Forecasting of Energy Load Demand and Energy Production from Renewable Sources using In-Memory Computing Prototype of an In-Memory Business Intelligence Solution for the Support of Forecasting of Energy Load Demand Infrastruktura HPI Future SOC Lab Sponsoring EMC, Fujitsu, HPI, SAP Np. maszyna z 6 GB 1000 rdzeniowej pamięci Europejskie projekty badawcze SAP HANA Jedyny polski partner 27

Energetyka wyniki Big Data Prognozowanie produkcji ze źródeł odnawialnych Energia wiatrowa Energia solarna Prognozowanie zachowania prosumentów Analiza informacji z danych społecznościowych Smart Data Smart Grid Prognozowanie zachowania prosumentów w zakresie Produkcji energii ze źródeł odnawialnych Konsumpcji energii Rekomendacje racjonalnych zachowań prosumentów Przesłanki do negocjacji dostaw i zakupów energii przez Smart Grid Rozproszony Smart Grid, odległe od siebie np. sklepy i punkty usługowe, siedziby banków i TW, stacje benzynowe 28

Interaktywne określanie profili prosumentów 29

Świat jest Smart (Data) Przykład niemieckiego Federalnego Ministerstwa Gospodarki i Technologii obszary Przemysł Energia Mobilność Zdrowie 30

Big Data = 4xV: Velocity wyzwania Internet Rzeczy komunikacja człowiek rzeczy rzeczy rzeczy Zastosowania Industry 4.0, np. elastyczne systemy produkcyjne, zdrowie maszyn Logistyka, np. RFID 31

Obiecujące obszary zastosowań Energetyka utilities Analiza mediów społecznościowych, np. racjonalizacja mix marketing, identyfikacja relacji interpersonalnych, np. influencer marketing Bezpieczeństwo cyberprzestrzeni, np. fraud detection and prevention Medycyna spersonalizowana Zarządzanie cyklem życia produktów i usług, np. motoryzacja, ubezpieczenia, energetyka, ale także produkty kupowane ciągle środki farmaceutyczne, nawozy 32

Semantyczny Monitoring Cyberprzestrzeni Energetyka utilities Analiza mediów społecznościowych, np. racjonalizacja mix marketing, identyfikacja relacji interpersonalnych Bezpieczeństwo cyberprzestrzeni, np. fraud detection and prevention Medycyna spersonalizowana Zarządzanie cyklem życia produktów i usług, np. motoryzacja, ubezpieczenia, energetyka, ale także produkty kupowane ciągle środki farmaceutyczne, nawozy Center for Strategic and International Studies - Cyberprzestępczość kosztuje globalną gospodarkę około o 445 mld USD rocznie 1 1 http://csis.org/ 33

Semantyczny Monitoring Cyberprzestrzeni 34

Semantyczny Monitoring Cyberprzestrzeni 35

Gorączka danych czas pionierów! Witold@Abramowicz.pl