Informatyczne aspekty analityki danych

Podobne dokumenty
Działanie 2.3: Inwestycje związane z rozwojem infrastruktury informatycznej nauki

USŁUGI HIGH PERFORMANCE COMPUTING (HPC) DLA FIRM. Juliusz Pukacki,PCSS

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa i multimedia

PRZEDMIOTY REALIZOWANE W RAMACH KIERUNKU INFORMATYKA I STOPNIA STUDIA STACJONARNE

Szybkość instynktu i rozsądek rozumu$

Kierunek: Informatyka rev rev jrn Stacjonarny 1 / 6

Przetwarzanie i zabezpieczenie danych w zewnętrznym DATA CENTER

Laboratorium demonstrator bazowych technologii Przemysłu 4.0 przykład projektu utworzenia laboratorium przez KSSE i Politechnikę Śląską

Chmura prywatna i publiczna sposób na efektywniejsze wykorzystanie środowisk IT

Zagadnienia egzaminacyjne INFORMATYKA. stacjonarne. I-go stopnia. (INT) Inżynieria internetowa STOPIEŃ STUDIÓW TYP STUDIÓW SPECJALNOŚĆ

BIG DATA w SM WARSZAWA

Kierunek: Informatyka rev rev jrn Niestacjonarny 1 / 5

Cloud Computing wpływ na konkurencyjność przedsiębiorstw i gospodarkę Polski Bohdan Wyżnikiewicz

Nowe aplikacje i usługi w środowisku Grid

Aplikacja inteligentnego zarządzania energią w środowisku domowym jako usługa Internetu Przyszłości

Liczba godzin w semestrze II r o k. Nazwa modułu. PLAN STUDIÓW (poziom studiów) I STOPNIA studia (forma studiów) stacjonarne

Odniesienie do efektów kształcenia dla obszaru nauk EFEKTY KSZTAŁCENIA Symbol

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa

Zespół do spraw Transformacji Przemysłowej Departament Innowacji

Chmura nad Smart City. dr hab. Prof. US Aleksandra Monarcha - Matlak

Zagadnienia egzaminacyjne INFORMATYKA. Stacjonarne. I-go stopnia. (INT) Inżynieria internetowa STOPIEŃ STUDIÓW TYP STUDIÓW SPECJALNOŚĆ

RAMOWY PROGRAM STUDIÓW NA KIERUNKU INFORMATYKA STUDIA INŻYNIERSKIE SEMESTR: I

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

MAREK NIEZGÓDKA ICM, UNIWERSYTET WARSZAWSKI

Liczba godzin w semestrze II r o k. Nazwa modułu. PLAN STUDIÓW (poziom studiów) I STOPNIA studia (forma studiów) niestacjonarne

Izabela Zimoch Zenon Szlęk Biuro Badań i Rozwoju Technologicznego. Katowice, dnia r.

Kierunek Informatyka stosowana Studia stacjonarne Studia pierwszego stopnia

LIDERZY DATA SCIENCE CENTRUM TECHNOLOGII ICM CENTRUM TECHNOLOGII ICM ICM UW TO NAJNOWOCZEŚNIEJSZY OŚRODEK DATA SCIENCE W EUROPIE ŚRODKOWEJ.

Informatyka- studia I-go stopnia

Sygnity.City Otwarty Ekosystem Inteligentnych Miast

Instytut Informatyki, PWSZ w Nysie Kierunek: Informatyka Specjalność: Systemy i sieci komputerowe, SSK studia stacjonarne Rok 2012/2013

Liczba godzin w semestrze II r o k III r o k IV rok. Nazwa modułu

Wizja platformy ITS w koncepcji sieciocentrycznej. dr inż. Mikołaj Sobczak

5 Moduył do wyboru II *[zobacz opis poniżej] 4 Projektowanie i konfiguracja sieci komputerowych Z

Prezentacja Grupy Atende

STUDIA I MONOGRAFIE NR

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma studiów: Stacjonarne. audytoryjne. Wykład Ćwiczenia

Nazwa przedmiotu. Załącznik nr 1 do Uchwały nr 70/2016/2017 Rady Wydziału Elektrycznego Politechniki Częstochowskiej z dnia r.

TECHNOLOGICZNY OKRĄGŁY STÓŁ EKF MAPA WYZWAŃ DLA SEKTORA BANKOWEGO

Rok I, semestr I (zimowy) Liczba godzin

Projekt ElGrid a CO2. Krzysztof Kołodziejczyk Doradca Zarządu ds. sektora Utility

I rok. semestr 1 semestr 2 15 tyg. 15 tyg. Razem ECTS. laborat. semin. ECTS. konwer. wykł. I rok. w tym. Razem ECTS. laborat. semin. ECTS. konwer.

Model funkcjonowania MPTI

PLAN NIESTACJONARNYCH STUDIÓW PIERWSZEGO STOPNIA (INŻYNIERSKICH) NA KIERUNKU INFORMATYKA

Prezentacja Grupy Atende 2017

Jarosław Żeliński analityk biznesowy, projektant systemów

Małopolska Chmura Edukacyjna Projekt pilotażowy MRPO, działanie 1.2

Zarządzanie energetyką prosumencką wybrane zagadnienia

1 Programowanie urządzen mobilnych Sztuczna inteligencja i systemy 2 ekspertowe

Wstęp. Historia i przykłady przetwarzania współbieżnego, równoległego i rozproszonego. Przetwarzanie współbieżne, równoległe i rozproszone

Liczba godzin w semestrze Ogółem Semestr 1 Semestr 2 Semestr 3 E Z Sh W C L S P W C L S P ECTS W C L S P ECTS W C L S P ECTS W C L S P ECTS

Technologie IoT - Analityka Big Data IoT Big Data& Analytics

Nazwa przedmiotu. 1 Matematyka. 2 Fizyka. 3 Informatyka. 4 Rysunek techniczny. 12 Język angielski. 14 Podstawy elektroniki. 15 Architektura komputerów

Instytut Nauk Technicznych, PWSZ w Nysie Kierunek: Informatyka Specjalność: Systemy i sieci komputerowe, SSK studia niestacjonarne Dla rocznika:

Plan studiów dla kierunku:

Id: B28-41F7-A3EF-E67F59287B24. Projekt Strona 1

Architektura komputerów

Relacja zakresu nauk humanistyczno-społecznych z Krajową Inteligentną Specjalizacją

Kierunek: INFORMATYKA. Studia stacjonarne. Studia drugiego stopnia. Profil: ogólnoakademicki

Matryca pokrycia efektów kształcenia. Efekty kształcenia w zakresie wiedzy (cz. I)

Spis treści. Wstęp... 11

Cechy e-usługi i e-firmy. Elastyczność i niezawodność. Jak się przygotować na zmiany?

Oracle Log Analytics Cloud Service

Przetwarzanie danych w chmurze

Systemy rozproszone. na użytkownikach systemu rozproszonego wrażenie pojedynczego i zintegrowanego systemu.

Plan studiów dla kierunku:

PLAN STUDIÓW. efekty kształcenia

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

LISTA KURSÓW PLANOWANYCH DO URUCHOMIENIA W SEMESTRZE ZIMOWYM 2015/2016

Zastosowanie chmury obliczeniowej w diagnostyce dróg

Tematy prac dyplomowych w roku akademickim 2012/2013 zgłoszone w Zakładzie Systemów Rozproszonych

Instytut Systemów Elektronicznych. Specjalność Systemy Informacyjno-Pomiarowe

Wsparcie dla działań na rzecz poprawy efektywności energetycznej ze strony systemów informatycznych

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa, Inżynieria oprogramowania, Technologie internetowe

KIERUNKOWE EFEKTY KSZTAŁCENIA

Obliczenia równoległe i rozproszone. Praca zbiorowa pod redakcją Andrzeja Karbowskiego i Ewy Niewiadomskiej-Szynkiewicz

Skalowalna Platforma dla eksperymentów dużej skali typu Data Farming z wykorzystaniem środowisk organizacyjnie rozproszonych

Transformacja wiedzy w budowie i eksploatacji maszyn

Droga do Industry 4.0. siemens.com/tia

WYKAZ PRZEDMIOTÓW I PLAN REALIZACJI

SMART OFFICE - NOWOCZESNE PODEJŚCIE DO FUNKCJONOWANIA FIRMY

ZAMAWIAJĄCY. CONCEPTO Sp. z o.o.

Automatyka i Robotyka, studia II stopnia (profil ogólnoakademicki)

" # # Problemy budowy bezpiecznej i niezawodnej globalnej sieci szerokopasmowej dla słub odpowiadajcych za bezpieczestwo publiczne

KIERUNKOWE EFEKTY KSZTAŁCENIA

Grafika i Systemy Multimedialne (IGM)

Systemy Optymalizacji Oświetlenia Zewnętrznego Kontekst Informatyczny. Dr hab. Leszek Kotulski, prof. AGH Dr Adam Sędziwy KIS WEAIiIB AGH

Zatwierdzono na Radzie Wydziału w dniu 11 czerwca 2015 r.

INFORMATYKA. PLAN STUDIÓW STACJONARNYCH INŻYNIERSKICH 2-go STOPNIA STUDIA ROZPOCZYNAJĄCE SIĘ W ROKU AKADEMICKIM 2018/19.

Matryca pokrycia efektów kształcenia

TOK STUDIÓW Kierunek: informatyka rok studiów: I studia stacjonarne pierwszego stopnia, rok akademicki 2014/2015. Forma zaliczen ia. egz. lab.

Lista rankingowa/suplement/korekta* Dla projektów o wartości wydatków kwalifikowanych co najmniej 15 mln PLN

Numeron. System ienergia

Podpis elektroniczny dla firm jako bezpieczna usługa w chmurze. mgr inż. Artur Grygoruk

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

Nowe technologie w szkole jako podstawa oddolnych działań: edukacyjna szansa czy szkodliwy gadżet?

Transformacja systemu komunikacji naukowej Otwarta Nauka: 2018+

Instytut Nauk Technicznych, PWSZ w Nysie Kierunek: Informatyka Specjalność: Systemy internetowe, SI studia stacjonarne Dla rocznika: 2018/2019

Zarządzanie informacją i wiedzą w usługach o podwyŝszonym poziomie bezpieczeństwa. Poznań,

Kierunek: Inżynieria Obliczeniowa Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

Transkrypt:

Informatyczne aspekty analityki danych Marek Niezgódka Centrum Cyfrowej Nauki i Technologii UKSW (Centrum CNT) marekn@uksw.edu.pl IX Konferencja Bezpieczeństwo w Internecie, Analityka Danych, UKSW, 6.06.2019

Dylematy Ile razy można? Każdorazowo trzeba byłoby wskazać znaczenie działań regulacyjnych oraz konsekwencji prawnych użycia 2

Dylematów ciąg dalszy Rola analityki danych i, szerzej, Data Science (nauk o danych) w rozwoju: gospodarki cyfrowej i cyfrowego zarządzania w szczególności w Internecie Rzeczy Big Data Miejsce sztucznej inteligencji, czy raczej uczenia maszynowego Sieci, również 5G, a także chmur, jako cudownych rozwiązań uniwersalnych Ale 3

Kategorie wielkich danych Big Data to zbiory niemożliwe do efektywnego przetwarzania przez tradycyjne architektury informatyczne (komputerowe, software owe i komunikacyjne) (Volume) Nie sama wielka objętość danych, ale również: Liczność i różnorodność źródeł (Variety) Dark Data Intensywność (szybkość) dopływu (Velocity): Fast Data Wysoka zmienność (Variability) Główne wyzwanie technologiczne i logistyczne: skalowalność 4

Kategoryzacja dużych danych, cd. Szybkie dane: Podstawowe znaczenie dla racjonalizacji sieciowych systemów energetycznych Ciemne dane: nieustrukturyzowane dane, m.in. strumieniowe multimedialne: Ponad 80% wszystkich danych w sieci Spośród ponad 250M kamer monitoringu na świecie ok. 20% jest w sieci, 2% jest archiwizowane Utracone dane: Sensory w instalacjach technologicznych: Rejestracja jedynie wewnątrzsystemowa (często zaledwie 1% danych używanych w procesach decyzyjnych) Nowe dane: Dane z nowych, nieharwestowanych źródeł Ref.: Forbes, Gartner, McKinsey 5

Obszary analityki danych Diagnostic analytics Descriptive analytics Predictive analytics Outcome analytics - podporządkowana efektom wynikowym Prescriptive analytics integrująca analizę i syntezę w formie nasycania danymi modeli matematycznych wspomagających procesy decyzyjne 6

Wyzwanie: nowe modele przetwarzania danych Systemy rozproszone i systemy masywnie zrównoleglone: Komputerowe architektury hybrydowe i konsekwencje ich zastosowania: Problem kwalifikacji precyzji i powtarzalności wyników Niedeterministyczne modele zarządzania danymi Rozproszone systemy hierarchiczne: Paradygmaty przetwarzania krawędziowego (edge computing) i mgłowego (fog computing) 7

Meandry rozwoju modeli przetwarzania Do 1970: Model scentralizowany - stacjonarny: - Komputery klasy Mainframe Do 2005: Model rozproszony: Klient Serwer (do 2000) Modele Gridowe (do 2005) Do 2020: Chmura Od 2020: Edge computing Fog computing Model scentralizowany - mobilny: Modele rozproszone - inteligentne: 8

Granice technologii obliczeniowych, 2019 Chiny: 3 exaskalowe systemy prototypowe, od 2018 USA: w pełni exaskalowy system: Cray Shasta at ANL, 2020 ($500M) Pierwszy zintegrowany komputer kwantowy - IBM Q System One, 2019 Europa: akcje (głównie) polityczne Krytyczne problemy: efektywność energetyczna, dostępność zlokalizowanego zasilania skalowalność komputerowych systemów komunikacji wewnętrznej 9

Implikacje dla infrastruktur cyfrowych Fascynacja chmurami zbliża się do szybszego końca niż przewidywano Iluzja możliwości delegowania kompetencji do chmury gaśnie Technologie typu Blockchain przystępują do ofensywy we mgle jako bezpieczne protokoły transferu danych 10

Infrastruktury cyfrowe: Edge Computing Koncepcja modelowa: rozproszona architektura zasobów serwerowych realizująca przetwarzanie danych jak najbliżej ich źródeł (na obrzeżach sieci at edges) Motywacja: Inteligentna sensoryka Sieci mobilne, bezzałogowa akwizycja danych (np. drony) Internet Rzeczy i jego mutacje Rozszerzony zakres analityki dużych danych (szczególnie, szybkich danych - Fast data) Aplikacje czasu rzeczywistego 11

Przejście od cloud computing do fog computing: schemat ideowy 12

Fog computing Standard implementacyjny dla Edge Computing Zdecentralizowany model, realizujący inteligentne rozpraszanie procesów przetwarzania danych, ich przechowywania i realizacji aplikacji do zoptymalizowanych lokalizacji sieciowych na krawędziach sieci (edges) Transfer danych: protokoły blockchain u Pierwsze referencje: CISCO, 2012 Wstępna specyfikacja: NIST, listopad 2017 NIST Special Publication 500-325: Fog Computing Conceptual Model, Recommendations of the National Institute of Standards and Technology, March 2018 13

Atrybuty edge i fog computing Zwiększone bezpieczeństwo Wyższy poziom prywatności Zwiększona odporność na ataki Ograniczenie ruchu w sieci Niższa latencja (możliwość synchronizacji przetwarzania) A ponadto: Sumarycznie niższy poziom kosztów od klasycznej chmury Elastyczność i ograniczenie uzależnienia od podmiotów zewnętrznych 14

Referencje aplikacyjne 15

Elektryczne smart grid y: ilustracja (ref.:https://sites.suffolk.edu/cdohertycrestin/2015/09/18/americas-energy-grid/ ) 16

Smart grid y: różnorodność problemów (ref.: General Electric Inc.) 17

Inteligentne sieci energetyczne: wyzwania analityczne Fast data o wielkiej objętości (zbierane w trybie czasu rzeczywistego przez rozproszone zdalne systemy sensoryczne) Sterowanie procesami w czasie rzeczywistym Predykcyjna użyteczność modeli i ich stosowalność w warunkach operacyjnych krytycznych czasowo: precyzja rozdzielczość skalowalność odporność 18

Komputery i medycyna Od medycyny precyzyjnej (spersonalizowanej) patient specific data analysis method / translation mathematical description reasoning method Modelowanie matematyczne, analiza danych, obliczenia personalized diagnosis/treatment do analizy populacyjnej patient specific data analysis method / translation mathematical description patient specific data analysis method / translation mathematical description patient specific data analysis method / translation mathematical description reasoning method reasoning method reasoning method personalized diagnosis/treatment personalized diagnosis/treatment personalized diagnosis/treatment reasoning method i wstecz population characteristics 19

Inteligentne systemy geofizyczne Odniesienia: Naturalne zasoby geofizyczne: eksploatacja Systemy geo-energetyczne: zasoby odnawialne Remediacja struktur geofizycznych Atrybuty złożoności: Natura wieloskalowa Agregacja efektów nieliniowych Niepewność danych spowodowana przez: nieprecyzyjność, niekompletność i możliwa niespójność Złożona struktura geometryczna 20

Standardy: znaczenie harmonizacji Przyszłość: standardy otwarte Standard jest Otwarty, jeżeli w szczególności jest: biznesowo neutralny, tzn. jest zarządzany przez szeroko akceptowaną organizację non-profit, dostępny równoprawnie dla wszelkich zainteresowanych stron, z nieograniczonym prawem wtórnego użycia, jego dokumentacja i związane z nim zasoby są dostępne bezkosztowo lub co najwyżej po kosztach nominalnych. W odniesieniu do oprogramowania, specyfikacja Standardu Otwartego może być dostępna na zasadzie jednej z licencji otwartych (Open Source albo Libre). 21

Standardy: znaczenie otwartości Zalety stosowania Standardów Otwartych: interoperacyjność, niezależną od stosowanego oprogramowania i sprzętu, zarówno na poziomie wymiany danych, integracji modułów przetwarzania, jak łączenia układów wykonawczych, integralność i trwałą odtwarzalność zasobów danych, co jest szczególnie ważne dla ich długookresowej archiwizacji, możliwość swobodnej wymiany składowych oprogramowania, co ułatwia optymalizację procesów przetwarzania, brak ograniczeń współpracy różnych podmiotów, także reprezentujących inne sektory i mających rozłączne cele działania. Podstawa Otwartej Innowacyjności, priorytetu IX Programu Ramowego Unii Europejskiej: Horyzont Europa 22

Centralna rola modelowania bazującego na danych Źródła danych różnorodne narzędzia akwizycji danych i podejścia wielomodalne: wysokorozdzielcze sensory eksperymenty przesiewowe Wyjścia wielkoskalowych symulacji komputerowych Wyzwania asymilacji danych dla potrzeb modelowania matematycznego: parametryzacja i kalibracja 23

Marek Niezgódka marekn@uksw.edu.pl 24

25