Jak Big Data rewolucjonizuje naukę oraz współpracę centrów badawczych z biznesem?



Podobne dokumenty
LIDERZY DATA SCIENCE CENTRUM TECHNOLOGII ICM CENTRUM TECHNOLOGII ICM ICM UW TO NAJNOWOCZEŚNIEJSZY OŚRODEK DATA SCIENCE W EUROPIE ŚRODKOWEJ.

Działanie 2.3: Inwestycje związane z rozwojem infrastruktury informatycznej nauki

Program Obliczeń Wielkich Wyzwań Nauki i Techniki (POWIEW)

Kierunek Informatyka stosowana Studia stacjonarne Studia pierwszego stopnia

INŻYNIERIA ZARZADZANIA,

Kierunek: Inżynieria i Analiza Danych Poziom studiów: Studia I stopnia Forma studiów: Stacjonarne. audytoryjne. Wykład Ćwiczenia

S PECJALNO S C I NTELIGENTNE S YSTEMY D ECYZYJNE


ZAJĘCIA ORGANIZACYJNE WSTĘP DO BIOINFORMATYKI

Zatwierdzono na Radzie Wydziału w dniu 11 czerwca 2015 r.

Plan studiów stacjonarnych pierwszego stopnia Kierunek: ANALITYKA I BADANIA EKONOMICZNE A. Moduły międzykierunkowe obligatoryjne

Polska Platforma Medyczna: portal zarządzania wiedzą i potencjałem badawczym projekt bibliotek medycznych

Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach PROGRAM KSZTAŁCENIA. Studia III stopnia (doktoranckie) kierunek Informatyka

Dwuletnie studia indywidualne II stopnia na kierunku fizyka, specjalność Metody fizyki w ekonomii (ekonofizyka)

Relacja zakresu nauk humanistyczno-społecznych z Krajową Inteligentną Specjalizacją

PODSTAWY BIOINFORMATYKI ORGANIZACJA ZAJĘĆ BIOINFORMATYKA PRZETWARZANIE I ANALIZA DANYCH

INFORMATYKA PLAN STUDIÓW NIESTACJONARNYCH 2-GO STOPNIA (W UKŁADZIE ROCZNYM) STUDIA ROZPOCZYNAJĄCE SIĘ W ROKU AKADEMICKIM 2015/16

RepOD Repozytorium Otwartych Danych Badawczych

"Zapisane w genach, czyli Python a tajemnice naszego genomu."

Kierownik Katedry: Prof. dr hab. inż. Tadeusz BURCZYŃSKI

15 tyg. 15 tyg. w tym laborat. ECTS. laborat. semin. semin. ćwicz. ćwicz. wykł. ECTS. w tym laborat. 15 tyg. ECTS. laborat. semin. semin. ćwicz.

ZASTOSOWANIA FIZYKI W BIOLOGII I MEDYCYNIE Specjalność: Projektowanie molekularne i bioinformatyka. 2-letnie studia II stopnia (magisterskie)

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa

Informatyka w medycynie Punkt widzenia kardiologa

1.1 Matryca pokrycia efektów kształcenia. Efekty kształcenia w zakresie wiedzy. Efekty kształcenia w zakresie umiejętności

Liczba godzin w semestrze Ogółem Semestr 1 Semestr 2 Semestr 3 E Z Sh W C L S P W C L S P ECTS W C L S P ECTS W C L S P ECTS W C L S P ECTS

ZASTOSOWANIA FIZYKI W BIOLOGII I MEDYCYNIE Specjalność: Biofizyka molekularna. 2-letnie studia II stopnia (magisterskie)

Plan studiów niestacjonarnych pierwszego stopnia Kierunek: ANALITYKA I BADANIA EKONOMICZNE A. Moduły międzykierunkowe obligatoryjne

STUDIA PODYPLOMOWE. Analiza i Eksploracja Danych Rynkowych i Marketingowych. Podstawa prawna

Repetytorium z matematyki 3,0 1,0 3,0 3,0. Analiza matematyczna 1 4,0 2,0 4,0 2,0. Analiza matematyczna 2 6,0 2,0 6,0 2,0

WSKAŹNIKI ILOŚCIOWE - Punkty ECTS w ramach zajęć: Efekty kształcenia. Wiedza Umiejętności Kompetencje społeczne (symbole) MK_1. Analiza matematyczna

Plan studiów dla kierunku:

INFORMATYKA. PLAN STUDIÓW NIESTACJONARNYCH 2-go STOPNIA (W UKŁADZIE ROCZNYM) STUDIA ROZPOCZYNAJĄCE SIĘ W ROKU AKADEMICKIM A K L S P

Matryca pokrycia efektów kształcenia

I rok. semestr 1 semestr 2 15 tyg. 15 tyg. Razem ECTS. laborat. semin. ECTS. konwer. wykł. I rok. w tym. Razem ECTS. laborat. semin. ECTS. konwer.

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

Spis treści. Od autorów / 9

Katedra Systemów Automatyki

Dwuletnie studia indywidualne II stopnia na kierunku fizyka, specjalność Matematyczne i komputerowe modelowanie procesów fizycznych

SUPERKOMPUTER OKEANOS BADAWCZE GRANTY OBLICZENIOWEWE

ROBOTYKA I SYSTEMY DECYZYJNE

INFORMATYKA. PLAN STUDIÓW STACJONARNYCH 2-go STOPNIA (W UKŁADZIE SEMESTRALNYM) STUDIA ROZPOCZYNAJĄCE SIĘ W ROKU AKADEMICKIM A K L S P

Kierunek: Geoinformatyka Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. audytoryjne. Wykład Ćwiczenia

Instytut Informatyki Politechniki Warszawskiej

Poz. 15 UCHWAŁA NR 15 RADY WYDZIAŁU NAUK EKONOMICZNYCH UW. z dnia 1 marca 2017 roku. w sprawie

II. MODUŁY KSZTAŁCENIA

Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

Kształcenie w Szkole Doktorskiej Politechniki Białostockiej realizowane będzie według następującego programu:

Studia II stopnia, kierunek Fizyka, specjalność Metody fizyki w ekonomii (ekonofizyka)

Liczba godzin w semestrze II r o k III r o k IV rok. Nazwa modułu

w tym laborat. Razem semin. konwer. wykłady ćwicz. w tym laborat. Razem ECTS Razem semin. konwer.

9 Eksploatacja maszyn produkcyjnych Zarządzanie projektem Razem

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa, Inżynieria oprogramowania, Technologie internetowe

WYKAZ PRZEDMIOTÓW I PLAN REALIZACJI

Techniki animacji komputerowej

15 tyg. 15 tyg. 15 tyg. ECTS. laborat. laborat. semin. semin. ECTS. 15 tyg. ECTS. laborat. laborat. semin. semin. ECTS

STUDIA PODYPLOMOWE. Analiza i Eksploracja Danych Rynkowych i Marketingowych. Podstawa prawna

Lista rankingowa/suplement/korekta* Dla projektów o wartości wydatków kwalifikowanych co najmniej 15 mln PLN

Wprowadzenie do teorii systemów ekspertowych

ZASTOSOWANIA FIZYKI W BIOLOGII I MEDYCYNIE Specjalność: Projektowanie molekularne i bioinformatyka. 3-letnie studia I stopnia (licencjackie)

efekty kształcenia dla kierunku Elektronika studia stacjonarne drugiego stopnia, profil ogólnoakademicki

Nazwa przedmiotu. 1 Matematyka. 2 Fizyka. 3 Informatyka. 4 Rysunek techniczny. 12 Język angielski. 14 Podstawy elektroniki. 15 Architektura komputerów

Plan studiów dla kierunku:

Wyższa Szkoła Technologii Teleinformatycznych w Świdnicy. Dokumentacja specjalności. Grafika komputerowa

PRZEDSIĘWZIĘCIA MORSKIE W KRAJOWYM PROGRAMIE KOSMICZNYM

rodzaj zajęć semestr 1 semestr 2 semestr 3 Razem Lp. Nazwa modułu E/Z Razem W I

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

INFORMATYKA. PLAN STUDIÓW STACJONARNYCH INŻYNIERSKICH 2-go STOPNIA STUDIA ROZPOCZYNAJĄCE SIĘ W ROKU AKADEMICKIM 2018/19.

PLAN STUDIÓW STACJONARNYCH DRUGIEGO STOPNIA DLA KIERUNKU INFORMATYKA I EKONOMETRIA

Odniesienie do efektów kształcenia w obszarze kształcenia w zakresie nauk przyrodniczych i technicznych

1 Programowanie urządzen mobilnych Sztuczna inteligencja i systemy 2 ekspertowe

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa

Informatyka- studia I-go stopnia

Opracowali: Jacek Słupianek Damian Dudek Marcin Żurawski. Katedra Informatyki

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma studiów: Stacjonarne. audytoryjne. Wykład Ćwiczenia

Matryca pokrycia efektów kształcenia. Efekty kształcenia w zakresie wiedzy (cz. I)

5 Moduył do wyboru II *[zobacz opis poniżej] 4 Projektowanie i konfiguracja sieci komputerowych Z

INTEGRACJA USŁUG DLA MIASTA. Skuteczna metoda rozwoju, integracji, testowania i wprowadzania usług dla miast z pomocą Living Labs

Fizyka z astronomią. Klasa I C Profil matematyczny

Wykorzystanie Banku Danych o Lasach w naukach leśnych i praktyce leśnictwa

Oferta przedmiotów wybieralnych 2017/2018. Studia I stopnia Elektronika i telekomunikacja

WYKAZ PRZEDMIOTÓW I PLAN REALIZACJI

Politechnika Gdańska i gospodarka Pomorza wspólne wyzwania rozwojowe

PLAN NIESTACJONARNYCH STUDIÓW PIERWSZEGO STOPNIA (INŻYNIERSKICH) NA KIERUNKU INFORMATYKA

Kurs wybieralny: Zastosowanie technik informatycznych i metod numerycznych w elektronice

Liczba godzin w semestrze II r o k. Nazwa modułu. PLAN STUDIÓW (poziom studiów) I STOPNIA studia (forma studiów) niestacjonarne

PROGRAM STUDIÓW. Egzamin, kolokwium, projekt, aktywność na zajęciach.

Załącznik nr 2 do Zarządzenia nr 72/2008 Rektora UŚ z dnia 20 listopada 2008 r.

I N F O R M A T Y K A

Liczba godzin w semestrze II r o k. Nazwa modułu. PLAN STUDIÓW (poziom studiów) I STOPNIA studia (forma studiów) stacjonarne

PROGRAM KSZTAŁCENIA NA STUDIACH III STOPNIA Informatyka (nazwa kierunku)

Opis efektu kształcenia dla programu kształcenia

PRZEDMIOTY REALIZOWANE W RAMACH KIERUNKU INFORMATYKA I STOPNIA STUDIA STACJONARNE

Polityka wspierania prac naukowych i wdrożeniowych w obszarze informatyki jako element budowy społeczeństwa informacyjnego w Polsce

Kierunek: Matematyka w technice

Plan dla studiów prowadzonych w formie niestacjonarnej 2014/2015

Dlaczego warto podjąć. studia na WETI PG na kierunku informatyka. Wydział Elektroniki, Telekomunikacji i Informatyki Politechniki Gdańskiej 1

Obowiązują od naboru na rok ak. 2014/2015. Egzamin po semestrze. seminarium. laboratoria. Razem

Transkrypt:

Jak Big Data rewolucjonizuje naukę oraz współpracę centrów badawczych z biznesem? dr Łukasz Bolikowski ICM, Uniwersytet Warszawski Big Data Summit, 26 listopada 2014

Czwarty paradygmat Cztery paradygmaty w nauce (Jim Gray, 2007): 1 Empiryczny opis zjawisk naturalnych (ostatnie tysiąclecia) 2 Teoretyczny budowa modeli i uogólnień (ostatnie stulecia) 3 Obliczeniowy symulacje złożonych zjawisk (ostatnie dekady) 4 Eksploracja danych badania data-intensive (ostatnie lata)

Duże dane w nauce Duży rozmiar 1000 Genomes Project 200 TB danych genomicznych NASA Earth Exchange 20 TB danych o Ziemi Duże tempo zmian Wielki Zderzacz Hadronów (CERN) 1 PB/s (w szczycie) Sekwenatory DNA setki GB tygodniowo Duża różnorodność Archiwum prognozy pogody ICM 1000+ rodzajów pól

Przyczyny zmiany paradygmatu Przejście od analogowego do cyfrowego dramatycznie zwiększyło podaż danych: książki, komunikacja naukowa dane medyczne Pojawiły się technologie generujące duże dane: urządzenia mobilne sieci społecznościowe sieci czujników (inteligentne miasta) Naukowcy uświadomili sobie, że eksploracja dużych zbiorów danych może prowadzić do odkryć: dane informacja wiedza

Skutki zmiany paradygmatu Potrzebujemy...... nowych infrastruktur obliczeniowych duże klastry do badań opartych o dane systemy do publikacji i dzielenia się danymi... nowych metod i algorytmów przetwarzania algorytmy w modelu MapReduce szybkie rozwiązania in-memory... nowych umiejętności i kompetencji przetwarzanie dużych danych, programowanie uczenie maszynowe, statystyka, matematyka wizualizacja informacji, prezentacja wyników ciekawość, pasja, żyłka eksploratora

ICM, Uniwersytet Warszawski Początki trzeci paradygmat Założone 20 lat temu jako centrum superkomputerowe prowadzące symulacje złożonych zjawisk przy użyciu modeli matematycznych i superkomputerów. Prawdziwie interdyscyplinarny zespół 150+ naukowców i programistów tworzących rozwiązania w obszarach tak różnych jak: transport lotniczy, bioinformatyka, modelowanie klimatu, medycyna wspomagana komputerowo, kosmologia, biblioteki cyfrowe, projektowanie leków, epidemiologia, rolnictwo, fizyka wysokich energii, uczenie maszynowe, projektowanie materiałów, neurobiologia, analiza sieci społecznych, prognozowanie pogody,... i wiele innych.

ICM, Uniwersytet Warszawski Przyszłość czwarty paradygmat ICM staje się centrum danych badawczych. W ramach projektu OCEAN o początkowym budżecie 80 mln zł do końca 2015 roku powstanie infrastruktura zdolna przetwarzać dziesiątki PB danych oraz centrum kompetencji skupiające doświadczone zespoły data scientists. (text mining, analiza sieci społecznych, analiza obrazów, uczenie maszynowe)

Wybrane projekty ICM UW oparte o analizę danych 1 Alzheimer s Disease Big Data DREAM Challenge Cel: identyfikacja biomarkerów pozwalających diagnozować i leczyć chorobę Alzheimera Dane: obrazowe (m.in. MRI mózgu), genetyczne (m.in. SNP), oceny funkcji poznawczych 2 Szacowanie krzywych laktacji i obserwacji odstających Cel: przewidywanie użytkowości mlecznej krów Dane: 80M+ rekordów opisujących krowy (np. geny, stado) i historię ich udojów (np. ilość i skład mleka) 3 SciVis Contest 2015 Cel: wizualizacja ewolucji wszechświata Dane: bilion (10 12 ) obiektów (położenia i prędkości) 100 klatek (oś czasu) = 3 PB danych (3 PB oznacza 9 m-cy kopiowania po Ethernecie, 1 tonę dysków HDD)

Nauka a biznes Biznes ma dane i pytania, cierpi na brak data scientists. Nauka ma kompetencje i infrastrukturę, szuka ciekawych wyzwań. Podobne zagadnienia, metody, metodologie: rozumienie wartości (dużych) danych, potencjału w nich tkwiącego metody statystyczne, uczenie maszynowe, wizualizacja informacji przetwarzanie dużych danych przy użyciu Apache Hadoop/Spark metodologie prowadzenia projektów data-miningowych, np. CRISP-DM Wniosek pasujemy do siebie jak nigdy dotąd! Zapraszam do współpracy.

Dziękuję za uwagę i zapraszam do kontaktu! linkedin.com/in/bolikowski twitter.com/bolikowski lukasz.bolikowski@icm.edu.pl +48 22 8749419

Licencja c 2014 ICM, Uniwersytet Warszawski. Pewne prawa zastrzeżone. Prezentacja udostępniona na licencji CC BY-ND 3.0 PL. Wykorzystane zostały materiały graficzne z następujących źródeł: http://research.microsoft.com/en-us/collaboration/fourthparadigm/ (str. 2, cała książka na CC BY-SA 3.0, tu dozwolony użytek okładki) https://www.flickr.com/photos/petrifiedforestnps/13808113813 (str. 3, CC BY 2.0) https://www.flickr.com/photos/11304375@n07/2046228644 (str. 3, CC BY 2.0) https://www.flickr.com/photos/mollyali/2518828977 (str. 4, CC BY 2.0) https://www.flickr.com/photos/kewl/8475764430 (str. 6, CC BY 2.0) https://www.flickr.com/photos/iwannt/8596885627 (str. 6, CC BY 2.0) https://www.flickr.com/photos/canyonjam/111754387 (str. 8, CC BY 2.0) https://www.flickr.com/photos/usdagov/9042954477 (str. 8, CC BY 2.0)