Analityka danych publicznych dla diagnoz i prognoz dotyczących osób niepełnosprawnych

Podobne dokumenty
w ekonomii, finansach i towaroznawstwie

Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

4.1. Wprowadzenie Podstawowe definicje Algorytm określania wartości parametrów w regresji logistycznej...74

data mining machine learning data science

Big Data i ich eksploracja: spojrzenia z perspektywy statystyki i uczenia maszynowego

Hadoop i Spark. Mariusz Rafało

WYDZIAŁ MATEMATYKI KARTA PRZEDMIOTU

Widzenie komputerowe (computer vision)


Mail: Pokój 214, II piętro

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

Analiza danych i data mining.

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Szkolenia SAS Cennik i kalendarz 2017

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2018/2019

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa, Inżynieria oprogramowania, Technologie internetowe

SZKOLENIA SAS. ONKO.SYS Kompleksowa infrastruktura inforamtyczna dla badań nad nowotworami CENTRUM ONKOLOGII INSTYTUT im. Marii Skłodowskiej Curie

Szczegółowy opis przedmiotu zamówienia

I rok. semestr 1 semestr 2 15 tyg. 15 tyg. Razem ECTS. laborat. semin. ECTS. konwer. wykł. I rok. w tym. Razem ECTS. laborat. semin. ECTS. konwer.

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Rok akademicki: 2030/2031 Kod: ZZP MK-n Punkty ECTS: 3. Poziom studiów: Studia II stopnia Forma i tryb studiów: Niestacjonarne

Python : podstawy nauki o danych / Alberto Boschetti, Luca Massaron. Gliwice, cop Spis treści

Studia podyplomowe w zakresie przetwarzanie, zarządzania i statystycznej analizy danych

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

Razem godzin w semestrze: Plan obowiązuje od roku akademickiego 2014/15 - zatwierdzono na Radzie Wydziału w dniu r.

Efekt kształcenia. Wiedza

Opis efektów kształcenia dla modułu zajęć

Dostawa oprogramowania. Nr sprawy: ZP /15

mgr inż. Magdalena Deckert Poznań, r. Uczenie się klasyfikatorów przy zmieniającej się definicji klas.

Systemy Informatyki Przemysłowej

Poz. 15 UCHWAŁA NR 15 RADY WYDZIAŁU NAUK EKONOMICZNYCH UW. z dnia 1 marca 2017 roku. w sprawie

UCZENIE MASZYNOWE I SZTUCZNA INTELIGENCJA Jako narzędzia wspomagania decyzji w zarządzaniu kapitałem ludzkim organizacji

Systemy uczące się Lab 4

Grafika i Systemy Multimedialne (IGM)

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Wprowadzenie do Hurtowni Danych

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006

Prof. Stanisław Jankowski

II. MODUŁY KSZTAŁCENIA

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa

POLITECHNIKA LUBELSKA Wydział Elektrotechniki Kierunek: INFORMATYKA II stopień niestacjonarne i Informatyki. Część wspólna dla kierunku

Informatyka studia stacjonarne pierwszego stopnia

Wykaz tematów prac magisterskich w roku akademickim 2018/2019 kierunek: informatyka

Analiza danych tekstowych i języka naturalnego

ALGORYTM RANDOM FOREST

Wprowadzenie do technologii informacyjnej.

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa i multimedia

Plan studiów niestacjonarnych pierwszego stopnia Kierunek: ANALITYKA I BADANIA EKONOMICZNE A. Moduły międzykierunkowe obligatoryjne

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel

SYLABUS. Dotyczy cyklu kształcenia Realizacja w roku akademickim 2016/2017. Wydział Matematyczno - Przyrodniczy

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

Plan studiów stacjonarnych pierwszego stopnia Kierunek: ANALITYKA I BADANIA EKONOMICZNE A. Moduły międzykierunkowe obligatoryjne

Analiza i wizualizacja danych Data analysis and visualization

L.p Nazwa przedmiotu Kod przedmiotu Osoba(y) prowadząca(e) WDP PDP WIR DAW BDZ

OBSERWATRIUM POLITYKI SPOŁECZNEJ

Indeksy w bazach danych. Motywacje. Techniki indeksowania w eksploracji danych. Plan prezentacji. Dotychczasowe prace badawcze skupiały się na

WIZUALNA EKSPLORACJA DANYCH I RAPORTOWANIE W SAS VISUAL ANALYTICS ORAZ WSTĘP DO SAS VISUAL STATISTICS

Informatyka- studia I-go stopnia

Odniesienie symbol II/III [1] [2] [3] [4] [5] Efekt kształcenia. Wiedza

Modelowanie Data Mining na wielką skalę z SAS Factory Miner. Paweł Plewka, SAS

Technologie IoT - Analityka Big Data IoT Big Data& Analytics

Kierunek: INFORMATYKA. Studia stacjonarne. Studia drugiego stopnia. Profil: ogólnoakademicki

KLASYFIKACJA. Słownik języka polskiego

Data Mining Kopalnie Wiedzy

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa

Podstawy Sztucznej Inteligencji (PSZT)

!!!!!!!!!!! PORTFOLIO: Analiza zachowań użytkowników serwisów internetowych. Autorzy: Marek Zachara

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Statystyka publiczna źródłem wiedzy w programowaniu krajowym i regionalnym

Jan Paradysz Nowe źródła danych w klasycznym paradygmacie informacji statystycznej

Podstawy analizy danych numerycznych w języku Python

Narzędzia geoprzestrzenne Business Intelligence (BI)

1.1 Matryca pokrycia efektów kształcenia. Efekty kształcenia w zakresie wiedzy. Efekty kształcenia w zakresie umiejętności

StatSoft profesjonalny partner w zakresie analizy danych

Rozpocznij swój pierwszy projekt IoT i AR z Transition Technologies PSC

PLAN STUDIÓW STACJONARNYCH I NIESTACJONARNYCH WIECZOROWYCH II STOPNIA OD ROKU AKADEMICKIEGO 2017/2018

Zagadnienia na egzamin magisterski

Plany mobilności miejskiej dla dzielnic

Repetytorium z matematyki 3,0 1,0 3,0 3,0. Analiza matematyczna 1 4,0 2,0 4,0 2,0. Analiza matematyczna 2 6,0 2,0 6,0 2,0

Eksploracja danych a serwisy internetowe Przemysław KAZIENKO

Nowe przewagi konkurencyjne - technologia, informacja, społeczność

Kierunek:Informatyka- - inż., rok I specjalność: Grafika komputerowa i multimedia

1 Programowanie urządzen mobilnych Sztuczna inteligencja i systemy 2 ekspertowe

Prezentacja specjalności studiów II stopnia. Inteligentne Technologie Internetowe

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA REALIZACJA W ROKU AKADEMICKIM 2016/2017

WSTĘP I TAKSONOMIA METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. Adrian Horzyk. Akademia Górniczo-Hutnicza

Zagadnienia egzaminacyjne AUTOMATYKA I ROBOTYKA. Stacjonarne I-go stopnia TYP STUDIÓW STOPIEŃ STUDIÓW SPECJALNOŚĆ

DLA SEKTORA INFORMATYCZNEGO W POLSCE

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)

Standard minimum praktyczne wskazówki

Zespół do spraw Transformacji Przemysłowej Departament Innowacji

Jak Big Data rewolucjonizuje naukę oraz współpracę centrów badawczych z biznesem?

Mariusz Dzieciątko. Krótko o sobie / Personal Overview/

PORTAL GEOSTATYSTYCZNY - GIS jako źródło informacji o terytorium i społeczeństwie

Opis efektów kształcenia dla modułu zajęć

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

Laboratorium przez Internet w modelu studiów inżynierskich

KATEDRA BIOSENSORÓW I PRZETWARZANIA SYGNAŁÓW BIOMEDYCZNYCH

Transkrypt:

XI Konferencja Naukowa Bezpieczeostwo w Internecie. Analityka danych Analityka danych publicznych dla diagnoz i prognoz dotyczących osób niepełnosprawnych Ewa Marzec UKSW

Uwagi historyczne Rosnące rozmiary danych Massive Data mining, Very Large Databases inne spojrzenia + wcześniejsze Big Data jako termin na amerykańskich konferencjach pojawia się pod koniec lat dziewięćdziesiątych Doświadczenia wielkich projektów badawczych NASA

Charakterystyka Big Data połączenie niejednorodnych i złożonych źródeł 3 V High volume, velocity and variety *Doug Laney 2001+. Kolejne V s stopniowo dodawane (Veracity, Value, ) Big Data to dane, których skala, zróżnicowanie i złożonośd wymaga nowych technologii i algorytmów w celu odkrycia wartościowej wiedzy [J.Gama 2015] HACE Theorem: Big Data starts with large-volume, heterogeneous, autonomous data sources with distributed and decentralized control, and seeks to explore complex and evolving relationships among data [Xindong Wu et al. 2013]

Źródło: N.Japkowicz and J.Stefanowski (Eds), Big Data Analysis: New Algorithms for a New Society, (2016).

Zagadnienie Tradycyjne Data Mining Analiza Big Data Dostęp do pamięci Architektura oblicz. Dane Jakośd danych Bezpieczeostwo i prywatnośd Przetwarzanie danych Analiza rezultatów Centralna pamięd operacyjna, łatwiejsze wielokrotne operacje odczyt / zapis Centralna pojedyncza jednostka (skalowalna) Dobra strukturalizacja (rel. DB), jednorodne, statyczne / integracja DW Dobrze przygotowane, wiele technik korekcji Udokumentowane pochodzenie Wiarygodne próbkowanie Wyselekcjonowane dobre dane Nie są wymagane Proste metody anonimizacji Klasyczne (batch); może byd off-line Brak konieczności próbkowania Prędkośd nie tak krytyczna Rozwinięte metody oceny wyników oraz wizualizacji Dane często rozproszone Minimalizowanie zapamiętanych elementów i dostępu do nich Rozproszone przetwarzanie Grona (clusters) słabszych komputerów Zróżnicowane źródła; brak struktury; Zmienne / dynamika i czas Słaba jakośd danych, niepewnośd i niedokładnośd; Słabo dokument. pochodzenie i preprocessing; Użyteczne dane mogą byd połączone z wieloma bezużytecznymi Krytyczny problem Współdzielenie danych; łączenie danych Możliwośd wymagania on-line; szybkośd; Wydajnośd alg. ma znaczenie Dane nie mieszczą się w pamięci Kompresja i próbkowanie danych Niebezpieczeostwa odkrycia nieznaczących rezultatów Trudności wizualizacji Źródło N.Japkowicz, J.Stefanowski: A Machine Learning Perspective on Big Data Analysis (2016)

Big Data znane metody w innym kontekście Standard metod Data Mining Klasyfikacja nadzorowana Regresja / ANN Analiza skupieo Asocjacje (zbiory częste, reguły asocjacyjne) Wzorce sekwencji Szeregi czasowe Wykrywanie anomalii i obserwacji nietypowych Statystyka opisowa Statystyka wielowymiarowa Dekompozycja macierzy (PCA, MDS, ).. Klasyfikacja i predykcja Drzewa decyzyjne Reguły Naive Bayes K-NN Regresja logistyczna Sztuczne sieci neuronowe Analiza dyskryminacyjna Metoda wektorów wspierających SVM Zespoły klasyfikatorów

Drzewo decyzyjne

Nowe problemy badawcze z punktu widzenia analizy danych Analiza grafów Social networks Integracja lub przetwarzanie online różnorodnych reprezentacji danych Eksploracja danych strumieniowych Analiza danych czasoworozproszonych Obliczenia mobilne (IoT) Wizualizacja danych Privacy data mining Data trust + provenance.. Inne problemy Interakcja z ekspertem Ocena wiedzy Etyka analizy Big Data Wpływ na społeczeostwo

Narzędzia do analizy Big Data R - pakiety do wizualizacji danych, pakiety do łączenia R z innymi językami, np. z Javą i hurtowniami danych Python język programowania SAS oprogramowanie do analizy danych SPSS, Statistica, Stata programy przeznaczone do analizy statystycznej Matlab język do analizy danych, statystyki i wizualizacji danych; Apache Mahout - biblioteka Java do uczenia maszynowego

Zjawisko niepełnosprawności Według danych z ostatniego NSP 2011 liczba osób niepełnosprawnych w Polsce wynosiła około 4,7 mln. Narodowy Spis Powszechny Ludności i Mieszkań. Raport z wyników, GUS, Warszawa 2012

Niepełnosprawni według formy niepełnosprawności i miejsca zamieszkania Narodowy Spis Powszechny Ludności i Mieszkań. Raport z wyników, GUS, Warszawa 2012

Liczba niepełnosprawnych w podziale na płeć (w tys. osób) Narodowy Spis Powszechny Ludności i Mieszkań. Raport z wyników, GUS, Warszawa 2012

Liczba niepełnosprawnych według miejsc zamieszkania (w tys. osób) Narodowy Spis Powszechny Ludności i Mieszkań. Raport z wyników, GUS, Warszawa 2012

Zjawisko niepełnosprawności z perspektywy metod analizy danych Zjawisko niepełnosprawności stanowi poważny problem wymagający odpowiednich rozwiązao: Zastosowania wybranych metod wielowymiarowej analizy danych do analizy zjawiska niepełnosprawności Stworzenia tzw. profilu osoby niepełnosprawnej na podstawie danych Projektowania usług publicznych zorientowanych na potrzeby użytkownika niepełnosprawnego [zwiększania dostępności+

Znaczenie danych o dostępności dla władz publicznych - Uchwalona została ustawa z dnia 4 kwietnia 2019 r. o dostępności cyfrowej stron internetowych i aplikacji mobilnych podmiotów publicznych, wdrażająca dyrektywę Parlamentu Europejskiego i Rady (UE) 2016/2102 z dnia 26 października 2016 r. w sprawie dostępności stron internetowych i mobilnych aplikacji organów sektora publicznego - Trwają prace nad projektem szerszej zakresowo ustawy o dostępności, stanowiącej, że: dostępnośd właściwośd środowiska fizycznego, środków transportu, technologii i systemów informacyjno-komunikacyjnych oraz towarów i usług, pozwalająca osobom z niepełnosprawnościami na korzystanie z nich w sposób możliwie samodzielny i na zasadzie równości z innymi osobami bariera przeszkoda lub ograniczenie architektoniczne, urbanistyczne, transportowe, cyfrowe, techniczne, w komunikowaniu się, w dostępie do informacji oraz inne, które uniemożliwia lub utrudnia osobom z niepełnosprawnościami udział w życiu społecznym na zasadzie równości z innymi osobami

Dziękuję za uwagę