UNIWERSYTET WARMIŃSKO-MAZURSKI W OLSZTYNIE PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE http://matman.uwm.edu.pl/psi e-mail: psi@matman.uwm.edu.pl ul. Słoneczna 54 10-561 Olsztyn kom. 664 31 55 25 Olsztyn 2017/2018/2019
ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE Lp. Przedmiot Forma zaliczenia punkty ECTS LICZBA GODZIN W SEMESTRZE 1 2 Razem godzin wykład ćwiczenia wykład ćwiczenia 1. Wprowadzenie do narzędzi analitycznych zal.o 3 20 20 2. Analiza struktury procesów masowych zal.o 2 6 10 16 3. 4. Techniki graficznej prezentacji danych statystycznych Elementy rachunku prawdopodobieństwa i wnioskowania statystycznego zal.o 1 8 8 zal.o 2 10 8 18 5. Wprowadzenie do Data Mining zal.o 4 10 20 30 6. Problemy społeczne i zawodowe informatyki zal.o 2 12 12 7. Statystyka matematyczna zal.o 2 8 10 18 8. Współzależność procesów masowych zal.o 2 8 8 16 9. Analiza dynamiki procesów masowych zal.o 2 8 10 18 10. Analiza statystyczna wielowymiarowa zal.o 2 6 8 14 11. Statystyki bayesowskie zal.o 1 10 10 12. Podstawy metody reprezentacyjnej zal.o 1 6 6 13. Elementy teorii gier zal.o 1 8 8 14. Analiza biznesowa zal.o 5 36 36 RAZEM 30 46 66 44 82 230
Wprowadzenie do wybranych narzędzi analitycznych (Pakiet R) 1. Import/Eksport danych; 2. Filtrowanie danych; 3. Łączenie danych; 4. Sortowanie danych; 5. Graficzna budowa zapytań; 6. Typy danych; Formaty; Instrukcje sterujące; 7. Podstawy makr Analiza struktury procesów masowych (Pakiet R) 1. Rodzaje i organizacja badań statystycznych 2. Cechy statystyczne 3. Klasyfikacja rozkładów empirycznych 4. Miary statystyczne Techniki graficznej prezentacji danych statystycznych (Pakiet R) 1. Metody prezentacji danych statystycznych 2. Zalety i ograniczenia rozmaitych technik prezentacji 3. Istota i cel tworzenia raportów 4. Techniki prezentacji danych jednowymiarowych 5. Techniki prezentacji danych wielowymiarowych Elementy rachunku prawdopodobieństwa 1. Elementy kombinatoryki 2. Prawdopodobieństwo klasyczne 3. Prawdopodobieństwo warunkowe 4. Wybrane rozkłady dyskretne 5. Wybrane rozkłady ciągłe 6. Zmienna losowa 7. Charakterystyki liczbowe zmiennych losowych 8. Dystrybuanta Wprowadzenie do Data Mining 1. Model CRISP-DM (cross-industry standard process for data mining). 2. Wybrane metody preprocesowania danych, 3. Wybrane metody budowania modeli data miningowych - klasyfikacja bazująca na regułach decyzyjnych, k-nn, Naiwny klasyfikator Bayesa. 4. Algorytmy genetyczne np. metody Pittsburg i Michigan, 5. Sieci neuronowe metoda Widrowa Hoffa, Algorytm wstecznej propagacji błędu, 6. Drzewa decyzyjne - algorytm C4.5.
Problemy społeczne i zawodowe informatyki 1. Społeczeństwo informacyjne. 2. Odpowiedzialność zawodowa i etyczna. 3. Podstawy przedsiębiorczości, rynek teleinformatyczny, ryzyko przedsięwzięć informatycznych. 4. Podstawowe zagadnienia prawne: ustawy dotyczące ochrony programów komputerowych, baz danych; przestępstwa komputerowe w kodeksie karnym. 5. Narzędzia wspomagające zarządzanie wiedzą: obieg dokumentów, hurtownie danych, portale korporacyjne, systemy eksperckie i drzewa decyzyjne, itp. Statystyka matematyczna (Pakiet R) 1. Próba losowa 2. Estymacja punktowa 3. Estymacja przedziałowa 4. Testowanie hipotez statystycznych 5. Analiza wariancji Współzależność procesów masowych (Pakiet R) 1. Analiza korelacji 2. Testy niezależności 3. Analiza regresji 4. Regresja pierwszego i drugiego rodzaju 5. Wnioskowanie statystyczne Analiza dynamiki procesów masowych (Pakiet R) 1. Metody indeksowe Przyrosty absolutne i względne Indeksy dynamiki 2. Dekompozycja szeregu czasowego Teoria trendu Wahania Analiza statystyczna wielowymiarowa (Pakiet R) 1. Regresja wielowymiarowa 2. Testy istotności 3. Regresja wielowymiarowa w prognozowaniu 4. Modele liniowe i nieliniowe 5. Wektory losowe 6. Rozkłady zmiennych losowych wielowymiarowych 7. Analiza wariancji wielowymiarowa 8. Analiza dyskryminacyjna
Statystyki bayesowskie (Pakiet R) 1. Podstawy metod bayesowskich 2. Twierdzenie Bayesa dla różnych typów rozkładów 3. Zastosowanie tw. Bayesa dla rozkładów ciągłych 4. Wnioskowanie statystyczne dla modeli bayesowskich Podstawy metody reprezentacyjnej 1. Podstawowe pojęcia metody reprezentacyjnej 2. Metody losowań statystycznych 3. Rodzaje błędów w badaniach statystycznych 4. Podstawowe metody imputacji 5. Metody szacowania precyzji estymatorów 6. Testy niezależności Elementy teorii gier 1. Gry jednoczesne 2. Gry sekwencyjne 3. Gry aukcyjne 4. Analiza decyzji 5. Drzewa decyzyjne Analiza biznesowa (Pakiet R) I. (8 godz.) 1. Język R Markdown 2. Pakiet knitr 3. Dokumenty 4. Prezentacje 5. Strony WWW 6. Dodatkowe szablony II. (26 godz.) 1. Detekcja i analiza współzależności w biznesie 2. Analiza szeregów czasowych, trendy i prognozowanie w biznesie 3. Wybrane zagadnienia Data Mining (analiza koszykowa, segmentacja) 4. Wielowymiarowa analiza statystyczna, klasyfikacja i analiza skupień i ich zastosowania 5. Business Intelligence Case Studies analiza przypadków zastosowań BI