KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angieskim Obowiązuje od roku akademickiego 2015/2016 Z-ID-509a Odkrywanie związków w danych wieowymiarowych Discovering Reationships within Mutivariate Data A. USYTUOWANIE MODUŁU W SYSTEMIE STUDIÓW Kierunek studiów Poziom kształcenia Profi studiów Forma i tryb prowadzenia studiów Specjaność Jednostka prowadząca moduł Koordynator modułu Inżynieria danych I stopień Praktyczny Studia stacjonarne Anaityka danych i modeowanie Katedra Informatyki i Matematyki Stosowanej Dr inż. Damian Krzesimowski Zatwierdził B. OGÓLNA CHARAKTERYSTYKA PRZEDMIOTU Przynaeżność do grupy/boku przedmiotów Status modułu Język prowadzenia zajęć Usytuowanie modułu w panie studiów - semestr Usytuowanie reaizacji przedmiotu w roku akademickim Wymagania wstępne Egzamin (TAK/NIE) Liczba punktów ECTS 3 Specjanościowy Obowiązkowy Poski Semestr V Semestr zimowy Agebra, Wnioskowanie statystyczne, Akwizycja danych pomiarowych NIE Forma prowadzenia zajęć Liczba godzin w semestrze wykład w ćwiczenia ć aboratorium 20 20 projekt p inne i 1
C. EFEKTY KSZTAŁCENIA I METODY SPRAWDZANIA EFEKTÓW KSZTAŁCENIA Ce modułu Ceem modułu jest zapoznanie studentów z podstawowymi pojęciami, metodami i agorytmami odkrywania związków w różnorodnych danych. Student zostanie zapoznany z podstawowymi metodami odkrywania reguł asocjacyjnych, wzorców sekwencji i kastrowania przy użyciu profesjonanych narzędzi programistycznych. Symbo efektu Efekty kształcenia Student ma wiedzę z zakresu probabiistyki i statystyki. Zna podstawowe techniki pozyskiwania, gromadzenia, weryfikacji i przetwarzania danych wieowymiarowych. Ma podstawową wiedzę z zakresu odkrywania wzorców sekwencji, odkrywania reguł asocjacyjnych i ich oceny. Ma podstawową wiedzę z zakresu grupowania i podziału zbioru danych oraz miar podobieństwa i odegłości. Forma prowadzenia zajęć U_01 Student potrafi przygotować dane do anaizy. Umie zastosować system SAS do odkrywania reguł asocjacyjnych, odkrywania wzorców sekwencji, grupowania i podziału. Potrafi zinterpretować wyniki anaiz i ocenić ich jakość. Rozumie potrzebę i zna możiwości ciągłego doskonaenia się. Potrafi komunikować się w zespoe również w zakresie wykraczającym poza zagadnienia techniczne. kierunkowych w, K_W02 w, K_W05 w, K_W13 w, K_W02 K_W13 K_U04 K_U06 K_U06 K_U16 K_U04 K_K01 K_K05 obszarowych T1P_W01 X1P_W02 X1P_W04 T1P_W02 T1P_W03 T1P_W06 inzp_w02 inzp_w03 T1P_W03 T1P_W06 X1P_W02 X1P_W04 T1P_W01 T1P_W03 T1P_W06 X1P_W02 X1P_W04 T1P_U09 T1P_U16 X1P_U03 T1P_U05 T1P_U08 T1P_U09 T1P_U16 T1P_U08 T1P_U09 X1P_U02 X1P_U03 T1P_K01 X1P_K01 X1P_K05 inzp_k01 inzp_k02 T1P_K03 X1P_K02 inzp_k01 2
Treści kształcenia 1. Treści kształcenia w zakresie wykładu Nr wykładu 1 2 3-4 5-6 7 8-9 10 Treści kształcenia Źródła danych. Pojęcie odkrywania wiedzy z danych. Wybrane narzędzia programistyczne do przetwarzania danych wieowymiarowych: Ms Exce, MatLAB, SAS i ich wykorzystanie w podstawowej anaizie statystycznej danych wieowymiarowych. Przygotowanie struktury danych do anaiz asocjacyjnych. Podstawy anaizy koszykowej. Kasyfikacja reguł asocjacyjnych. Wybrane miary oceny reguł asocjacyjnych i ich interpretacja. Odkrywanie reguł asocjacyjnych z wykorzystaniem profesjonanego oprogramowania (SAS). Ocena jakości reguł asocjacyjnych. Ogóny agorytm odkrywania reguł asocjacyjnych budowa programu do anaizy koszykowej w środowisku Ms Exce. Przygotowanie struktury danych do anaizy sekwencji, roa zmiennej czasowej. Kasyfikacja probemów odkrywania wzorców sekwencji; uogónione wzorce sekwencji. Odkrywanie wzorców sekwencji z wykorzystaniem profesjonanego oprogramowania (SAS). Ocena jakości sekwencji. Pojęcie metryki. Miary podobieństw i odegłości da atrybutów binarnych, nominanych, porządkowych i iościowych. Obiczanie miar podobieństw i odegłości z wykorzystaniem środowiska Ms Exce, MatLAB i SAS. Pojęcie kastra; omówienie podstawowych typów grupowania i podziału. Hierarchiczna i niehierarchiczna anaiza skupień. Zagadnienie normaizacji zmiennych. Przykładowy agorytm agomeracyjny metoda najbiższego sąsiada (SAS). Probem podziału zbioru i grupowania pojęciowego. Ocena jakości grupowania. Przykładowe metody podziału: k-średnich, k-medoid, SSN Kohonena. kształcenia da modułu 2. Treści kształcenia w zakresie ćwiczeń 3. Treści kształcenia w zakresie zadań aboratoryjnych Nr zajęć ab. 1 2 3 Treści kształcenia Przegąd materiałów dotyczących odkrywania związków w danych wieowymiarowych dostępnych w domenie pubicznej. Przegąd wybranych serwisów i repozytoriów danych. Zapoznanie z przykładowymi danymi pod kątem anaiz asocjacyjnych i anaiz skupień. Pozyskanie i przygotowanie danych do anaiz. Wykonanie anaityki prostej da danych ekspoatacja wybranych programów komputerowych. Opracowanie raportu z eksporacji danych wybranych do anaiz. Przekształcenie struktury danych da potrzeb anaiz asocjacyjnych dobór i wykorzystanie właściwego oprogramowanie do wykonania zadania. Przeprowadzenie anaizy koszykowej na przygotowanych danych z wykorzystaniem profesjonanego oprogramowania (SAS). kształcenia da modułu U_01 U_01 3
4 5-6 7 8 9-10 Anaiza i interpretacja wyników anaizy koszykowej. Ocena jakości reguł asocjacyjnych, kryteria wyboru reguł najepszych. Opracowanie raportu z wykonania prac z ćwiczeń nr 3 i 4, sformułowanie wniosków i zaeceń. Przekształcenie struktury danych da potrzeb anaiz sekwencyjnych dobór i wykorzystanie właściwego oprogramowania do wykonania zadania. Przeprowadzenie anaizy sekwencyjnej na przygotowanych danych z wykorzystaniem profesjonanego oprogramowania (SAS). Opracowanie raportu z wykonania prac z ćwiczeń nr 5 i 6, sformułowanie wniosków i zaeceń. Obiczanie wartości miar odegłości danych iościowych z wykorzystaniem różnych metryk. Uwzgędnianie aspektu wieowymiarowości danych w hierarchicznej anaizie skupień. Normaizacja zmiennych. Kastrowanie iościowych danych wieowymiarowych z wykorzystaniem oprogramowania SAS agorytm najbiższego sąsiada. Kryteria przerwania pracy agorytmu agomeracyjnego. Opracowanie raportu z wykonania prac z ćwiczeń nr 7 i 8, sformułowanie wniosków i zaeceń. Obiczanie wartości miar podobieństwa danych jakościowych. Podział zbioru danych iościowych i jakościowych z wykorzystaniem oprogramowania SAS agorytm k-średnich, SSN Kohonena. Ocena jakości podziału zbioru. Opracowanie raportu z wykonania prac z ćwiczeń nr 9 i 10, sformułowanie wniosków i zaeceń. 4. Charakterystyka zadań projektowych 5. Charakterystyka zadań w ramach innych typów zajęć dydaktycznych Metody sprawdzania efektów kształcenia Symbo efektu U_01 Metody sprawdzania efektów kształcenia (sposób sprawdzenia, w tym da umiejętności odwołanie do konkretnych zadań projektowych, aboratoryjnych, itp.) Poprawne wykonanie wszystkich ćwiczeń praktycznych na ćwiczeniach aboratoryjnych. Poprawne wykonanie raportów. Poprawne wykonanie wszystkich ćwiczeń praktycznych na ćwiczeniach aboratoryjnych. Poprawne wykonanie raportów. Poprawne wykonanie wszystkich ćwiczeń praktycznych na ćwiczeniach aboratoryjnych. Poprawne wykonanie raportów. Aktywność na ćwiczeniach. Wnioski i zaecenia zamieszczone w raportach. Aktywność na ćwiczeniach. 4
D. NAKŁAD PRACY STUDENTA Bians punktów ECTS Lp. Rodzaj aktywności Obciążenie studenta Jednostka 1. Udział w wykładach 20 h 2. Udział w ćwiczeniach 3. Udział w aboratoriach 20 h 4. Udział w zajęciach projektowych 5. Udział w konsutacjach (2-3 razy w semestrze) 6 h 6. Konsutacje projektowe 7. Udział w egzaminie 8. 9. Liczba godzin reaizowanych przy bezpośrednim udziae nauczyciea akademickiego 46 h Liczba punktów ECTS, którą student uzyskuje na zajęciach 10. wymagających bezpośredniego udziału nauczyciea akademickiego 1,7 ECTS (1 punkt ECTS=27 godzin obciążenia studenta) 11. Samodziene studiowanie tematyki wykładów 7 h 12. Samodziene przygotowanie się do ćwiczeń 13. Samodziene przygotowanie się do kookwiów 14. Samodziene przygotowanie się do aboratoriów 18 h 15. Wykonanie sprawozdań 10 h 16. Przygotowanie do kookwium końcowego z aboratorium 17. Wykonanie projektu ub dokumentacji 18. Przygotowanie do egzaminu 19. 20. Liczba godzin samodzienej pracy studenta 35 h Liczba punktów ECTS, którą student uzyskuje w ramach 21. samodzienej pracy 1,3 ECTS (1 punkt ECTS=27 godzin obciążenia studenta) 22. Sumaryczne obciążenie pracą studenta 81 h 23. 24. 25. Punkty ECTS za moduł 1 punkt ECTS=27 godzin obciążenia studenta Nakład pracy związany z zajęciami o charakterze praktycznym Suma godzin związanych z zajęciami praktycznymi Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym 1 punkt ECTS=27 godzin obciążenia studenta 3 ECTS 54 h 2 ECTS 5
E. LITERATURA Wykaz iteratury Witryna WWW modułu/przedmiotu 1. Andrienko N., Andrienko G., Exporatory Anaysis of Spartia and Tempora Data. A systematic Approach, Springer, 2005. 2. Baingsey P., Prawdopodobieństwo i miara, PWN, 2009. 3. Hoagin D. C, Mosteer F., Tukey J. W., Exporing Data Tabes, Trends and Shapes, 1985. 4. Martinez W. L., Martunez A. R., Soka J., Exporatory Data Anaysis with MATLAB, Chapman & Ha/CRC, 2010. 5. Eiot J., Marsh C., Exporing Data: An introduction to Data Anaysis for Socia Scientists, 2009. 6. Hand D., Mannia H., Smyth P., Eksporacja danych, WNT, Warszawa 2005. 7. Krzyśko M., Wołyński W., Górecki T., Skorzybut M., Systemy uczące się. Rozpoznawanie wzorców, anaiza skupień i redukcja wymiarowości, WNT, Warszawa 2008. 8. Larose D. T., Odkrywanie wiedzy z danych, PWN, 2006. 9. Larose D. T., Metody i modee eksporacji danych, PWN, 2012. 10. Luszniewicz A., Statystyka ogóna, PWE, 1987. 11. Morzy T., Eksporacja danych, PWN, 2013. 12. Osowski S., Metody i narzędzia eksporacji danych, Wyd. Heion, Giwice 2013. 6