KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2015/2016 Z-ID-607a Wybrane modele klasyfikacji i regresji Selected Models of Classification and Regression A. USYTUOWANIE MODUŁU W SYSTEMIE STUDIÓW Kierunek studiów Poziom kształcenia Profil studiów Forma i tryb rowadzenia studiów Secjalność Jednostka rowadząca moduł Koordynator modułu Inżynieria danych I stoień Praktyczny Studia stacjonarne Analityka danych i modelowanie Katedra Informatyki i Matematyki Stosowanej Mgr Grażyna Gębal Dr hab. Marzena Nowakowska Zatwierdził B. OGÓLNA CHARAKTERYSTYKA PRZEDMIOTU Przynależność do gruy/bloku rzedmiotów Status modułu Język rowadzenia zajęć Usytuowanie modułu w lanie studiów - semestr Usytuowanie realizacji rzedmiotu w roku akademickim Wymagania wstęne Egzamin (TAK/NIE) Liczba unktów ECTS 4 Secjalnościowy Obowiązkowy Polski Semestr VI Semestr letni Elementy rachunku rawdoodobieństwa i statystyki, Logika, Wnioskowanie statystyczne, Algorytmy i struktury danych, Podstawy modelowania zależności w danych, Eksloracja i rzygotowanie danych do analizy TAK Forma rowadzenia zajęć Liczba godzin w semestrze wykład w ćwiczenia ć laboratorium l rojekt 15 30 inne i 1
C. EFEKTY KSZTAŁCENIA I METODY SPRAWDZANIA EFEKTÓW KSZTAŁCENIA Cel modułu Wykształcenie umiejętności stosowania w badaniach wybranych metod rognostycznych (regresja wieloraka i regresyjne drzewa decyzyjne) oraz klasyfikacyjnych (regresja logistyczna i klasyfikacyjne drzewa decyzyjne). Nabycie umiejętności wykorzystania akietu SAS do zadań raktycznych w zakresie omawianych metod. Symbol efektu Efekty kształcenia Zna modele wielokrotnej regresji liniowej i logistycznej. Forma rowadzenia zajęć w, W_02 Zna modele drzew regresyjnych i klasyfikacyjnych. w, W_04 W_05 W_06 U_01 U_02 Zna odstawowe testy arametryczne i niearametryczne. Zna rolę zbiorów treningowego, walidacyjnego i testowego w rocesie modelowania związków w danych. Zna możliwości raktycznego zastosowania modeli wielokrotnej regresji liniowej i logistycznej. Zna możliwości raktycznego zastosowania modeli drzew regresyjnych i klasyfikacyjnych. Umie zastosować akiet statystyczny Enterrise Miner (EM) systemu SAS do modelowania w zakresie regresji liniowej i logistycznej. Umie zastosować akiet statystyczny Enterrise Miner systemu SAS do modelowania w zakresie drzew decyzyjnych. U_03 Potrafi rzygotować dane do analizy. Odniesienie do efektów kierunkowych K_W02 K_W02 w, K_W02 w, K_W02 w w K_U06 K_U16 K_U06 K_U16 K_U04 K_U06 U_04 Potrafi zinterretować wyniki modelowania. K_U04 U_05 Potrafi ocenić jakość wyznaczonych modeli. K_U04 K_01 Potrafi doskonalić, uzuełniać zdobytą wiedzę i umiejętności. Ma świadomość rofesjonalnego działania w analizach zjawisk i rocesów. w, K_K01 K_K04 K_K05 Odniesienie do efektów obszarowych X1P_W02 X1P_W04 T1P_W01 X1P_W03 X1P_W04 X1P_W02 X1P_W02 T1P_U05 T1P_U16 T1P_U05 T1P_U16 T1P_U16 X1P_U03 X1P_U02 X1P_U03 T1P_K01 X1P_K01 X1P_K05 T1P_K03 T1P_K04 2
Treści kształcenia 1. Treści kształcenia w zakresie wykładu Nr wykładu 1 2 3 4 5 6 7 Treści kształcenia Wielokrotna regresja liniowa. Miary wsółzależności cech, testowanie istotności wsółczynnika korelacji. Metody szacowania arametrów modelu regresji. Ocena jakości wyznaczonego modelu. Zaoznanie z akietem statystycznym SAS. Środowisko akietu Enterrise Miner (EM). SAS (EM) ekserymenty badawcze. Przygotowanie danych do analizy. Budowa diagramu rzeływu informacji dla modelu wielokrotnej regresji liniowej. Interretacja wyników modelowania. Wielokrotna regresja logistyczna. Pojęcia szansy, ilorazu szans, funkcji logistycznej. Metody wyznaczania modelu logistycznego. Ocena jakości modelu. Analiza macierzy omyłek. Prognozowanie sukcesu na odstawie wyestymowanego modelu. Interretacja wyestymowanych ilorazów szans. Charakterystyka danych do analizy, modyfikacja wartości zmiennych. Podział zbioru źródłowego na odzbiory: treningowy, walidacyjny, testowy. Niwelowanie nierównomiernego rozkładu jakościowej zmiennej celu. Metody wyznaczania modelu wielokrotnej regresji logistycznej. Budowa diagramu rzeływu informacji dla modelu. Interretacja wyników modelowania. SAS (EM) ekserymenty badawcze. Decyzyjne drzewa regresyjne i klasyfikacyjne. Obszary zastosowań. Rekurencyjne algorytmy budowy drzewa decyzyjnego. Problemy w budowaniu drzewa. Kryteria oceny jakości drzewa jako klasyfikatora. Sosoby rzygotowania zbioru danych do analizy. Podział na odzbiory: treningowy, walidacyjny, testowy. Definiowanie wariantów ekserymentów orzez różne ustawienia dla drzewa decyzyjnego. Budowa diagramu rzeływu informacji dla drzewa decyzyjnego. Interretacja wyników modelowania. SAS (EM) ekserymenty badawcze. Ocena i orównanie modeli: rognostycznych: regresja liniowa vs regresyjne drzewo decyzyjne, klasyfikacyjnych: regresja logistyczna vs klasyfikacyjne drzewo decyzyjne. 8 Egzamin. Odniesienie do efektów kształcenia dla modułu W_05 W_05 W_04 W_02 W_06 W_02 W_04 W_02 2. Treści kształcenia w zakresie ćwiczeń 3. Treści kształcenia w zakresie zadań laboratoryjnych 4. Charakterystyka zadań rojektowych Student w ramach rzedmiotu jest zobowiązany do wykonania: czterech rac rojektowych (ekseryment badawczy + srawozdanie), srawozdania końcowego orównującego wykorzystane metody i narzędzia oraz wyniki analiz otrzymanych z wykorzystaniem tych narzędzi. Każdy rojekt obejmuje wybór i rzygotowanie danych do modelowania, wykonanie obliczeń z wykorzystaniem akietu SAS oraz analizę merytoryczną i jakościową otrzymanych wyników. Zakres tematyczny oszczególnych rojektów obejmuje: Projekt 1: Wielokrotna regresja liniowa. Projekt 2: Wielokrotna regresja logistyczna. 3
Projekt 3: Drzewa regresyjne (dane z rojektu nr 1). Projekt 4: Drzewa kwalifikacyjne (dane z rojektu nr 2). Srawozdanie końcowe owinno zawierać jakościowe orównanie wyników modelowania z wykorzystaniem metod wielokrotnej regresji liniowej i drzewa regresyjnego oraz wielokrotnej regresji logistycznej i drzewa kwalifikacyjnego otrzymanych z rzerowadzonych wcześniej ekserymentów badawczych. 5. Charakterystyka zadań w ramach innych tyów zajęć dydaktycznych Metody srawdzania efektów kształcenia Symbol efektu Metody srawdzania efektów kształcenia (sosób srawdzenia, w tym dla umiejętności odwołanie do konkretnych zadań rojektowych, laboratoryjnych, it.) Egzamin, rojekt 1, rojekt 2. W_02 Egzamin, rojekt 3, rojekt 4. Egzamin, rojekty 1-4. W_04 Egzamin, rojekt 2, rojekt 4. W_05 Egzamin. W_06 Egzamin. U_01 Projekt 1, rojekt 2. U_02 Projekt 2, rojekt 3. U_03 Projekty 1-4. U_04 Projekty 1-4. U_05 Projekty 1-4, srawozdanie końcowe. K_01 Tworzenie modeli oraz srawozdań dla rzerowadzonych ekserymentów badawczych. Tworzenie modeli oraz srawozdań dla rzerowadzonych ekserymentów badawczych. 4
D. NAKŁAD PRACY STUDENTA Bilans unktów ECTS L. Rodzaj aktywności Obciążenie studenta Jednostka 1. Udział w wykładach 15 h 2. Udział w ćwiczeniach 3. Udział w laboratoriach 4. Udział w zajęciach rojektowych 30 h 5. Udział w konsultacjach (2-3 razy w semestrze) 6. Konsultacje rojektowe 4 h 7. Udział w egzaminie 2 h 8. 9. Liczba godzin realizowanych rzy bezośrednim udziale nauczyciela akademickiego 51 h Liczba unktów ECTS, którą student uzyskuje na zajęciach 10. wymagających bezośredniego udziału nauczyciela akademickiego 1,9 ECTS (1 unkt ECTS=27 godzin obciążenia studenta) 11. Samodzielne studiowanie tematyki wykładów 18 h 12. Samodzielne rzygotowanie się do ćwiczeń 13. Samodzielne rzygotowanie się do kolokwiów 14. Samodzielne rzygotowanie się do laboratoriów 15. Wykonanie srawozdań 16. Przygotowanie do kolokwium końcowego z laboratorium 17. Wykonanie rojektu lub dokumentacji 30 h 18. Przygotowanie do egzaminu 9 h 19. 20. Liczba godzin samodzielnej racy studenta 57 h Liczba unktów ECTS, którą student uzyskuje w ramach 21. samodzielnej racy 2,1 ECTS (1 unkt ECTS=27 godzin obciążenia studenta) 22. Sumaryczne obciążenie racą studenta 108 h 23. Punkty ECTS za moduł 1 unkt ECTS=27 godzin obciążenia studenta 4 ECTS 24. 25. Nakład racy związany z zajęciami o charakterze raktycznym Suma godzin związanych z zajęciami raktycznymi Liczba unktów ECTS, którą student uzyskuje w ramach zajęć o charakterze raktycznym 1 unkt ECTS=27 godzin obciążenia studenta 64 h 2,4 ECTS 5
E. LITERATURA Wykaz literatury 1. Chat T. L., Alied Categorical Data Analysis, A Wiley Interscience Publication, John Wiley&Sons Inc., 1998. 2. Cichosz P., Systemy uczące się, WN-T, Warszawa 2000. 3. Giudici P., Alica Data Mining. Statistical methods for Business and Industry, John Wiley & Sons Ltd., Chichester 2003. 4. Hand D., Mannila H., Smyth P., Eksloracja danych, WNT, Warszawa 2005. 5. Larose D. T., Metody i modele eksloracji danych, Wydawnictwo Naukowe PWN, Warszawa 2008. 6. Larose D. T., Odkrywanie wiedzy z danych, Wydawnictwo Naukowe PWN, Warszawa 2006. 7. Mulawka J., Systemy eksertowe, WN-T, wydanie II, Warszawa 1996. 8. Koronacki J., Ćwik J., Statystyczne systemy uczące się, WN-T, Warszawa 2005. 9. Nowakowska M., Knowladge discovery in databases. Podręcznik akademicki oracowany w ramach Euroejskiego Funduszu Sołecznego KAPITAŁ LUDZKI. NARODOWA STRATEGIA SPÓJNOŚCI, Kielce 2012, htt://wzimk moodle.tu.kielce.l. Witryna WWW modułu/rzedmiotu 6