KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angieskim Obowiązuje od roku akademickiego 05/06 Z-ID-50 Eksporacja i przygotowanie danych do anaiz Data Exporation and Preparation to Anayses A. USYTUOWANIE MODUŁU W SYSTEMIE STUDIÓW Kierunek studiów Poziom kształcenia Profi studiów Forma i tryb prowadzenia studiów Specjaność Jednostka prowadząca moduł Koordynator modułu Inżynieria danych I stopień Praktyczny Studia stacjonarne Wszystkie specjaności Katedra Informatyki i Matematyki Stosowanej Dr hab. Marzena Nowakowska Zatwierdził B. OGÓLNA CHARAKTERYSTYKA PRZEDMIOTU Przynaeżność do grupy/boku przedmiotów Status modułu Język prowadzenia zajęć Usytuowanie modułu w panie studiów - semestr Usytuowanie reaizacji przedmiotu w roku akademickim Wymagania wstępne Egzamin (TAK/NIE) Liczba punktów ECTS Kierunkowy Obowiązkowy Poski Semestr V Semestr zimowy Agebra iniowa, Eementy rachunku prawdopodobieństwa i statystyki, Bazy danych, Logika, Agorytmy i struktury danych, Akwizycja danych pomiarowych, Bezpieczeństwo danych, Zarządzanie bazami danych - SQL TAK Forma prowadzenia zajęć Liczba godzin w semestrze wykład w ćwiczenia ć aboratorium 5 0 projekt p inne i
C. EFEKTY KSZTAŁCENIA I METODY SPRAWDZANIA EFEKTÓW KSZTAŁCENIA Ce modułu Nabycie przez studenta umiejętności przetwarzania danych w ceu ich przygotowania do zaawansowanych anaiz. Wykształcenie świadomości ważności tego procesu pracy z danymi jako fundamentanego etapu pośredniego między etapem rejestracji i zarządzania danymi a etapem anaizy związków w danych. Wskazanie możiwości wykorzystania programów: Access, Exce, SAS (w tym pakietu Enterprise Miner oraz modułu Enterprise Guide ) w reaizacji zadań eksporacji i przygotowania danych do anaiz. Symbo efektu W_0 W_0 W_0 W_0 U_0 U_0 U_0 U_05 K_0 Efekty kształcenia Student wie jak poszukiwać i pozyskiwać dane potrzebne do anaiz. Student ma świadomość znaczenia jakości danych. Ma podstawową wiedzę w zakresie diagnozowania jakości danych oraz narzędzi wykorzystywanych do czyszczenia danych. Student ma wiedzę dotycząca przygotowania danych do anaiz poprzez ich ewidencję i wstępną eksporację. Student wie jak i jakie narzędzia programistyczne stosować do eksporacji i przygotowania danych do anaiz. Student potrafi pozyskać dane do anaiz oraz scharakteryzować ich strukturę. Student potrafi wykonać podstawową diagnozę jakości danych i wykonać podstawowe operacje czyszczenia tych danych. Student potrafi wykonać eksporację danych iościowych i jakościowych, wykorzystując właściwe oprogramowanie. Student potrafi zidentyfikować podstawowe probemy w danych oraz zaproponować rozwiązanie tych probemów, również z wykorzystaniem właściwego oprogramowania. Student umie opracować wyniki swojej pracy w formie dokumentacji ub Student ma świadomość odpowiedzianości za pracę własną oraz ponoszenia odpowiedzianości za wspónie reaizowane zadania projektowe. Student umie komunikować się w zespoe interdyscypinarnym w zakresie wykraczającym poza zagadnienia czysto techniczne. Forma prowadzenia zajęć w, w, w, w, kierunkowych K_W K_W09, K_W K_W K_W, K_W obszarowych TP_W07 TP_W0 TP_W07 XP_W0 XP_W0 XP_W0 w, K_U0 TP_U5 K_U06, K_U6 K_U06, K_U K_U, K_U6 K_U0 w, K_K0 w, K_K05 TP_U05 TP_U08 TP_U09 TP_U6 TP_U0 TP_U08 TP_U09 TP_U TP_U0 TP_U09 TP_U5 TP_U0 TP_U0 XP_U05 XP_U08 TP_K0 TP_K0 XP_K0 TP_K0 XP_K0
Treści kształcenia. Treści kształcenia w zakresie wykładu Nr wykładu Treści kształcenia Źródła danych i metody pozyskiwania danych do anaiz (dane oportunistyczne, eksperymentane). Diagnozowanie struktur danych. Kasyfikacja danych. Znaczenie jakości danych. Niekompetność i niepoprawność danych. Możiwości diagnozowania jakości danych i usuwania w nich usterek zagadnienie czyszczenia danych. Weryfikacja danych w oparciu o źródła wewnętrzne i zewnętrzne. Pozyskiwanie i tworzenie zasobów zewnętrznych do weryfikacji danych. Spójność wewnętrzna i integraność referencyjna w bazach danych. Metody i narzędzia do weryfikacji i naprawy danych numerycznych (w tym danych typu data/godzina). Metody i narzędzia do weryfikacji i naprawy danych tekstowych. Eksporacja danych kwaitatywnych (rozkłady, ocena zmiennych jakościowych, badanie niezaeżności zmiennych jakościowych). Eksporacja danych kwantytatywnych (miary statystyczne, histogramy, anaiza koreacji). Probemy z danymi: duże zbiory danych, iczne atrybuty, iczne rekordy, 5 niekompetność danych, nierównomierny rozkład atrybutów. Metody rozwiązywania probemów z danymi. Narzędzia do rozwiązywania probemów z danymi w systemie SAS. 6 Wykorzystanie węzłów wspomagających przetwarzanie danych w środowisku pakietu Enterprise Miner. Przekształcanie danych da ceów anaiz (data manipuation): dane iościowe: odrzucanie wartości ekstremanych, normaizacja, dyskretyzacja (kategoryzacja) atrybutów ciągłych, 7 dane jakościowe: wartości rzadkie, agregacja wartości cechy, agregacja cech. 8 Egzamin. kształcenia da modułu W_0, U_0 W_0, W_0, U_0 W_0, U_0 U_0. Treści kształcenia w zakresie ćwiczeń. Treści kształcenia w zakresie zadań aboratoryjnych Nr zajęć ab. 5 6 Treści kształcenia Pozyskanie danych do anaiz. Charakterystyka źródła danych i sposobu ich pozyskania, opis struktury pozyskanego zbioru danych i charakterystyka jego zawartości, kasyfikacja danych w zbiorze. Opracowanie Sprawozdanie z wykonania prac z ćwiczeń nr. Wnioski i zaecenia. Identyfikacja danych niekompetnych, błędów w danych i możiwych źródeł ich powstania. Wskazanie zakresu poprawy danych. Wybrane metody naprawy danych. Przygotowanie źródeł zewnętrznych do wsparcia procedur czyszczenia. Opracowanie i zastosowanie narzędzi do poprawy danych w oparciu o źródła zewnętrze i dane wewnętrzne: weryfikacja i naprawa danych numerycznych (w tym danych typu data/godzina), wersyfikacja i naprawa danych tekstowych. Statystyka weryfikacji i naprawy danych. Opracowanie Sprawozdanie z wykonania prac z ćwiczeń nr i. Wnioski i zaecenia. Eksporacja danych kwaitatywnych z wykorzystaniem programu Exce i modułu Enterprise Guide (EG) systemu SAS: zakresy wartości i rozkłady zmiennych jakościowych, ocena zmiennych jakościowych, badanie niezaeżności zmiennych jakościowych. kształcenia da modułu W_0, W_0, U_0 W_0, W_0, U_0, W_0, U_0, U_0,
7 8 9-0 Eksporacja danych kwantytatywnych z wykorzystaniem programu Exce i modułu Enterprise Guide (EG) systemu SAS: miary statystyczne zmiennych iościowych, rozkłady zmiennych iościowych, anaiza koreacji miedzy zmiennymi iościowymi. Opracowanie Sprawozdanie z wykonania prac z ćwiczeń nr 6 i 7. Rozwiązywanie probemów z danymi w systemie SAS. Węzły wspomagające przetwarzanie danych w środowisku pakietu Enterprise Miner (EM). Budowanie diagramu przepływu informacji w obszarze roboczym EM do przygotowania danych do anaiz. Opracowanie Sprawozdanie z wykonania prac z ćwiczeń nr 9 i 0. Przekształcanie danych iościowych w środowisku systemu SAS w ceu ich przygotowania do anaiz (narzędzia i metody przetwarzania danych): wartości ekstremane, normaizacji, dyskretyzacja atrybutów ciągłych. Przekształcanie danych jakościowych w środowisku systemu SAS w ceu ich przygotowania do anaiz (narzędzia i metody przetwarzania danych): wartości rzadkie, agregacja wartości zmiennych jakościowych, agregacja zmiennych jakościowych. Opracowanie Sprawozdanie z wykonania prac z ćwiczeń nr i. 5 Kookwium podsumowujące.. Charakterystyka zadań projektowych 5. Charakterystyka zadań w ramach innych typów zajęć dydaktycznych Metody sprawdzania efektów kształcenia Symbo efektu W_0 W_0 W_0 W_0 U_0 U_0 U_0 U_05 K_0 Metody sprawdzania efektów kształcenia (sposób sprawdzenia, w tym da umiejętności odwołanie do konkretnych zadań projektowych, aboratoryjnych, itp.) Zadania do samodzienego wykonania na zajęciach. Zadania do samodzienego wykonania na zajęciach. Egzamin. Zadania do samodzienego wykonania na zajęciach. Egzamin. Zadania do samodzienego wykonania na zajęciach. Egzamin. Zadania do samodzienego wykonania na zajęciach. Praca przy komputerze oraz opracowanie Zadania do samodzienego wykonania na zajęciach. Praca przy komputerze oraz opracowanie Zadania do samodzienego wykonania na zajęciach. Praca przy komputerze oraz opracowanie Zadania do samodzienego wykonania na zajęciach. Praca przy komputerze oraz opracowanie Opracowanie raportów z prac oraz dyskusja nad ich strukturą ogiczną i treściami merytorycznymi. Komentarze i dyskusja opracowań studenckich na ćwiczeniach aboratoryjnych i wykładach. Komentarze i dyskusja opracowań studenckich na ćwiczeniach aboratoryjnych i wykładach.
D. NAKŁAD PRACY STUDENTA Bians punktów ECTS Obciążenie Jednostka Lp. Rodzaj aktywności studenta. Udział w wykładach 5 h. Udział w ćwiczeniach. Udział w aboratoriach 0 h. Udział w zajęciach projektowych 5. Udział w konsutacjach (- razy w semestrze) h 6. Konsutacje projektowe 7. Udział w egzaminie h 8. 9. Liczba godzin reaizowanych przy bezpośrednim udziae nauczyciea akademickiego 5 h Liczba punktów ECTS, którą student uzyskuje na zajęciach 0. wymagających bezpośredniego udziału nauczyciea akademickiego,9 ECTS ( punkt ECTS=7 godzin obciążenia studenta). Samodziene studiowanie tematyki wykładów 8 h. Samodziene przygotowanie się do ćwiczeń. Samodziene przygotowanie się do kookwiów. Samodziene przygotowanie się do aboratoriów 0 h 5. Wykonanie sprawozdań 0 h 6. Przygotowanie do kookwium końcowego z aboratorium 7. Wykonanie projektu ub dokumentacji 8. Przygotowanie do egzaminu 9 h 9. 0. Liczba godzin samodzienej pracy studenta 57 h Liczba punktów ECTS, którą student uzyskuje w ramach samodzienej pracy, ECTS. ( punkt ECTS=7 godzin obciążenia studenta). Sumaryczne obciążenie pracą studenta 08 h. Punkty ECTS za moduł punkt ECTS=7 godzin obciążenia studenta ECTS. 5. Nakład pracy związany z zajęciami o charakterze praktycznym Suma godzin związanych z zajęciami praktycznymi Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym punkt ECTS=7 godzin obciążenia studenta E. LITERATURA Wykaz iteratury Witryna WWW modułu/przedmiotu 6 h, ECTS. Cichosz P., Systemy uczące się, Wydawnictwa Naukowo-Techniczne, Warszawa 000.. Larose D.T., Metody i modee eksporacji danych, Wydawnictwo Naukowe PWN, Warszawa 008.. Hand D., Mania H., Smyth P., Eksporacja danych, Wydawnictwa Naukowo- Techniczne, Warszawa 005.. Ohost F.J., Big Data Anaytics. Turning Big Data into Big Money, John Wiey & Sons, Inc., Hoboken, New Jersey 0. 5. Panek T., Statystyczne metody wieowymiarowej anaizy porównawczej, Szkoła Główna Handowa w Warszawie, Warszawa 009. 6. Dokumentacja programu SAS dostępna on-ine. 5