Załącznik nr 4 do Uchwały Senatu nr 430/01/2015 SYLABUS Dotyczy cyklu kształcenia 2014-2018 Realizacja w roku akademickim 2016/2017 1.1. PODSTAWOWE INFORMACJE O PRZEDMIOCIE/MODULE Nazwa przedmiotu/ modułu Komputerowe narzędzia eksploracji danych Kod przedmiotu/ modułu* Wydział (nazwa jednostki prowadzącej kierunek) Nazwa jednostki realizującej przedmiot Kierunek studiów Poziom kształcenia Profil Forma studiów Wydział Matematyczno - Przyrodniczy Wydział Matematyczno - Przyrodniczy Informatyka studia inżynierskie I-go stopnia ogólnoakademicki stacjonarne Rok i semestr studiów rok III, semestr 6 Rodzaj przedmiotu Koordynator przedmiot specjalnościowy o tematyce obieralnej dr hab. Jan G. Bazan, prof. UR Imię i nazwisko osoby prowadzącej / osób dr hab. Jan G. Bazan, prof. UR, mgr inż. Łukasz Dydo prowadzących * - zgodnie z ustaleniami na wydziale 1.2. Formy zajęć dydaktycznych, wymiar godzin i punktów ECTS Wykł. Ćw. Konw. Lab. Sem. ZP Prakt. Inne ( jakie?) Liczba pkt ECTS 30 30 5 1.3. Sposób realizacji zajęć zajęcia w formie tradycyjnej zajęcia realizowane z wykorzystaniem metod i technik kształcenia na odległość 1.4. Forma zaliczenia przedmiotu/ modułu ( z toku) ( egzamin, zaliczenie z oceną, zaliczenie bez oceny) EGZAMIN 2.WYMAGANIA WSTĘPNE ALGORYTMY I ZŁOŻONOŚĆ, PROGRAMOWANIE OBIEKTOWE I I II, SZTUCZNA INTELIGENCJA, METODY EKSPLORACJI DANYCH, BAZY DANYCH I I II. 3. CELE, EFEKTY KSZTAŁCENIA, TREŚCI PROGRAMOWE I STOSOWANE METODY DYDAKTYCZNE 3.1. Cele przedmiotu/modułu Celem przedmiotu jest zaznajomienie z przykładowymi konkretnymi systemami eksploracji danych, C1 w których można wykonywać podstawowe zadania eksploracji jak przygotowanie danych, selekcja cech, konstruowanie klasyfikatorów, grupowanie obiektów i odkrywanie wzorców (np. reguł) itd.
Oraz nabycie umiejętności i ich zastosowanie w praktyce. 3.2 EFEKTY KSZTAŁCENIA DLA PRZEDMIOTU/ MODUŁU ( WYPEŁNIA KOORDYNATOR) EK ( efekt kształcenia) EK_01 EK_02 EK_03 EK_04 Treść efektu kształcenia zdefiniowanego dla przedmiotu (modułu) Zna wybrane narzędzia informatyczne do eksploracji danych oraz zna techniki realizacji w nich podstawowych zadań eksploracji. Ma wiedzę (także pozainformatyczną) niezbędną do realizacji projektów informatycznych związanych z eksploracją danych przy użyciu języka programowania Java. Potrafi stosować wybrane narzędzia informatyczne do eksploracji danych, w tym do realizacji w nich podstawowych zadań eksploracji. Potrafi realizować projekty informatyczne związane z eksploracją danych przy użyciu języka programowania Java. Odniesienie do efektów kierunkowych (KEK) K_W04, K_K06 K_W26, K_W33, K_W39 K_U04, K_U29 K_U29, K_W33 3.3 TREŚCI PROGRAMOWE (wypełnia koordynator) A. Problematyka wykładu Treści merytoryczne 1. Wprowadzenie do komputerowych metod eksploracji danych (tablice danych, formaty danych, import danych, problem pustych miejsc w tablicach, dyskretyzacja atrybutów, klasyfikacja i klasyfikatory, generowanie decyzji na podstawie klasyfikatora, metody oceny jakości klasyfikatora, podstawowe scenariusze eksperymentów związane z eksploracją danych). Przegląd najbardziej znanych systemów eksploracji danych. 1. Wprowadzenie do SAS Enterpise Minera. 2. Predykcja z SAS Enterprise Miner-em. 3. Grupowanie z SAS Enterprise Miner-em. 4. Reguły asocjacyjne z SAS Enterprise Miner-em. 5. Reguły sekwencyjne z SAS Enterprise Miner-em. 6. Omówienie obsługi systemu WEKA dla GUI tego systemu. 7. Omówienie WEKA API na przykładzie konkretnych programów. 8. Podstawy systemu Spark na przykładzie konkretnych programów. 9. Omówienie egzaminu z przedmiotu. B. Problematyka ćwiczeń audytoryjnych, konwersatoryjnych, laboratoryjnych, zajęć praktycznych Treści merytoryczne 1. Prezentacja systemu RSES (Rough Set Exploration System) i wykonywanie zadań eksploracyjnych z użyciem tego systemu.
2. Rozpoczęcie pracy z SAS. Przygotowanie przykładowej biblioteki. Wstawianie danych bezpośrednio w pliku CSV. Role atrybutów i typy atrybutów. Wykorzystanie narzędzi: Wykresy różne i Eksploracja statystyk. Próbkowanie danych. Partycjonowanie danych. Filtrowanie danych, w tym wyciąganie podtablicy na atrybutach numerycznych i symbolicznych. 3. Generowanie drzewa decyzyjnego (z partycjonowaniem) dla różnych parametrów. Analiza drzewa i wyników klasyfikacji. Generowanie sieci neuronowej w zadaniu klasyfikacji. Analiza wyników klasyfikacji. Stosowanie regresji w zadaniu klasyfikacji. Porównanie wyników tworzonych modeli (m.in. krzywa ROC). Eksport wyników z systemu. 4. Stosowanie regresji w zadaniu regresji (ciągły atrybut decyzyjny). Sporządzanie prognoz (generowanie decyzji dla nieznanych obiektów). Wykorzystanie macierzy poniesionych kosztów podjętych decyzji. Eksport wyników z systemu. 5. Grupowanie danych z różnymi parametrami. Analiza wyników grupowania: wizualizacja grup, statystyka średnich, tabela istotności zmiennych, drzewo przynależności obiektów do skupień (jeśli jest), rozmiar segmentów, wykres średnich wejściowych, wykres rozkładu atrybutu decyzyjnego w poszczególnych skupieniach, eksport danych z etykieta skupienia, przypisywanie nowych obiektów do skupień. 6. Wyliczanie reguł asocjacyjnych w SAS dla różnych parametrów. Analiza wyników: wykres statystyk, macierz reguł, wykres liniowy statystyk, lista reguł, wizualizacja powiązań pomiędzy regułami. Eksport danych odpowiadających regułom asocjacyjnym. 7. Wyliczanie reguł sekwencyjnych w SAS. Analiza wyników: wykres statystyk, macierz reguł, wykres liniowy statystyk, lista reguł, wizualizacja powiązań pomiędzy regułami. Eksport danych odpowiadających regułom sekwencyjnym. Wyliczanie wartości atrybutów związanych z wyliczonymi wcześniej regułami sekwencyjnymi dla nowych obiektów. 8. Wykorzystanie GUI WEKA do wczytywania danych, wyliczania statystyk, w zadaniu klasyfikacji, grupowania i wyliczana reguł asocjacyjnych. 9. Przykłady użycia WEKA API do czytanie danych i wyliczania statystyk dla zbiorów danych. 10. Przykłady użycia WEKA API do budowy klasyfikatorów. 11. Przykłady użycia WEKA API do grupowania obiektów w danych. 12. Przykłady użycia WEKA API do wyliczania reguł asocjacyjnych. 3.4 METODY DYDAKTYCZNE Wykład: wykład z prezentacją multimedialną Laboratorium: wykonywanie zadań eksploracji danych z użyciem oprogramowania narzędziowego 4 METODY I KRYTERIA OCENY 4.1 Sposoby weryfikacji efektów kształcenia Symbol efektu Metody oceny efektów kształcenia ( np.: kolokwium, egzamin ustny, egzamin pisemny, projekt, sprawozdanie, obserwacja w trakcie zajęć) Forma zajęć dydaktycznych ( w, ćw, )
EK_ 01 KOLOKWIUM, EGZAMIN LAB, W EK_ 02 PROJEKT LAB EK_ 03 KOLOKWIUM, EGZAMIN LAB, W EK_ 04 PROJEKT LAB 4.2 Warunki zaliczenia przedmiotu (kryteria oceniania) Efekt Ocena Kryteria oceny EK_01 dst b EK_02 dst Zna wybrane narzędzia informatyczne do eksploracji danych oraz zna techniki realizacji w nich podstawowych zadań eksploracji. W szczególności, zna techniki wczytywania danych, ich przygotowania do eksploracji, wyliczania dla nich podstawowych statystyk, tworzenia podstawowych modeli eksploracji i wizualizacji podstawowych informacji o ich strukturze oraz podstawowe techniki mierzenia jakości wyznaczonych modeli i formułowania opinii na temat jakości tych metod. Jednak nie ma wystarczającej wiedzy jak poprawnie użyć wyznaczone modele eksploracji danych zarówno w typowej jak i nie typowej sytuacji. Nie zna także technik wyliczania bardziej złożonych statystyk dotyczących danych lub wyznaczonych modeli. Zna wybrane narzędzia informatyczne do eksploracji danych oraz zna techniki realizacji w nich podstawowych zadań eksploracji. W szczególności, zna techniki wczytywania danych, ich przygotowania do eksploracji, wyliczania dla nich podstawowych statystyk, tworzenia podstawowych modeli eksploracji i wizualizacji podstawowych informacji o ich strukturze oraz podstawowe techniki mierzenia jakości wyznaczonych modeli i formułowania opinii na temat jakości tych metod. Ponadto, wie jak poprawnie użyć wyznaczone modele eksploracji danych w typowej sytuacji oraz jak wyliczać bardziej złożone statystyki dotyczące danych lub wyznaczonych modeli. Jednak nie wie jak można poprawnie użyć wyznaczone modele eksploracji danych w nietypowej sytuacji lub w nietypowy sposób, tj. np. wtedy, gdy dane testowe nie są bezpośrednio dostępne w narzędziu i trzeba je zaimportować w nie trywialny sposób. Zna wybrane narzędzia informatyczne do eksploracji danych oraz zna techniki realizacji w nich podstawowych zadań eksploracji. W szczególności, zna techniki wczytywania danych, ich przygotowania do eksploracji, wyliczania dla nich podstawowych statystyk, tworzenia podstawowych modeli eksploracji i wizualizacji podstawowych informacji o ich strukturze oraz podstawowe techniki mierzenia jakości wyznaczonych modeli i formułowania opinii na temat jakości tych metod. Ponadto, wie jak poprawnie użyć wyznaczone modele eksploracji danych w typowej sytuacji oraz jak wyliczać bardziej złożone statystyki dotyczące danych lub wyznaczonych modeli. Wreszcie wie jak poprawnie użyć wyznaczone modele eksploracji danych w nietypowej sytuacji lub w nietypowy sposób, tj. np. wtedy, gdy dane testowe nie są bezpośrednio dostępne w narzędziu i trzeba je zaimportować w nie trywialny sposób. Ma wiedzę (także pozainformatyczną) niezbędną do realizacji projektów informatycznych związanych z eksploracją danych przy użyciu języka programowania Java. Wiedza ta umożliwia wykonanie projektu oprogramowania, które wyposażone jest w elementarny interfejs użytkownika oraz nie ma mechanizmów odporności na błędy popełniane przez użytkownika. Ma wiedzę (także pozainformatyczną) niezbędną do realizacji projektów informatycznych związanych z eksploracją danych przy użyciu języka programowania Java. Wiedza ta umożliwia wykonanie projektu oprogramowania, które wyposażone jest w podstawowy interfejs użytkownika oraz ma mechanizmy odporności na błędy popełniane przez użytkownika, które
b EK_03 dst b EK_04 dst b jednak nie zawsze działają poprawnie i efektywnie. Ma wiedzę (także pozainformatyczną) niezbędną do realizacji projektów informatycznych związanych z eksploracją danych przy użyciu języka programowania Java. Wiedza ta umożliwia wykonanie projektu oprogramowania, które wyposażone jest w zaawansowany interfejs użytkownika oraz ma niezawodne mechanizmy odporności na błędy popełniane przez użytkownika. Potrafi stosować wybrane narzędzia informatyczne do eksploracji danych, w tym techniki do realizacji w nich podstawowych zadań eksploracji. W szczególności, potrafi stosować techniki wczytywania danych, ich przygotowania do eksploracji, wyliczania dla nich podstawowych statystyk, tworzenia podstawowych modeli eksploracji i wizualizacji podstawowych informacji o ich strukturze oraz potrafi stosować podstawowe techniki mierzenia jakości wyznaczonych modeli. Jednak nie zawsze potrafi poprawnie użyć wyznaczone modele eksploracji danych zarówno w typowej jak i nie typowej sytuacji. Ma także problemy z wyliczaniem bardziej złożonych statystyk dotyczące danych lub wyznaczonych modeli. Potrafi stosować wybrane narzędzia informatyczne do eksploracji danych, w tym techniki do realizacji w nich podstawowych zadań eksploracji. W szczególności, potrafi stosować techniki wczytywania danych, ich przygotowania do eksploracji, wyliczania dla nich podstawowych statystyk, tworzenia podstawowych modeli eksploracji i wizualizacji podstawowych informacji o ich strukturze oraz potrafi stosować podstawowe techniki mierzenia jakości wyznaczonych modeli. Ponadto, potrafi poprawnie użyć wyznaczone modele eksploracji danych w typowej sytuacji oraz wylicza bardziej złożone statystyki dotyczące danych lub wyznaczonych modeli. Jednak nie potrafi poprawnie użyć wyznaczone modele eksploracji danych w nietypowej sytuacji lub w nietypowy sposób. Potrafi stosować wybrane narzędzia informatyczne do eksploracji danych, w tym techniki do realizacji w nich podstawowych zadań eksploracji. W szczególności, potrafi stosować techniki wczytywania danych, ich przygotowania do eksploracji, wyliczania dla nich podstawowych statystyk, tworzenia podstawowych modeli eksploracji i wizualizacji podstawowych informacji o ich strukturze oraz potrafi stosować podstawowe techniki mierzenia jakości wyznaczonych modeli. Ponadto, potrafi poprawnie użyć wyznaczone modele eksploracji danych w typowej sytuacji oraz wylicza bardziej złożone statystyki dotyczące danych lub wyznaczonych modeli. Wreszcie potrafi poprawnie użyć wyznaczone modele eksploracji danych w nietypowej sytuacji lub w nietypowy sposób, tj. np. wtedy, gdy dane testowe nie są bezpośrednio dostępne w narzędziu i trzeba je zaimportować w nie trywialny sposób. Potrafi realizować projekty informatyczne związane z eksploracją danych przy użyciu języka programowania Java, przy czym projekty te są związane z budową oprogramowania do eksploracji danych, które wyposażone jest w elementarny interfejs użytkownika oraz często nie jest odporne na błędy obsługi popełniane przez użytkownika. Potrafi realizować projekty informatyczne związane z eksploracją danych przy użyciu języka programowania Java, przy czym projekty te są związane z budową oprogramowania do eksploracji danych, które wyposażone jest w podstawowy interfejs użytkownika oraz czasem nie jest odporne na błędy obsługi popełniane przez użytkownika. Potrafi realizować projekty informatyczne związane z eksploracją danych przy użyciu języka programowania Java, przy czym projekty te są związane z budową oprogramowania do eksploracji danych, które wyposażone jest w
zaawansowany interfejs użytkownika oraz jest odporne na błędy obsługi popełniane przez użytkownika. Zasady uzyskania oceny końcowej: Zaliczenie laboratorium następuje na podstawie zaliczenia wszystkich efektów weryfikowanych przez planowane w danym okresie metody weryfikacji. Przy czym zakłada się, że każda metoda weryfikacji dostarcza osobne oceny dla każdego z weryfikowanych przez nią efektów kształcenia. Jeśli dany efekt jest weryfikowany przez więcej niż jedną metodę, to ocena weryfikująca osiągnięcie tego efektu jest obliczana jako średnia arytmetyczna ocen uzyskanych w poszczególnych metodach weryfikowania tego efektu. Student otrzymuje z zaliczenia ocenę niedostateczny, gdy metody weryfikacji wykażą, iż co najmniej jeden z efektów nie został osiągnięty (średnia ocena dla tego efektu jest niższa niż 3.0); Student otrzymuje ocenę dostateczny, gdy przeciętnie każdy z efektów zostanie osiągnięty na poziomie co najmniej 3.0, ale chociaż jeden z efektów został osiągnięty na poziomie mniejszym od 3.75; Student otrzymuje ocenę dobry, gdy przeciętnie każdy z efektów zostanie osiągnięty na poziomie co najmniej 3.75, ale chociaż jeden z efektów został osiągnięty na poziomie mniejszym od 4.75; Student otrzymuje ocenę bardzo dobry, gdy przeciętnie każdy z efektów zostanie osiągnięty na poziomie co najmniej 4.75; Zaliczenie przedmiotu następuje na podstawie zaliczenia wszystkich form zajęć. Student otrzymuje ocenę niedostateczny, gdy nie zaliczył ćwiczeń lub egzamin wykaże, iż co najmniej jeden z efektów nie został osiągnięty (średnia ocena dla tego efektu jest niższa niż 3.0); Student otrzymuje ocenę dostateczny, gdy posiada zaliczenie z ćwiczeń, a przeciętnie każdy z efektów weryfikowanych na egzaminie zostanie osiągnięty na poziomie co najmniej 3.0, ale chociaż jeden z efektów został osiągnięty na poziomie mniejszym od 3.75; Student otrzymuje ocenę dobry, gdy posiada zaliczenie z ćwiczeń oraz przeciętna ocena z zaliczenia każdego efektu spośród weryfikowanych na egzaminie wyniesie co najmniej 3.75, ale chociaż jeden z efektów został osiągnięty na poziomie mniejszym od 4.75; Student otrzymuje ocenę bardzo dobry, gdy posiada zaliczenie z ćwiczeń oraz przeciętna ocena z zaliczenia każdego efektu spośród weryfikowanych na egzaminie wyniesie co najmniej 4.75. 5. Całkowity nakład pracy studenta potrzebny do osiągnięcia założonych efektów w godzinach oraz punktach ECTS Aktywność godziny zajęć wg planu z nauczycielem 60 Liczba godzin/ nakład pracy studenta
przygotowanie do zajęć (w tym do kolokwiów) udział w konsultacjach 4 20 czas na wykonanie projektu 25 przygotowanie do egzaminu 15 udział w egzaminie 4 SUMA GODZIN 128 SUMARYCZNA LICZBA PUNKTÓW ECTS 5 6. PRAKTYKI ZAWODOWE W RAMACH PRZEDMIOTU/ MODUŁU wymiar godzinowy - zasady i formy oywania praktyk - 7. LITERATURA Literatura podstawowa: 1. Wykłady: http://fenix.univ.rzeszow.pl/bazan/ 2. Dokumentacja systemu RSES ( http://logic.mimuw.edu.pl/~rses/ Dokumentacja systemu WEKA (http://www.cs.waikato.ac.nz/ml/weka/documentation.html ). 3. Witryna internetowa API WEKA (https://weka.wikispaces.com/use+weka+in+your+java+code ) 4. Mirosława Lasek, Marek Pęczkowski: Enterprise Miner. Wykorzystywanie narzędzi Data Mining w systemie SAS, Wydawnictwo Uniwersytetu Warszawskiego, 2013. 5. Larose D.T., Odkrywanie wiedzy z danych; wprowadzenie do eksploracji danych, PWN, 2006. Literatura uzupełniająca: 1. Dokumentacja systemu SAS (https://support.sas.com/documentation/). 2. Morzy T., Eksploracja danych; Metody i algorytmy, PWN, 2013. 3. Dokumentacja systemu PostgreSQL (https://www.postgresql.org/docs/). Akceptacja Kierownika Jednostki lub osoby upoważnionej