Sylabus Nazwa przedmiotu (w j. polskim i angielskim) Nazwisko i imię prowadzącego (stopień i tytuł naukowy) Zaawansowana analiza danych eksperymentalnych Advanced analysis of experimental data dr Veslava Osińska Rok i semestr studiów I rok UM, semestr zimowy Wymiar godzin 30 Kod przedmiotu 0951-K-S2-1-ZADE Kod Erasmus Liczba punktów ECTS 6 Język wykładowy polski Forma zajęć ćwiczenia Sposób zaliczenia końcowego Wymagania wstępne wobec studenta Skrócony opis przedmiotu Pełny opis przedmiotu Zaliczenie na ocenę na podstawie ewaluacji projektu zaliczeniowego Podstawowa znajomość obsługi arkuszy kalkulacyjnych, podstawowa znajomość oprogramowania zorientowanego na statystyczną obróbkę danych. Cel przedmiotu jest określony jako praktyczne zapoznanie się z elementami eksploracyjnej analizy danych, jak również z metodami profesjonalnej wizualizacji wyników przy użyciu specjalistycznego oprogramowania. Wiedza ta jest niezbędna w samodzielnym opracowaniu statystycznym wyników badań empirycznych. Zajęcia mają za zadanie przekazanie studentom praktycznej wiedzy jak umiejętnie zarządzać dużymi, wielowymiarowymi zbiorami danych oraz jakie stosować metody analizy wizualnej do wydajnej eksploracji wyników. W samodzielnym opracowaniu statystycznym wyników badań empirycznych (ankiet, kwestionariuszy, formularzy) niezbędne są umiejętności: obróbki statystycznej danych, fachowej prezentacji, interpretacji i formułowania wniosków. Tych umiejętności dostarcza poniższy
przedmiot, zaplanowany zarówno na przekazanie wiedzy teoretycznej, tak i praktyczną implementację rachunku prawdopodobieństwa w serii przygotowanych ćwiczeń za pomocą wyspecjalizowanych narzędzi sieciowych oraz pakietu SPSS. Podczas teoretycznego omawiania zagadnień wprowadzana jest fachowa terminologia. Na etapie końcowym studenci uczą się efektywnej wizualizacji wyników badań przy wykorzystaniu sieciowych narzędzi Open Source. Studenci ćwiczą z narzędziami do zarządzania danymi, analiz statystycznej i eksploracyjnowizualnej, za pomocą których będą mogli: - zbierać i opracowywać materiał empiryczny, - grupować i filtrować dane, używając relacyjnych baz danych, - przeprowadzać podstawową analizę statystyczną danych, - przeprowadzić zaawansowane testy statystyczne, - przeprowadzać eksploracyjną analizę danych, - formułować poprawne wnioski, - prezentować wyniki w ujęciu ich praktycznego wykorzystania. Zakres tematów (bloki tematyczne) Treści materiału zawierają następujące bloki tematyczne: 1. Obróbka danych i wizualizacja w arkuszach kalkulacyjnych: typy danych, formaty importu/eksportu danych tekstowych, podstawowe funkcje do przetwarzania danych numerycznych i tekstowych. 2. Relacyjne bazy danych: pojęcia, definicje, przykłady, projektowanie tabel i relacji. Obiekty, struktura, typy danych, formularze, raporty. Projekt własnej relacyjnej bazy danych i wizualizacja diagramu relacji. 3. Podstawowe miary statystyczne. Rozkład normalny. Błędy statystyczne, wariancja, średnie i mediany. Histogram. Przedział ufności. Interfejs SPSS. Zmienne badane zależne i niezależne. Test normalności rozkładu. Stawianie i testowanie hipotez badawczych. Hipotezy zerowe i alternatywne. Prawdopodobieństwo wartości losowej. Poziom ufności w badaniu.
4. Elementy analizy eksploracyjnej: PCA, wykres współrzędnych równoległych, metody wizualizacji. Sieciowe narzędzia do wizualnej analizy danych. Wybór właściwego narzędzia dopasowanego do formatu i specyfikacji danych eksperymentalnych. 5. Metodologia badań eksperymentalnych w neuronaukach. Metody nieliniowe w analizie danych eksperymentalnych. Literatura (Obowiązkowa, ponadobowiązkowa) Podstawowa: 1. M. Kopertowska-Tomczak. Bazy danych. PWN, Warszawa, 2009. 2. M. J. Hernandez Bazy danych dla zwykłych śmiertelników. Mikom, Warszawa 2004. 3. Daniel T. Larose. Odkrywanie wiedzy z danych. PWN, Warszawa, 2006. 4. Ian Witten, Eibe Frank. Data Mining. ELSEVIER, 2005. 5. Tom Soukup, Jan Sorensen. Visual Data Mining: Techniques and Tools for Data Visualization and Mining, WILEY, 2002. 6. A Hrynkiewicz. Fizyczne metody diagnostyki medycznej. PWN, Warszawa, 2002. Dodatkowa: 1. W. Osińska, G. Osiński. Technologia Informatyczna. UMK, Toruń, 2001. 2. Jack Cohen, Ian Stewart The Collapse of Chaos Penguin Groups 1995.c c Cele (z punktu widzenia nauczyciela) Odniesienie do kierunkowy ch efektów kształcenia Efekty kształcenia Odniesienie do obszarowych efektów kształcenia Metody i środki dydaktyczne Kryteria i forma oceny 1. Przedstawienie metodologii analizy danych uzyskanych w K_W05 Student ma uporządkowaną wiedzę na temat metod statystyki opisowej w naukach społecznych i humanistycznych. X2A_W05 H2A_W04 Praktyczne zadanie obliczeniowe na
podstawowych doświadczeniach stosowanych w warsztacie naukowym neuronauk. K_U03 Student zna podstawowe metody, techniki i narzędzia stosowane przy przetwarzaniu zasobów danych tekstowo-graficznych. Student twórczo wykorzystuje wiedzę z dyscyplin wchodzących w skład kognitywistyki i metodologiczną w formułowaniu hipotez i konstruowaniu krytycznych argumentacji H2A_U01 H2A_U06 plat Moodle. 2. Zapoznanie studentów z planowaniem etapów procesu badawczego: kolekcjonowaniem, obróbką, analizą, wizualizacją i interpretacją danych. K_W06 K_U01 Student/ka ma wiedzę i potrafi zaplanować przeprowadzenie eksperymentu w oparciu o analizę dużej ilości danych wieloparametrycznych w utworzonej wcześniej bazie danych. Potrafi również przeanalizować problem badawczy i zastosować właściwą metodologię analizy danych eksperymentalnych X2A_W05 H2A_U01 Wykonywanie ćwiczeń w trakcie zajęć. 3. Nauczenie studentów praktycznej umiejętności projektowania i zarządzania bazą danych ekspertmenttalnych. K_U02 K_K02 Student potrafi zgromadzić niezbędne dane eksperymentalne. Student umie zaprojektować relacyjną bazę danych i zarządzać nią. Student potrafi samodzielnie dobrać odpowiednie narzędzie do profesjonalnego przetworzenia danych wielowymiarowych. H2A_U03 H2A_K02 Prezentacja wzorowej specjalistyczn ej bazy danych i jej analiza. Wykonanie projektu własnej relacyjnej bazy danych wyspecjalizowa nej w zakresie neuronauk. 4. Zapoznanie studentów z metodami statystycznej i K_U17 Student potrafi dokonać samodzielnej analizy statystycznej dużego zbioru danych oraz dokonać. Student umie interpretować wyniki badań X2A_U02 seria Ćwiczenia. plat Moodle na
eksploracyjnej analizy danych pomiarowych. K_K04 stat.ystycznych. Student jest świadom wagi opisu statystycznego badań empirycznych w zakresie nauk kognitywnych. X2A_K06 P2A_K06 zaplanowanych wspólnych ćwiczeń, 5. Nauczenie studentów efektywnej, profesjonalnej wizualizacji wyników eksperymentalnych. K_U22 K_K04 Student potrafi dokonać przejrzystej wizualizacji wyników pracy empirycznej, umie dokonać wyboru właściwej techniki wizualizacyjnej w celu prezentacji wyników określonej grupie docelowej. Student rozumie potrzebę fachowej interpretacji wyników analizy statystycznej i przekazywania społeczeństwu wiedzy o tym. P2A_U06 X2A_K06 P2A_K06 dyskusja Projekt zaliczeniowy.