Podstawy statystyki matematycznej w programie R

Podobne dokumenty
Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Spis treści 3 SPIS TREŚCI

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

STATYSTYKA MATEMATYCZNA

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

Opis przedmiotu. Karta przedmiotu - Probabilistyka I Katalog ECTS Politechniki Warszawskiej

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

przedmiot podstawowy obowiązkowy polski drugi

Opis przedmiotu: Probabilistyka I

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Rok akademicki: 2012/2013 Kod: JFM s Punkty ECTS: 3. Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne

laboratoria 24 zaliczenie z oceną

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie...

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

SPIS TEŚCI CZĘŚĆ I RACHUNEK PRAWDOPODOBIEŃSTWA

Opis programu studiów

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

STATYSTYKA Statistics. Inżynieria Środowiska. II stopień ogólnoakademicki

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

KARTA PRZEDMIOTU / SYLABUS

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

Sylabus do programu kształcenia obowiązującego od roku akademickiego 2014/15

KARTA KURSU. Kod Punktacja ECTS* 1

Wykład Ćwiczenia Laboratorium Projekt Seminarium 30

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Przykład 1. (A. Łomnicki)

STATYSTYKA MATEMATYCZNA

WNIOSKOWANIE STATYSTYCZNE SYLABUS A. Informacje ogólne

Statystyka matematyczna i ekonometria

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

wolne wolne wolne wolne

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Statystyka w zarządzaniu : pełny wykład / Amir D. Aczel. wyd. 1, dodr. 5. Warszawa; Spis treści

Własności statystyczne regresji liniowej. Wykład 4

Metody statystyczne w socjologii SYLABUS A. Informacje ogólne Opis

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Testy nieparametryczne

Nazwa przedmiotu: Informatyczne systemy statystycznej obróbki danych. Informatics systems for the statistical treatment of data Kierunek:

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

S YLABUS MODUŁU (PRZEDMIOTU) I nformacje ogólne. Nie dotyczy

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2013/2014

STATYSTYKA MATEMATYCZNA

BIOSTATYSTYKA. Liczba godzin. Zakład Statystyki i Informatyki Medycznej

Statystyka matematyczna dla leśników

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

author: Andrzej Dudek

KARTA PRZEDMIOTU / SYLABUS

Metody Statystyczne. Metody Statystyczne.

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Metody statystyczne w pedagogice Kod przedmiotu

KARTA PRZEDMIOTU / SYLABUS

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

KARTA PRZEDMIOTU / SYLABUS

MATEMATYKA3 Mathematics3. Elektrotechnika. I stopień ogólnoakademicki. studia stacjonarne. Katedra Matematyki dr Zdzisław Piasta

KARTA PRZEDMIOTU / SYLABUS Wydział Nauk o Zdrowiu Zdrowie Publiczne ogólnoakademicki praktyczny inny jaki. Zakład Statystyki i Informatyki Medycznej

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Uczelnia Łazarskiego Wydział Medyczny Kierunek Lekarski

Z-0033z Statystyka. Zarządzanie i Inżynieria Produkcji I stopień Ogólnoakademicki. Stacjonarne Wszystkie Katedra Matematyki dr Zdzisław Piasta

Testowanie hipotez statystycznych.

Wprowadzenie do analizy korelacji i regresji

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Z poprzedniego wykładu

Analiza niepewności pomiarów

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

KARTA PRZEDMIOTU. WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI 1. Brak

SYLABUS. DOTYCZY CYKLU KSZTAŁCENIA (skrajne daty) Statystyka w badaniach medycznych. dr Bernard Sozański wykład, ćwiczenia konwersatoryjne

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

CZĘŚĆ I: ISTOTNE STATYSTYKI DOTYCZĄCE STATYSTYKI

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Statystyka Matematyczna Anna Janicka

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Statystyka SYLABUS A. Informacje ogólne

Informatyka I stopień (I stopień / II stopień) ogólno akademicki (ogólno akademicki / praktyczny) podstawowy (podstawowy / kierunkowy / inny HES)

Elektrotechnika II [ Laboratorium Grupa 1 ] 2016/2017 Zimowy. [ Laboratorium Grupa 2 ] 2016/2017 Zimowy

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Transkrypt:

Podstawy statystyki matematycznej w programie R Piotr Ćwiakowski Wydział Fizyki Uniwersytetu Warszawskiego Zajęcia 1. Wprowadzenie 1 marca 2017 r.

Program R Wprowadzenie do R i badań statystycznych podstawowe operacje w R eksploracyjna analiza danych podstawowe metody wizualizacji Statystyka opisowa miary tendencji centralnej miary rozproszenia histogram wykres pudełkowy wykres słupkowy rozkład empiryczny zmiennej rozkłady statystyczne zmiennej ciągłej i dyskretnej Elementy rachunku prawdopodobieństwa dystrybuanta i funkcja gęstości Prawo Wielkich Liczb Centralne Twierdzenie Graniczne schematy losowań próby losowej losowanie proste, warstwowe, grupowe metodologia badań statystycznych wybrane zagadnienia

Program (2) Budowa testu statystycznego: błąd standardowy (pojęcie i oszacowanie), budowa hipotez statystycznych, weryfikacja hipotez błędy I i II rodzaju, określanie i znaczenie poziomu istotności, konstrukcja statystyki testowej weryfikacja i interpretacja wyniku testu statystycznego przedział ufności budowa i interpretacja badanie mocy testu, określanie wielkości próby do badania Przegląd testów parametrycznych testy średniej w jednej próbie test wariancji w jednej próbie testy równości średnich w dwóch próbach, testy homogeniczności wariancji w dwóch próbach Badanie normalności rozkładu znaczenie założenia o normalności rozkładu, testowanie hipotezy o normalności rozkładu (przegląd testów) Przegląd testów nieparametrycznych test znaków test Manna-Witneya testy Wicoxona testy odsetka

Program (3) Analiza korelacji korelacja Pearsona korelacja Spearmana korelacja Tau Kendalla korelogram wizualizacja macierzy korelacji testy parametryczne i nieparametryczne istotności korelacji Analiza tablicy kontyngencji test zgodności i niezależności chi-kwadrat, poprawka Yatesa test Fishera statystyka V-Cramera współczynnik Phi wizualizacja tablicy kontyngencji (np. wykres mozaikowy, balloon plot) Wstęp do regresji liniowej teoria budowy modelu regresji liniowej algorytm wyznaczania parametrów regresja z jedną zmienną regresja wielu zmiennych oszacowanie i interpretacja wyników

Charakter kursu Teoria badań statystycznych Praktyka badań statystycznych

Terminy i tematyka spotkań Lp. Data Temat 1 1 marca Wprowadzenie do programu 2 8 marca Przetwarzanie danych w programie R 3 15 marca Wizualizacja danych w R 4 22 marca Statystyka opisowa, wprowadzenie do badań statystycznych 5 29 marca Elementy rachunku prawdopodobieństwa 6 5 kwietnia Budowa testu statystycznego testy parametryczne 7 12 kwietnia Testy parametryczne - ćwiczenia

Terminy i tematyka spotkań Lp. Data Temat 8 19 kwietnia Testy na normalność rozkładu, testy nieparametryczne 9 26 kwietnia Moc testu statystycznego, wyznaczanie optymalnej wielkości próby 10 10 maja Model ANOVA, testy post-hoc 11 17 maja Analiza korelacji 12 24 maja Analiza tablicy kontyngencji 13 31 maja Analiza regresji liniowej cz. 1 14 7 czerwca Analiza regresji liniowej cz. 2 15 14 czerwca Wprowadzenie do statystyki bayesowskiej

Zaliczenie kursu obecność (możliwe trzy nieobecności nieusprawiedliwione) praca na zajęciach Za aktywność dodatkowe punkty prace domowe Prace domowe są po każdych zajęciach Łączna liczba punktów z prac domowych wynosi 100 pkt. (100% zaliczenia) Prac domowych będzie 14 (różnie punktowane) praca dodatkowe pojawiają się nieregularnie, można zdobyć dodatkowe punkty

Materiały Materiały dostępne są: na platformie edukacyjnej Moodle (mikroekonomia.wne.uw.edu.pl) W skład materiałów wchodzą: Prezentacja (pdf) Kod R-owy z komentarzem (rozszerzenie *.R) Bazy danych Treści zadań (pdf) Rozwiązania zadań (dostępne po zajęciach)

Organizacja pracy na zajęciach Tryb pracy na zajęciach wykład (część teoretyczna ), ćwiczenia (praktyczna implementacja w programie R) warsztat (praca samodzielna pod kierunkiem prowadzącego), praca samodzielna w domu (powtarzanie materiału z ) Kontakt mailowy W sprawach organizacyjnych oraz merytorycznych W czasie trwania kursu oraz po jego zakończeniu Adres: pcwiakowski@wne.uw.edu.pl Środowisko pracy Program R Nakładka R Studio

O programie R Licencja freeware Olbrzymia funkcjonalność Łatwa rozbudowa pakietu Duża społeczność użytkowników Dynamiczny rozwój w ostatnich latach Podstawowe narzędzie w Data Science język funkcyjny i obiektowy jednocześnie Bezkonkurencyjny pod względem możliwości graficznych

Dlaczego R? (1)

Dlaczego R? (2)

Dlaczego R? (3)

Dlaczego R? (4)

Dlaczego R? (5)

W chwilach zagubienia

R-Studio Licencja freeware Możliwość optymalizacji (tworzenie projektom etc.) Dużo udogodnień: Podpowiedzi w pisaniu kodu i sprawdzanie części składni, Notatnik powiązany z konsolą Możliwość przeglądania obiektów Możliwość samodzielnego rozbudowania poprzez umieszczanie własnych wtyczek R Markdown Shiny Wiele innych

Gdzie szukać informacji o R? Oficjalna strona projektu: cran.r-project.org (do ściągnięcia R) Oficjalna strona R-Studio: www.rstudio.com (do ściągnięcia R-Studio) Wyszukiwarka R: rseek.org Wyszukiwarka Google: zapytanie z dopiskiem in R Podręczniki do R: www.statmethods.net/about/books.html Blog użytkowników R: www.r-bloggers.com Forum użytkowników R (i nie tylko): stackoverflow.com

R pierwsze kroki

Wielkość liter ma znaczenie R rozróżnia: A i a Poszczególne komendy mogą być rozdzielane albo enterem (kolejna linijka) albo znakiem 0 ; Komentarze można wprowadzać po znaku # (całą treść po tym znaku R ignoruje do końca linijki). W przypadku niekompletnej komendy R informuje znakiem +, najczęściej chodzi o: brakujący nawias (lub o jeden za dużo), brakujący cudzysłów (lub o jeden za dużo) Przerwanie uzupełniania komendy za pomocą klawisza Esc Nazwy zmiennych mogą zawierać: litery, cyfry, _ i. Polskie znaki obsługiwane, ale lepiej unikać Rozróżniamy w R: Wyrażenie obliczone, pokazane i wartość jest ostatecznie nigdzie niezapisana. Przypisanie wartość wyliczona i zapisana, ale nie jest automatycznie pokazana.

Dziękuję za uwagę!