STATYSTYKA POWTORZENIE. Dr Wioleta Drobik-Czwarno

Podobne dokumenty
LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Wprowadzenie do programowania. Dr Wioleta Drobik

1 Podstawy rachunku prawdopodobieństwa

1 Estymacja przedziałowa

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Laboratorium 3 - statystyka opisowa

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Statystyka Matematyczna Anna Janicka

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Statystyka matematyczna dla leśników

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Testowanie hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Wnioskowanie statystyczne. Statystyka w 5

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

PDF created with FinePrint pdffactory Pro trial version

Eksploracja Danych. Testowanie Hipotez. (c) Marcin Sydow

W1. Wprowadzenie. Statystyka opisowa

Wykład 7 Testowanie zgodności z rozkładem normalnym

STATYSTYKA MATEMATYCZNA

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Metody Statystyczne. Metody Statystyczne.

METODOLOGIA BADAŃ HUMANISTYCZNYCH METODYKA NAUCZANIA JĘZYKA OBCEGO CZ.II

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

Próba własności i parametry

Pozyskiwanie wiedzy z danych

Statystyka matematyczna i ekonometria

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Testowanie hipotez statystycznych.

1. szereg wyliczający (szczegółowy) - wyniki są uporządkowane wyłącznie według wartości badanej cechy, np. od najmniejszej do największej

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

166 Wstęp do statystyki matematycznej

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

Wykład 9 Wnioskowanie o średnich

Testowanie hipotez statystycznych

Statystyka matematyczna i ekonometria

Testowanie hipotez statystycznych

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

MODELE LINIOWE. Dr Wioleta Drobik

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez statystycznych.

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Rozkłady statystyk z próby. Statystyka

Testowanie hipotez statystycznych.

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Spis treści 3 SPIS TREŚCI

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Statystyka w przykładach

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Zadania ze statystyki cz.8. Zadanie 1.

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Statystyka matematyczna i ekonometria

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Transkrypt:

STATYSTYKA POWTORZENIE Dr Wioleta Drobik-Czwarno

Populacja Próba Parametry EX, µ Statystyki średnia D 2 X, δ 2 S 2 wnioskowanie DX, δ p ρ S w r......

JAK POWSTAJE MODEL MATEMATYCZNY Dane eksperymentalne Dane uzyskane na podstawie modelu Problem badawczy Rozwiązanie i weryfikacja modelu Sformułowanie modelu matematycznego Helen M. Byrne (2010), Nature Reviews Cancer Proces modelowania ma charakter iteracyjny i multidyscyplinarny

Etapy analizy statystycznej Problem badawczy Hipotezy badawcze Wybór próby i narzędzi badawczych Gromadzenie danych Analiza danych Wnioski

STATYSTYKA OPISOWA (OPIS PRÓBY) Miary położenia (skupienia, tendencji centralnej): średnia arytmetyczna, mediana, dominanta Miary zmienności (rozproszenia, rozrzutu, dyspersji): wariancja, odchylenie standardowe, wskaźnik zmienności Miary asymetrii (skośności): Średnia a mediana Współczynniki asymetrii

ASYMETRIA

ESTYMACJA badana cecha: masa ciała ryjówki malutkiej badanie nr 1 średnia = 4,8 g badanie nr 2 średnia = 6,2 g badanie nr 3 średnia = 5,1 g

ESTYMACJA PRZEDZIAŁOWA (PRZEDZIAŁY UFNOŚCI) P(x 1 < EX <x 2 ) = 1 - α np.: P(3 < EX < 7) = 0,99 P(4 < EX < 6) = 0,95

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH Hipoteza badawcza: leki A i B różnie wpływają na stan kliniczny pacjentów EXA EXB (na tym nam zależy) Hipoteza statystyczna (H0): lek A i B tak samo wpływają na stan kliniczny pacjentów EXA = EXB (łatwiejsze do zbadania)

TEST STATYSTYCZNY Zbiór reguł postępowania, w wyniku których podejmujemy decyzję o przyjęciu lub odrzuceniu H 0. decyzja prawdziwa przyjmujemy + odrzucamy błąd I rodzaju poziom istotności (α) 0,05; 0,01 fałszywa błąd II rodzaju (β) moc testu (1-β) 0,8-0,9 +

WYBÓR TESTU STATYSTYCZNEGO Czy istnieje zależność między grupami badawczymi? (tak/nie) Ile mamy grup badawczych? (2/>2) Jaka jest skala pomiarowa zmiennych? (nominalna/porządkowa/ilościowa) Jaki jest rozkład zmiennych? (normalny/inny) Czy wariancje w poszczególnych grupach są jednorodne? (tak/nie)

ANALIZY STATYSTYCZNE W R

PRZYKŁADOWA BAZA DANYCH Baza survey z pakietu MASS Baza zawiera odpowiedzi 237 studentów uniwersytetu Adelaide na pytania zawarte w ankiecie Przykładowe zmienne: Płeć: Male, Female W.Hnd: praworęczność right lub leworęczność left, Pulse (uderzenia serca na minute) Smoke (jak dużo papierosów pali student): Heavy, Regul, Occas, Never Height (wzrost w cm) Age (wiek)

PRZYKŁADOWA BAZA DANYCH

CECHY JAKOŚCIOWE Tabela liczebności (kontyngencji) funkcja table() zestawienie liczebności w grupach Przykład:

STATYSTYKA OPISOWA CECHY ILOŚCIOWE Cechy ilościowe - najważniejsze funkcje: length długość wektora (liczba elementów) sum suma elementów wektora max, min maksymalna i minimalna wartość z wektora mean średnia arytmetyczna Jeśli podamy dodatkowy parametr trim - to funkcja policzy, średnią po odrzuceniu określonego odsetka wartości skrajnych, np. mean(x,trim=0.1) to średnia z x po odrzuceniu 10% wartości skrajnych quantile dowolny kwantyl, np. quantile(x,.5) - to mediana z x, inaczej median(x) sd odchylenie standardowe var wariancja moda wartość występująca najczęściej

STATYSTYKA OPISOWA Funkcja summary() wyświetla proste podsumowania wektora obserwacji Dla zmiennej jakościowej: Liczebności obserwacji w każdym z możliwych poziomów Dla zmiennej ilościowej: Wektor z wartościami: Minimum Maksimum Średnia Mediana Kwartyle

STATYSTYKA OPISOWA Wynik funkcji summary() dla przykładowej ramki danych

WYKRESY Możliwość wykorzystania jednego z dwóch systemów graficznych Pakiet graphics wykorzystany w podstawowej wersji R Pakiet grid wykorzystany w dodatkowych pakietach np. lattice, ggplot2 Pakiet graphics Pakiet lattice Pakiet ggplot2 plot(pulse,height) xyplot(height~pulse) qplot(pulse,height)

WYKRESY Histogram przedstawia liczebności obiektów w poszczególnych przedziałach (klasach) danej zmiennej Funkcja hist() Histogram, ustawienia domyślne Zmiana liczby przedziałów (breaks)

Wykresy Wykres pudełkowy zmienność pojedynczej lub kilku zmiennych Funkcja boxplot() Obserwacje odstające (ang. outliers) - ponad 1,5 przedziału międzykwartylowego (IQR) od kwartyli

WYKRESY Wykres rozrzutu zależności między parą zmiennych ilościowych Funkcja plot() plot(pulse,height,col=rainbow(2),pch=19)

WYKRESY Najważniejsze argumenty wykresów main tytuł np. main= wykres xlab, ylab - tytuły osi np. xlab= nazwa osi x ylim dolna i górna granica wartości dla osi y np. zakres od 0 do 50 co 5: ylim=c(0,50,5) breaks liczba przedziałów przy tworzeniu histogramu col - kolory

TESTOWANIE HIPOTEZ p-value = prawdopodobieństwo testowe, graniczny poziom istotności Prawdopodobieństwo uzyskania analizowanych danych przy założeniu, że hipoteza zerowa jest prawdziwa Miara prawdopodobieństwa popełnienia błędu pierwszego rodzaju czyli nieodrzucenia fałszywej hipotezy zerowej p-value > 0.05 brak podstaw do odrzucenia hipotezy zerowej p-value <= 0.05 istotnie odrzucamy hipotezę zerową p-value <= 0.01 wysokoistotnie odrzucamy hipotezę zerową

WYBRANE TESTY STATYSTYCZNE Sprawdzanie czy zmienna ma rozkład normalny Ograniczenia przy powtórzonych wartościach w próbie Test Shapiro-Wilka Wartość empiryczna testu shapiro.test(x) H 0 : badana zmienna ma rozkład normalny Czyli: 1 x 10^-16 Prawdopodobieństwo testowe < 0.01 więc odrzucamy hipotezę zerową wysokoistotnie Prawdopodobieństwo testowe > 0.05 więc brak podstaw do odrzucenia hipotezy zerowej

WYBRANE TESTY STATYSTYCZNE Sprawdzanie zgodności rozkładu z założonym (ang. Chi square goodness of fit test) H 0 : Rozkład jest zgodny z założonym (1:7:1:1) zakładamy, że 70% studentów należy do osób nie palących, a w każdej z pozostałych grup znajduje się po 10% studentów

WYBRANE TESTY STATYSTYCZNE Test na jednorodność wariancji F-Snedecora var.test(x,y) H 0 : σ 2 1= σ 2 2

WYBRANE TESTY STATYSTYCZNE Test na proporcje mała próba binom.test(x=9,n=20,p=0.2) Oparty na rozkładzie dwumianowym 9 sukcesów w 20 próbach prawdopodobieństwo sukcesu 20% H 0 : p=0.2

WYBRANE TESTY STATYSTYCZNE Test na proporcje duża próba (odpowiednik testu U) Oparty na statystyce Chi-kwadrat prop.test(x=2000,n=100000,p=0.2) 2000 sukcesów w 100 000 prób prawdopodobieństwo sukcesu 20% H 0 : p=0.2

WYBRANE TESTY STATYSTYCZNE Test na średnią w jednej populacji Zakłada rozkład normalny Test t-studenta Przykład: Czy średni wzrost studentów był równy 170 cm? t.test(x,mu=170) H 0 : μ=170

WYBRANE TESTY STATYSTYCZNE Test na średnią w dwóch populacjach Zakłada rozkład normalny i jednorodność wariancji Test t-studenta Przykład: Czy średnia wzrostu dla studentów obu płci jest taka sama? t.test(wzrost_m,wzrost_f) H 0 : μ 1 = μ 2

WYBRANE TESTY STATYSTYCZNE Test na niezależność chi-kwadrat Musimy mieć tabelę liczebności np: Kolejne elementy to gatunek filmowy: sensacyjny, komedia, horror kobiety<-c(21,12,32) mezczyzni<-c(33,22,33) chisq.test(bind(kobiety, mezczyzni)) H 0 : Cechy są niezależne

WYBRANE TESTY STATYSTYCZNE Test na niezależność chi-kwadrat Czy częstotliwość palenia tytoniu u studentów zależy od płci?

WYBRANE TESTY STATYSTYCZNE Korelacja liniowa Pearsona Wartości od -1 do +1 Liniowa zależność pomiędzy dwoma zmiennymi ilościowymi funkcja: cor() lub z testem istotności cor.test()