gkrol@wz.uw.edu.pl #4 1
Sprawdzian! 5 listopada (ok. 45-60 minut): - Skale pomiarowe - Zmienne ciągłe i dyskretne - Rozkład teoretyczny i empiryczny - Miary tendencji centralnej i rozproszenia - Standaryzacja - CTG; rozkład statystyki M - Przedziały ufności dla średniej - Formułowanie hipotez (H 0, H 1 ) 2
Statystyki i parametry PRÓBA: <- losowanie <- POPULACJA: statystyka parametr M μ Statystyki to wartości liczbowe wyliczane na podstawie próby Parametry to wartości liczbowe opisujące populację 3
Rozkład normalny ( Gaussa) Rozkład symetryczny (średnia=mediana) Najwięcej przypadków skupionych wokół średniej Zmienna ciągła
C B A A B C
A > B > C A=34,13% B=13,59% C=2,15%
N(0,1) A=(-1,0)(0,1) B=(-2,-1),(1,2) C=(-3,-2)(2,3)
C B A A B C
N(100,10) Obszar A (90,100) (100,110) Obszar B (80,90) (110,120) Obszar C (70,80) (120,130) N(0,1) [standaryzacja] Obszar A (-1,0) (0,1) Obszar B (-2,-1) (1,2) Obszar C (-3,-2) (2,3) C B A A B C
Jan ma 195 cm (przykład s.157-158) Jak bardzo prawdopodobne jest, że Jan został wylosowany z próby polskiej jeśli wzrost Polaków N (175,10)? Jak bardzo prawdopodobne jest, że wylosujemy mężczyznę o wzroście co najmniej 195 cm z próby polskiej jeśli wzrost Polaków N(175,10)? z J =(195-175)/10=20/10=2 P(z 2)=?
C B A A B C
Jan ma 195 cm s.157-158 Jak bardzo prawdopodobne jest, że Jan został wylosowany z próby hiszpańskiej jeśli wzrost Hiszpanów N (167,10)? Jak bardzo prawdopodobne jest, że wylosujemy mężczyznę o wzroście co najmniej 195 cm z próby hiszpańskiej jeśli wzrost Hiszpanów N(167,10)? z J =(195-167)/10=28/10=2,8 P(z 2,8)=?
C B A A B C P(z 2,8)=?
P(z 2,8)=? 16
Jan ma 195 cm s.157-158 Jak bardzo prawdopodobne jest, że Jan został wylosowany z próby duńskiej jeśli wzrost Duńczyków N (180,10)? Jak bardzo prawdopodobne jest, że wylosujemy mężczyznę o wzroście co najmniej 195 cm z próby duńskiej jeśli wzrost Duńczyków N(180,10)? z J =(195-180)/10=15/10=1,5 P(z 1,5)=? Prawdopodobieństwa odczytujemy z tablic
P(z 1,5)=? 18
Ćwiczenie 4.7. s. 158 Rozkład wyników w teście inteligencji N(110,10) H 0 µ=110 Jak bardzo prawdopodobne jest, że Ewa która uzyskała wynik A) 90 punktów z=? B) 80 punktów z=? C) 115 punktów z=? Jest normalna czyli pochodzi z populacji o N(110,10)
Ćwiczenie 4.7. s. 158 Rozkład wyników w teście inteligencji N(110,10) H 0 µ=110 Jak bardzo prawdopodobne jest, że Ewa która uzyskała wynik A) 90 punktów z=-2 B) 80 punktów z=-3 C) 115 punktów z= 0,5 Jest normalna czyli pochodzi z populacji o N(110,10)
Ćwiczenie 4.7. s. 158 Rozkład wyników w teście inteligencji N(90,10) H 0 µ=90 Jak bardzo prawdopodobne jest, że Ewa która uzyskała wynik A) 90 punktów z=? B) 80 punktów z=? C) 115 punktów z=? Jest normalna czyli pochodzi z populacji o N(110,10)
Ćwiczenie 4.7. s. 158 Rozkład wyników w teście inteligencji N(90,10) H 0 µ=90 Jak bardzo prawdopodobne jest, że Ewa która uzyskała wynik A) 90 punktów z=0 B) 80 punktów z=-1 C) 115 punktów z= 2,5 Jest normalna czyli pochodzi z populacji o N(110,10)
Z dla Ewy zależy od jej wyniku i wartości wyspecyfikowanym w założeniu (hipotezie) Wynik Ewy Hipoteza: N(110,10) 80 Z=-3 Z=-1 Hipoteza: N(90,10) 105 Z=-0,5 Z=1,5
Statystyki i parametry PRÓBA: <- losowanie <- POPULACJA: statystyka parametr M μ Statystyki to wartości liczbowe wyliczane na podstawie próby Parametry to wartości liczbowe opisujące populację 24
Estymacja Estymacja = szacowanie parametrów populacji na podstawie statystyk z próby M jest estymatorem μ s jest estymatorem σ 25
Co pozwala nam na estymację? Prawo Wielkich Liczb Centralne Twierdzenie Graniczne 26
Prawo wielkich liczb Zmienna losowa X, wartość w populacji E(x) M n = (X 1 + X 2 + X 3... + X n )/n M n E(x) dla n Czyli M n μ dla n (sformułowane przez Bernouliego w 1713r): Z prawdopodobieństwem dowolnie bliskim 1 można się spodziewać, iż przy dostatecznie wielkiej liczbie prób częstość danego zdarzenia losowego będzie się dowolnie mało różniła od jego prawdopodobieństwa. 27
Przykład X = liczba wyrzuceń orła w 100 rzutach monetą E(x) = liczba rzutów * prawdopodobieństwo wyrzucenia orła E(x) = 100 * 0.5 = 50 Np: M n = (55 + 64 + 47 + 42 + 51... ) / n M n 50 wraz z n 28
Przykład, cd 55 + 64 + 47 + 52 + 51...n (55 + 64)/2 (55 + 64 + 47)/3 (55 + 64 + 47 + 52)/4 (55 + 64 + 47 + 52 + 51)/5 (...)/n {r} ## PRAWO WIELKICH LICZB n <- 1000; means <- cumsum(rnorm(n)) / (1 : n) plot(1 : n, means, type = "l", lwd = 3, col='blue', frame = FALSE, ylab = "średnie skumulowane", xlab = "wielkość próby") abline(h = 0) 29
Paradoks hazardzisty (gambler s fallacy) Po serii wysokich wyników nie należy wcale oczekiwać serii niskich wyników! Nie ważne, co się wydarzy ze średnią w skończonej liczbie powtórzeń, w nieskończonej liczbie powtórzeń oczekiwana wartość dąży do średniej. 30
Przykład: populacja marsjańska 3 Marsjan, każdy o innym wzroście: 1m 2m 3m Oblicz średni wzrost w populacji: μ = Oblicz wariancję w populacji: σ 2 =.. 31
μ = (1 + 2 +3)/3 = 2 μ, σ σ 2 = [(1-2) 2 + (2-2) 2 + (3-2) 2 ] / 3 = 2/3 32
Próba losowa Zakładamy że koszty pomiaru są duże, więc dobieramy małe próby (2-elementowe) Jak losować: Ze zwracaniem? Bez zwracania? Ile możemy otrzymać prób: Ze zwracaniem? Bez zwracania? 33
Rozkład średnich (M) Losowanie 1 Losowanie 2 Wynik (wzrost) Statystyka M Mały Mały 1 1 Średni 1 2 Duży 1 3 Średni Mały 2 1 Średni 2 2 Duży 2 3 Duży Mały 3 1 Średni 3 2 Duży 3 3 34
Średnia w 9 próbach Średnia Częstość Procent 1 1,5 2 2,5 3 Razem 9 100 35
Średnia w 9 próbach Średnia Częstość Procent 1 1 11,1 1,5 2 22,2 2 3 33,3 2,5 2 22,2 3 1 11,1 Razem 9 100 36
Średnia z rozkładu średnich μ M = (1+1.5+1.5+2+2+2+2.5+2.5+3)/9 = 2 Średnia rozkładu statystyki M (średnia średnich) jest równa średniej rozkładu zmiennej w populacji. μ M = μ 37
Rozproszenie rozkładu statystyki M σ 2 M = σ 2 / n σ 2 M = SS M / N SSM = (1-2) 2 + 2*(1.5-2) 2 + 3*(2-2) 2 + 2*(2.5-2) 2 + (3-2) 2 = σ M to błąd standardowy czyli Odchylenie standardowe rozkładu statystyki 38
Rozkład z próby Można wyliczyć dla dowolnej statystyki: Średniej Sumy Mediany... 39
Centralne Twierdzenie Graniczne Jeśli pobieramy kolejno próby losowe o liczebności N z populacji o dowolnym rozkładzie ze średnią μ i wariancją σ 2, to dla dostatecznie dużych prób rozkład średnich (statystyki M) będzie rozkładem normalnym o średniej μ i wariancji σ 2 /N. Gdy zmienna w populacji ma rozkład normalny, to rozkład średnich jest normalny także dla małych prób. 40
DZIĘKUJĘ ZA UWAGĘ! 41