Metody Statystyczne. Metody Statystyczne.

Podobne dokumenty
Pobieranie prób i rozkład z próby

Wnioskowanie statystyczne. Statystyka w 5

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Rozkłady statystyk z próby. Statystyka

Rozkłady statystyk z próby

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

STATYSTYKA wykład 5-6

Rozkład normalny. Marcin Zajenkowski. Marcin Zajenkowski () Rozkład normalny 1 / 26

Oszacowanie i rozkład t

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyka matematyczna i ekonometria

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyka w analizie i planowaniu eksperymentu

Z poprzedniego wykładu

Centralne twierdzenie graniczne

Estymacja punktowa i przedziałowa

Statystyka w analizie i planowaniu eksperymentu

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Statystyka w analizie i planowaniu eksperymentu

Jeśli powyższy opis nie jest zrozumiały należy powtórzyć zagadnienie standaryzacji zanim przejdzie się dalej!

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Statystyka matematyczna dla leśników

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO czȩść I

STATYSTYKA I DOŚWIADCZALNICTWO

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Analiza niepewności pomiarów

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Zadania ze statystyki, cz.6

Rozkłady prawdopodobieństwa zmiennych losowych

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Weryfikacja hipotez statystycznych

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Testowanie hipotez statystycznych. Wprowadzenie

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Metody Statystyczne. Metody Statystyczne

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Spis treści 3 SPIS TREŚCI

SMOP - wykład. Rozkład normalny zasady przenoszenia błędów. Ewa Pawelec

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Estymacja parametrów rozkładu cechy

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

1 Podstawy rachunku prawdopodobieństwa

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA MATEMATYCZNA

WYKŁAD 5 TEORIA ESTYMACJI II

STATYSTYKA MATEMATYCZNA

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

I jest narzędziem służącym do porównywania rozproszenia dwóch zmiennych. Używamy go tylko, gdy pomiędzy zmiennymi istnieje logiczny związek

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

4,5. Dyskretne zmienne losowe (17.03; 31.03)

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

1 Estymacja przedziałowa

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Dokładne i graniczne rozkłady statystyk z próby

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Dyskretne zmienne losowe

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka matematyczna dla leśników

Ważne rozkłady i twierdzenia c.d.

Prawdopodobieństwo i rozkład normalny cd.

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Transkrypt:

gkrol@wz.uw.edu.pl #4 1

Sprawdzian! 5 listopada (ok. 45-60 minut): - Skale pomiarowe - Zmienne ciągłe i dyskretne - Rozkład teoretyczny i empiryczny - Miary tendencji centralnej i rozproszenia - Standaryzacja - CTG; rozkład statystyki M - Przedziały ufności dla średniej - Formułowanie hipotez (H 0, H 1 ) 2

Statystyki i parametry PRÓBA: <- losowanie <- POPULACJA: statystyka parametr M μ Statystyki to wartości liczbowe wyliczane na podstawie próby Parametry to wartości liczbowe opisujące populację 3

Rozkład normalny ( Gaussa) Rozkład symetryczny (średnia=mediana) Najwięcej przypadków skupionych wokół średniej Zmienna ciągła

C B A A B C

A > B > C A=34,13% B=13,59% C=2,15%

N(0,1) A=(-1,0)(0,1) B=(-2,-1),(1,2) C=(-3,-2)(2,3)

C B A A B C

N(100,10) Obszar A (90,100) (100,110) Obszar B (80,90) (110,120) Obszar C (70,80) (120,130) N(0,1) [standaryzacja] Obszar A (-1,0) (0,1) Obszar B (-2,-1) (1,2) Obszar C (-3,-2) (2,3) C B A A B C

Jan ma 195 cm (przykład s.157-158) Jak bardzo prawdopodobne jest, że Jan został wylosowany z próby polskiej jeśli wzrost Polaków N (175,10)? Jak bardzo prawdopodobne jest, że wylosujemy mężczyznę o wzroście co najmniej 195 cm z próby polskiej jeśli wzrost Polaków N(175,10)? z J =(195-175)/10=20/10=2 P(z 2)=?

C B A A B C

Jan ma 195 cm s.157-158 Jak bardzo prawdopodobne jest, że Jan został wylosowany z próby hiszpańskiej jeśli wzrost Hiszpanów N (167,10)? Jak bardzo prawdopodobne jest, że wylosujemy mężczyznę o wzroście co najmniej 195 cm z próby hiszpańskiej jeśli wzrost Hiszpanów N(167,10)? z J =(195-167)/10=28/10=2,8 P(z 2,8)=?

C B A A B C P(z 2,8)=?

P(z 2,8)=? 16

Jan ma 195 cm s.157-158 Jak bardzo prawdopodobne jest, że Jan został wylosowany z próby duńskiej jeśli wzrost Duńczyków N (180,10)? Jak bardzo prawdopodobne jest, że wylosujemy mężczyznę o wzroście co najmniej 195 cm z próby duńskiej jeśli wzrost Duńczyków N(180,10)? z J =(195-180)/10=15/10=1,5 P(z 1,5)=? Prawdopodobieństwa odczytujemy z tablic

P(z 1,5)=? 18

Ćwiczenie 4.7. s. 158 Rozkład wyników w teście inteligencji N(110,10) H 0 µ=110 Jak bardzo prawdopodobne jest, że Ewa która uzyskała wynik A) 90 punktów z=? B) 80 punktów z=? C) 115 punktów z=? Jest normalna czyli pochodzi z populacji o N(110,10)

Ćwiczenie 4.7. s. 158 Rozkład wyników w teście inteligencji N(110,10) H 0 µ=110 Jak bardzo prawdopodobne jest, że Ewa która uzyskała wynik A) 90 punktów z=-2 B) 80 punktów z=-3 C) 115 punktów z= 0,5 Jest normalna czyli pochodzi z populacji o N(110,10)

Ćwiczenie 4.7. s. 158 Rozkład wyników w teście inteligencji N(90,10) H 0 µ=90 Jak bardzo prawdopodobne jest, że Ewa która uzyskała wynik A) 90 punktów z=? B) 80 punktów z=? C) 115 punktów z=? Jest normalna czyli pochodzi z populacji o N(110,10)

Ćwiczenie 4.7. s. 158 Rozkład wyników w teście inteligencji N(90,10) H 0 µ=90 Jak bardzo prawdopodobne jest, że Ewa która uzyskała wynik A) 90 punktów z=0 B) 80 punktów z=-1 C) 115 punktów z= 2,5 Jest normalna czyli pochodzi z populacji o N(110,10)

Z dla Ewy zależy od jej wyniku i wartości wyspecyfikowanym w założeniu (hipotezie) Wynik Ewy Hipoteza: N(110,10) 80 Z=-3 Z=-1 Hipoteza: N(90,10) 105 Z=-0,5 Z=1,5

Statystyki i parametry PRÓBA: <- losowanie <- POPULACJA: statystyka parametr M μ Statystyki to wartości liczbowe wyliczane na podstawie próby Parametry to wartości liczbowe opisujące populację 24

Estymacja Estymacja = szacowanie parametrów populacji na podstawie statystyk z próby M jest estymatorem μ s jest estymatorem σ 25

Co pozwala nam na estymację? Prawo Wielkich Liczb Centralne Twierdzenie Graniczne 26

Prawo wielkich liczb Zmienna losowa X, wartość w populacji E(x) M n = (X 1 + X 2 + X 3... + X n )/n M n E(x) dla n Czyli M n μ dla n (sformułowane przez Bernouliego w 1713r): Z prawdopodobieństwem dowolnie bliskim 1 można się spodziewać, iż przy dostatecznie wielkiej liczbie prób częstość danego zdarzenia losowego będzie się dowolnie mało różniła od jego prawdopodobieństwa. 27

Przykład X = liczba wyrzuceń orła w 100 rzutach monetą E(x) = liczba rzutów * prawdopodobieństwo wyrzucenia orła E(x) = 100 * 0.5 = 50 Np: M n = (55 + 64 + 47 + 42 + 51... ) / n M n 50 wraz z n 28

Przykład, cd 55 + 64 + 47 + 52 + 51...n (55 + 64)/2 (55 + 64 + 47)/3 (55 + 64 + 47 + 52)/4 (55 + 64 + 47 + 52 + 51)/5 (...)/n {r} ## PRAWO WIELKICH LICZB n <- 1000; means <- cumsum(rnorm(n)) / (1 : n) plot(1 : n, means, type = "l", lwd = 3, col='blue', frame = FALSE, ylab = "średnie skumulowane", xlab = "wielkość próby") abline(h = 0) 29

Paradoks hazardzisty (gambler s fallacy) Po serii wysokich wyników nie należy wcale oczekiwać serii niskich wyników! Nie ważne, co się wydarzy ze średnią w skończonej liczbie powtórzeń, w nieskończonej liczbie powtórzeń oczekiwana wartość dąży do średniej. 30

Przykład: populacja marsjańska 3 Marsjan, każdy o innym wzroście: 1m 2m 3m Oblicz średni wzrost w populacji: μ = Oblicz wariancję w populacji: σ 2 =.. 31

μ = (1 + 2 +3)/3 = 2 μ, σ σ 2 = [(1-2) 2 + (2-2) 2 + (3-2) 2 ] / 3 = 2/3 32

Próba losowa Zakładamy że koszty pomiaru są duże, więc dobieramy małe próby (2-elementowe) Jak losować: Ze zwracaniem? Bez zwracania? Ile możemy otrzymać prób: Ze zwracaniem? Bez zwracania? 33

Rozkład średnich (M) Losowanie 1 Losowanie 2 Wynik (wzrost) Statystyka M Mały Mały 1 1 Średni 1 2 Duży 1 3 Średni Mały 2 1 Średni 2 2 Duży 2 3 Duży Mały 3 1 Średni 3 2 Duży 3 3 34

Średnia w 9 próbach Średnia Częstość Procent 1 1,5 2 2,5 3 Razem 9 100 35

Średnia w 9 próbach Średnia Częstość Procent 1 1 11,1 1,5 2 22,2 2 3 33,3 2,5 2 22,2 3 1 11,1 Razem 9 100 36

Średnia z rozkładu średnich μ M = (1+1.5+1.5+2+2+2+2.5+2.5+3)/9 = 2 Średnia rozkładu statystyki M (średnia średnich) jest równa średniej rozkładu zmiennej w populacji. μ M = μ 37

Rozproszenie rozkładu statystyki M σ 2 M = σ 2 / n σ 2 M = SS M / N SSM = (1-2) 2 + 2*(1.5-2) 2 + 3*(2-2) 2 + 2*(2.5-2) 2 + (3-2) 2 = σ M to błąd standardowy czyli Odchylenie standardowe rozkładu statystyki 38

Rozkład z próby Można wyliczyć dla dowolnej statystyki: Średniej Sumy Mediany... 39

Centralne Twierdzenie Graniczne Jeśli pobieramy kolejno próby losowe o liczebności N z populacji o dowolnym rozkładzie ze średnią μ i wariancją σ 2, to dla dostatecznie dużych prób rozkład średnich (statystyki M) będzie rozkładem normalnym o średniej μ i wariancji σ 2 /N. Gdy zmienna w populacji ma rozkład normalny, to rozkład średnich jest normalny także dla małych prób. 40

DZIĘKUJĘ ZA UWAGĘ! 41