Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)

Podobne dokumenty
Wykład 2. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd.

Wykład 10. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd.

Wykład 2. Standaryzacja: Przykład: wpływ stałej addytywnej: odejmujemy 20. Liniowa transformacja zmiennych. Liniowa transformacja zmiennych, cd.

Wykład 2. Transformacje (przekształcenia) danych

Wykład 2. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd.

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Prawdopodobieństwo i statystyka

Pobieranie prób i rozkład z próby

Estymacja parametrów rozkładu cechy

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Wykład 2: Tworzenie danych

Metody probabilistyczne

Testowanie hipotez statystycznych.

Centralne twierdzenie graniczne

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Estymacja punktowa i przedziałowa

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Testowanie hipotez statystycznych.

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Statystyka i eksploracja danych

Testowanie hipotez statystycznych.

Metoda momentów i kwantyli próbkowych. Wrocław, 7 listopada 2014

1.1 Wstęp Literatura... 1

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

STATYSTYKA MATEMATYCZNA WYKŁAD grudnia 2009

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Metody Statystyczne. Metody Statystyczne.

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wnioskowanie statystyczne. Statystyka w 5

Statystyka w analizie i planowaniu eksperymentu

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Jeśli powyższy opis nie jest zrozumiały należy powtórzyć zagadnienie standaryzacji zanim przejdzie się dalej!

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Monte Carlo, bootstrap, jacknife

Wykład 9 Wnioskowanie o średnich

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Statystyka w analizie i planowaniu eksperymentu

STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Statystyka w analizie i planowaniu eksperymentu

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Estymacja parametrów w modelu normalnym

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

STATYSTYKA MATEMATYCZNA

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Prawdopodobieństwo i statystyka r.

Metody probabilistyczne

Prawdopodobieństwo i statystyka

PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO czȩść I

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Wykład 6 Estymatory efektywne. Własności asymptotyczne estym. estymatorów

Rozkłady prawdopodobieństwa zmiennych losowych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

STATYSTYKA I DOŚWIADCZALNICTWO

Spis treści 3 SPIS TREŚCI

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

Dokładne i graniczne rozkłady statystyk z próby

Statystyka. Wykład 2. Krzysztof Topolski. Wrocław, 11 października 2012

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Rozkłady statystyk z próby. Statystyka

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Hipotezy statystyczne

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

METODY STATYSTYCZNE W BIOLOGII

Testowanie hipotez statystycznych.

Rozkład normalny. Marcin Zajenkowski. Marcin Zajenkowski () Rozkład normalny 1 / 26

Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Wykład z analizy danych: estymacja punktowa

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Prawdopodobieństwo i rozkład normalny cd.

P (A B) = P (A), P (B) = P (A), skąd P (A B) = P (A) P (B). P (A)

Statystyka matematyczna dla leśników

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Wykład 3 Momenty zmiennych losowych.

Wykład 3 Momenty zmiennych losowych.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Hipotezy statystyczne

WYKŁAD 5 TEORIA ESTYMACJI II

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015

Transkrypt:

Wykład 4 Próbkowanie i rozkłady próbkowe µ = średnia w populacji, µ=ey, wartość oczekiwana zmiennej Y σ= odchylenie standardowe w populacji, σ =(Var Y) 1/2, pierwiastek kwadratowy wariancji zmiennej Y, Var Y=E(Y-µ) 2...i inne. Statystyki z próby są estymatorami, służą do oceny parametrów całej populacji. Populacja a próba Średnia z próby y na ogół różni się od wartości oczekiwanej µ=ey (średniej w populacji), ale w miarę wzrostu rozmiaru próby różnica między tymi wielkościami zwykle dąży do zera. Średnia z próby jest estymatorem wartości oczekiwanej. Podobnie próbkowe odchylenie standardowe s i wariancja próbkowa s 2 są estymatorami odpowiednich parametrów w populacji: σ i σ 2 =Var Y. Próbkowanie Prosta próba losowa: Każdy osobnik z populacji może być wybrany z tym samym prawdopodobieństwem. Wybory poszczególnych osobników są od siebie niezależne. Jak wybrać prostą próbę losową: Mechanizm losujący, np.: Przyznajemy numer każdemu osobnikowi Zapisujemy numery na kulach Mieszamy kule w urnie Losujemy kule=numery=osobników, tyle razy, ile wynosi rozmiar próby Do losowania możemy również użyć komputera lub gotowej tablicy liczb (numerów) losowych (zob. dalej). Gdy rozmiar populacji nie jest ustalony lub nie mamy dostępu do wszystkich osobników, zadanie jest dużo trudniejsze. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy) Dziennikarka Ann Landers spytała swoich czytelników Gdybyście mogli zacząć jeszcze raz: czy mielibyście znowu dzieci? Odpisało prawie 10,000 czytelników i 70% powiedziało: Nie! Populacja: wszyscy rodzice w USA 1

Przykład 1 (Ochotnicy) cd. Próba: pewna część populacji, która zdecydowała się odpisać, n=10,000. Czasopismo Newsday przeprowadziło statystycznie zaplanowaną ankietę, w której 91% z 1,373 przepytanych rodziców odpowiedziało: Tak! Ochotnicy: bardzo zła reprezentatywność (badanie bezwartościowe). Przykład 2 Przewidywanie wyników wyborów prezydenckich w USA, 1936: Literary Digest wysłało kwestionariusze do 10 milionów ludzi (25% głosujących) Odpowiedziało 2.4 miliona: Przewidywanie: Landon 57%, Roosevelt 43% Wynik wyborów: Roosevelt 62%, Landon 38% Uwagi: F.D. Roosevelt, Partia Demokratyczna, prezydent w latach 1933-1945; Wielki Kryzys: 1929-1933 Przyczyny błędu Literary Digest: Złe (dyskryminujące) próbkowanie Użyto książek telefonicznych, list członkowskich klubów, listy zamówień pocztowych, listy właścicieli pojazdów Brak odpowiedzi Tylko 24% odpowiedziało (niemal wyłącznie Republikanie) Uwaga: George Gallup przewidział poprawnie na podstawie reprezentatywnej próbki 50 000 osób. Obciążenie w próbkowaniu Obciążenie w próbkowaniu występuje, gdy mamy do czynienia z systematycznym błędem faworyzującym pewną część populacji. W przypadku takiego obciążenia nie pomoże nawet duży rozmiar próby. Losowy wybór elementów do próby zwykle eliminuje takie obciążenie. Warianty losowego wyboru: Stratyfikacja Dzielimy populację na pod-populacje podobnych jednostek (warstwy) i oddzielnie próbkujemy w każdej warstwie. Przykłady warstw: studenci & studentki grupy zawodowe regiony geograficzne Warianty losowego wyboru cd.: Próbkowanie wielostopniowe Przykład: Badanie w USA dotyczące struktury zatrudnienia. Ankietuje się około 60.000 gospodarstw domowych co miesiąc. Poziom 1: losowa próba z 3,000 counties Poziom 2: losowa próba reprezentująca powiaty w każdym wybranym county Poziom 3: losowa próba reprezentująca gminy w każdym wybranym powiecie Poziom 4: losowa próba gospodarstw domowych w każdej wybranej gminie 2

Rozkłady próbkowe Rozważmy populację o pewnym rozkładzie, np.: normalnym N(µ, σ), lub dwupunktowym, np. P(Y=sukces)=p, P(Y=porażka)=1-p Parametry populacji: µ i σ, lub p. Bierzemy próbę o rozmiarze n z populacji. Wynik: y 1, y n, lub y = sumaryczna liczba sukcesów. Obliczamy estymatory y i s, lub ˆp Gdy n jest duże, estymatory są na ogół bliskie parametrom które estymują. Rozkłady próbkowe, cd. Jak bardzo estymatory mogą sią różnić od prawdziwych parametrów? Co się stanie, jeżeli wylosujemy inną próbę? Otrzymamy inne wartości y i s, lub ˆp Interesuje nas rozkład (próbkowy) y,s, ˆp. Meta-eksperyment Wyobraźmy sobie, że powtarzamy eksperyment wiele razy Interesuje nas rozkład wszystkich możliwych do uzyskania wartości y, s lub ˆp. Taki rozkład będziemy nazywali rozkładem próbkowym estymatora. Zwykle próbkujemy tylko raz. Rozkłady próbkowe można obliczyć teoretycznie. Rozkład próbkowy dla średniej z rozkładu normalnego Próba o rozmiarze n z populacji normalnej Obserwujemy średnią próbkową Jak daleko od µ może być y? Odpowiemy na to pytanie znajdując rozkład próbkowy y. Wyobraźmy sobie wielokrotne powtarzanie próbkowania. Za każdym razem liczymy y. Możemy o tym myśleć jak o nowym eksperymencie w którym obserwacjami są średnie. Jaki będzie rozkład (histogram) tych średnich? FAKT 1 : Suma dwóch zmiennych niezależnych o rozkładzie normalnym ma rozkład normalny. FAKT 2 : Jeżeli X ma rozkład normalny to Y=aX+b, gdzie a 0, ma również rozkład normalny. ZADANIE: Oblicz rozkład. Y 3

Rozwiązanie: Histogramyśrednich z rozkładu standardowego normalnego Rozmiary pojedynczych prób n=1 and n=50. Liczba powtórzeń eksperymentu N=1000. Przykład: Y ~ N(30, 6). Bierzemy 10 próbek o rozmiarze n = 9: y 29.89 32.27 31.19 30.86 s 5.74 5.01 6.06 6.25 y 29.60 30.02 31.19 29.84 s 6.83 3.81 5.13 4.82 28.68 6.31 30.27 4.90 Sprawdzenie: Rozkład Y ma wartość oczekiwaną= i odchylenie standardowe SD= Oczekujemy, że średnia próbkowa: Z p-stwem 0.95 będzie w odległości nie większej niż 1.96 SD od µ, tzn. pomiędzy... a... Z p-stwem 0.8 będzie w odległości nie większej niż 1.28 SD od µ, tzn. pomiędzy 27.4 a 32.6. 0.68 1 SD tzn. pomiędzy 28 a 32. Nieobciążoność, Zgodność Niech X będzie liczbą tych próbek (z 10) dla których średnie różnią się od µ o nie więcej niż 1 SD. Podaj rozkład X. Estymator T n parametru θ jest nieobciążony jeżeli E(T n )= θ. Estymator T n parametru θ jest zgodny, jeżeli dla każdego ε >0 P( T n -θ > ε) dąży do 0 gdy liczba obserwacji n dąży do nieskończoności. 4

Własności średniej z próby 5