Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15
Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp. Próba dowolny podzespół pobrany z populacji Parametr właściwość opisująca populację Estymator właściwość opisująca próbę Marcin Zajenkowski () Pobieranie prób i rozkład z próby 2 / 15
Populacja i próba Na podstawie pomiarów pochodzących z próby oblicza się estymator, który odpowiada wartości w populacji (parametrowi). W większości populacji parametry są nieznane i muszą być oszacowane na podstawie danych z próby. Statystyka próby zestaw metod statystycznych służących do formułowania twierdzeń na temat parametrów populacji na podstawie statystyk z próby. Marcin Zajenkowski () Pobieranie prób i rozkład z próby 3 / 15
Populacja i próba Na podstawie pomiarów pochodzących z próby oblicza się estymator, który odpowiada wartości w populacji (parametrowi). W większości populacji parametry są nieznane i muszą być oszacowane na podstawie danych z próby. Statystyka próby zestaw metod statystycznych służących do formułowania twierdzeń na temat parametrów populacji na podstawie statystyk z próby. Marcin Zajenkowski () Pobieranie prób i rozkład z próby 3 / 15
Populacja i próba Na podstawie pomiarów pochodzących z próby oblicza się estymator, który odpowiada wartości w populacji (parametrowi). W większości populacji parametry są nieznane i muszą być oszacowane na podstawie danych z próby. Statystyka próby zestaw metod statystycznych służących do formułowania twierdzeń na temat parametrów populacji na podstawie statystyk z próby. Marcin Zajenkowski () Pobieranie prób i rozkład z próby 3 / 15
Metody pobierania prób Wnioskowanie statystyczne - indukcyjne. Aby na podstawie próby móc wyciągać wnioski na temat populacji - próba musi być losowa. Próba pobrana losowo z populacji tzn. że każdy element populacji może się w niej znaleźć z takim samym prawdopodobieństwem. Np. losowanie z kapelusza, tablica liczb losowych (nie ma systematycznej zależności między liczbami). Marcin Zajenkowski () Pobieranie prób i rozkład z próby 4 / 15
Metody pobierania prób Wnioskowanie statystyczne - indukcyjne. Aby na podstawie próby móc wyciągać wnioski na temat populacji - próba musi być losowa. Próba pobrana losowo z populacji tzn. że każdy element populacji może się w niej znaleźć z takim samym prawdopodobieństwem. Np. losowanie z kapelusza, tablica liczb losowych (nie ma systematycznej zależności między liczbami). Marcin Zajenkowski () Pobieranie prób i rozkład z próby 4 / 15
Metody pobierania prób Systematyczny dobór próby co pewien wynik. Losowa próba warstwowa na podstawie wcześniejszej wiedzy o populacji, dobieramy odpowiednio próbę np. ze względu na płeć, wiek itp. Czy zawsze jesteśmy w stanie losowo dobrać elementy z populacji? Marcin Zajenkowski () Pobieranie prób i rozkład z próby 5 / 15
Metody pobierania prób Systematyczny dobór próby co pewien wynik. Losowa próba warstwowa na podstawie wcześniejszej wiedzy o populacji, dobieramy odpowiednio próbę np. ze względu na płeć, wiek itp. Czy zawsze jesteśmy w stanie losowo dobrać elementy z populacji? Marcin Zajenkowski () Pobieranie prób i rozkład z próby 5 / 15
Błędy próby Często wartości różnych statystyk w próbie (estymatorów) różnią się od właściwości w populacji (parametrów). Błąd próby różnica między parametrem a estymatorem. Np. błąd średniej: µ - X = e gdzie µ - średnia w populacji X - średnia w próbie e - błąd próby Marcin Zajenkowski () Pobieranie prób i rozkład z próby 6 / 15
Błędy próby Często wartości różnych statystyk w próbie (estymatorów) różnią się od właściwości w populacji (parametrów). Błąd próby różnica między parametrem a estymatorem. Np. błąd średniej: µ - X = e gdzie µ - średnia w populacji X - średnia w próbie e - błąd próby Marcin Zajenkowski () Pobieranie prób i rozkład z próby 6 / 15
Przykład Np. wiemy że w populacji studentów (N = 1000) średnia w teście wiedzy wynosi 562. W wylosowanej próbie 100 studentów średnia = 566. Zatem: 562 566 = - 4 Często nie znamy wartości w populacji. Jak w takiej sytuacji oszacować wielkość błędu próby? Np. wielokrotnie powtarzając pomiar. Marcin Zajenkowski () Pobieranie prób i rozkład z próby 7 / 15
Przykład Np. wiemy że w populacji studentów (N = 1000) średnia w teście wiedzy wynosi 562. W wylosowanej próbie 100 studentów średnia = 566. Zatem: 562 566 = - 4 Często nie znamy wartości w populacji. Jak w takiej sytuacji oszacować wielkość błędu próby? Np. wielokrotnie powtarzając pomiar. Marcin Zajenkowski () Pobieranie prób i rozkład z próby 7 / 15
Przykład 1 Kolejne pomiary długości stołu. Dwie procedury: A: 55.95, 56.23, 56.25, 56.41, 56.54 B: 54.80, 55.31, 56.44, 56.52, 57.29 2 Która procedura obarczona jest większym błędem? I co na to wskazuje? Marcin Zajenkowski () Pobieranie prób i rozkład z próby 8 / 15
Błąd próby 1 Teoretycznie mówiąc, błąd próby można by obliczyć pobierając losowo pewną liczbę k prób i obliczać średnią dla każdej próby. Możemy sformułować następujące równania: µ - X = e 1 µ - X = e 2 µ - X = e 3... µ - X = e k Marcin Zajenkowski () Pobieranie prób i rozkład z próby 9 / 15
Błąd próby W poprzednim przykładzie µ była stałą, a X zmieniało się w zależności od próby. Można by zatem użyć jakiejś miary zmienności, aby opisać teoretyczny rozkład średnich z próby. Dobrą miarą jest odchylenie standardowe. Marcin Zajenkowski () Pobieranie prób i rozkład z próby 10 / 15
Błąd standardowy Błąd standardowy (błąd próby) odchylenie standardowe rozkładu z próby Odchylenie standardowe rozkładu z próby średnich wyraża wzór: σ X = σ n Można go obliczyć jedynie gdy znamy wartości w populacji Marcin Zajenkowski () Pobieranie prób i rozkład z próby 11 / 15
Błąd standardowy σ X = σ n σ X - odchylenie standardowe (błąd) rozkładu z próby średnich. σ - odchylenie standardowe w populacji. n - liczebność próby Marcin Zajenkowski () Pobieranie prób i rozkład z próby 12 / 15
Błąd standardowy W praktyce odchylenie standardowe w populacji jest nieznane i szacuje się je na podstawie odchylenia standardowego z próby, czyli: s X = s n Ze wzoru wynika że im większa liczebność, tym mniejszy błąd standardowy. Im mniejszy błąd standardowy, tym lepsze oszacowanie parametru (właściwości w populacji). Marcin Zajenkowski () Pobieranie prób i rozkład z próby 13 / 15
Centralne twierdzenie graniczne Rozkład średnich z prób zbliża się coraz bardziej do postaci normalnej w miarę jak rośnie liczebność kolejnych prób, mimo odchyleń od normalności rozkładów w populacji. Marcin Zajenkowski () Pobieranie prób i rozkład z próby 14 / 15
Zadanie 100 studentów rozwiązało test mierzący nasilenie bycia romantycznym. Średnia w tej grupie wyniosła 20 a odchylenie standardowe 4. Oblicz błąd standardowy średniej. Marcin Zajenkowski () Pobieranie prób i rozkład z próby 15 / 15