Oszacowanie i rozkład t

Podobne dokumenty
Pobieranie prób i rozkład z próby

Zadania ze statystyki, cz.6

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Analiza niepewności pomiarów

Rozkład normalny. Marcin Zajenkowski. Marcin Zajenkowski () Rozkład normalny 1 / 26

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Wnioskowanie statystyczne. Statystyka w 5

Metody Statystyczne. Metody Statystyczne.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Estymacja przedziałowa. Przedział ufności

Weryfikacja hipotez statystycznych

Wykład 9 Wnioskowanie o średnich

STATYSTYKA MATEMATYCZNA

Estymacja punktowa i przedziałowa

Rozkłady statystyk z próby. Statystyka

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Jeśli powyższy opis nie jest zrozumiały należy powtórzyć zagadnienie standaryzacji zanim przejdzie się dalej!

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Przedziały ufności. Poziom istotności = α (zwykle 0.05) Poziom ufności = 1 α Przedział ufności dla parametru μ = taki przedział [a,b], dla którego

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

WYKŁAD 5 TEORIA ESTYMACJI II

KURS STATYSTYKA. Lekcja 2 Przedziały ufności i estymacja przedziałowa ZADANIE DOMOWE. Strona 1

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Teoria Estymacji. Do Powyżej

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

1 Podstawy rachunku prawdopodobieństwa

Komputerowa Analiza Danych Doświadczalnych

Statystyka matematyczna

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Testowanie hipotez statystycznych

Zadania ze statystyki cz.8. Zadanie 1.

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyka i Analiza Danych

LABORATORIUM 6 ESTYMACJA cz. 2

Estymacja parametrów rozkładu cechy

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Estymacja przedziałowa

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Rozkłady statystyk z próby

Prawdopodobieństwo i rozkład normalny cd.

Spis treści 3 SPIS TREŚCI

I jest narzędziem służącym do porównywania rozproszenia dwóch zmiennych. Używamy go tylko, gdy pomiędzy zmiennymi istnieje logiczny związek

Dokładne i graniczne rozkłady statystyk z próby

JEDNOCZYNNIKOWA ANOVA

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

4.Zmienne losowe X 1, X 2,..., X 100 są niezależne i mają rozkład wykładniczy z α = 0.25 Jakie jest prawdopodobieństwo, że 1

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

ESTYMACJA. Przedział ufności dla średniej

5. WNIOSKOWANIE PSYCHOMETRYCZNE

STATYSTYKA wykład 5-6

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Statystyka dla doktorantów: Estymacja przedziałowa. Przemysław Borys Wydział Chemiczny Politechniki Śląskiej

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

Weryfikacja hipotez statystycznych testy t Studenta

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Estymacja parametro w 1

Wykład 3 Hipotezy statystyczne

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

SMOP - wykład. Rozkład normalny zasady przenoszenia błędów. Ewa Pawelec

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW

Analizy wariancji ANOVA (analysis of variance)

Zmienne losowe dyskretne i Zmienne losowe ciągłe Rozkład Normalny

METODY STATYSTYCZNE W BIOLOGII

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ESTYMACJA

1 Estymacja przedziałowa

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Wielkość dziennego obrotu w tys. zł. (y) Liczba ekspedientek (x) ,5 6,6

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD STATYSTYK Z PRÓBY

Statystyka w przykładach

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozdział 8. Regresja. Definiowanie modelu

Statystyka matematyczna dla leśników

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Kolokwium ze statystyki matematycznej

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Zadanie 2.Na III roku bankowości złożonym z 20 studentów i 10 studentek przeprowadzono test pisemny ze statystyki. Oto wyniki w obu podgrupach.

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

STATYSTYKA MATEMATYCZNA

Transkrypt:

Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31

Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie partii politycznej X; jaki procent osób cierpi na chorobę Alzheimera; jaki odsetek populacji stanowią osoby homoseksualne. 2 Problem: dlaczego różne sondaże podają różne wyniki? 3 W populacji istnieje pewna zmienność (zróżnicowanie) wartości mierzonej zmiennej, które wpływa na błąd pomiaru. Marcin Zajenkowski () Oszacowanie i rozkład t 2 / 31

Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie partii politycznej X; jaki procent osób cierpi na chorobę Alzheimera; jaki odsetek populacji stanowią osoby homoseksualne. 2 Problem: dlaczego różne sondaże podają różne wyniki? 3 W populacji istnieje pewna zmienność (zróżnicowanie) wartości mierzonej zmiennej, które wpływa na błąd pomiaru. Marcin Zajenkowski () Oszacowanie i rozkład t 2 / 31

Rodzaje oszacowań Oszacowanie punktowe otrzymane bezpośrednio z obliczeń, np. średni wynik z testu wiedzy w grupie studentów = 26,88. Nie dostarcza ono informacji o błędzie jakim jest obciążony estymator. Oszacowanie przedziałowe uwzględniając błąd, twierdzimy z pewnym stopniem ufności, że wartość populacji znajduje się w obrębie przedziału. Np. średnia z testu wiedzy mieści się w granicach 24,92 a 28,84 przedział ufności. Marcin Zajenkowski () Oszacowanie i rozkład t 3 / 31

Przedział ufności Znając błąd standardowy można zbudować przedział w którym znajduje się średnia. Np. średnia z testu wiedzy mieści się w granicach 24,92 a 28,84 to tzw. przedział ufności. Błąd wyznacza dolną i górną granicę przedziału ufności. Marcin Zajenkowski () Oszacowanie i rozkład t 4 / 31

Właściwości oszacowań Nie obciążone gdy estymator w kolejnych pobieranych próbach nie odbiega systematycznie od parametru. Czyli nie jest obciążony stałym błędem. Inaczej: estymator równy jest wartości oczekiwanej. Wartość oczekiwana uzyskana po uśrednieniu wartości w nieskończenie wielkiej liczbie powtarzanych prób losowych. Marcin Zajenkowski () Oszacowanie i rozkład t 5 / 31

Właściwości oszacowań Spójne jeśli oszacowanie to coraz bardziej zbliża się do parametru populacji w miarę wzrostu liczebności próby. Efektywne jeżeli mamy dwie metody szacowania tego samego parametru populacji, to efektywniejsza jest metoda o mniejszej wariancji (np. średnia i mediana)? Wystarczające gdy jest bardziej efektywne niż inne metody. Marcin Zajenkowski () Oszacowanie i rozkład t 6 / 31

Przedział ufności dla średnich z prób dużych Rozkład zbliża się coraz bardziej do normalnego wraz ze wzrostem liczebności próby. Dlatego też dla dużych prób stosuje się rozkład normalny w celu oszacowania wyniku. Do obliczenia błędu standardowego stosuje się odchylenie rozkładu z próby średnich, czyli: s X = s n Marcin Zajenkowski () Oszacowanie i rozkład t 7 / 31

Przedział ufności dla średnich z prób dużych Chcemy oszacować różnicę między średnią w próbie a średnią w populacji, czyli: X - µ W oszacowanie należy uwzględnić błąd standardowy, zatem: X µ s X Rozkład z próby średniej będzie normalny (zgodnie z centralnym twierdzeniem granicznym) o średniej µ. Zatem powyższe równanie przedstawia wynik standardowy dla średniej z próby w odniesieniu do rozkładu z próby średniej: z = X µ s X Marcin Zajenkowski () Oszacowanie i rozkład t 8 / 31

Przedział ufności dla średnich z prób dużych Rozkład z próby średniej będzie normalny (zgodnie z centralnym twierdzeniem granicznym) o średniej µ. Zatem powyższe równanie przedstawia wynik standardowy dla średniej z próby w odniesieniu do rozkładu z próby średniej: z = X µ s X +-1,96 odchylenia standardowego mieści 95% powierzchni rozkładu normalnego +-2,58 odchylenia standardowego mieści 99% powierzchni Marcin Zajenkowski () Oszacowanie i rozkład t 9 / 31

Przedział ufności Przy założeniu normalności z, istnieje 95% prawdopodobieństwo, że prawdziwe jest następujące twierdzenie: -1,96 z = X µ s X 1,96 Marcin Zajenkowski () Oszacowanie i rozkład t 10 / 31

Przedział ufności Aby przekształcić tę nierówność, tak aby odnosiła się do wyników surowych, mnozymy wszystkie człony przez odchylenie i dodajemy średnią, dostajemy: X - 1,96 s X µ X + 1,96 s X Ogólnie: odjęcie i dodanie do średniej odpowiedniej wartości z pomnożonej przez odchylenie (błąd standardowy). Marcin Zajenkowski () Oszacowanie i rozkład t 11 / 31

Przedział ufności Wartości z dla prawdopodobieństw (z tablic) najczęściej przyjmowanych: 68% = 1 85% = 1,44 90% = 1,64 95% = 1,96 99% = 2,58 Marcin Zajenkowski () Oszacowanie i rozkład t 12 / 31

Przykład Ustal przedział ufności. Średni iloraz inteligencji w grupie 100 uczniów szkoły średniej wynosi 114, a odchylenie standardowe 17. Marcin Zajenkowski () Oszacowanie i rozkład t 13 / 31

Rozwiązanie s X = 1,7 Dolna granica: 110, 67 Górna granica: 117,33 Marcin Zajenkowski () Oszacowanie i rozkład t 14 / 31

Znaczenie Gdyby pobierać dużą liczbę prób i sporządzać przedzaiły ufności dla średniej, to 95% otrzymanych przedziałów zawierałoby średnią a 5% - nie. Marcin Zajenkowski () Oszacowanie i rozkład t 15 / 31

Zadanie 1 Dla tych samych danych ustal przedział z: 68% prawdopodobieństwem 99% prawdopodobieństwem Marcin Zajenkowski () Oszacowanie i rozkład t 16 / 31

Zadanie 2 Aby wypróbować swój nowy samochód, pan Andrzej przejechał nim 36 razy na trasie Warszawa-Kolbuszowa. Obliczył, że jego samochód spalał średnio 8 litrów benzyny, a odchylenie standardowe wynosiło 3. Zbuduj przedział ufności dla tej średniej z 85% prawdopodobieństwem. Marcin Zajenkowski () Oszacowanie i rozkład t 17 / 31

Zadanie 3 Oszacuj 95% i 99% przedziały ufności dla danych: Zadanie Średnia N (X X ) 2 1 80 37 1296 2 58 64 249 3 46 35 350 4 100 32 496 Marcin Zajenkowski () Oszacowanie i rozkład t 18 / 31

Przedziały ufności dla średnich z prób małych Rozkład z próby średniej, zbliża się do rozkładu normalnego wraz ze wzrostem liczebności próby, niezależnie od kształtu rozkładu w populacji. Dla małych prób jednak często odbiega od normalnego. W próbach małych stosuje się rozkład t. Marcin Zajenkowski () Oszacowanie i rozkład t 19 / 31

Rozkład t Analogicznie do stosunku z wprowadza się stosunek t: t = X µ s X Marcin Zajenkowski () Oszacowanie i rozkład t 20 / 31

Rozkład t Rozkład t nie jest normalny, ale zbliża się do rozkładu normalnego wraz ze wzrostem n. Rozkład t odbiega znacznie od normalnego przy małych próbach (np. n=5) Rozkład t nie jest pojedynczy, lecz to rodzina rozkładów. Wygląda inaczej w zależności od wielkości próby (stopni swobody). Marcin Zajenkowski () Oszacowanie i rozkład t 21 / 31

t.jpg Marcin Zajenkowski () Oszacowanie i rozkład t 22 / 31

Stopnie swobody Stopnie swobody df (degrees of freedom) Liczba wartości zmiennej które mogą się swobodnie zmieniać. pomiary 10, 14, 6, 5, 5 mają odchylenia od średniej: 2, 6, -2, -3, -3. Suma = 0. Jeżeli zatem znamy 4 z tych odchyleń to piąte jest zdeterminowane. Marcin Zajenkowski () Oszacowanie i rozkład t 23 / 31

Stopnie swobody Przykład 1. Pomiary 10, 14, 6, 5, 5 mają odchylenia od średniej: 2, 6, -2, -3, -3. Suma = 0. Jeżeli zatem znamy 4 z tych odchyleń to piąte jest zdeterminowane. Przykład 2. Średnia = 4, pomiary: 2,4 i? Ostatni musi być 6 Marcin Zajenkowski () Oszacowanie i rozkład t 24 / 31

Stopnie swobody Przykład 1. Pomiary 10, 14, 6, 5, 5 mają odchylenia od średniej: 2, 6, -2, -3, -3. Suma = 0. Jeżeli zatem znamy 4 z tych odchyleń to piąte jest zdeterminowane. Przykład 2. Średnia = 4, pomiary: 2,4 i? Ostatni musi być 6 Marcin Zajenkowski () Oszacowanie i rozkład t 24 / 31

Obszar pod rozkładem t Rozkład t ma średnią = 0. Obszar pod krzywą jest inny niż w rozkładzie normalnym zależy od wielkości próby, czyli od stopni swobody Marcin Zajenkowski () Oszacowanie i rozkład t 25 / 31

Marcin Zajenkowski () Oszacowanie i rozkład t 26 / 31

Rozkład t - Studenta Rozkład t Studenta. Twórca William Gossett, pisał pod pseudonimem Student. Przy dużym N, rozkład t jest taki sam jak rozkład normalny. Niektórzy przyjmują, że duże N powyżej 30. Marcin Zajenkowski () Oszacowanie i rozkład t 27 / 31

Przedziały ufności dla średnich z prób małych Np. średnia = 24,26, odchylenie=8 Błąd standardowy = 2 Wartość t dla 95% powierzchni przy 15 df wynosi 2,13 po obu stronach średniej Granice to 24,26 4,26; 24,26 + 4,26 20; 28,52 Marcin Zajenkowski () Oszacowanie i rozkład t 28 / 31

Zadanie Oszacuj 95% i 99% granice ufności dla średniej=20, N = 9 i s = 6. Marcin Zajenkowski () Oszacowanie i rozkład t 29 / 31

Zadanie Znajdź taką wartość t dla df = 20, aby część powierzchni pod krzywą: na prawo od t wynosiła 0,025 na lewo od t wynosiła 0,0005 między średnią a t wynosiła 0,45 między +-t wynosiła 0,90 Marcin Zajenkowski () Oszacowanie i rozkład t 30 / 31

Zadanie Oszacuj 95% i 99% granice ufności dlaśredniej=40, N=400 i s=15 Marcin Zajenkowski () Oszacowanie i rozkład t 31 / 31

Zadanie Jaka część rozkładu pod krzywą t mieści się: poniżej t= - 2,262, przy df =9 powyżej t = -1,476 przy df=5 między t=+-2,228, przy df=10 między t=-1,533 i t=2,776 przy df=4 Marcin Zajenkowski () Oszacowanie i rozkład t 32 / 31