Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Podobne dokumenty
Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

STATYSTYKA MATEMATYCZNA

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Statystyka matematyczna dla leśników

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka matematyczna i ekonometria

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Wykład 3 Hipotezy statystyczne

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Statystyka matematyczna Testowanie hipotez dla średnich w rozkładzie normalnym. Wrocław, r

Testowanie hipotez statystycznych

Hipotezy statystyczne

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych.

1 Estymacja przedziałowa

Hipotezy statystyczne

Estymacja parametrów rozkładu cechy

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych.

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyka matematyczna i ekonometria

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych

Pobieranie prób i rozkład z próby

Statystyka matematyczna

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Testowanie hipotez statystycznych

STATYSTYKA MATEMATYCZNA

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

166 Wstęp do statystyki matematycznej

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Statystyka Matematyczna Anna Janicka

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Kolokwium ze statystyki matematycznej

Testowanie hipotez cz. I

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Testowanie hipotez statystycznych cd.

Weryfikacja hipotez statystycznych

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

ESTYMACJA. Przedział ufności dla średniej

Wykład 10 Testy jednorodności rozkładów

Wykład 12 Testowanie hipotez dla współczynnika korelacji

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Testowanie hipotez statystycznych. Wprowadzenie

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Weryfikacja hipotez statystycznych

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Estymacja punktowa i przedziałowa

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

1.1 Wstęp Literatura... 1

Testowanie hipotez statystycznych.

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

2.1 Przykład wstępny Określenie i konstrukcja Model dwupunktowy Model gaussowski... 7

Wnioskowanie statystyczne. Statystyka w 5

Transkrypt:

Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r

Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Testowanie hipotez

Przykład Właściciel firmy produkującej telefony komórkowe twierdzi, że wśród jego produktów maksymalnie 2% ma wady fabryczne. Właściciel salonu z telefonami chce sprawdzić czy jego dostawca jest wiarygodny. Jak to zrobić? 1 Zakładamy, że wadliwość danej partii wynosi 2%. 2 Sprawdzenie: z partii telefonów pobierana jest losowa próba o określonej liczbie elementów - w naszym przypadku 80. Następnie, oznaczając przez n - liczbę wadliwych elementów obliczamy prawdopodobieństwa:

Przykład - c.d. n 0 1 2 3 4 5 6 7 8 P(X = n) 0.198 0.324 0.261 0.138 0.054 0.016 0.004 0.0009 0.00017 P(X n) 1.000 0.801 0.477 0.215 0.076 0.022 0.005 0.0011 0.00020 3 Wyciąganie wniosków: Przypuszczenie słuszne, niefortunnie dobrana próba danych. Próba danych poprawna, przypuszczenie nie było prawdziwe 4 Konkluzja: po zaobserwowaniu więcej niż 6 telefonów z wadami fabrycznymi należy uznać stwierdzeni producenta za fałszywe.

Hipoteza i test statystyczny Definicja Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu zmiennej losowej.

Hipoteza i test statystyczny Definicja Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu zmiennej losowej. Test statystyczny to reguła precyzująca dla jakich wartości próby można uznać sprawdzaną hipotezę za fałszywą a dla jakich za prawdziwą

Hipoteza i test statystyczny Definicja Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu zmiennej losowej. Test statystyczny to reguła precyzująca dla jakich wartości próby można uznać sprawdzaną hipotezę za fałszywą a dla jakich za prawdziwą Testy: 1. parametryczne 2. nieparametryczne

Etapy testowania hipotez

Etapy testowania hipotez 1. sformułowanie hipotez: 1.1 H 0 - hipoteza zerowa 1.2 H 1 - hipoteza alternatywna 2. ustalenie poziomu istotności α 3. obliczenie wartości statystyki testowej 4. ustalenie rozkładu statystyki testowej przy prawdziwości H 0 5. wyznaczenie obszaru krytycznego testu (obszaru odrzucenia hipotezy), w oparciu o odpowiednie kwantyle rozkładu statystyki testowej 6. wnioskowanie: jeżeli wartość statystyki testowej należy do obszaru krytycznego odrzucamy H 0 na rzecz alternatywy H 1 (H 1 uznajemy za prawdziwa, jeżeli wartość statystyki testowej nie mieści sie w zbiorze krytycznym nie mamy podstaw do odrzucenia hipotezy zerowej H 0.

Błędy w testowaniu hipotez

Błędy BŁĘDY ZWIĄZANE Z TESTOWANIEM HIPOTEZ BŁĘDY PRAWDZIWA HIPOTEZA H 0 H 1 PRZYJĘTA HIPOTEZA H 0 H 1 a b Copyright 2010, Joanna Szyda

Błędy Definicja Błędem I rodzaju (type I error) nazywamy błędne odrzucenie hipotezy H 0, gdy jest ona prawdziwa. Definicja Błędem II rodzaju (type II error) podjęcie decyzji o nieodrzuceniu hipotezy H 0, gdy jest ona fałszywa. Który błąd groźniejszy w skutkach?

Błędy Definicja p-wartość prawdopodobieństwo popełnienia błędu pierwszego rodzaju. Kontrolujemy błąd I rodzaju ograniczając jego prawdopodobieństwo z góry przez małą liczbę - poziom istotności (α). Za hipotezę H 0 będziemy przyjmowali to z przypuszczeń, którego błędne odrzucenie spowoduje poważniejsze skutki niż jego błędne przyjęcie.

Błędy Wnioskowanie w oparciu o p - wartość: Jeżeli p < α odrzucamy H 0 Jeżeli p > α nie ma podstaw do odrzucenia H 0

Błędy Definicja moc testu jest to prawdopodobieństwo odrzucenia fałszywej H 0 i przyjęcie prawdziwej H 1, czyli prawdopodobieństwo niepopełnienia błędu drugiego rodzaju

BŁĘDY ZWIĄZANE Z TESTOWANIEM HIPOTEZ ZALEŻNOŚĆ MIĘDZY i 1- prawdziwa H 0 prawdziwa H 1 Copyright 2011, Joanna Szyda

BŁĘDY ZWIĄZANE Z TESTOWANIEM HIPOTEZ ZALEŻNOŚĆ MIĘDZY i 1- prawdziwa H 0 poziom istotności przyjęta H 1 1- przyjęta H 0 prawdziwa H 1 moc 1- Copyright 2011, Joanna Szyda

BŁĘDY ZWIĄZANE Z TESTOWANIEM HIPOTEZ ZALEŻNOŚĆ MIĘDZY i 1- prawdziwa H 0 przyjęta H 1 poziom istotności 1- przyjęta H 0 prawdziwa H 1 moc 1- Copyright 2011, Joanna Szyda

Testowanie wielokrotne

TESTOWANIE WIELOKROTNE 1 2 3 H 0 : k1 k2 / H 1 : k1>k2 =0.05 t p H 0 /H 1 5% H 0 : k1 k2 / H 1 : k1>k2 =0.05 t p H 0 /H 1 5% H 0 : k1 k2 / H 1 : k1>k2 =0.05 t p H 0 /H 1 5% 10 H 0 : k1 k2 / H 1 : k1>k2 =0.05 t p H 0 /H 1 5% CAŁKOWITY BŁĄD Igo RODZAJU MAX 0.05*10 = 50% Copyright 2010, Joanna Szyda

TESTOWANIE WIELOKROTNE Jak temu zaradzić? KOREKTA BONFERRONIEGO testy niezależne od siebie 1 2 b = / N b = 0.05 / 10 b = 0.005 b = / N b = 0.05 / 10 b = 0.005 10 b = / N b = 0.05 / 10 b * = 0.005 CAŁKOWITY BŁĄD Igo RODZAJU 0.005*10 = 5% Copyright 2010, Joanna Szyda

TESTOWANIE WIELOKROTNE Jak temu zaradzić? KOREKTA FALSE DISCOVERY RATE (FDR) testy zależne BŁĘDY PRAWDZIWA HIPOTEZA H 0 H 1 FDR = E + PRZYJĘTA HIPOTEZA H 0 H 1 Copyright 2010, Joanna Szyda

Estymacja parametrów

Przedziały ufności PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ Jerzy Neyman Copyright 2010, Joanna Szyda

Przedziały ufności dla średniej PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ Przedział ufności dla estymatora średniej: przedział w jakim z określonym prawdopodobieństwem znajduje się prawdziwa wartość parametru x x min x max granice przedziału ufności Copyright 2010, Joanna Szyda

Przedziały ufności dla średniej 1. Znane odchylenie standardowe σ: [ µ X u 1 α/2 σ ; X + u ] 1 α/2 σ, n n gdzie: u 1 α/2 kwantyl ze standardowego rozkładu normalnego N(0, 1) rzędu 1 α 2 X = 1 n ni=1 X i - średnia z próby n - rozmiar próby

Przedziały ufności dla średniej 2. Nieznane odchylenie standardowe: [ µ X t 1 α/2(n 1) S ; X + t ] 1 α/2(n 1) S, n n gdzie: t 1 α/2 (n 1) kwantyl rozkładu studenta rzędu 1 α 2 z n 1 stopniami swobody. X = 1 ni=1 n X i - średnia z próby S = S 2 - odchylenie standardowe z próby, gdzie S 2 = 1 ni=1 n 1 (X i X ) 2 oznacza wariancję z próby. n - rozmiar próby

Przedziały ufności PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ Prawdopodobieństwo wystąpienia prawdziwej średniej w przedziale ufności, a długość przedziału 1. Przedział ufności 95% P 0. 95 x 2. Przedział ufności 99% P 0. 99 x Copyright 2010, Joanna Szyda

Przedziały ufności dla średniej Długość przedziału ufności zależy od: 1. rozmiaru próby 2. poziomu ufności

Przedziały ufności dla średniej Długość przedziału ufności zeleży od: 1. rozmiaru próby - większa próba = krótszy przedział 2. poziomu ufności - większy poziom = dłuższy przedział

Przykład - przedział ufności dla średniej ze znanym parametrem wariancji Z populacji, o rozkładzie normalnym o nieznanej średniej i znanej wariancji równej 0.5, przedstawiającej średnią ocen pewnych uczniów z klasy pierwszej wylosowano próbę 6 osób, dla których ta średnia wynosiła 3.71, 4.28, 2.95, 3.38, 4.05, 4.98. Wyznaczyc 99% przedział ufności dla średniej średniej ocen uczniów. Dane: n = 6 σ 2 = 0.5, a stąd σ = 0.7 X = 1 6 (3.71 + 4.28 + 2.95 + 3.38 + 4.05 + 4.98) = 3.9 1 α = 0.99 - poziom ufności, a zatem α = 0.01 u 0.995 = 2.57

Przykład - przedział ufności dla średniej ze znanym parametrem wariancji - cd Obliczmy końce przedziałów ufności: X u 1 α/2 σ 0.7 2.57 = 3.9 = 3.9 0.73 = 3.15 n 6 stąd X + u 1 α/2 σ 0.7 2.57 = 3.9 + = 3.9 + 0.73 = 4.63, n 6 µ [3.15, 4.63]. A zatem mamy 99% pewności, że parametr średniej ocen wśród uczniów rozważanej klasy pierwszej mieści się w przedziale [3.15, 4.63].

Przykład - przedział ufności dla średniej z nieznanym parametrem wariancji Na podstawie wielokrotnych obserwacji ustalono, że rozkład czasu dojazdu do pracy osób zatrudnionych w sklepach pewnej sieci jest rozkładem normalnym. W celu oszacowania nieznanej średniej w tym rozkładzie wylosowano niezależnie 17 elementową próbę pracowników. Średni czas dojazdu w tej próbie wynosił 40 minut a odchylenie standardowe stanowiło połowę czasu średniego. Wyznacz 95% przedział ufności dla średniego czasu dojazdu do pracy dla ogółu pracowników.

Przykład - przedział ufności dla średniej z nieznanym parametrem wariancji Dane: X = 40 S = 0.5 40 = 20 n = 17 1 α = 0.95 - poziom ufności, a stąd α = 0.05 t 0.975 (16) = 2.12.

Przykład - przedział ufności dla średniej z nieznanym parametrem wariancji - cd Obliczmy końce przedziałów ufności X t 1 α/2(n 1) S 20 2.12 = 40 = 40 10.59 = 29.4 n 1 16 X + t 1 α/2(n 1) S 20 2.12 = 40 + = 40 + 10.59 = 50.59, n 1 16 stąd µ [29.4, 50.59] A zatem z prawdopodobieństwem 0.95 możemy stwierdzić, że średni czasu dojazdu do pracy dla ogółu pracowników mieści się w przedziale [29.4, 50.59].

Przedział ufności dla wariancji [ σ 2 ns 2 ns 2 ] χ 2 1 α/2 (n 1); χ 2, α/2 (n 1) gdzie: χ 2 1 α/2 (n 1) i χ2 α/2 (n 1) kwantyle rozkładów χ2 rzędów 1 α/2 i α/2, odpowiednio, z n 1 stopniami swobody.

Przykład - przedział ufności dla wariancji W pewnej firmie zatrudniającej 200 osób, zbadano zarobki losowo wybranych 80 pracowników i tak średnia w tej próbie wyniosła 1300 zł, a odchylenie standardowe 140 zł. Skonstruować przedział ufności dla odchylenia standardowego zarobków w tej firmie na poziomie ufności 0.95. Dane: n = 100 X = 1300 S = 140 α = 0.05 χ 2 0.975 (79) = 105.4728 (79) = 56.3089 χ 2 0.025

Przykład Przykład - przedział ufności dla wariancji - cd Obliczmy końce przedziałów ufności: χ 2 1 α/2 χ 2 α/2 n 80 = 140 = 0.87 140 = 121.92 (n 1)S 105.4728 n 80 = 140 = 1.19 140 = 166.87, (n 1)S 56.3 stąd σ [121.92, 166.87].

Błąd standardowy BŁĄD STANDARDOWY ŚREDNIEJ ARYTMETYCZNEJ Błąd standardowy estymatora średniej (standard error): odchylenie standardowe rozkładu estymatora średniej x x Jaki jest rozkład? Jak obliczyć x? s Copyright 2010, Joanna Szyda

Błąd standardowy BŁĄD STANDARDOWY ŚREDNIEJ ARYTMETYCZNEJ Jak obliczyć odchylenie standardowe rozkładu średniej (bez konieczności pobierania wielu prób danych)? S Sx N Odchylenie standardowe w próbie danych: 2 xi x 1 x S i x Liczebność próby danych N N 1 BŁĄD STANDARDOWY ŚREDNIEJ Copyright 2010, Joanna Szyda

Błąd standardowy Błąd standardowy estymatora prawdopodobieństwa N p p S p ˆ 1 ˆ ˆ Copyright 2013. Joanna Szyda BŁĄD STANDARDOWY INNYCH ESTYMATORÓW Błąd standardowy współczynnika regresji 2 2 2 ˆ 1 x x N y y S i i i b