STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów
WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów Błąd standardowy Przedział ufności
WNIOSKOWANIE STATYSTYCZNE TESTOWANIE HIPOTEZ ESTYMACJA PARAMETRÓW
WNIOSKOWANIE STATYSTYCZNE Omułek słodkowodny Hyridella menziesi n=30 25.0 mg/g 1. Na oko różnica 2.UWAGA!!! 3.Błąd próbkowania 4.Estymatory różne 5.Parametry różne/równe 6.??? 7.Wnioskowanie statystyczne n=30 22.9 mg/g
WNIOSKOWANIE STATYSTYCZNE PRÓBA DANYCH WNIOSKOWANIE STATYSTYCZNE statistical inference POPULACJA
TESTOWANIE HIPOTEZ H 0 - hipoteza zerowa H 1 - hipoteza alternatywna H 0 + H 1 = 1 H 1 jest odwrotnością H 0 Testowanie hipotez dotyczy przyjęcia lub odrzucenia H 0
TESTOWANIE HIPOTEZ np. 1 PARAMETR H 0 : koncentracja lipidów w gr. doświadczalnej wynosi 25.0 mg/g H 1 : koncentracja lipidów w gr. doświadczalnej jest inna H 1 H 0 H 1 H 0 : k = 25.0 H 1 : k 25.0 H 0 : koncentracja lipidów w gr. doświadczalnej przekracza 25.0 mg/g H 1 : koncentracja lipidów w gr. doś. jest mniejsza lub równa 25.0 mg/g H 1 H 0 H 0 : k > 25.0 H 1 : k 25.0
TESTOWANIE HIPOTEZ np. 2 PARAMETRY H 0 : koncentracja lipidów w gr. doświadczalnej jest równa koncentracji w gr. kontrolnej H 1 : koncentracja lipidów w gr. doświadczalnej i kontrolnej są różne H 0 : koncentracja lipidów w gr. doświadczalnej jest wyższa niż w gr. kontrolnej H 1 : koncentracja lipidów w gr. doświadczalnej jest niższa lub równa gr. kontrolnej H 0 : k1 = k2 H 1 : k1 k2 H 0 : k1 > k2 H 1 : k1 k2 H 1 H 1 k2 H 0 k2 H 1 H 0 k1 k1
BŁĘDY ZWIĄZANE Z TESTOWANIEM HIPOTEZ BŁĘDY PRAWDZIWA HIPOTEZA H 0 H 1 PRZYJĘTA HIPOTEZA H 0 H 1 - błąd I-go rodzaju (type I error) - błąd II-go rodzaju (type II error)
BŁĘDY ZWIĄZANE Z TESTOWANIEM HIPOTEZ BŁĘDY PRAWDZIWA HIPOTEZA H 0 H 1 BŁĄD I-go RODZAJU PRZYJĘTA HIPOTEZA H 0 H 1 prawdopodobieństwo błędnego odrzucenie prawdziwej H 0 poziom istotności testu (significance level) P wartość (P value) np. jeżeli =0.05 to na 100 testów w 5 niepotrzebnie odrzucono H 0 kontrolujemy w czasie testowania
BŁĘDY ZWIĄZANE Z TESTOWANIEM HIPOTEZ BŁĘDY PRAWDZIWA HIPOTEZA H 0 H 1 BŁĄD II-go RODZAJU PRZYJĘTA HIPOTEZA H 0 H 1 prawdopodobieństwo odrzucenie prawdziwej H 1 1-β moc testu (power) Copyright 2012 Joanna Szyda
ETAPY TESTOWANA HIPOTEZ METODA TRADYCYJNA 1. Określenie hipotez H 0 i H 1 2. Ustalenie poziomu istotności 3. Wybór i obliczenie wartości testu statystycznego 4. Wyznaczenie obszaru krytycznego 5. Decyzja dotycząca przyjęcia lub odrzucenia H0; sformułowanie wniosków
ETAPY TESTOWANA HIPOTEZ METODA TRADYCYJNA 1. Określenie hipotez H 0 i H 1 H 0 : u = 23 H 1 : u 30 H 1 : u < 30 H 1 : u > 30
ETAPY TESTOWANA HIPOTEZ METODA TRADYCYJNA 1. Określenie hipotez H 0 i H 1 2. Ustalenie poziomu istotności =0.1 lub =0.05 lub =0.01
ETAPY TESTOWANA HIPOTEZ METODA TRADYCYJNA 1. Określenie hipotez H 0 i H 1 2. Ustalenie poziomu istotności 3. Wybór i obliczenie wartości testu statystycznego Rozkład normalny Znany parametr
ETAPY TESTOWANA HIPOTEZ METODA TRADYCYJNA 1. Określenie hipotez H 0 i H 1 2. Ustalenie poziomu istotności 3. Wybór i obliczenie wartości testu statystycznego 4. Wyznaczenie obszaru krytycznego H 1 : u 30 H 2 : u < 30 H 3 : u > 30
ETAPY TESTOWANA HIPOTEZ METODA TRADYCYJNA 1. Określenie hipotez H 0 i H 1 2. Ustalenie poziomu istotności 3. Wybór i obliczenie wartości testu statystycznego 4. Wyznaczenie obszaru krytycznego 5. Decyzja dotycząca przyjęcia lub odrzucenia H0; sformułowanie wniosków Czy wartość statystyki testowej znajduje się w przedziale krytycznym? Tak odrzucamy H 0 Nie nie mamy podstaw do odrzucenia H 0
ETAPY TESTOWANA HIPOTEZ - PRZYKŁAD Baterie alkaliczne do samochodu zabawki zostały zaprojektowane tak, aby działały przez 30 godzin, ze znanym odchyleniem standardowym równym 2,95. Klienci narzekali jednak, iż baterie działają krócej niż 30 godzin. Losowo, wybrano próbę 38 baterii. Ich średnia długość działania wynosiła 29,3 godziny. Czy czas działania baterii jest znacząco niższy niż 30 godzin? Rozważ problem dla poziomu istotności =0.05
ETAPY TESTOWANA HIPOTEZ 1. Określenie hipotez H 0 i H 1 H 0 : u = 30 H 1 : u < 30 2. Ustalenie poziomu istotności =0.05 3. Wybór i obliczenie wartości testu statystycznego Z = 29,3 30 2,95 4. Wyznaczenie obszaru krytycznego C: (-, -1,64] 38 = -1,46 STATYSTYKA Z 5. Decyzja dotycząca przyjęcia lub odrzucenia H0; -1,64 sformułowanie wniosków Wartość statystyki testowej nie mieści się w przedziale krytycznym. Nie mamy podstaw do odrzucenia H 0 WNIOSEK?
ETAPY TESTOWANA HIPOTEZ P-value 1. Określenie hipotez H 0 i H 1 2. Ustalenie poziomu istotności 3. Wybór i obliczenie wartości testu statystycznego 4. Wyznaczenie P value ( T ) i porównanie z ustalonym poziomem istotności 5. Decyzja dotycząca przyjęcia lub odrzucenia H0 im niższa wartość P tym większe przesłanki do odrzucenia H0 np. = 0.05 T = P = 0.02 H 0 H 1?? np. = 0.05 T = P = 0.21 H 0 H 1??
TESTOWANIE WIELOKROTNE 1 H 0 : k1 k2 / H 1 : k1>k2 MAX =0.05 t T H 0 /H 1 5% 2 3 H 0 : k1 k2 / H 1 : k1>k2 MAX =0.05 t T H 0 /H 1 5% H 0 : k1 k2 / H 1 : k1>k2 MAX =0.05 t T H 0 /H 1 5% 10 H 0 : k1 k2 / H 1 : k1>k2 MAX =0.05 t T H 0 /H 1 5% CAŁKOWITY BŁĄD Igo RODZAJU MAX 0.05*10 = 50%
TESTOWANIE WIELOKROTNE Jak temu zaradzić? KOREKTA BONFERRONIEGO testy niezależne od siebie 1 2 MAX* = MAX / N MAX* = 0.05 / 10 MAX* = 0.005 MAX* = MAX / N MAX* = 0.05 / 10 MAX* = 0.005 10 MAX* = MAX / N MAX* = 0.05 / 10 MAX* = 0.005 CAŁKOWITY BŁĄD Igo RODZAJU MAX 0.005*10 = 5%
WNIOSKOWANIE STATYSTYCZNE TESTOWANIE HIPOTEZ ESTYMACJA PARAMETRÓW Estymacja punktowa Estymacja przedziałowa
WNIOSKOWANIE STATYSTYCZNE ESTYMACJA PARAMETRÓW n=30 średnia koncentracja lipidów 22.9 ± 0.7 mg/g
WNIOSKOWANIE STATYSTYCZNE ESTYMACJA PARAMETRÓW n=100 średnia długość ogona ryjówki 23 ± 15 mm
BŁĄD STANDARDOWY JAK DOKŁADNY JEST DANY ESTYMATOR??? Jaka jest średnia długość ogona w populacji ryjówek? Aby uzyskać dokładną wartość średniej badacz musiałby zmierzyć wszystkie ogony ryjówek. Z praktycznego punktu widzenia jest to niemożliwe i nieopłacalne. Badacz chciał estymować prawdziwą wartość średniej długości ogona w tej populacji na podstawie próby 100 ryjówek. Stwierdził, że średnia długość w jego próbie wyniósł 23 mm Czy jest to faktyczna średnia wartość długości ogona w całej populacji?
BŁĄD STANDARDOWY JAK DOKŁADNY JEST DANY ESTYMATOR??? Jaka jest średnia długość ogona w populacji ryjówek? Aby uzyskać dokładną wartość średniej badacz musiałby zmierzyć wszystkie ogony ryjówek. Z praktycznego punktu widzenia jest to niemożliwe i nieopłacalne. Badacz chciał estymować prawdziwą wartość średniej długości ogona w tej populacji na podstawie próby 100 ryjówek. Stwierdził, że średnia długość w jego próbie wyniósł 23 mm Czy jest to faktyczna średnia wartość długości ogona w całej populacji? Jest to wartość zbliżona do faktycznej wartości, ale najprawdopodobniej nie jest ona identyczna. Średnia z próby (z jednego badania) stanowi estymator (przybliżenie) wartości prawdziwej w populacji.
BŁĄD STANDARDOWY JAK DOKŁADNY JEST DANY ESTYMATOR??? Jaka jest średnia długość ogona w populacji ryjówek? Estymator średniej = 23 mm Jeżeli badacz przeprowadziłby wielokrotnie takie badanie, dla każdej z prób (dla każdego z badania) otrzymałby jakiś średni wynik. Za każdym razem ten wynik byłby "przybliżeniem" prawdziwej średniej wartości długości ogona. Błąd standardowy jest miarą zróżnicowania tych średnich z prób, z kolejnych badań, czyli na ile nasz estymowany (w populacji) średni wynik zmienia się w poszczególnych próbach. 23 21 26 23 24 23 23
BŁĄD STANDARDOWY ŚREDNIEJ ARYTMETYCZNEJ Błąd standardowy estymatora średniej: odchylenie standardowe rozkładu estymatora średniej Jaki jest rozkład? Jak obliczyć? s Copyright 2010, Joanna Szyda
BŁĄD STANDARDOWY ŚREDNIEJ ARYTMETYCZNEJ Jaki rozkład ma estymator średniej? Dla dużych prób danych (N): rozkład estymatora średniej zbliża się do rozkładu Normalnego estymator średniej zbliża się do prawdziwej wartości parametru próby niezależnie od rozkładu obserwacji w próbie danych
BŁĄD STANDARDOWY ŚREDNIEJ ARYTMETYCZNEJ Błąd standardowy estymatora średniej (standard error): odchylenie standardowe rozkładu estymatora średniej Jaki jest rozkład? Jak obliczyć? s Copyright 2010, Joanna Szyda
BŁĄD STANDARDOWY ŚREDNIEJ ARYTMETYCZNEJ Jak obliczyć odchylenie standardowe rozkładu średniej (bez konieczności pobierania wielu prób danych)? S S N Odchylenie standardowe w próbie danych: i i1 S Liczebność próby danych N N 1 2 BŁĄD STANDARDOWY ŚREDNIEJ
Błąd standardowy estymatora prawdopodobieństwa N p p S p ˆ 1 ˆ ˆ Copyright 2013. Joanna Szyda BŁĄD STANDARDOWY INNYCH ESTYMATORÓW Błąd standardowy współczynnika regresji 2 2 2 ˆ 1 N y y S i i i b
PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ Na podstawie błędu standardowego estymatora możemy określić przedziały ufności estymatora. Im większy błąd standardowy oraz przedział ufności tym estymator mniej dokładnie określa parametr populacji. Przedział ufności dla estymatora średniej: przedział w jakim z określonym prawdopodobieństwem znajduje się prawdziwa wartość parametru
PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ Przedział ufności dla estymatora średniej: przedział w jakim z określonym prawdopodobieństwem znajduje się prawdziwa wartość parametru min ma granice przedziału ufności
PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ Jak obliczyć granice przedziału ufności? 1. Wariancja próby znana lub próba bardzo liczna S min średnia - (błąd standardowy * wartość kwantyla z danego rozkładu) z z S ma średnia + (błąd standardowy * wartość kwantyla z danego rozkładu) 2. Wariancja próby nieznana = obliczana na podstawie obserwacji w próbie min t,n1 S ma t,n1 S
PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ Jak obliczyć granice przedziału ufności? Przedział ufności dla średniej 10 i odchyleniu standardowym 3, w próbie złożonej z 50 obserwacji - rozkład normalny, z założonym prawdopodobieństwem 95%. S min S N = 0,424 z S = 10 1,96 0,424 z= S9.16 ma S ma z = 10 + 1,96 0,424 = 10.83 Jesteśmy na 95% pewni, że średnia wartość wynosi od 9,17 i 10,83
PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ Jak obliczyć granice przedziału ufności? 1. Wariancja próby znana lub próba bardzo liczna min z S ma z S 2. Wariancja próby nieznana = obliczana na podstawie obserwacji w próbie min t,n1 S ma t,n1 S
PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ Prawdopodobieństwo wystąpienia prawdziwej średniej w przedziale ufności, a długość przedziału 1. Przedział ufności 95% P 0. 95 2. Przedział ufności 99% P 0. 99
WNIOSKOWANIE STATYSTYCZNE Omułek słodkowodny Hyridella menziesi n=30 25.0 ± 0.9 mg/g [23.2, 26.8] n=30 22.9 ± 0.7 mg/g [ 21.5, 24.3 ]