Statystyka matematyczna i ekonometria Wykład 5 dr inż. Anna Skowrońska-Szmer zima 2017/2018
Hipotezy 2
Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją jako prawdziwą dopóki nie uzyskamy informacji statystycznych, które dadzą nam argument aby nasze przekonanie zmienić. Hipoteza alternatywna (H A )- to hipoteza, która przypisuje parametrowi (lub parametrom) populacji wartość niezgodną z przypisaną mu (bądź im) przez hipotezę zerową. Hipotezy 3
Hipotezy hipoteza zerowa i alternatywna to hipotezy dopełniające się, uwzględniają wszystkie możliwe wartości parametru (parametrów), przykład: H 0 : μ = 168 H A : μ 168 4
Hipotezy Sprawdzian (statystyka testu) statystyka z próby, której wartość obliczona na podstawie wyników obserwacji jest wykorzystywana do ustalenia czy możemy hipotezę zerową odrzucić czy nie. Reguła decyzyjna testu hipotezy statystycznej reguła która ustala warunki, pod którymi można odrzucić hipotezę zerową 5
Reguła decyzyjna dla testu statystycznego nie znamy rzeczywistego stanu rzeczy, musimy jednak podjąć decyzję czy odrzucamy czy nie hipotezę H 0. Hipotezy Konsekwencje decyzji: Gdy odrzucimy H 0 uznając że prawdziwa jest H A, a w rzeczywistości prawdziwa jest H 0 - błąd pierwszego rodzaju (błąd rodzaju I). Gdy nie odrzucimy H 0, gdy H 0 w rzeczywistości jest nieprawdziwa błąd nieodrzucenia fałszywej hipotezy H 0 - błąd drugiego rodzaju (błąd rodzaju II). 6
Hipotezy Prawdopodobieństwo popełnienia błędu I rodzaju α. Prawdopodobieństwo popełnienia błędu II rodzaju β. Bardziej chcemy ustrzec się popełnienia błędu pierwszego rodzaju. Chcemy by α i β były małe. Popełnienie błędu I rodzaju można dopuszczać tylko z małym prawdopodobieństwem. H 0 zwykle jest zgodne z panującym przekonaniem, chcemy przede wszystkim kontrolować wielkość prawdopodobieństwa z jakim możemy popełnić błąd I rodzaju. Z reguły będziemy dążyć aby prawdopodobieństwo popełnienie błędu I rodzaju (α) było równe 0.05 lub 0.01 (rygorystyczne). 7
Hipotezy Definicja: α = P(H 0 odrzucona I H 0 jest prawdziwa) β = P(H 0 nieodrzucona I H 0 jest fałszywa) Odrzucamy H 0 - jesteśmy mocno przekonani, że H 0 powinna być odrzucona. Akceptujemy H 0 - nie mamy dostatecznych podstaw do odrzucenia hipotezy. 8
Małe, z góry ustalone prawdopodobieństwo α czyli prawdopodobieństwo odrzucenia H 0 w momencie gdy nie powinna ona być odrzucona powoduje, że jest to wniosek stanowczy. Hipotezy Prawdopodobieństwo β zaakceptowania (nieodrzucenia) H 0 gdy powinna być odrzucona jest zwykle niestanowczym (słabym) wnioskiem. Prawdopodobieństwo β zazwyczaj nie jest z góry ustalone. 9
Hipotezy Schemat postępowania: 1. Przy sprawdzaniu hipotez statystycznych hipoteza zerowa zakłada coś o jednym (lub wielu) parametrze populacji. 2. Przyjmujemy, że hipoteza zerowa jest prawdziwa. 3. Przyglądamy się faktom, które zaobserwujemy w wyniku pobrania próby losowej. 4. Jeżeli fakty z próby znajdą się daleko od hipotetycznego parametru z populacji to zajdzie zdarzenie o małym prawdopodobieństwie. 5. Wtedy odrzucamy hipotezę zerową na korzyść hipotezy alternatywnej. 10
Hipotezy Zadanie 5.1: Firma rozwożąca przesyłki na terenie Wrocławia zapewnia, że średni czas dostarczenia listu od drzwi wysyłającego do drzwi adresata wynosi 28 minut. Chcemy sprawdzić tę informację. Traktujemy ją jako hipotezę statystyczną. Zakładamy, że średni czas dostarczenia przesyłki z próby 100 losowo wybranych zleceń wynosi 31,5 minuty, a odchylenie standardowe z tej próby wynosi 5 minut. Przedział ufności na poziomie 95%. 11
12
Wnioski z zadania 5.1: Hipotezy 1. Przy ustalaniu reguły decyzyjnej potrzebnej do testowania hipotezy statystycznej można wykorzystać przedział ufności dla rozpatrywanego parametru populacji. 1. Jeżeli poziom ufności wykorzystywanego przedziału ufności wynosi 1-α, to prawdopodobieństwo popełnienie błędu I rodzaju jest najwyżej równe α. 13
Zadanie 5.1 inaczej: Hipotezy Firma rozwożąca przesyłki na terenie Wrocławia zapewnia, że średni czas dostarczenia listu od drzwi wysyłającego do drzwi adresata wynosi 28 minut. Chcemy sprawdzić tę informację. Traktujemy ją jako hipotezę statystyczną. Zakładamy, że średni czas dostarczenia przesyłki z próby 100 losowo wybranych zleceń wynosi 31,5 minuty, a odchylenie standardowe z tej próby wynosi 5 minut. Przedział ufności na poziomie 95%. 14
Hipotezy 15
Poziom istotności (α) testu hipotezy statystycznej to prawdopodobieństwo popełnienia błędu pierwszego rodzaju. Hipotezy Obszar odrzucenia (obszar krytyczny) hipotezy statystycznej jest to taki zbiór liczb, że jeżeli sprawdzian przyjmuje wartość z tego zbioru, to odrzucamy H 0. Obszar nieodrzucenia (przyjęcia) hipotezy statystycznej jest taki zbiór liczb, że jeżeli sprawdzian przyjmie wartość z tego zbioru, to nie odrzucimy H 0. Obszar krytyczny/przyjęcia wyznaczają punkty (wartości) krytyczne. 16
Hipotezy Ustalanie obszaru krytycznego/przyjęcia: Obszar krytyczny ustala się tak, aby przed pobraniem próby prawdopodobieństwo α, że sprawdzian znajdzie się w tym obszarze, przy założeniu, że H 0 jest prawdziwa, było równe α. Obszar nieodrzucenia ustala się tak, aby przed pobraniem próby prawdopodobieństwo, że sprawdzian znajdzie się w tym obszarze, przy założeniu, że H 0 jest prawdziwa, było równe 1- α. 17
Test dwustronny Test dwustronny to test, którego obszar odrzucenia składa się z wartości położonych pod dwoma ogonami krzywej gęstości rozkładu sprawdzianu (przy założeniu, że H 0 jest prawdziwa). Hipotezę H 0 odrzucamy zarówno wtedy gdy parametr przyjmuje wartość większą niż założenie H 0 jak i również gdy przyjmuje wartość mniejszą niż założenie H 0. 18
Test dwustronny We wszystkich testach hipotez statystycznych, hipoteza zerowa musi być formułowana za pomocą znaku równości. W testach jednostronnych dopuszcza się formułowanie H 0 ze znakiem, ale będzie to zawsze nierówność słaba. 19
Test dla wartości średniej w populacji μ (duża próba) Test dwustronny: H 0 : μ = μ 0 H A : μ μ 0 Test dwustronny Sprawdzian: z = x μ 0 s n z zestandaryzowany rozkład normalny. Reguła decyzyjna: odrzucić H 0 gdy z > zα 2, lub z < zα. 2 20
Zadania 5.2: Dyrektor szkoły chce sprawdzić, czy tornistry uczniów klasy pierwszej nie są zbyt ciężkie. Założono, że przeciętna waga tornistra jednego ucznia wynosi 2 kg. Badanie ma na celu sprawdzenie czy rzeczywiście tak jest. Założono poziom istotności α =0,05, n = 144 przebadanych (losowych) tornistrów uczniów klas pierwszych, stwierdzono że x = 2,6 kg, a odchylenie standardowe s = 0,6 kg. 21
22
Dwustronny test dla wartości średniej w populacji μ Mała próba H 0 : μ = μ 0 H A : μ μ 0 t = x μ 0 s n, t rozkład t-studenta Jeżeli rozkład w populacji jest normalny, a hipoteza zerowa jest prawdziwa, to sprawdzian ma rozkład t o n-1 stopniach swobody. 23
Zadanie 5.3: Badania wskazują, że średnia waga chłopca w wieku 13 lat wynosi 43 kg. Nauczycielka chce sprawdzić czy w jej klasie ta teoria również się sprawdza. W klasie jest 16 chłopców, zostali oni wszyscy zważeni. Podaj H 0 i H A, przyjmij, że wartość średnia z badanej próby dała wynik 41 kg, a odchylenie standardowe z próby wyniosło 6. Korzystając z tych informacji przeprowadź test statystyczny hipotezy zerowej na poziomie istotności 0,01. 24
25
Dwustronny test dla frakcji w populacji Duża próba gdzie q 0 =1 - p 0 z zestandaryzowany rozkład normalny 26
Testy jednostronne Testy jednostronne mają zastosowanie np. przy kontroli jakości. Sprawdzamy hipotezę zerową, że frakcja sztuk wadliwych jest nie większa niż dana wartość, wobec hipotezy alternatywnej, że ta frakcja jest większa od danej wartości a. H 0 : p / a H A : p > / < a 27
Testy jednostronne Wybór testu podyktowany jest przez potrzebę działania. Test prawostronny jeżeli działanie będzie podjęte, gdy parametr przekroczy pewną wartość a, wtedy alternatywną hipotezą będzie, że parametr jest większy od a. Test lewostronny - jeżeli działanie będzie podjęte, gdy parametr przyjmie wartość mniejszą niż a, wtedy alternatywną hipotezą będzie, że parametr ma wartość mniejszą od a. 28
Jednostronny test dla wartości średniej w populacji μ (duża próba) Hipoteza: H 0 : μ μ 0 H A : μ > μ 0 Test jednostronny Sprawdzian: z = x μ 0 s n z zestandaryzowany rozkład normalny. Reguła decyzyjna: odrzucić H 0 gdy z > z α., 29
Hipoteza: H 0 : σ 2 μ 0 Sprawdzian hipotezy dla wariancji w populacji statystyka: gdzie σ2 0 zerowej, H A : σ 2 > μ 0 χ 2 = (n 1)s2 σ 0 2 jest wartością wariancji założoną w hipotezie reguła decyzyjna - odrzucić H 0 gdy χ 2 > χ 2 α. 30
Zadanie 5.4: Maszyna wytwarza okrągłe gumowe zawory wykorzystywane do produkcji maszyny rolniczej. Średnica zaworu jest zmienną losową o średniej 5mm. Proces produkcyjny jest pod kontrolą (zawory mają dopuszczalne wymiary) dopóki wariancja średnicy tego zaworu nie przekracza 1mm (mm 2 ). Jeżeli wariancja jest większa niż 1mm maszyna jest rozregulowana i trzeba ją naprawić. Postaw hipotezę zerową i alternatywną. Przyjmij, że została pobrana próba losowa 31 zaworów i stwierdzono na tej podstawie, że s 2 = 1.62. Obliczenia wykonaj dla poziom istotności 0,05 a następnie 0,01. Czy są podstawy do podjęcia regulacji procesu? A. Aczel, statystyka w zarządzaniu 31
32
Wybrane punkty krytyczne statystyki Z Poziom istotności 0,1 0,05 0,01 Test jednostronny Test dwustronny + lub 1,28 + lub 1,645 + lub 2,326 + oraz 1,645 + oraz 1,96 + oraz 2,576 33