Statystyka matematyczna i ekonometria Wykład 5 Anna Skowrońska-Szmer lato 2016/2017
Hipotezy 2
Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją jako prawdziwą dopóki nie uzyskamy informacji statystycznych, które dadzą nam argument aby nasze przekonanie zmienić. Hipoteza alternatywna (H A )- to hipoteza, która przypisuje parametrowi (lub parametrom) populacji wartość niezgodną z przypisaną mu (bądź im) przez hipotezę zerową. Hipotezy 3
Hipotezy Hipoteza zerowa i alternatywna to hipotezy dopełniające się. Uwzględniają wszystkie możliwe wartości parametru (parametrów). Przykład: H 0 : μ = 168 H A : μ 168 4
Hipotezy Sprawdzian (statystyka testu) statystyka z próby, której wartość obliczona na podstawie wyników obserwacji jest wykorzystywana do ustalenia czy możemy hipotezę zerową odrzucić czy nie. Reguła decyzyjna testu hipotezy statystycznej reguła która ustala warunki, pod którymi można odrzucić hipotezę zerową 5
Hipotezy Reguła decyzyjna dla testu statystycznego nie znamy rzeczywistego stanu rzeczy, musimy jednak podjąć decyzję czy odrzucamy czy nie hipotezę H 0. Konsekwencje decyzji: Gdy odrzucimy H 0 uznając że prawdziwa jest H A, a w rzeczywistości prawdziwa jest H 0 - błąd pierwszego rodzaju (błąd rodzaju I). Gdy nie odrzucimy H 0, gdy H 0 w rzeczywistości jest nieprawdziwa błąd nieodrzucenia fałszywej hipotezy H 0 - błąd drugiego rodzaju (błąd rodzaju II). 6
Hipotezy Prawdopodobieństwo popełnienia błędu I rodzaju α. Prawdopodobieństwo popełnienia błędu II rodzaju β. Bardziej chcemy ustrzec się popełnienia błędu pierwszego rodzaju. Chcemy by α i β były małe. Popełnienie błędu I rodzaju można dopuszczać tylko z małym prawdopodobieństwem. H 0 zwykle jest zgodne z panującym przekonaniem, chcemy przede wszystkim kontrolować wielkość prawdopodobieństwa z jakim możemy popełnić błąd I rodzaju. Z reguły będziemy dążyć aby prawdopodobieństwo popełnienie błędu I rodzaju (α) było równe 0.05 lub 0.01 (rygorystyczne). 7
Hipotezy Definicja: α = P(H 0 odrzucona I H 0 jest prawdziwa) β = P(H 0 nieodrzucona I H 0 jest fałszywa) Odrzucamy H 0 - jesteśmy mocno przekonani, że H 0 powinna być odrzucona. Akceptujemy H 0 - nie mamy dostatecznych podstaw do odrzucenia hipotezy. 8
Hipotezy Małe, z góry ustalone prawdopodobieństwo α czyli prawdopodobieństwo odrzucenia H 0 w momencie gdy nie powinna ona być odrzucona (błąd I rodzaju) powoduje, że jest to wniosek stanowczy. Prawdopodobieństwo β zaakceptowania (nieodrzucenia) H 0 gdy powinna być odrzucona (błąd II rodzaju) jest zwykle niestanowczym (słabym) wnioskiem. Prawdopodobieństwo β zazwyczaj nie jest z góry ustalone. 9
Hipotezy Schemat postępowania: 1. Przy sprawdzaniu hipotez statystycznych hipoteza zerowa zakłada coś o jednym (lub wielu) parametrze populacji. 2. Przyjmujemy, że hipoteza zerowa jest prawdziwa. 3. Przyglądamy się faktom, które zaobserwujemy w wyniku pobrania próby losowej. 4. Jeżeli fakty z próby znajdą się daleko od hipotetycznego parametru z populacji to zajdzie zdarzenie o małym prawdopodobieństwie. 5. Wtedy odrzucamy hipotezę zerową na korzyść hipotezy alternatywnej. 10
Hipotezy Odrzucenie hipotezy zerowej przykład: Firma rozwożąca przesyłki na terenie Wrocławia zapewnia, że średni czas dostarczenia listu od drzwi wysyłającego do drzwi adresata wynosi 28 minut. Chcemy sprawdzić tę informację. Traktujemy ją jako hipotezę statystyczną. H 0 : μ = 28 H A : μ 28 11
Wnioski z przykładu: Hipotezy 1. Przy ustalaniu reguły decyzyjnej potrzebnej do testowania hipotezy statystycznej można wykorzystać przedział ufności dla rozpatrywanego parametru populacji. 1. Jeżeli poziom ufności wykorzystywanego przedziału ufności wynosi 1-α, to prawdopodobieństwo popełnienie błędu I rodzaju jest najwyżej równe α. 12
Hipotezy Przykład inaczej: 13
Hipotezy 14
Poziom istotności (α) testu hipotezy statystycznej to prawdopodobieństwo popełnienia błędu pierwszego rodzaju. Hipotezy Obszar odrzucenia (obszar krytyczny) hipotezy statystycznej jest to taki zbiór liczb, że jeżeli sprawdzian przyjmuje wartość z tego zbioru, to odrzucamy H 0. Obszar nieodrzucenia (przyjęcia) hipotezy statystycznej jest taki zbiór liczb, że jeżeli sprawdzian przyjmie wartość z tego zbioru, to nie odrzucimy H 0. Obszar krytyczny/przyjęcia wyznaczają punkty (wartości) krytyczne 15
Hipotezy Ustalanie obszaru krytycznego/przyjęcia: Obszar krytyczny ustala się tak, aby przed pobraniem próby prawdopodobieństwo α, że sprawdzian znajdzie się w tym obszarze, przy założeniu, że H 0 jest prawdziwa, było równe α. Obszar nieodrzucenia ustala się tak, aby przed pobraniem próby prawdopodobieństwo, że sprawdzian znajdzie się w tym obszarze, przy założeniu, że H 0 jest prawdziwa, było równe 1- α. 16
Test dwustronny Test dwustronny to test, którego obszar odrzucenia składa się z wartości położonych pod dwoma ogonami krzywej gęstości rozkładu sprawdzianu (przy założeniu, że H 0 jest prawdziwa). Hipotezę H 0 odrzucamy zarówno wtedy gdy parametr przyjmuje wartość większą niż założenie H 0 jak i również gdy przyjmuje wartość mniejszą niż założenie H 0. 17
Test dwustronny Test dla średniej w populacji (duża próba) Test dwustronny: H 0 : μ = μ 0 H A : μ μ 0 We wszystkich testach hipotez statystycznych, hipoteza zerowa musi być formułowana za pomocą znaku równości. W testach jednostronnych dopuszcza się formułowanie H 0 ze znakiem, ale będzie to zawsze nierówność słaba. 18
Dwustronny test dla wartości średniej w populacji μ Duża próba 19
Dwustronny test dla wartości średniej w populacji μ Przykład: Linie lotnicze chcą sprawdzić, czy podręczny bagaż pasażerów nie jest zbyt ciężki w stosunku do przewidzianej możliwości jego przewożenia w kabinie pasażerskiej samolotu. Założono że przeciętna waga bagażu podręcznego na jednego pasażera wynosi 12 kg. Badanie ma na celu sprawdzenie czy rzeczywiście tak jest. Założono poziom istotności α =0,05, n = 144 przebadanych (losowych) pasażerów, stwierdzono że x = 14,6 kg, a odchylenie standardowe s = 7,8 kg. 20
Dwustronny test dla wartości średniej w populacji μ Mała próba Jeżeli rozkład w populacji jest normalny, a hipoteza zerowa jest prawdziwa, to sprawdzian ma rozkład t o n-1 stopniach swobody. 21
Dwustronny test dla wartości średniej w populacji μ Przykład: Założono, że średnia waga chłopca w wieku 13 lat wynosi 49 kg. Nauczycielka w swojej klasie chcemy sprawdzić czy faktycznie tak jest. W klasie jest 18 chłopców, zostali oni wszyscy zważeni. Podaj H 0 i H A, przyjmij że wartość średnia z badanej próby dała wynik 38, a odchylenie standardowe z próby wyniosło 14. Korzystając z tych informacji przeprowadź test statystyczny hipotezy zerowej na poziomie istotności 0,01. 22
Dwustronny test dla frakcji w populacji Duża próba gdzie q 0 =1 - p 0 23
Testy jednostronne Testy jednostronne mają zastosowanie np. przy kontroli jakości. Sensowniej jest sprawdzić hipotezę zerową że frakcja sztuk wadliwych jest nie większa niż dana wartość, wobec hipotezy alternatywnej, że ta frakcja jest większa od danej wartości a. H 0 : p a H A : p > a 24
Testy jednostronne Wybór testu podyktowany jest przez potrzebę działania. Test prawostronny jeżeli działanie będzie podjęte, gdy parametr przekroczy pewną wartość a, wtedy alternatywną hipotezą będzie, że parametr jest większy od a. Test lewostronny - jeżeli działanie będzie podjęte, gdy parametr przyjmie wartość mniejszą niż a, wtedy alternatywną hipotezą będzie, że parametr ma wartość mniejszą od a. 25
Jednostronny test dla wartości średniej w populacji μ Duża próba 26
Sprawdzian hipotezy dla wariancji w populacji Statystyką testu przy testowaniu hipotezy o wariancji w populacji jest: Gdzie zerowej. jest wartością wariancji założoną w hipotezie 27
Wybrane punkty krytyczne statystyki Z Poziom istotności 0,1 0,05 0,01 Test jednostronny Test dwustronny + lub 1,28 + lub 1,645 + lub 2,326 + oraz 1,645 + oraz 1,96 + oraz 2,576 28
Sprawdzian hipotezy dla wariancji w populacji Przykład: Maszyna wytwarza metalowe uszczelki wchodzące w skład większej części podzespołu do produkcji silników. Średnica uszczelki jest zmienną losową o średniej 5mm. Proces produkcyjny jest pod kontrolą (uszczelki mają dopuszczalne wymiary) dopóki wariancja średnicy tej uszczelki nie przekracza 1mm (mm 2 ). Jeżeli wariancja jest większa niż 1mm maszyna jest rozregulowana i trzeba ją naprawić. Postaw hipotezę zerową i alternatywną. Przyjmij, że pobrałeś próbę losową złożoną z n = 31 uszczelek i stwierdziłeś na tej podstawie że s 2 = 1.62. Czy są podstawy do podjęcia regulacji procesu? 29
Sprawdzian hipotezy dla wariancji w populacji Przykład - rozwiązanie 30