Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (estymacja punktowa, przedziałowa) Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,
Hipoteza badawcza (robocza) to przypuszczenie, które dotyczy rozkładu cechy lub wartości parametrów rozkładu tej cechy. Hipoteza stattystyczna to hipoteza badawcza, która może być weryfikowane statystycznie tzn. o wyniki zaobserwowane w próbie losowej Hipoteza statystyczna dotyczy rozkładu cechy (wartości parametrów) w populacji, a nie wyników uzyskanych w próbie Wnioskowanie statystyczne - na podstawie wyników uzyskanych w badaniach (dla próby) weryfikujemy hipotezy statystyczne, uogólniając wyniki na populację
// Mówi o istnieniu różnicy lub związku między zmiennymi Średnia liczba wypożyczonych książek jest różna wśród studentów studiów stacjonarnych i niestacjonarnych Płeć różnicuje opinie o skuteczności diet odchudzających Częstość uprawiania sportu zależy od miejsca zamieszkania Wynik testu kompetencji społecznych jest różny wśród studentów na różnych kierunkach studiów Wskazuje na kierunek związku między zmiennymi Studenci studiów stacjonarnych wypożyczają średnio więcej książek niż studenci studiów niestacjonarnych Kobiety częściej uważają, że diety odchudzające są skuteczne Mieszkańcy miast częściej uprawiają sport niż mieszkańcy wsi Studenci kierunków technicznych osiągają niższe wyniki z testu kompetencji społecznych niż studenci kierunków pedagogicznych
Hipoteza zerowa (H 0 ) to hipoteza, w której zakładamy, że nie ma różnicy między analizowanymi parametrami lub rozkładami Hipoteza zerowa jest przeciwieństwem hipotezy badawczej (H 1 ), którą sprawdzamy w badaniach Hipoteza badawcza jest hipotezą alternatywną do hipotezy zerowej Hipoteza alternatywna zakłada istnienie zależności. Może być kierunkowa lub bezkierunkowa Hipotezy zerowej nie podajemy w opisie badań. Prezentując wyniki badań przywołujemy wyłącznie hipotezy badawcze (statystyczne)
H 1 : Płeć różnicuje ilość czasu przeznaczanego na prace domowe H 0 : Płeć nie różnicuje ilości czasu przeznaczanego na prace domowe/kobiet i mężczyźni przeznaczają na prace domowy tyle samo czasu H 1 : Kobiety częściej niż mężczyźni doświadczają zaburzeń odżywiania H 0 : Kobiety tak samo często jak mężczyźni doświadczają zaburzeń odżywiania H 1 : Studenci kierunków pedagogicznych bardziej są zadowoleni ze studiów niż studenci kierunków technicznych H 0 : Studenci są zadowoleni ze studiów w takim samym stopniu (nie ma różnic między nimi) w poziomie zadowolenia ze studiów H 1 : Im starsi badani tym rzadziej korzystają z portali społecznościowych H 0 : Wiek nie różnicuje częstości korzystania z portali społecznościowych H 1 : Studenci studiów licencjackich przeznaczają więcej czasu na naukę niż studenci studiów magisterskich H 0 : Studenci studiów licencjackich i magisterskich przeznaczają na naukę tyle samo czasu H 1 : Miejsce zamieszkania różnicuje gotowość do wzięcia udziału w wyborach samorządowych H 0 : Miejsce zamieszkania nie różnicuje gotowości do wzięcia udziału w wyborach samorządowych
Jednoznacznie zdefiniowana reguła postępowania, która określa warunki przy których sprawdzaną hipotezę można dla populacji przyjąć lub odrzucić. Testy statystyczne testują hipotezy zerowe Testy statystyczne wykonywane z wykorzystaniem programów statystycznych testują hipotezy bezkierunkowe Są to testy dwustronne czyli nie testują kierunku zależności Wynik testu pozwala podjąć decyzję o odrzuceniu lub nie hipotezy zerowej (czyli mówiącej o braku zróżnicowania) Testy statystyczne nie mierzą siły związku Wynik testu statystycznego (wartość statystki testowej) dla pojedynczej próby jest liczbą, jest wartością losową (bo obliczoną na podstawie estymatorów z losowo wybranej próby)
Hipoteza zerowa (oskarżony) DECYZJA (udowodniono winę) Odrzucamy Nie odrzucamy (nie udowodniono winy) WNIOSEK Pomiędzy zmiennymi istnieje związek/zależność Wyniki badań wzmacniają hipotezę o istnieniu zależności, potwierdzają istnienie zróżnicowania. Wynik istotny statystycznie (otrzymanie takiego rezultatu przez przypadek jest mało prawdopodobne) Oskarżony winny Nie ma postaw do odrzucenia hipotezy zerowej Nieodrzucenie hipotezy zerowej nie dowodzi jej prawdziwości! (czyli tego, że między zmiennymi nie ma zależności) Oskarżonego nie skazujemy, ale to nie oznacza, że rzeczywiście jest niewinny. (Może jest niewinny, a może jest winny, ale nie udało się tego dowieść)
Decyzja Nie odrzucamy Odrzucamy Prawdziwość hipotezy zerowej Prawdziwa Fałszywa Decyzja właściwa Błąd drugiego rodzaju ( ) Prawdopodobieństwo = 1- Prawdopodobieństwo = Błąd pierwszego rodzaju ( ) Decyzja właściwa Prawdopodobieństwo = Prawdopodobieństwo = moc testu (1- ) Błąd polegający na odrzuceniu hipotezy zerowej, podczas gdy jest ona w rzeczywistości prawdziwa - badacz stwierdza zależność tam gdzie jej nie ma. Odbiorcy wyników badań (nauka) są zainteresowani minimalizacją tego błędu. Błąd alfa można popełnić tylko jeśli hipoteza zerowa jest prawdziwa. Błąd alfa = skazanie niewinnego Błąd polegający na przyjęciu hipotezy zerowej, podczas gdy jest ona w rzeczywistości fałszywa badacz nie stwierdza zależności, choć w rzeczywistości ona istnieje. Badacz jest zainteresowany zmniejszeniem ryzyka tego błędu! Błąd beta można popełnić tylko jeśli hipoteza zerowa jest fałszywa. Błąd beta = nieskazanie winnego
Alfa maksymalne dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju (α) (odrzucenia hipotezy zerowej podczas gdy jest ona prawdziwa, czyli nie powinniśmy odrzucać więc popełnimy błąd) Poziom istotności określa maksymalne ryzyko błędu, jakie badacz jest skłonny zaakceptować odrzucając hipotezę zerową Najczęściej przyjmuje się α = 0,05; 0,01 lub 0,001 Różnica między różnicą istotną statystycznie a różnicą istotną dla praktyki/nauki Różnica istotna statystycznie wynik uzyskany w próbie można uogólnić na populację. Jest mała szansa (mniejsza niż 0,05), że uzyskana w badaniach różnica jest przypadkowa Różnica (istotna) ważna dla praktyki/nauki musi być istotna statystycznie, ale o jej znaczeniu decyduje o siła związku (efekt)
Przykład: H o - średnia uzyskana w badaniach nie różni się od średniej w populacji (np. studenci mają taką samą średnią inteligencji jak społeczeństwo ( =100) A l f a maksymalne dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju (α) (odrzucenia hipotezy zerowej podczas gdy jest ona prawdziwa Rozkład z próby (przypomnienie) jeśli teoretycznie przeprowadzimy nieskończenie wiele losowań i obliczymy średnią dla każdej próby, to najwięcej wyników uzyskamy bliskich rzeczywistej średniej w populacji (dla ilorazu inteligencji najwięcej będzie zatem bliskich 100), wyniki odległe od średniej (dużo od niej niższe lub wyższe) będą się pojawiały się rzadziej. Z własności rozkładu normalnego wiemy, że 95% wyników z znajduje się w przedziale z (-1,96, 19,6) czyli 5% wyników pojawi się bardzo rzadko (w 100 próbach 5 razy) Przeprowadzamy jedna próbę, Jeśli uzyskamy jeden z tych 95% wyników nie odrzucamy hipotezy zerowej (przyjmujemy, że średnia uzyskana w badaniach nie różni się od prawdziwej średniej (np. dla ilorazu inteligencji od 100). Otrzymaliśmy bowiem wynik, który (jak wynika z teoretycznego rozkładu z próby) dla populacji, gdzie średnia rzeczywiście wynosi 100, występuję bardzo często. Jeśli w badaniach uzyskamy jeden z 5% skrajnych wyników (czyli występujących bardzo rzadko) to odrzucimy hipotezę zerową. Oznacza to, że stwierdzamy, że średnia w populacji z której pochodzi próba (populacji studentów) jest inna niż 100. Ale uzyskany przez nas wynik nie jest niemożliwy do uzyskania w populacji dla której średnia wynosi 100, jest tylko bardzo mało prawdopodobny. Odrzucając hipotezę zerową stwierdzamy różnicę, ale ta decyzja jest obarczona błędem, zawsze istnieje prawdopodobieństwo pomyłki. Na ogół dopuszczamy 5% prawdopodobieństwo pomyłki. Przyjęta granica jest poziomem istotności -prawdziwa średnia w populacji (wyrażona w wartościach wystandaryzowanych =0 ) 2,5% Obszar odrzucenia (krytyczny) 95% Obszar nieodrzucenia 2,5% Obszar odrzucenia (krytyczny) -1,96-1,96 W istocie w teście statystycznym nie obliczamy średniej, a wartość statystyki testowej, ale idea pozostaje taka sama - porównujemy wartość obliczoną dla próby z wartością krytyczną (w przykładzie 1,96). Dla różnych testów statystycznych (np. testu z, t, chi kwadrat) mamy inne rozkłady teoretyczne i wartość statystyki testowej liczymy na podstawie innych wzorów. Niektóre teoretyczne rozkłady statystyk testów są podobne do rozkładu normalnego.
Wykorzystując do analiz wyników badań programy komputerowe decyzje o pozostawieniu lub odrzuceniu hipotezy zerowej podejmujemy porównując wartość założonego poziomu istotności ( =0,05; 0,01 lub 0,001) z wyliczoną dla testu statystycznego p-wartością (granicznym poziomem istotności) czyli tzw. istotnością asymptotyczną dwustronną. P-wartość jest wyliczoną przez program miarą prawdopodobieństwa popełnienia błędu pierwszego rodzaju. p > 0,05 nie ma podstaw do odrzucenia hipotezy zerowej. Wyniki są nieistotne statystycznie p < 0,05 odrzucamy hipotezę zerową z prawdopodobieństwem pomyłki mniejszym niż 0,05. Wyniki są istotne statystycznie
ALFA (poziom istotności) maksymalne dopuszczalne prawdopodobieństwo popełnienia błędu polegającego na odrzuceniu prawdziwej hipotezy zerowej. Błąd alfa - orzeczenie/stwierdzenie istotnej różnicy, wtedy gdy w rzeczywistości różnica nie istnieje (hipoteza zerowa jest prawdziwa) BETA prawdopodobieństwo błędu polegającego na przyjęciu hipotezy zerowej, podczas gdy jest ona w rzeczywistości fałszywa MOC TESTU (1-Beta) Beta) prawdopodobieństwo odrzucenia fałszywej hipotezy zerowej czyli wskazania przez test na nieprawdziwość hipotezy zerowej Rekomendowana/pożądana moc (0,8) 0,9 Moc testu 90% oznacza, że gdybyśmy przeprowadzili 100 losowań (a nie jak w rzeczywistości jedno) to w 90 przypadkach odrzucilibyśmy fałszywą hipotezę zerową. Czyli moc testu możemy zinterpretować jako zdolność testu do odrzucania fałszywej hipotezy zerowej czyli wykrycia różnicy istotnej jeśli ona istnieje Im większa moc testu tym mniejsze ryzyko przyjęcia (nieodrzucenia) fałszywej hipotezy zerowej Im słabsza skala pomiaru zmiennych tym niższa moc testu Testy słabsze (dla skal porządkowych/nominalnych) mogą nie odkryć zróżnicowania jeśli ono istnieje (nie odrzucimy fałszywej hipotezy zerowej)
Pomiędzy alfa i beta istnieje zależność. Obniżając ryzyko błędu alfa (czyli odrzucenia prawdziwiej hipotezy zerowej) zwiększamy ryzyko błędu beta (nieodrzucenia fałszywej hipotezy zerowej) i odwrotnie! EFEKT siła związku MOC 1- LICZEBNOŚĆ PRÓBY Moc testu zależy od: wielkości próby użytej w badaniu rzeczywistej wielkości efektu przyjętego poziomu istotności α (najczęściej 0,05) ISTOTNOŚĆ Im większa liczebność próby tym większa moc testu, a zatem większa zdolność testu do odrzucenia fałszywej hipotezy zerowej. Jeśli próba jest duża to nawet małe różnice mogą okazać się istotne statystycznie. Im większy efekt (silniejsza siła związku między zmiennymi w populacji) tym mniejsza próba potrzebna do uzyskania wyniku istotnego statystycznie
Problem: czy istnieje korelacja między ziemnymi (np. czy istnieje korelacja miedzy wzrostem a wagą?) Hipoteza: Istniej korelacja między wzrostem a wagą Hipoteza zerowa: Nie ma (nie istnieje) korelacji miedzy wzrostem a wagą Badania przeprowadzone: - liczebność próby - przyjęty poziom istotność - efekt (współczynnik korelacji) Planowanie badania: - przyjęty poziom istotność (0,05) - znana wielkość efektu (współczynnika korelacji) - moc testu (0,9 lub wyższa) Można obliczyć moc testu, przy założeniu, że wyznaczona w badaniach siła związku (efekt) jest taka jak w populacji Można obliczyć jaka wielkość próby zapewnia uzyskanie wyniku istotnego statystycznie (o ile taki związek rzeczywiście istnieje) Planując badania powinniśmy zadbać o wysoką moc testu! Wysoka moc + brak istotności statystycznej = brak zależności w populacji
Jeśli orzekamy, że wynik jest nieistotny statystycznie, to nie oznacza to, że przyjmujemy hipotezę zerową (czyli stwierdzamy brak związku), oznacza to, że hipotezy zerowej nie odrzucamy Jeśli chcemy stwierdzić brak związku w populacji musimy mieć wiedzę o mocy testu! Brak różnic w populacji można stwierdzić, jeśli test ma wystarczającą moc (>0,9) czyli z dużym prawdopodobieństwem odrzuca fałszywą hipotezę zerową TEST HIPOTEZY ZEROWEJ p<0,05 odrzucamy hipotezę zerową istnieją różnice analizujemy siłę i kierunek zależności p>0,05 nie odrzucamy hipotezy zerowej nie ma podstaw do stwierdzenia różnic <0,1 (moc testu > 0,9) różnice nie istnieją w populacji >0,1 (moc testu < 0,9) nie ma podstaw do stwierdzenia różnic, czyli nie możemy nic więcej powiedzieć niż na podstawie p