Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego Błąd statystyczny nie jest konsekwencją błędów a procedurze badań, Błąd statystyczny (w uproszczeniu) jest określeniem rozbieżności między wartością w populacji (prawdziwym), a wartością obliczoną w próbie jednej z nieskończenie wielu prób, które można wylosować 1
Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości lub jej rozkładu w populacji generalnej Przypuszczenie, które dotyczy rozkładu cechy lub wartości parametrów rozkładu tej cechy, które może być weryfikowane statystycznie tzn. o wyniki zaobserwowane w próbie losowej Hipoteza statystyczna dotyczy rozkładu cechy (wartości parametrów) w populacji, a nie wyników uzyskanych w próbie Na podstawie wyników uzyskanych w badaniach (dla próby) weryfikujemy hipotezy statystyczne, uogólniając wyniki na populację 2
Mówi o istnieniu różnicy lub związku między zmiennymi Średnia liczba wypożyczonych książek jest różna wśród studentów stacjonarnych i niestacjonarnych Płeć różnicuje opinie o skuteczności diet odchudzających Wskazuje na kierunek związku między zmiennymi Studenci studiów stacjonarnych wypożyczają średnio więcej książek niż studenci studiów niestacjonarnych Kobiety częściej uważają, że diety odchudzające są skuteczne Dotyczy rozkładu paramentów Średnia liczba wypożyczonych książek jest różna wśród studentów stacjonarnych i niestacjonarnych Zarobki pracowników administracji są mniej zróżnicowane niż pracowników fizycznych (akordowych) Dotyczy rozkładu cechy w populacji Im wyższa ocena własnej sytuacji materialnej tym większa gotowość do pomagania innym Studenci studiów stacjonarnych częściej są zadowoleni ze studiów niż studenci studiów niestacjonarnych 3
Hipoteza, w której zakładamy, że nie ma różnicy między analizowanymi parametrami lub rozkładami Hipoteza zerowa jest przeciwieństwem hipotezy (mówiącej o zróżnicowaniu lub związku pomiędzy zmiennymi), którą chcemy sprawdzić w badaniach H 1 : Studenci studiów licencjackich przeznaczają więcej czasu na naukę niż studenci studiów magisterskich H 0 : Studenci studiów licencjackich i magisterskich przeznaczają na naukę tyle samo czasu H 1 : Płeć różnicuje ilość czasu przeznaczanego na prace domowe H 0 : Płeć nie różnicuje ilości czasu przeznaczanego na prace domowe H 1 : Studenci kierunków pedagogicznych częściej są zadowoleni ze studiów niż studenci kierunków technicznych H 0 : Kierunek studiów nie różnicuje poziomu zadowolenia ze studiów/zadowolenie ze studiów jest takie samo na wszystkich kierunkach studiów H 1 : Miejsce zamieszkania różnicuje gotowość do wzięcia udziału w wyborach samorządowych H 0 : Miejsce zamieszkania nie różnicuje gotowości do wzięcia udziału w wyborach samorządowych 4
Jednoznacznie zdefiniowana reguła postępowania, która określa warunki przy których sprawdzaną hipotezą można przyjąć lub odrzucić. Testy statystyczne testują hipotezy zerowe Testy statystyczne wykonywane z wykorzystaniem programów statystycznych testują hipotezy bezkierunkowe Są to testy dwustronne czyli nie testują kierunku zależności W każdym teście wyliczana jest wartość liczbowa tzw. statystyka testu/wartość testu Wynik testu pozwala podjąć decyzję o odrzuceniu lub nie hipotezy zerowej (czyli mówiącej o braku zróżnicowania) Przykłady testów statystycznych Testy do porównywania średnich (parametryczne): test t-studenta Testy do porównywania porządków/rang (nieparametryczne): U Manna-Whitneya Testy do porównywania rozkładów (nieparametryczne) test chi kwadrat 5
Hipoteza zerowa (oskarżony) DECYZJA (udowodniono winę) Odrzucamy Nie odrzucamy (nie udowodniono winy) WNIOSEK Pomiędzy zmiennymi istnieje związek/zależność Wyniki badań wzmacniają hipotezę o istnieniu zależności, potwierdzają istnienie zróżnicowania. Wynik istotny statystycznie (otrzymanie takiego rezultatu przez przypadek jest mało prawdopodobne) Oskarżony winny Nie ma postaw do odrzucenia hipotezy zerowej Nieodrzucenie hipotezy zerowej nie dowodzi jej prawdziwości! (czyli tego, że między zmiennymi nie ma zależności) Oskarżonego nie skazujemy, ale to nie oznacza, że rzeczywiście jest niewinny. (Może jest niewinny, a może jest winny, ale nie udało się tego dowieść) Decyzja Nie odrzucamy Odrzucamy Prawdziwość hipotezy zerowej Prawdziwa Decyzja właściwa Prawdopodobieństwo = 1- Błąd pierwszego rodzaju ( ) Prawdopodobieństwo = Fałszywa Błąd drugiego rodzaju ( ) Prawdopodobieństwo = Decyzja właściwa Prawdopodobieństwo = moc testu (1- ) BŁĄD PIERWSZEGO RODZAJU (ALFA) Błąd polegający na odrzuceniu hipotezy zerowej, podczas gdy jest ona w rzeczywistości prawdziwa - badacz stwierdza zależność tam gdzie jej nie ma. Odbiorcy wyników badań (nauka) są zainteresowani minimalizacją tego błędu. Błąd alfa można popełnić tylko jeśli hipoteza zerowa jest prawdziwa. Błąd alfa = skazanie niewinnego BŁĄD DRUGIEGO RODZAJU (BETA) Błąd polegający na przyjęciu hipotezy zerowej, podczas gdy jest ona w rzeczywistości fałszywa badacz nie stwierdza zależności, choć w rzeczywistości ona istnieje. Badacz jest zainteresowany zmniejszeniem ryzyka tego błędu! Błąd beta można popełnić tylko jeśli hipoteza zerowa jest fałszywa. Błąd beta = nieskazanie winnego 6
Maksymalne dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju (α) Poziom istotności określa maksymalne ryzyko błędu, jakie badacz jest skłonny zaakceptować. Najczęściej przyjmuje się α = 0,05; 0,01 lub 0,001 Wykorzystując do analiz wyników badań programy komputerowe decyzje o pozostawieniu lub odrzuceniu hipotezy zerowej podejmujemy porównując wartość założonego poziomu istotności ( =0,05; 0,01 lub 0,001) z wyliczoną dla testu statystycznego p-wartością (granicznym poziomem istotności) czyli tzw. istotnością asymptotyczną dwustronną. P-wartość jest wyliczoną przez program miarą prawdopodobieństwa popełnienia błędu pierwszego rodzaju. p > 0,05 nie ma podstaw do odrzucenia hipotezy zerowej. Wyniki są nieistotne statystycznie p < 0,05 odrzucamy hipotezę zerową z prawdopodobieństwem pomyłki mniejszym niż 0,05. Wyniki są istotne statystycznie 7