STATYSTYKA I DOŚWIADCZALNICTWO Wykład
Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α; n 1): wartość krytyczna rozkładu t - Studenta n-1 oznaczane również jako v - stopnie swobody α - poziom istotności (zazwyczaj przyjmujemy α=0,05) Poziom ufności: 1 α ustalone z góry prawdopodobieństwo z jakim ten przedział pokrywa nieznaną wartość parametru np. w tym przypadkuśrednią
Weryfikacja (testowanie) hipotez statystycznych sprawdzenie określonych przypuszczeń (założeń) wysuniętych w stosunku do parametrów lub rozkładu populacji generalnej na podstawie próby. Hipotezy możemy podzielić na dotyczące typu rozkładu populacji dotyczące parametrów rozkładu (który jest znany)
Test statystyczny reguła postępowania, która pozwala na przyjęcie (nieodrzucenie) bądź odrzucenie sprawdzanej hipotezy Procedura testowania hipotez polega na tym, że zakładamy pewną hipotezę zerową (H 0 ), którą uznajemy za możliwą. Następnie sprawdzamy, czy ona może być prawdziwa przy pomocy testu statystycznego. Jeśli podczas weryfikacji hipotezy odrzucimy hipotezę zerową to przyjmujemy przeciwną do niej hipotezę alternatywną (H 1 ). Możliwe do popełnienia błędy przy testowaniu hipotez: Błąd I rodzaju błąd odrzucenia, występuje, gdy odrzucamy hipotezę, natomiast jest ona prawdziwa Błąd II rodzaju błąd przyjęcia, występuje gdy przyjmujemy hipotezę, natomiast jest ona fałszywa Prawdopodobieństwo popełnienia błędu I rodzaju nazywamy poziomem istotności (α) (przyjmujemy najczęściej α=0,05)
Test t do porównania średniej z normą Hipoteza zerowa H 0 : m = m 0 Hipoteza alternatywna H 1 : m m 0 (uwaga: zamiast symbolu m oznaczającego średnią dla populacji używamy również zamiennie symbolu µ) założenia: zmienna ma rozkład normalny Przykłady zastosowań: Sprawdzenie, czy urządzenie pakujące pewien produkt w opakowania po 1 kg średnio pakuje dokładnie 1 kg (badana zmienna: waga netto produktu)
Funkcja testowa: x m 0 temp = Sx x Średnia dla próby m 0 zakładana wartość ( norma ) S x błąd standardowy S x = s n
Wartość t emp. porównujemy z wartością t kryt. i na tej podstawie stwierdzamy, czy średnia może być równa normie (zakładanej wartości), czy też nie. Wartość krytyczna t α,ν, dla rozkładu t-studenta, gdzie α jest przyjętym poziomem istotności (najczęściej 0,05), a ν liczbą stopni swobody, czyli liczebność próby pomniejszona o 1 (n - 1) Jeżeli t emp > t α,ν to hipotezę H 0 odrzucamy i przyjmujemy hipotezę alternatywną H 1 : m m 0 a więc stwierdzamy że średnia różni się istotnie od normy (zakładanej wartości) W programach statystycznych zamiast wartości krytycznej podawana jest wartość p (p-value). Decyzję o tym, czy hipotezę zerową odrzucamy, czy też nie podejmujemy na podstawie wartości p. Jeżeli p<α to hipotezę zerową odrzucamy i przyjmujemy hipotezę alternatywną, a jeśli p>α to hipotezy zerowej nie odrzucamy. Przyjęło się, że wartość α ustalamy równą 0,05.
Test t do porównania średnich dwóch populacji Hipoteza zerowa H 0 : m 1 = m Hipoteza alternatywna H 1 : m 1 m założenia: zmienne mają rozkład normalny σ 1 = σ (jeśli to założenie nie jest spełnione stosujemy zmodyfikowaną wersję testu t uwzględniającą nierówność wariancji) Przykłady zastosowań: Porównanie wysokości plonów dwóch odmian roślin uprawnych (badana zmienna: plon) Porównanie skuteczności dwóch leków obniżających ciśnienie krwi (zmienna: ciśnienie krwi) Porównanie wyników z egzaminu dla dwóch grup studentów (kontrolnej i poddanej nowemu sposobowi nauczania) Zmienna: liczba pkt uzyskana z egzaminu
Funkcja testowa: x1 x temp = Sr x1 Średnia dla próby z pierwszej populacji x Średnia dla próby z drugiej populacji S r błąd różnicyśrednich gdzie wspólna wariancja: varx = n i= 1 (xi x) S r S e = = S 1 n 1 e + 1 n varx1 + varx ( n 1) + ( n 1) 1 jest sumą kwadratów odchyleń od średniej
Wartość t emp. porównujemy z wartością t kryt. i na tej podstawie stwierdzamy, czy średnie mogą być równie, czy też nie. Wartość krytyczna t α,ν, dla rozkładu t-studenta, gdzie α jest przyjętym poziomem istotności (najczęściej 0,05), a ν liczbą stopni swobody, czyli liczebność prób pomniejszona o (n 1 +n -) Jeżeli t emp > t α,ν to hipotezę H 0 odrzucamy i przyjmujemy hipotezę alternatywną H 1 : m 1 m a więc stwierdzamy że średnie różnią się istotnie W programach statystycznych zamiast wartości krytycznej podawana jest wartość p (p-value). Decyzję o tym, czy hipotezę zerową odrzucamy, czy też nie podejmujemy na podstawie wartości p. Jeżeli p<α to hipotezę zerową odrzucamy i przyjmujemy hipotezę alternatywną, a jeśli p>α to hipotezy zerowej nie odrzucamy. Przyjęło się, że wartość α ustalamy równą 0,05.
test F - porównanie wariancji populacji pod względem zmienności (wartości wariancji) Hipoteza zerowa H 0 : σ 1 = σ Hipoteza alternatywna H 1 : σ 1 σ Założenie: zmienne mają rozkład normalny Funkcja testowa F = emp s s 1 Gdzie wartość s 1 >s Wartość krytyczna F α,ν,u dla rozkładu F-Fishera, gdzieα jest przyjętym poziomem istotności (najczęściej 0,05), a ν i u liczbami stopni swobody, czyli liczebnością próby pierwszej (n 1-1) i drugiej (n -1)
test U Manna-Whitneya - porównanieśrednich populacji o dowolnych rozkładach Test U Manna-Whitneya (nazywany również testem rang Wilcoxona) służy do porównania zgodności dwóch rozkładów. Wykorzystywany jest natomiast najczęściej do porównania median. Jeśli rozkłady są symetryczne i ich wariancje są równe lub bliskie to uzasadnione jest stosowanie tego testu jako alternatywy dla testu t przy braku założenia normalności rozkładów. Dlatego też ten test stosuje się często do porównania średnich dla dwóch populacji o innych rozkładach niż normalne. Statystyka testową jest wartość U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w hipotezie zerowej przyjmujemy, że średnie nie różnią się. Jeśli ją odrzucimy to przyjmujemy hipotezę alternatywną, czyli stwierdzamy, że występuje różnica między średnimi. Przykład zastosowania: Porównanie wyników z odpowiedzi z ankiety między kobietami a mężczyznami Zmienna: odpowiedź w skali od 1-5