STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez statystycznych 5. Testy parametryczne (na przykładzie testu t ) 6. Testy nieparametryczne 7. Korelacja i regresja liniowa i nieliniowa 8. Analiza wariancji
TESTY PARAMETRYCZNE weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (gł. cechy ilościowe o rozkładzie normalnym) hipotezy dotyczące średniej: test t (duże próby test średniej standaryzowanej, z) hipotezy dotyczące wariancji: test F w analizie wariancji i analizie regresji
TEST T 1. Zakres stosowalności. la pojedynczej próby 3. la dwu niezależnych prób 4. la dwu sparowanych prób 5. Test uncana
0, 1 1 1 k k Var E t k k k k f k k ROZKŁA t Copyright 009, Joanna Szyda Kształt zależny od stopni swobody la wielu stopni swobody zbliżony do rozkł. normalnego
ZAKRES STOSOWALNOŚCI TESTU T 1. Test parametryczny. ane o charakterze ciągłym 3. Wartości w próbie danych rozkład normalny 4. Porównywane próby danych podobne wariancje
POJEYNCZA PRÓBA
TEST T POJEYNCZA PRÓBA BM SEX 0.97 1 0.73 1 0.87 1 0.94 1 1.0 1 0.76 1 0.78 1 1.01 1 0.8 1 0.76 1 0.87 1 0.7 1 0.91 1.0 0.87 1. Badanie osteoporozy. Medical Research Council, Cambridge PRÓBA ANYCH 3. Gęstość kości [g/cm ] 40 zdrowych osób dorosłych W próbie: n 0,85 0,1040 40
TEST T POJEYNCZA PRÓBA 1. Określenie hipotez H 0 i H 1 H 0 : średnia gęstość kości w populacji wynosi 1.0 g/cm H 1 : średnia gęstość kości w populacji różni się od 1.0 g/cm H 0 : = 1.0 H 1 : 1.0 (test dwustronny). Ustalenie poziomu istotności MAX = 0.05
Pojedyncza próba, nieznana wariancja 3. Wybór i określenie rozkładu statystyki testowej Statystyka gdzie: t s n s standardowe odchylenie w próbie danych ma rozkład t Studenta o k = n -1 stopniach swobody stopnie swobody (degrees of freedom): wielkość określająca kształt rozkładu statystyki testowej (testu) w zależności od liczby obserwacji w próbie
TEST T POJEYNCZA PRÓBA 4. Obliczenie wartości testu t 1.0 s 1,0 s n 0,85 1,0 0,1040 40 9,1 5. Obliczenie wartości t (lub odczyt t ) T 0,0000000000331 ( t 0,05;40-1 =,07 ) 6. ecyzja t < ma H 0 H 1 ( t > t ) średnia gęstość kości w populacji różni się od 1.0 g/cm
WIE NIEZALEŻNE PRÓBY
TEST T WIE NIEZALEŻNE PRÓBY BM SEX 0.97 1 0.73 1 0.87 1 0.94 1 1.0 1 0.76 1 0.78 1 1.01 1 0.8 1 0.76 1 0.87 1 0.7 1 0.91 1.0 0.87 n PRÓBA ANYCH 1. Badanie osteoporozy. Medical Research Council, Cambridge 3. Gęstość kości [g/cm ] 40 zdrowych osób dorosłych 4. Wartości znane dla mężczyzn i kobiet K M K 0,8 0,88 n M 0
TEST T WIE NIEZALEŻNE PRÓBY 1. Określenie hipotez H 0 i H 1 H 0 : średnia gęstość kości kobiet jest taka sama jak mężczyzn H 1 : średnia gęstość kości kobiet jest różna niż mężczyzn H 0 : K = M H 1 : K M (test dwustronny). Ustalenie poziomu istotności MAX = 0.05
wie próby, nieznana wariancja 3. Wybór i określenie rozkładu statystyki testowej Statystyka t 1 s gdzie s s n 1 1 s n s 1, n 1 stand. odchylenie i liczebność w pierwszej próbie danych; s, n stand. odchylenie i liczebność w drugiej próbie danych ma rozkład t Studenta o k = n 1 +n - st. swob.
TEST T WIE NIEZALEŻNE PRÓBY 4. Obliczenie wartości statystyki testowej t s n K K K M s n M M t 0,8 0,01895 0 0,88 0,0076895 0 1,8987
TEST T WIE NIEZALEŻNE PRÓBY 5. Obliczenie wartości t t 0.065 6. ecyzja t > ma H 0 H 1 Nie można odrzucić hipotezy zerowej! TEST JENOSTRONNY: H 0 : K = M H 1 : K < M t 0.036 ecyzja??
WNIOSKOWANIE STATYSTYCZNE Omułek słodkowodny Hyridella menziesi n=30 5.0 ± 0.9 mg/g [3., 6.8] H 0 : 1 = ma =0,05 t = 1,84 H 1 : 1 T = 0,0709 H 1 : 1 > T = 0,0354 n=30.9 ± 0.7 mg/g [ 1.5, 4.3 ] Wnioski?
WIE SPAROWANE PRÓBY (pary skorelowane)
TEST T PARY SKORELOWANE PRÓBA ANYCH Low CCT High CCT 0.0 14.3 13.9 13.8 18.3 15.8 1.1 33.4 0.1 0.3 4.4 19.9 0. 14.3 11.6 11.4 8.8 5.1 18.5 4.1 1. Badanie ciśnienia w gałce ocznej. Ciśnienie w gałkach tej samej osoby 3. U każdego człowieka oko prawe i lewe ma różną grubość rogówki podział oczu w parach pod tym względem (low CCT i high CCT)
TEST T PARY SKORELOWANE 1. Określenie hipotez H 0 i H 1 H 0 : ciśnienie w gałce ocznej nie zależy od grubości rogówki H 1 : ciśnienie w gałce ocznej zależy od grubości rogówki H 0 : L = H H 1 : L H. Ustalenie poziomu istotności MAX = 0.05
3. Wybór i określenie rozkładu statystyki testowej TEST T WIE SPAROWANE PRÓBY 1 1 1 1 1 N S N S S N N S t N i i N i i N i i i i i Średnia arytmetyczna różnic ( i ) w parach obserwacji Błąd standardowy średniej Tak określona statystyka ma rozkład t-studenta o N-1 stopniach swobody (N liczba par!) Standardowe odchylenie różnic
TEST T WIE SPAROWANE PRÓBY 4. Obliczenie wartości statystyki S S t i N i1 S S 1i i1 N i N N N i i 0,45 1,7895 1 10 5,6589 4,5 10 0,5 0,45 88.1 10 1 1,7895 5,6589
TEST T WIE SPAROWANE PRÓBY 5. Obliczenie wartości t t 0.808 6. ecyzja t > ma H 0 H 1 ciśnienie w gałce ocznej nie zależy od grubości rogówki
KILKA PRÓB - TEST UNCANA
TEST T KILKA PRÓB, TEST UNCANA PRÓBA ANYCH 1. Badanie frekwencji na zajęciach ze statystyki w USA. 4 grupy - atrakcyjność wykładowcy 3. Frekwencja na zajęciach w semestrze poziom atrakcyjności 0 1 4 15 0 10 30 10 13 4 1 10 9 9 10 1 0............ średnia 11.13 17.88 0.5 4.38
TEST T KILKA PRÓB, TEST UNCANA 1. Próby uszeregowane od najniższej do najwyższej średniej. Sekwencja kilku testów t dla niezależnych prób 3. Zmodyfikowany poziom błędu istotności MAX MAX * = 1 - (1 - MAX ) n-1 liczba prób 0 1 * = 1 - (1-0.7) -1 = 0.7 pojedynczego testu t 3 H 0 : 1 = H 1 : 1
TEST T KILKA PRÓB, TEST UNCANA 1. Próby uszeregowane od najniższej do najwyższej średniej. Sekwencja kilku testów t dla niezależnych prób 3. Zmodyfikowany poziom błędu istotności MAX MAX * = 1 - (1 - MAX ) n-1 0 1 * = 1 - (1-0.00000096) 4-1 = 0.000009 3 H 0 : 0 = 1 = = 3 H 1 : 0 1 3
TEST T KILKA PRÓB, TEST UNCANA 1. Próby uszeregowane od najniższej do najwyższej średniej. Sekwencja kilku testów t dla niezależnych prób 3. Zmodyfikowany poziom błędu istotności MAX MAX * = 1 - (1 - MAX ) n-1 0 1 * = 1 - (1-0.000) 3-1 = 0.0004 3 * = 1 - (1-0.0048) 3-1 = 0.0097 H 0 : 0 = 1 = H 1 : 0 1 H 0 : 1 = = 3 H 1 : 1 3
TEST T KILKA PRÓB, TEST UNCANA 1. Próby uszeregowane od najniższej do najwyższej średniej. Sekwencja kilku testów t dla niezależnych prób 3. Zmodyfikowany poziom błędu istotności MAX MAX * = 1 - (1 - MAX ) n-1 0 1 * = 1 - (1-0.0036) -1 = 0.0036 3 * = 1 - (1-0.065) -1 = 0.065 H 0 : 0 = 1 H 1 : 0 1 H 0 : = 3 H 1 : 3
TEST T KILKA PRÓB, TEST UNCANA 0 1 A A B 3 B 1. Atrakcyjność wykładowcy wpływa na frekwencję. Frekwencja na zajęciach nie różni się istotnie (=0.05) w grupach 1 i oraz i 3
Test t 1. Zakres stosowalności. la pojedynczej próby 3. la dwu niezależnych prób 4. la dwu sparowanych prób 5. Test uncana