Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości Informatyka 007 009 aktualizacja dla 00 JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska Plan wykładu. Przypomnienie testu dla pojedynczej zbiorowości.. Dlaczego dwie zbiorowości. 3. Testowanie hipotez statystycznych - standardowy schemat postępowania dla rozkładu Z. 4. Test t-studenta (wersja prób niezależnych). 5. Przykłady. 6. Test t-studenta (wersja prób zależnych). 7. Badanie równości wariancji (test F).
Schemat postępowania dla jednej zbiorowości Krok : Sprawdź założenia: czy zmienna X ma rozkład normalny (lub zbliżony do normalnego)? Jeśli NIE i ponadto liczebność próby n nie jest wystarczająca, to nie powinno się przeprowadzać testu (spróbuj powiększyć próbę). X ma rozkład normalny. Krok : Określenie hipotez: H 0 : µ = µ 0 H : µ µ 0 H : µ < µ 0 lub H : µ > µ 0 Krok 3: Sprawdzianem testu są statystyki. X µ S 0 : 0 X N( µ, S X ) lub X µ T = 0 S X S S gdzie S X = lub S X = n n Krok 4: Wybór poziomu istotności α. o rozkładzie t Studenta z n stopniami swobody Schemat postępowania (wersja t) Czy liczebność próby n > 30? Jeśli TAK to postępujemy standardowo stosując statystykę Z; Jeśli NIE to stosujemy test t-studenta i statystykę o rozkładzie t. Test jednostronny: H 0 : µ = µ 0 H : µ < µ 0 lub H : µ > µ 0 H0 odrzucamy, jeśli T t lub α T tα Test dwustronny: H 0 : µ = µ 0 H : µ µ 0 Hipotezę H0 odrzucamy, jeśli T t α lub T t α
Excel funkcja odwr. rozkładu t Studenta () Test jednostronny α Test dwustronny α /
Inny przykład tablicy z rozkładem t-studenta Za książką Statystyka Praktyczna. W.Skarzyńska Trochę podglądu wartości statystyk t Oprogramowanie Statistica
Inne przykłady testu Z Przedsiębiorstwo A zajmuje się dystrybucją kawy opakowania 3 kg. Wylosowano 36 opakowań z partii dostarczanej firmie B średnia waga w próbie,9 z odchyleniem 0,8 kg. Firma B chciałaby wiedzieć czy waga opakowania nie zmniejszyła się w stosunki do normy. Test z poziomem istotności 0.0%. Policzmy. Wprowadzenie do testowania dwóch zbiorowości Dotychczasowe schematy testów pomiar jednej zmiennej dla jednej zbiorowości (jedna seria pomiarowa); Pytanie czy wartość średnia spełnia jakiś warunek wobec pewnego progu stałej wartości Dalsze pytania mogą dotyczyć porównywanie parametru dotyczącego dwóch zbiorowości! Porównanie zdolności zawodowej studentów z dwóch różnych uczelni (czy są średnio tak samo zdolni? Czy któraś z uczelni lepiej średnio kształci ) Ocena skuteczności leku w pewnej terapii (grupa leczona vs. grupa kontrolna) Ocena oddziaływania pewnego bodźca na postawy klientów (np. skuteczność kampanii reklamowej)
Etapy postępowania w testowaniu hipotez (test z) Pobrano próby losowe: o liczności n z pierwszej populacji oraz o liczności n z drugiej populacji. W obu próbach zmierzono tą samą zmienną X, zakładamy że ma ona rozkłady N(µ,σ ), N(µ,σ ) Sformułowanie hipotez H0 : µ = µ H hipoteza alternatywna może być sformułowana na trzy sposoby: H : µ > µ (test jednostronny) H : µ < µ (test jednostronny) H : µ µ (test dwustronny) Etapy postępowania w testowaniu hipotez (test z) Krok : Określenie statystyki testowej W teście istotności dla nieznanej średniej zbiorowości jest statystyka Z o rozkładzie normalnym standaryzowanym N(0,). ( X Z = X ) ( µ µ ) σ σ + n n Oblicz wartość Z na podstawie próby.
Etapy postępowania w testowaniu hipotez (test z) Krok 3/4 Ustalenie reguły decyzyjnej Ustalenie tzw. poziomu istotności α Znając rozkład statystyki określamy, które wartości są mało prawdopodobne (odrzuć H0), a które nie pozwalają na odrzucenie H0. Przykład do obliczenia Ocena wydatków posiadaczy kart kredytowych w USA VISA vs. American Express Przykład podyktowant i wspólnie go wyliczymy.
Co z małymi próbami? Testowanie hipotez o różnicach wartości średnich dla dwóch serii pomiarów pochodzących z populacji o rozkładach normalnych. Ale zrobimy tylko wersje dla małych prób Podobne zasady dla testu t lecz inny wzór na statystykę testową x x t = NS + NS + N + N N N Zmienna o rozkładzie t-studenta z n+n- stopniami swobody Test różnic t - Studenta dla zmiennych niezależnych Kierowca może jechać dwoma różnymi drogami D i D, ale nie jest pewien, która z nich jest szybsza. Eksperymentuje mierząc czas swojej podróży jeżdżąc codziennie inną drogą wyniki w tabeli poniżej. Dzień Droga D Dzień Droga D 3 4 3 35 4 8 5 36 6 30 7 37 8 3 9 36 0 35 4
Inna tabela z rozkładem t-studenta za Powell Test różnic t - Studenta dla zmiennych niezależnych Stawia się hipotezę zerową H0 nie ma różnicy pomiędzy średnimi czasami podróży, Hipoteza alternatywna H mówi, iż różnica jest istotna. Liczba obserwacji N + N = 6 + 5 = Średni czas przejazdu x=36.333 oraz x=9.8 t = ( N x x ) S + ( N ) S N + N N + N N N Wartość statystyki t po obliczeniach jest równa,98 Przy założonym poziomie istotności 0.05 i dla stopni swobody=9 wartość krytyczna tk jest równa.6 (test dwustronny) Jaki wyciągamy wniosek?
Inne zadanie rozwiąż w Excelu
Dostępne oprogramowanie - Excel Zadanie dodatkowe Podano dwa leki A i B obniżające ciśnienie dwom grupom pacjentów. Poniżej podane mamy wielkości mówiące o ile obniżyło się ciśnienie po podaniu specyfiku. Lek A 5,00 6,00,0 9,00 8,00 5,00 7,00 8,00 5,0 7,00 Lek B 6,00 5,00,0 5,00 3,00 4,00 6,00 6,00 4,00 9,00 3,00,00 Określ, który z leków jest skuteczniejszy z uwagi na zdolności do obniżania ciśnienia. Proszę założyć poziom istotności α=0.05
Test różnic t-studenta dla zmiennych zależnych Przykład: Pewnej grupie 0 pacjentów leczonych na nadciśnienie podawano odpowiedni lek. Wyniki pomiarów pewnego parametru krwi przed leczeniem (sytuacja A) oraz po leczeniu (B) są następujące: Pacjent 3 4 5 6 7 8 9 0 Syt. A 0 85 70 85 00 95 55 90 5 30 Syt. B 90 75 5 60 5 95 60 50 55 75 d Pytanie: Czy stosowanie leku powoduje istotną spadek poziomu parametry krwi (powiązanego z spadkiem ciśnienia tętniczego krwi). Dostępne oprogramowanie - Statistica
Statistica niezależne próby Przykład ciąg dalszy
Test istotności dla dwóch wariancji n i n dwie niezależne próby oraz X i X zmienne losowe o rozkładzie normalnym. Pytania - hipoteza: H0 : σ = σ Statystyka testowa: gdzie S,S to wartości estymatorów wariancji z prób n i n, przy czym przez zbiorowość rozumie się tę, której S z próby jest większe Statystyka F ma rozkład Fishera-Snedocera o n- oraz n- stopniach swobody H : σ > σ S F = S Przykład test istotności dla dwóch wariancji Dla potrzeb ustalenia różnicy w doświadczeniu przedsiębiorstw świadczących usługi w miastach A i B zebrano następujące dane nt okresu ich działalności Pytanie: Czy istnieje znacząca różnica między średnimi okresami działalności przedsiębiorstw w obu miastach? Miasto A n=0 x=7 miesiące S=6 miesięcy Miasto B n= x=78 miesiące S=8 miesięcy
Sprawdź jednorodność wariancji H0 : σ = σ H : σ > σ Policz wariancje: S = 64 S = 36 Wyznacz wartość statystyki F: Odczytaj wartość krytyczną α=0.0 oraz k=n-= i k=n-=9 stopniach swobody F(kryt)=.98 64 F = =.78 36 I jaki ma to wpływ na dalsze postępowanie. Statistica
Możliwości Excel-a Excel
Inne wykorzystanie testu F Przegląd różnych testów istotności różnic Za książką F.Clegg
Literatura Statystyka dla studentów kierunków technicznych i przyrodniczych, Koronacki Jacek, Mielniczuk Jan, WNT, 00. Statystyka. Wprowadzenie do analizy danych sondażowych i eksperymentalnych. G.Wieczorkowska, Scholar, 004. Przystępny kurs statystyki, Stanisz A., 997. Po prostu statystyka, Clegg F., 994. Statystyczna analiza wyników badań, Dobosz M., 00. I wiele innych Dziękuję za uwagę Więcej możesz znaleźć na http://www.cs.put.poznan.pl/jstefanowski Czytaj także podręczniki