ANOVA-ćwiczenia 2 - rozwiązania

Wielkość: px
Rozpocząć pokaz od strony:

Download "ANOVA-ćwiczenia 2 - rozwiązania"

Transkrypt

1 1 ANALIZA KONTRASTÓW 1.1 Przeprowadź porównanie nowych metod leczenia nadciśnienia z metodą tradycyjną wykorzystując analizę kontrastów i plik nadciśnienie_zmienna_grupująca.sta. (Eksperyment ten był rozważany w zadaniu 1.3 z ćwiczeń ANOVA, część 1, przy wykorzystaniu testu ogólnego i testu Dunnetta porównań z grupą kontrolną.) Przeprowadź najpierw porównanie każdej nowej metody leczenia z metodą tradycyjną. Zauważ, że wynik testu F dla wszystkich zaplanowanych kontrastów pokrywa się wynikiem ogólnego testu F dla jednoczynnikowej analizy wariancji. Następnie porównaj wszystkie nowe metody leczenia z metodą tradycyjną. Za pomocą współczynnika r 2 oceń, w jakim procencie kontrast ten wyjaśnia zmienność wśród średnich grupowych. Wyznacz średnie grupowe i wylicz na podstawie próby (sprawdź) ocenę kontrastu, wartość testu F, wartość testu t, przedział ufności dla kontrastu. Rozwiązanie: Aby przeprowadzić porównania zaplanowane, kliknij przycisk Więcej wyników i wybierz zakładkę Porównania zaplanowane. Następnie wybierz przycisk Kontrasty dla oczekiwanych średnich brzegowych, wywołujący okno Określ kontrasty dla tego czynnika. Aby porównać każdą nową metodę leczenia nadciśnienia z metodą tradycyjną ustawiamy kontrasty w następujący sposób. Wszystkie kontrasty zaplanowane są istotne, czyli metoda tradycyjna leczenia nadciśnienia różni się istotnie od każdej nowej metody. Zauważmy, że przedziały ufności nie zawierają zera (weryfikowana hipoteza dla kontrastu w populacji, to hipoteza, że kontrast jest równy 0). ANOVA 2 rozwiązania Strona 1

2 Test F pozwala na stwierdzenie wysokiej istotności całej grupy porównań zaplanowanych (p=0,000002). Zauważmy, że ten sam wynik (wartość statystyki, p-wartość) uzyskujemy dla omnibus test ANOVA jednoczynnikowa (tabela poniżej). Okazuje się bowiem, że dodanie sum kwadratów, za które odpowiedzialne są te trzy kontrasty daje w rezultacie. Zatem współczynnik dla tej grupy kontrastów jest równy 100%, czyli badane trzy kontrasty wyjaśniają całą zmienność średnich grupowych. Jest tak również zawsze, gdy mamy k-1 kontrastów ortogonalnych. Zróbmy teraz analizę kontrastu porównującego metodę tradycyjną z nowymi metodami leczenia. Ustawiamy współczynniki kontrastu jak poniżej. Wyznaczmy przedział ufności dla kontrastu i wartość statystyki t oraz p-wartość dla tej statystyki. Kontrast okazał się wysoce istotny, czyli nowe metody leczenia są istotnie różne od metody tradycyjnej. Poniższa tabela przedstawia wynik testu F dla tego porównania. Widzimy, że w przypadku jednego kontrastu, oba testy dają tą samą p-wartość. ANOVA 2 rozwiązania Strona 2

3 Obliczmy współczynnik grupowych. Kontrast ten wyjaśnia 65% zmienności wśród średnich Wyznaczmy średnie grupowe, wybierając na karcie Średnie moduł Obserwowane, nieważone. Wyliczmy teraz wartość kontrastu z próby Następnie wyznaczamy sumę kwadratów, za którą odpowiedzialny jest kontrast =41,89 oraz wartość statystyki Wyznaczmy teraz p-wartość dla testu istotności kontrastu korzystając z kalkulatora prawdopodobieństwa i rozkładu F(1,36). Kopiujemy wartość obliczonej statystyki testowej do F i zaznaczamy prawy ogon (1-p) i otrzymujemy 0, Wartość statystyki t dla istotności kontrastu obliczamy ze wzoru Natomiast przedział ufności dla kontrastu ma postać 1.2 Przeprowadzono eksperyment dla określenia wpływu sześciu różnych rodzajów pracy na częstość skurczów serca pracownika. W eksperymencie tym 78 mężczyznom losowo przydzielono wykonywanie 6 różnych zadań (po 13 pracowników dla każdego zadania). Ze względu na otarcia skóry tylko 68 pracowników ukończyło eksperyment. W wybranym dniu, po godzinnej pracy pracownikom zmierzono tętno (liczbę skurczów w ciągu 20 sekund). Obserwacje zawarte są w przykładowym pliku programu Statistica Pulse.sta. Na poziomie istotności 0,01, sprawdź, czy rodzaj wykonywanego zadania wpływa na tętno. Przeprowadź następujące porównania zaplanowane: średniej Tętna dla Zadania 4 względem średniej Tętna dla Zadania 5, średniej Tętna dla Zadania 1 względem średnich Tętna dla zadań 2, 3 i 4 średniej Tętna dla Zadania 1 względem średnich Tętna dla zadań: od Zadania 3 do Zadania 6. Rozwiązanie: Otwórz przykładowy plik Pulse.sta (Plik-Otwórz przykłady-datastes). Wybierz moduł Statystyka-ANOVA-Jednoczynnikowa ANOVA. Ustaw jako zmienną zależną TĘTNO, a jako czynnik (predykator jakościowy) ZADANIE. Aby zmienić poziom ufności z typowego 0,05 na 0,01 oraz poziom ufności z typowego 0,95 na 0,99 na karcie Podsumowanie zmień te parametry. Wybierz przycisk Wszystkie efekty. ANOVA 2 rozwiązania Strona 3

4 Następnie sporządź wykres średnich wybierając Średnie/wykresy. 44 ZADANIE; Oczekiwane średnie brzegowe Bieżący efekt: F(5, 62)=4,4941, p=,00147 Dekompozycja efektywnych hipotez Pionowe słupki oznaczają 0,95 przedziały ufności TĘTNO ZADANIE Na poziomie istotności 0,01, można stwierdzić istotny wpływ rodzaju wykonywanego zadania na tętno (p=0,001<0,01). Aby przeprowadzić porównania zaplanowane, kliknij przycisk Więcej wyników i wybierz zakładkę Porównania zaplanowane. Następnie wybierz przycisk Kontrasty dla oczekiwanych średnich brzegowych, wywołujący okno Określ kontrasty dla tego czynnika. Ustaw kontrasty jak w oknie poniżej. Kliknij przycisk OK, a następnie Oblicz. Arkusz Oceny kontrastów wyświetla wyniki testów istotności i przedziały ufności dla każdego porównania. ANOVA 2 rozwiązania Strona 4

5 Zatem, tylko pierwsze z porównań zaplanowanych jest istotne (p=0,0007<0,01). Wartość 0 znajduje się wewnątrz 99% przedziału ufności dla obydwu ostatnich porównań zaplanowanych i nie wpada do przedziału ufności dla pierwszego porównania. Potwierdza to wynik testu o istotności tylko pierwszego kontrastu. Arkusz Jednowymiarowe testy istotności dla porównań zaplanowanych przedstawia wynik testu istotności dla zbioru kontrastów. Zbiór trzech analizowanych kontrastów okazał się istotny (p=0,006). 1.3 Na podstawie obserwacji zebranych w pliku plony_cukru.sta (porównaj zadanie 2.3 z części 1) zbadaj, czy plony cukru wzrastają liniowo wraz ze zwiększaniem dawek potasu. Jaki procent zmienności średnich plonów dla poszczególnych dawek potasu wyjaśnia ten kontrast? Zbadaj istotność trendu liniowego dla wzrastających dawek potasu przy zastosowaniu nawożenia fosforem w ilości 35 kg/ha. Jaki procent zmienności wyjaśnia ten kontrast? Rozwiązanie: Otwórz plik plony_cukru.sta. Zastosuj plan bloków losowych z możliwością interakcji pomiędzy badanymi czynnikami. Ustaw wagi dla zbadania kontrastu liniowego pomiędzy dawkami potasu, korzystając z predefiniowanych kontrastów wielomianowych.. ANOVA 2 rozwiązania Strona 5

6 Kontrast liniowy jest wysoce istotny. Wyjaśnia on (wartość 2449,1, to odczytany z tabeli poniżej). zmienności średnich grupowych ANOVA 2 rozwiązania Strona 6

7 Uwaga: Kontrast ten możemy również zbadać ustawiając odpowiednio wagi dla interakcji Dawki potasuxdawki fosforu: Jeśli zastosowano nawożenie fosforem w dawce 35 kg/ha i interesuje nas, czy wówczas plony cukru wzrastają liniowo wraz ze zwiększaniem dawek potasu ustawiamy wagi dla kontrastu: ANOVA 2 rozwiązania Strona 7

8 Klikając Oblicz, dostajemy wynik testu istotności. Również rozważając tylko ten poziom czynnika Dawki fosforu, również możemy stwierdzić istotny trend liniowy. 2 KWADRATY ŁACIŃSKIE I UKŁADY ZAGNIEŻDŻONE 2.1 Firma jubilerska zamierza reklamować swoje produkty przy użyciu afiszów reklamowych w sklepach. Firma ma pięć afiszy reklamowych i chce zbadać, który z nich jest najbardziej skuteczny. Firma chce zbadać wielkość sprzedaży swoich produktów po zastosowaniu tych afiszy w pięciu sklepach różniących się wielkością sprzedaży. Wiadomo również, że wielkość sprzedaży może zależeć od dnia tygodnia. Aby wykryć ewentualne różnice w wielkości sprzedaży wynikające z zastosowania różnych afiszy reklamowych i uniezależnić te różnice od różnic wynikających z dnia sprzedaży i sklepu zastosowano plan kwadratu łacińskiego. Dane do tego planu znajdują się w pliku kwadrat_łaciński.sta. Czy sprzedaż zależy od wywieszonego afisza? Który afisz jest najbardziej skuteczny? Rozwiązanie: Ponieważ w planie układu kwadratu łacińskiego zakłada się brak interakcji pomiędzy czynnikami w wierszach i kolumnach, analizę przeprowadzamy w module ANOVA efektów głównych. ANOVA 2 rozwiązania Strona 8

9 Istotnie wielkość sprzedaży zależy od wywieszonego afisza reklamowego w sklepie (p=0,000301). Sporządźmy wykres średnich, aby zaobserwować różnice pomiędzy średnimi. 9 Plakat; Oczekiwane średnie brzegowe Bieżący efekt: F(4, 12)=12,555, p=,00030 Dekompozycja efektywnych hipotez Pionowe słupki oznaczają 0,95 przedziały ufności Sprzedaż B C A D E Plakat Aby sprawdzić, czy istotnie afisz A przyczynia się do zwiększenia sprzedaży bardziej niż cztery pozostałe zastosujmy analizę kontrastu (-1,-1,4,-1,-1). Kontrast jest istotny, zatem afisz A w istotnie większym stopniu zwiększa sprzedaż w porównaniu z pozostałymi. 2.2 Wśród chorych z upośledzeniem funkcji wydalania przez wątrobę i nerki przeprowadzono eksperyment w układzie podwójnie zagnieżdżonym. Badano trzy grupy pacjentów w zależności od stanu klinicznego (ciężki, średni, lekki). Stosowano sześć leków (po dwa do każdego stanu klinicznego) oraz po dwie swoiste dawki do każdego leku. Obserwowano obniżenie stężenia amoniaku po kuracji danym środkiem farmakologicznym przy danej dawce. Zebrane obserwacje ANOVA 2 rozwiązania Strona 9

10 zawiera plik amoniak.sta. Przeprowadź analizę wariancji w układzie podwójnie zagnieżdżonym i odpowiedź na podstawowe pytania weryfikacyjne w tym układzie: Czy stan kliniczny ma istotny wpływ na spadek stężenia amoniaku? Czy w obrębie każdego stanu klinicznego rodzaj podawanego leku ma istotny wpływ na wynik eksperymentu? Czy w obrębie każdego leku są istotne różnice pomiędzy grupami pacjentów w zależności od dawki zastosowanego leku? Ponadto, stosując analizę kontrastów zbadaj jaki lek byłby najlepszy dla pacjentów w ciężkim stanie? Sprawdź, czy są różnice w działaniu dla zastosowanych dawek wybranego leku. Rozwiązanie: Otwórz plik amoniak.sta. Wybieramy moduł Statystyka-Zaawansowane modele liniowe i nieliniowe-ogólne modele liniowe-układ zagnieżdżony ANOVA. Wybieramy zmienne i ustawiamy efekty międzygrupowe jak w poniższym oknie. Ustawione zmienne i sposób zagnieżdżenia czynników przedstawia okno poniżej. Czynnikiem nadrzędnym jest Stan kliniczny, na pierwszym poziomie zagnieżdżenia jest czynnik Lek, a na drugim Dawka. Zmienna zależną jest Stężenie amoniaku. Po kliknięciu Wszystkie efekty, otrzymujemy okno wyników: ANOVA 2 rozwiązania Strona 10

11 Jak widzimy, wszystkie efekty są statystycznie istotne, czyli: 1. Stan kliniczny ma istotny wpływ na spadek stężenia amoniaku u pacjentów z upośledzeniem funkcji wydalania przez wątrobę i nerki (p<0,000001). 2. W obrębie każdego stanu klinicznego zastosowany lek ma istotny wpływ na spadek stężenia amoniaku (p<0,000001). 3. W obrębie każdego leku spadek stężenia amoniaku istotnie różnicuje zastosowana dawka leku (p=0,000056). Sprządźmy wykresy średnich dla oceny zróżnicowania średnich dla różnych stanów klinicznych pacjentów. 38 Stan kliniczny; Oczekiwane średnie brzegowe Bieżący efekt: F(2, 36)=23,192, p=,00000 Dekompozycja typu III Pionowe słupki oznaczają 0,95 przedziały ufności Stężenie amoniaku Ciężki Średni Lekki Stan kliniczny Przeprowadźmy test post-hoc Scheffe dla zbadania różnic pomiędzy parami tych średnich. Możemy wybrać tworzenie grup jednorodnych. Grupy pacjentów w stanie ciężkim i średnim nie różnią się istotnie pod względem średniego spadku stężenia amoniaku po zastosowaniu leczenia. Istotnie wyższy spadek można zaobserwować natomiast w ANOVA 2 rozwiązania Strona 11

12 grupie pacjentów w lekkim stanie. Aby zbadać różnice średnich dla leków stosowanych u pacjentów stanie ciężkim wybieramy zakładkę Porównania zaplanowane i w oknie Efekt wybieramy Lek( Stan kliniczny ). Ustawiamy wagi dla kontrastów zaplanowanych. Ponieważ chcemy porównać Lek1 i Lek2 stosowane u pacjentów w stanie ciężkim, wpisujemy 1 i -1 w dwóch pierwszych wierszach i dalej same 0. Arkusz wyników, pokazuje, ze kontrast ten jest istotny. Jest istotna różnica w działaniu obu leków stosowanych u pacjentów ciężkim stanie. Klikając Oczekiwane średnie brzegowe, uzyskujemy tabelę ze średnimi, na podstawie której widzimy, że średni spadek stężenia amoniaku jest wyższy przy zastosowaniu Leku1 w porównaniu z Lekiem2. Lek1 jest więc istotnie najlepszy w leczeniu pacjentów w ciężkim stanie. Możemy zilustrować różnice pomiędzy średnimi na wykresach średnich utworzonych w module Statystyka-Statystyki podstawowe i tabele-statytyki opisowe. ANOVA 2 rozwiązania Strona 12

13 55 Wykres średnich i przedz. ufności (95,00%) Stężenie amoniaku Wartości Ciężki Średni Lekki Stan kliniczny Lek1 Lek2 Lek3 Lek4 Lek5 Lek6 Zobaczymy jeszcze, czy zastosowana dawka wpływa różnicująco. Wybierzmy tylko kody tych leków i dawek stosowanych w stanie ciężkim. 35 Wykres średnich i przedz. ufności (95,00%) Stężenie amoniaku Wartości Lek1 Lek Lek2 Dawka 11 Dawka 12 Dawka 21 Dawka 22 Wykres średnich wskazuje, że nie będzie istotnych różnic w zastosowanych dawkach dla Leku1. Sprawdźmy to, stosując analizę kontrastów. Wybieramy ostatni poziom zagnieżdżenia w oknie Efekt i wpisujemy 1 i -1 w dwa pierwsze wiersza i dalej same 0, gdyż chcemy porównać tylko dwie dawki dla Leku1. ANOVA 2 rozwiązania Strona 13

14 Wynik statystyki F potwierdza spostrzeżenie poczynione na podstawie wykresu średnich, iż nie ma istotnych różnic w działaniu zastosowanych dawek dla Leku W eksperymencie farmakologicznym oceniano trzy nowe leki stosowane w celu obniżenia cholesterolu LDL. Każdy lek stosowano w dwóch klinikach. Obserwacje zawarte w pliku cholesterol.sta zawierają wartości o jakie obniżył się poziom LDL po kuracji danym środkiem farmakologicznym. Ponadto eksperyment ma wykazać, czy są różnice w działaniu tych leków dla kobiet i mężczyzn. Przeprowadź analizę wariancji. Czy można stwierdzić, który z badanych leków jest najbardziej skuteczny? Rozwiązanie: Otwórz plik danych. Wybieramy Statystyka-Zaawansowane modele liniowe i nieliniowe-ogólne modele liniowe-ogólne modele liniowe. Wybieramy zmienne i klikamy na Efekty międzygrupowe i ustawiamy je według wzoru. Następnie klikamy przycisk Wszystkie efekty. ANOVA 2 rozwiązania Strona 14

15 Tylko efekt wpływu leku okazał się istotny. Nie można stwierdzić istotnego wpływu płci, ani interakcji pomiędzy płcią, a zastosowanym lekiem. Klinika tez nie ma istotnego wpływu na spadek cholesterolu LDL. Wyznaczmy wykresy średnich dla Leku. 22 Lek; Oczekiwane średnie brzegowe Bieżący efekt: F(2, 36)=61,147, p=,00000 Dekompozycja typu III Pionowe słupki oznaczają 0,95 przedziały ufności obniżenie LDL Lek 1 Lek 2 Lek 3 Lek Przeprowadźmy test post-hoc dla zbadania istotności porównań parami. Test Tukeya pozwala na stwierdzenie istotnych różnic dla wszystkich par średnich. Lek 1 jest więc istotnie najbardziej skuteczny. 3 ANOVA Z POWTARZANYMI POMIARAMI ANOVA 2 rozwiązania Strona 15

16 3.1 Dokonano kolejnych pomiarów co trzy miesiące stężenia glukozy w surowicy krwi dla losowo wybranych pięciu pacjentów chorych na pewną chorobę w celu określenia rodzaju i istotności zmian w czasie w trakcie leczenia. Pomiary zebrano w pliku glukoza.sta. Zastosuj analizę wariancji z powtarzanymi pomiarami. Porównaj wynik tej analizy z analizą jednoczynnikową (czynnik CZAS) i dwuczynnikową efektów głównych po dodaniu drugiego czynnika (OSOBA). Zauważ, że w analizie jednoczynnikowej zmienność między osobami wchodzi w skład zmienności wynikającej z błędów losowych, co osłabia moc testu. Zauważ dalej, że rozkład zmienności w analizie dwuczynnikowej pokrywa się z rozkładem zmienności w analizie z powtarzanymi pomiarami, lecz ze względu na losowy charakter czynnika OSOBA w eksperymencie z powtarzanymi pomiarami nie badamy jego efektu głównego, a tylko oddzielamy zmienność wynikającą z jego działania od zmienności losowej. Utwórz wykres średnich i zauważ, że w szóstej dobie w próbie stężenie glukozy było najniższe. Wykorzystując analizę kontrastów sprawdź, czy można to stwierdzenie uogólnić na populację? Ze względu na małą wartość statystyki Mauchleya wyznacz macierz kowariancji i zastosuj testy wielowymiarowe dla potwierdzenia wyniku jednowymiarowego. Rozwiązanie: Otwór plik glukoza.sta. Otwieramy moduł Układy z powtarzanymi pomiarami wybierając go albo z modułu ANOVA albo z Zaawansowane modele liniowe i nieliniowe-ogólne modele liniowe. Wybieramy wszystkie zmienne na liście zmiennych zależnych (pierwszej). Klikamy na przycisk Powtarzane pomiary i wybieramy liczbę powtórzeń oraz wpisujemy nazwę dla czynnika powtarzanych pomiarów np. CZAS. Kliknijmy przycisk Więcej i na zakładce Podsumowanie zauważmy grupę narzędzi dla powtarzanych pomiarów: Klikając przycisk Sferyczność wywołujemy wynik testu Mauchleya. ANOVA 2 rozwiązania Strona 16

17 Ponieważ p=0,523>0,05, to można uznać, że spełnione jest założenie o sferyczności i możemy stosować test jednowymiarowy. Wybieramy Testy jednowymiarowe i otrzymujemy okno wynikowe. Czynnik CZAS istotnie wpływa więc na wynik leczenia (p=0,000018). Jeśli chcemy zobaczyć pełną tabelę z wszystkimi sumami kwadratów musimy wybrać Wszystkie efekty. Widzimy tutaj zmienność wynikająca z różnic pomiędzy osobami (29,597), o którą pomniejszamy wielkość błędu losowego. Zobaczmy jak wyglądałby wynik jednoczynnikowej analizy wariancji. Widzimy, że zmienność wynikająca z błędów losowych jest sumą zmienności losowej i między pacjentami z poprzedniej tabeli. Zobaczmy, jeszcze, że rozkład zmienności w analizie efektów głównych dwuczynnikowej pokrywa się całkowicie z rozkładem zmienności w analizie z powtarzanymi pomiarami. Ze względu na losowość czynnika OSOBA inaczej musimy interpretować wyniki. ANOVA 2 rozwiązania Strona 17

18 Wyznaczmy wykres średnich pomiarów i zauważmy, że w szóstej dobie stężenie glukozy jest najmniejsze. 10 CZAS; Oczekiwane średnie brzegowe Bieżący efekt: F(3, 12)=25,381, p=,00002 Dekompozycja efektywnych hipotez Pionowe słupki oznaczają 0,95 przedziały ufności DV_ Doba 0 Doba 3 Doba 6 Doba 9 CZAS Czy można to stwierdzenie uogólnić na populację? Ustawmy wagi kontrastu porównującego średnią w szóstej dobie z pozostałymi średnimi (razem). Klikamy OK. i otrzymujemy okno wynikowe. ANOVA 2 rozwiązania Strona 18

19 Istotnie stężenie glukozy w szóstej dobie jest niższe od tego stężenia w pozostałych punktach czasowych. Macierz korelacji wybieramy na zakładce Macierz. Widzimy, że wartość 0,64 jest trochę za mała. Sprawdźmy wynik korzystając z dostępnych testów wielowymiarowych. Test ten potwierdził otrzymany wynik testem jednowymiarowym. Możemy również sprawdzić wynik stosując poprawki. W tym celu klikamy na przycisk G-G i H-F. Wynik testu po zastosowaniu poprawek nadal pozostaje bez zmian. 3.2 Eksperyment badał wyniki terapii hormonalnej u 40 kobiet mierzone co miesiąc (przez cztery miesiące) na depresyjnej skali Hamiltona. W badaniu grupa kobiet została losowo podzielona na dwie grupy, z których jedna otrzymywała placebo, a druga właściwy lek. Obserwacje zawarte są w pliku terapia_hormonalna.sta. Przeprowadź analizę wariancji dla zbadania, czy są istotne różnice w czasie poziomu depresji i czy zależy to od badanej grupy. Sprawdź, korzystając z odpowiednich kontrastów, czy poziom depresji wzrasta z miesiąca na miesiąc w grupie nieleczonej. Rozwiązanie: Otwórzmy plik terapia_hormonalna.sta. Wybieramy Układy z powtarzanymi pomiarami i ustawiamy zmienne i ustawiamy liczbę pomiarów powtarzanych oraz nazwę czynnika klikając na Powtarzane pomiary. ANOVA 2 rozwiązania Strona 19

20 Sprawdzamy założenie o normalności i sferyczności. Założenie jest spełnione i można stosować podejście jednowymiarowe. Klikamy na Testy jednowymiarowe. Wszystkie efekty okazały się wysoce istotne. Są różnice w czasie poziomu depresji i występuje też wyraźna interakcja MIESIĄC x Grupa, co ilustruje wykres interakcji. ANOVA 2 rozwiązania Strona 20

21 13 MIESIĄC*Grupa; Oczekiwane średnie brzegowe Bieżący efekt: F(3, 114)=7,0857, p=,00021 Dekompozycja efektywnych hipotez Pionowe słupki oznaczają 0,95 przedziały ufności DV_ Miesiąc 1 Miesiąc 2 Miesiąc 3 Miesiąc 4 MIESIĄC Grupa Lek Grupa Placebo Wzrost poziomu depresji w grupie z placebo jest znacznie szybszy niż w grupie leczonej. Na podstawie arkusza wynikowego dla wszystkich efektów, stwierdzamy tez istotny wpływ grupy na poziom depresji u chorych. Przeprowadźmy analizę kontrastów dla zbadania, czy z miesiąca na miesiąc wzrasta poziom depresji w grupie nieleczonej. Skorzystajmy z predefiniowanego kontrastu Powtarzany. Na podstawie arkusza wynikowego stwierdzamy, że w grupie leczonej poziom depresji wzrasta istotnie z miesiąca na miesiąc, z wyjątkiem pierwszego miesiąca. 3.3 Na konkursie plastycznym osiem prac zostało nominowanych do nagrody głównej (plik ANOVA 2 rozwiązania Strona 21

22 prace_plastyczne.sta). Każdą pracę oceniało niezależnie 13 ekspertów. Czy są istotne różnice pomiędzy tymi pracami w świetle ich oceny przez ekspertów? Ze względu na silne odchylenia od normalności rozkładów w grupach zastosuj nieparametryczny odpowiednik ANOVA z powtarzanymi pomiarami test Friedmana. Czy oceny ekspertów są zgodne? Oceń zgodność tych ocen za pomocą współczynnika Kendalla. Rozwiązanie: Wybieramy moduł Statystyka-Testy nieparametryczne-porównanie wielu prób zależnych (zmiennych). Klikamy test ANOVA Friedmana i współczynnik zgodności i otrzymujemy wynik. Pomiędzy pracami są istotne różnice (p<0,00001). Ponadto osoby oceniające wykazują dużą zgodność w swych ocenach, gdyż współczynnik Kendalla wynosi 0,71. ANOVA 2 rozwiązania Strona 22

ANALIZA WARIANCJI - KLASYFIKACJA WIELOCZYNNIKOWA

ANALIZA WARIANCJI - KLASYFIKACJA WIELOCZYNNIKOWA ANALIZA WARIANCJI - KLASYFIKACJA WIELOCZYNNIKOWA Na poprzednich zajęciach omawialiśmy testy dla weryfikacji hipotez, że kilka średnich dla analizowanej zmiennej grupującej mają jednakowe wartości średnie.

Bardziej szczegółowo

Analiza wariancji, część 2

Analiza wariancji, część 2 Analiza wariancji, część 2 1 / 74 Analiza kontrastów a priori Testy post hoc porównują wszystkie możliwe pary średnich i wykonuje się je dopiero po stwierdzeniu za pomocą testu F istotności danego czynnika.

Bardziej szczegółowo

ANALIZA WARIANCJI - KLASYFIKACJA JEDNOCZYNNIKOWA

ANALIZA WARIANCJI - KLASYFIKACJA JEDNOCZYNNIKOWA ANALIZA WARIANCJI - KLASYFIKACJA JEDNOCZYNNIKOWA Na poprzednich zajęciach omawialiśmy testy dla weryfikacji hipotez, że dwie populacje o rozkładach normalnych mają jednakowe wartości średnie. Co jednak

Bardziej szczegółowo

Szkice rozwiązań z R:

Szkice rozwiązań z R: Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -

Bardziej szczegółowo

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych 1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja

Bardziej szczegółowo

Analiza wariancji - ANOVA

Analiza wariancji - ANOVA Analiza wariancji - ANOVA Analiza wariancji jest metodą pozwalającą na podział zmienności zaobserwowanej wśród wyników eksperymentalnych na oddzielne części. Każdą z tych części możemy przypisać oddzielnemu

Bardziej szczegółowo

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22 Spis treści Przedmowa do wydania pierwszego.... 11 Przedmowa do wydania drugiego.... 15 Wykaz symboli.... 17 Litery alfabetu greckiego wykorzystywane w podręczniku.... 17 Symbole wykorzystywane w zagadnieniach

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice Przedmowa do wydania polskiego Przedmowa CZĘŚĆ I. PODSTAWY STATYSTYKI Rozdział 1 Podstawowe pojęcia statystyki

Bardziej szczegółowo

Analizy wariancji ANOVA (analysis of variance)

Analizy wariancji ANOVA (analysis of variance) ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 Inne układy doświadczalne 1) Układ losowanych bloków Stosujemy, gdy podejrzewamy, że może występować systematyczna zmienność między powtórzeniami np. - zmienność

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe? 2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich

Bardziej szczegółowo

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Autor prezentuje spójny obraz najczęściej stosowanych metod statystycznych, dodatkowo omawiając takie

Bardziej szczegółowo

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna 1 Laboratorium VIII: Analiza kanoniczna Spis treści Laboratorium VIII: Analiza kanoniczna... 1 Wiadomości ogólne... 2 1. Wstęp teoretyczny.... 2 Przykład... 2 Podstawowe pojęcia... 2 Założenia analizy

Bardziej szczegółowo

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Zadanie Zbadano satysfakcję z życia w skali 1 do 10 w dwóch grupach rodziców: a) Rodzice dzieci zdrowych oraz b) Rodzice dzieci z niepełnosprawnością

Bardziej szczegółowo

Wydział Matematyki. Testy zgodności. Wykład 03

Wydział Matematyki. Testy zgodności. Wykład 03 Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane

Bardziej szczegółowo

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas: ROZWIĄZANIA I ODPOWIEDZI Zadanie A1. Można założyć, że przy losowaniu trzech kul jednocześnie kolejność ich wylosowania nie jest istotna. A więc: Ω = 20 3. a) Niech: - wśród trzech wylosowanych opakowań

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

TECHNIKA DRZWI ZATRZAŚNIĘTE PRZED NOSEM

TECHNIKA DRZWI ZATRZAŚNIĘTE PRZED NOSEM Badanie pilotażowe TECHNIKA DRZWI ZATRZAŚNIĘTE PRZED NOSEM Czy łatwa prośba etyczna zostanie spełniona istotnie częściej jeśli poprzedzi się ją nieetyczną prośbą trudną? H0 nie, H1 tak. Schemat eksperymentu

Bardziej szczegółowo

Badanie zależności skala nominalna

Badanie zależności skala nominalna Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Analiza wariancji i kowariancji

Analiza wariancji i kowariancji Analiza wariancji i kowariancji Historia Analiza wariancji jest metodą zaproponowaną przez Ronalda A. Fishera. Po zakończeniu pierwszej wojny światowej był on pracownikiem laboratorium statystycznego w

Bardziej szczegółowo

R-PEARSONA Zależność liniowa

R-PEARSONA Zależność liniowa R-PEARSONA Zależność liniowa Interpretacja wyników: wraz ze wzrostem wartości jednej zmiennej (np. zarobków) liniowo rosną wartości drugiej zmiennej (np. kwoty przeznaczanej na wakacje) czyli np. im wyższe

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

, a ilość poziomów czynnika A., b ilość poziomów czynnika B. gdzie

, a ilość poziomów czynnika A., b ilość poziomów czynnika B. gdzie Test Scheffego, gdzie (1) n to ilość powtórzeń (pomiarów) w jednej grupie (zabiegu) Test NIR Istnieje wiele testów dla porównań wielokrotnych opartych o najmniejszą istotna różnicę między średnimi (NIR).

Bardziej szczegółowo

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Nazwa

Bardziej szczegółowo

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych 3.1. Estymacja parametrów i ocena dopasowania modeli z jedną zmienną 23. Właściciel komisu w celu zbadania

Bardziej szczegółowo

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Wykład 4: Wnioskowanie statystyczne Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Idea wnioskowania statystycznego Celem analizy statystycznej nie jest zwykle tylko

Bardziej szczegółowo

Ćwiczenia 7. Badanie istotności róŝnic część II.

Ćwiczenia 7. Badanie istotności róŝnic część II. Ćwiczenia 7. Badanie istotności róŝnic część II. Zadania obowiązkowe UWAGA! Elementy zadań oznaczone kolorem czerwonym naleŝy przygotować lub wypełnić. Zadanie 7.1. (STATISTICA/R) W pliku Serce2.sta (porównaj

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

Elementy statystyki STA - Wykład 5

Elementy statystyki STA - Wykład 5 STA - Wykład 5 Wydział Matematyki i Informatyki Uniwersytet im. Adama Mickiewicza 1 ANOVA 2 Model jednoczynnikowej analizy wariancji Na model jednoczynnikowej analizy wariancji możemy traktować jako uogólnienie

Bardziej szczegółowo

Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008

Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008 Redaktor: Alicja Zagrodzka Korekta: Krystyna Chludzińska Projekt okładki: Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008 ISBN 978-83-7383-296-1 Wydawnictwo Naukowe Scholar

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

TABELE WIELODZIELCZE

TABELE WIELODZIELCZE TABELE WIELODZIELCZE W wielu badaniach gromadzimy dane będące liczebnościami. Przykładowo możemy klasyfikować chore zwierzęta w badanej próbie do różnych kategorii pod względem wieku, płci czy skali natężenia

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU

LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU Tomasz Demski, StatSoft Polska Sp. z o.o. Wprowadzenie Jednym z elementów walidacji metod pomiarowych jest sprawdzenie liniowości

Bardziej szczegółowo

ZARZĄDZANIE DANYMI W STATISTICA

ZARZĄDZANIE DANYMI W STATISTICA Wprowadzenie do STATISTICA Krzysztof Regulski AGH, WIMiIP ZARZĄDZANIE DANYMI W STATISTICA 1) Zastosowanie: STATISTICA umożliwia w zakresie zarządzania danymi m.in.: scalanie plików sprawdzanie danych sortowanie

Bardziej szczegółowo

WSPOMAGANIE ANALIZY DANYCH ZA POMOCĄ NARZĘDZI STATISTICA

WSPOMAGANIE ANALIZY DANYCH ZA POMOCĄ NARZĘDZI STATISTICA WSPOMAGANIE ANALIZY DANYCH ZA POMOCĄ NARZĘDZI STATISTICA Janusz Wątroba i Grzegorz Harańczyk, StatSoft Polska Sp. z o.o. Zakres zastosowań analizy danych w różnych dziedzinach działalności biznesowej i

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

Analiza Statystyczna

Analiza Statystyczna Lekcja 5. Strona 1 z 12 Analiza Statystyczna Do analizy statystycznej wykorzystać można wbudowany w MS Excel pakiet Analysis Toolpak. Jest on instalowany w programie Excel jako pakiet dodatkowy. Oznacza

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Dwuczynnikowa analiza wariancji (2-way

Bardziej szczegółowo

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna Badanie współzależności zmiennych Uwzględniając ilość zmiennych otrzymamy 4 odmiany zależności: Zmienna zależna jednowymiarowa oraz jedna

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom

Bardziej szczegółowo

JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA

JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA 1 Obserwowana (badana) cecha Y Czynnik wpływający na Y (badany) A A i i ty poziom czynnika A a liczba poziomów (j=1..a), n i liczba powtórzeń w i tej populacji

Bardziej szczegółowo

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona Badanie zależności między cechami Obserwujemy dwie cechy: X oraz Y Obiekt (X, Y ) H 0 : Cechy X oraz Y są niezależne Próba: (X 1, Y 1 ),..., (X n, Y n ) Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej:

1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej: Metoda analizy macierzy współczynników korelacji Idea metody sprowadza się do wyboru takich zmiennych objaśniających, które są silnie skorelowane ze zmienną objaśnianą i równocześnie słabo skorelowane

Bardziej szczegółowo

czerwiec 2013 Uwaga: Przy rozwiązywaniu zadań, jeśli to konieczne, należy przyjąć poziom istotności 0,1 i współczynnik ufności 0,90

czerwiec 2013 Uwaga: Przy rozwiązywaniu zadań, jeśli to konieczne, należy przyjąć poziom istotności 0,1 i współczynnik ufności 0,90 Uwaga: Przy rozwiązywaniu zadań, jeśli to konieczne, należy przyjąć poziom istotności 0,1 i współczynnik ufności 0,90 czerwiec 2013 Zadanie 1 Poniższe tabele przestawiają dane dotyczące umieralności dzieci

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

POLITECHNIKA OPOLSKA

POLITECHNIKA OPOLSKA POLITECHNIKA OPOLSKA WYDZIAŁ MECHANICZNY Katedra Technologii Maszyn i Automatyzacji Produkcji Laboratorium Podstaw Inżynierii Jakości Ćwiczenie nr 4 Temat: Analiza korelacji i regresji dwóch zmiennych

Bardziej szczegółowo

Spis treści. LaboratoriumV: Podstawy korelacji i regresji. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych

Spis treści. LaboratoriumV: Podstawy korelacji i regresji. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych 1 LaboratoriumV: Podstawy korelacji i regresji Spis treści Laboratorium V: Podstawy korelacji i regresji...1 Wiadomości ogólne...2 1. Wstęp teoretyczny....2 1.1 Korelacja....2 1.2 Funkcja regresji....5

Bardziej szczegółowo

Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji

Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji gkrol@mail.wz.uw.edu.pl #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji 1 Ryzyko błędu - powtórzenie Statystyka niczego nie dowodzi, czyni tylko wszystko mniej lub bardziej prawdopodobnym

Bardziej szczegółowo

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15 VII WYKŁAD STATYSTYKA 30/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 7 (c.d) WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności,

Bardziej szczegółowo

Analiza wariancji (ANalysis Of Variance - ANOVA)

Analiza wariancji (ANalysis Of Variance - ANOVA) Analiza wariancji (ANalysis Of Variance - ANOVA) W poprzednim rozdziale przedstawiono sposób porównywania dwóch wartości średnich. Często jednak zachodzi potrzeba porównywania większej liczby średnich

Bardziej szczegółowo

PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA

PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA Krzysztof Suwada, StatSoft Polska Sp. z o.o. Wstęp Wiele różnych analiz dotyczy danych opisujących wielkości charakterystyczne bądź silnie

Bardziej szczegółowo

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś.

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś. Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś. Województwo Urodzenia według płci noworodka i województwa. ; Rok 2008; POLSKA Ogółem Miasta Wieś Pozamałżeńskie- Miasta Pozamałżeńskie-

Bardziej szczegółowo

ANALIZA KORELACJI Korelacja między zmiennymi X i Y jest miarą siły liniowego związku między tymi zmiennymi.

ANALIZA KORELACJI Korelacja między zmiennymi X i Y jest miarą siły liniowego związku między tymi zmiennymi. ANALIZA KORELACJI Większość zjawisk w otaczającym nas świecie występuje nie samotnie a w różnorodnych związkach. Odnosi się to również do zjawisk biologiczno-medycznych. O powiązaniach między nimi mówią

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne 1 Wybrane testy nieparametryczne 1. Test chi-kwadrat zgodności z rozkładem oczekiwanym 2. Test chi-kwadrat niezależności dwóch zmiennych kategoryzujących 3. Test U Manna-Whitney

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ Opracowała: Milena Suliga Wszystkie pliki pomocnicze wymienione w treści

Bardziej szczegółowo

Wykład 4: Statystyki opisowe (część 1)

Wykład 4: Statystyki opisowe (część 1) Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można

Bardziej szczegółowo

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby 1. Wstęp teoretyczny Prezentowane badanie dotyczy analizy wyników uzyskanych podczas badania grupy rodziców pod kątem wpływu ich przekonań

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM

Bardziej szczegółowo

Analiza zależności liniowych

Analiza zależności liniowych Narzędzie do ustalenia, które zmienne są ważne dla Inwestora Analiza zależności liniowych Identyfikuje siłę i kierunek powiązania pomiędzy zmiennymi Umożliwia wybór zmiennych wpływających na giełdę Ustala

Bardziej szczegółowo

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28 Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych

Bardziej szczegółowo

Dopasowywanie modelu do danych

Dopasowywanie modelu do danych Tematyka wykładu dopasowanie modelu trendu do danych; wybrane rodzaje modeli trendu i ich właściwości; dopasowanie modeli do danych za pomocą narzędzi wykresów liniowych (wykresów rozrzutu) programu STATISTICA;

Bardziej szczegółowo

Szukanie rozwiązań funkcji uwikłanych (równań nieliniowych)

Szukanie rozwiązań funkcji uwikłanych (równań nieliniowych) Szukanie rozwiązań funkcji uwikłanych (równań nieliniowych) Funkcja uwikłana (równanie nieliniowe) jest to funkcja, która nie jest przedstawiona jawnym przepisem, wzorem wyrażającym zależność wartości

Bardziej szczegółowo

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica 1. Zarządzanie danymi. Pierwszą czynnością w pracy z pakietem Statistica jest zazwyczaj wprowadzenie danych do arkusza. Oprócz możliwości

Bardziej szczegółowo

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Andrzej Tarłowski Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Stacjonarne

Bardziej szczegółowo

Prognozowanie na podstawie modelu ekonometrycznego

Prognozowanie na podstawie modelu ekonometrycznego Prognozowanie na podstawie modelu ekonometrycznego Przykład. Firma usługowa świadcząca usługi doradcze w ostatnich kwartałach (t) odnotowała wynik finansowy (yt - tys. zł), obsługując liczbę klientów (x1t)

Bardziej szczegółowo

ESTYMACJA. Przedział ufności dla średniej

ESTYMACJA. Przedział ufności dla średniej ESTYMACJA Przedział ufności dla średniej W grupie 900 losowo wybranych pracowników przedsiębiorstwa średnia liczba dni nieobecności w pracy wynosiła 30, a odchylenie standardowe 3 dni. a) Przyjmując współczynnik

Bardziej szczegółowo

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

Wykład 10 Zrandomizowany plan blokowy

Wykład 10 Zrandomizowany plan blokowy Wykład 10 Zrandomizowany plan blokowy Staramy się kontrolować efekty zróżnicowania badanych jednostek eksperymentalnych poprzez zapewnienie ich ``jednorodności wewnątrz każdej grupy zabiegowej. Dzielimy

Bardziej szczegółowo

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH Co to są hipotezy statystyczne? Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej. Dzielimy je

Bardziej szczegółowo

Ścieżki dostępu do STATISTICA

Ścieżki dostępu do STATISTICA Ścieżki dostępu do STATISTICA Spis treści Sprawdzanie zgodności z rozkładem normalnym test Shapiro-Wilka:... 2 Test t-studenta w modelu zmiennych niezależnych:... 3 Test t-studenta w modelu zmiennych powiązanych...

Bardziej szczegółowo

Ćwiczenie: Weryfikacja hipotez statystycznych dla jednej i dwóch średnich.

Ćwiczenie: Weryfikacja hipotez statystycznych dla jednej i dwóch średnich. Ćwiczenie: Weryfikacja hipotez statystycznych dla jednej i dwóch średnich. EXCEL Do weryfikacji różnic między dwiema grupami jednostek doświadczalnych w Excelu wykorzystujemy funkcję o nazwie T.TEST. Zastosowana

Bardziej szczegółowo