Przykłady bloków: Przykład. Przyporządkowanie. Wykład 9 Zrandomizowany plan blokowy

Podobne dokumenty
Przykłady bloków: Przykład. Przyporządkowanie. Wykład 10 Zrandomizowany plan blokowy

Wykład 10 Zrandomizowany plan blokowy

Uwaga! Test studenta dla pojedynczej próby, niekierunkowy. Wykład 9: Testy Studenta. Test Studenta dla jednej próby, kierunkowy

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Testy nieparametryczne

Wykład 11: Dane jakościowe. Rozkład χ 2. Test zgodności chi-kwadrat

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

Wykład 2: Tworzenie danych

Wykład 10 Testy jednorodności rozkładów

Wykład 9 Testy rangowe w problemie dwóch prób

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Wykład 3 Hipotezy statystyczne

Elementy statystyki STA - Wykład 5

Statystyka matematyczna dla leśników

Testowanie hipotez statystycznych.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

STATYSTYKA MATEMATYCZNA

Wykład 12: Tablice wielodzielcze

Szkice rozwiązań z R:

Rozkłady dwuwymiarowe. Tablice dwudzielcze. Przykład (wstępny):

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Badania eksperymentalne

Test U Manna-Whitneya : Test H Kruskala-Wallisa Test Wilcoxona

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Badanie zależności zmiennych kolumnowej i wierszowej:

KORELACJE I REGRESJA LINIOWA

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Wykład 14 Test chi-kwadrat zgodności

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Statystyka matematyczna Test χ 2. Wrocław, r

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Wykład 9 Wnioskowanie o średnich

Wykład 11 Testowanie jednorodności

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka i Analiza Danych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

PDF created with FinePrint pdffactory Pro trial version

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Testowanie hipotez statystycznych.

Przykład 1. (A. Łomnicki)

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

, a ilość poziomów czynnika A., b ilość poziomów czynnika B. gdzie

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

Wykład Ćwiczenia Laboratorium Projekt Seminarium 30

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Analiza wariancji. dr Janusz Górczyński

Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)?

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

STATYSTYKA MATEMATYCZNA

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA MATEMATYCZNA

Wykład 5 Teoria eksperymentu

Statystyczna analiza danych

Porównanie dwóch rozkładów normalnych

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Zadania ze statystyki cz.8. Zadanie 1.

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Pobieranie prób i rozkład z próby

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

WNIOSKOWANIE STATYSTYCZNE

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Testowanie hipotez statystycznych

Testy nieparametryczne

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Zawartość. Zawartość

Rozkład Gaussa i test χ2

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Wydział Matematyki. Testy zgodności. Wykład 03

Elementarne metody statystyczne 9

Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

Wybrane statystyki nieparametryczne. Selected Nonparametric Statistics

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Hipotezy statystyczne

Hipotezy statystyczne

Transkrypt:

Wykład 9 Zrandomizowany plan blokowy Staramy się kontrolować efekty zróżnicowania badanych jednostek eksperymentalnych poprzez zapewnienie ich ``jednorodności wewnątrz każdej grupy zabiegowej. Dzielimy obiekty na bloki: Blok to grupa podobnych obiektów Podobieństwo dotyczy wartości zmiennych ubocznych (``zakłócających ). Powinniśmy uwzględniać jedynie zmienne mogące mieć wpływ na wynik eksperymentu. Przykłady bloków: Pacjenci podobni pod względem wieku (płci, diagnozy i/lub historii choroby, itp.) Rośliny kukurydzy rosnące na tym samym stanowisku Przyporządkowanie Obiekty dzielimy na jednorodne bloki, biorąc pod uwagę zmienne uboczne mogące mieć wpływ na wynik eksperymentu. Dokonujemy randomizacji w obrębie każdego z bloków (losowo przyporządkowujemy obiekty z bloku do poszczególnych zabiegów). W każdej grupie zabiegowej otrzymujemy tę samą liczbę obiektów z każdego bloku Tak więc rozkłady zmiennych ubocznych w grupach zabiegowych są podobne. Przykład Porównujemy efekt działania nowego lekarstwa z placebo: Obiekty ochotniczki, u których w ciągu ostatniego roku stwierdzono raka piersi Niektóre miały lumpektomię, inne radykalną mastektomię () Niektóre były po naświetlaniach, inne nie () U niektórych zidentyfikowano ryzyko genetyczne BRCA, BRCA, u innych nie (3) Dzielimy pacjentki na 3= bloków, tzn.: lumpektomia, naświetlania, BRCA lumpektomia, naświetlania, BRCA,. mastektomia, brak naświetlań, bez ryz. gen. W każdym bloku losowo wybrana połowa kobiet otrzymuje lekarstwo, a druga--placebo Dlatego grupy kobiet biorących lekarstwo i placebo mają podobną strukturę Inne czynniki używane do blokowania: Laboratorium lub osoba dokonująca pomiarów Laboratorium lub osoba wykonująca zabieg Geografia Genetyka Czynniki socjo-ekonomiczne Blokujemy tylko względem tych czynników, które mogą mieć wpływ na odpowiedź.

Stratyfikacja Jest to blokowanie względem zmiennej ubocznej, której wartości można uporządkować (np. ilościowej). Dzielimy na tzw. warstwy (zamiast na bloki). Przykłady: Niskie, średnie, wysokie dochody Grupy wiekowe Stopień rozwoju choroby Randomizujemy w obrębie każdej warstwy. Czasami definiujemy warstwy przed próbkowaniem, aby pobrać podobną liczbę obserwacji z każdej; próbkowanie warstwowe. Powiązane pary Obserwacje występują w parach Przykłady: Układ blokowy dla dwu zabiegów, gdzie każdy blok składa się z dwu obiektów Dwa pomiary na tym samym obiekcie (dwa kolejne dni, dwie strony, przed/po ) Obserwujemy dwie grupy w czasie Przykłady cd.: Obiekty naturalnie występują w parach, takich jak pary identycznych blizniaków Obiekty łaczymy w pary o podobnym wieku, płci, zawodzie, stanie rozwoju choroby itd. Ten sam obiekt mierzony przy dwu okazjach Test Studenta dla powiązanych par Do produkcji butów używamy dwóch różnych materiałów: A i B. Obserwacje: zużycie podeszew w butach noszonych przez 0 chłopców. Każdy chłopiec ma podeszwę w jednym bucie zrobioną z materiału A, a w drugim z materiału B Randomizujemy (A na lewy albo na prawy) Zużycie podeszew Chłopiec 0 A 3. 8. 3.3 B.0 8.8 3. A-B -0.8-0.. -0.3 wear 8 0 średnia -0. s 0.38 8 0 boys

8 0 A B b - a -0. 0.0 0. 0. 0. 0.8.0 8 0 Hipoteza H 0 : µ d = µ A - µ B =0 H a : µ d 0 Liczymy d= Y - Y, średnią(d), SD(d), SE(d) liczymy t s = średnia(d)/se(d) = df = n d -= P-wartość= Tablica wartości krytycznych z książki ``Introduction to the Practice of Statistics, D.S. Moore, G. P. McCabe Co się stanie, jeżeli wykonamy test Studenta dla prób niezależnych? Ta sama hipoteza Y =0.3, Y =.0 SE =. Y Y t s =(0.3-.0)/.=-0.39 P-wartość = Skąd taka rozbieżność? Bardzo różne SE Test dla par : SE = 0. Test dla dwóch niezależnych prób: SE=. Duże zróżnicowanie między obiektami może ukryć wpływ zabiegu! To zróżnicowanie można zneutralizować łącząc obiekty w pary (neutralizujemy wpływ zmiennej ubocznej=ruchliwość dziecka). 3

Kiedy użyć testu dla par, a kiedy testu dla niezależnych prób? Na ogół łatwo stwierdzić, czy istnieją naturalne pary obiektów z jednej i drugiej grupy zabiegowej. Kiedy zaplanować eksperyment w oparciu o powiązane pary? Założenie Test Studenta dla par jest oparty na założeniu, że różnice mają w przybliżeniu rozkład normalny. Trudniejsze: oczekujemy, że zmienne zakłócające mogą istotnie zwiększyć rozrzut wyników i staramy się utworzyć dwuelementowe bloki jednorodne ze względu na zmienne zakłócające. Test znaków Co zrobić jeżeli obserwacje nie mają rozkładu normalnego? Dla dwóch niezależnych prób liczyliśmy test Wilcoxona-Manna-Whitneya. Gdy występują sparowane obserwacje możemy zastosować prosty test znaków. Obliczamy znak różnicy między pierwszym i drugim elementem każdej pary obserwacji. Jeżeli zabiegi się nie różnią efektem, to p-stwo, że w dowolnej parze dostaniemy plus powinno być ½. Liczba plusów powinna być w przybliżeniu równa liczba minusów. π = p-stwo, że w dowolnej ustalonej parze pierwszy zabieg daje lepszy wynik niż drugi. H 0 : π =... H A : π... Dla każdej pary obserwacji zapisujemy () gdy y y jest dodatnie lub ( ) gdy jest ujemne Zliczamy liczbę (= N ) i (= N ) (nie liczymy zer) Niech n = #par z niezerowymi wynikami. Statystyka testowa B s = max(n, N ) dla testu dwustronnego Wartości krytyczne na kolejnym slajdzie. (dla testu jedno i dwustronnego) Odrzucamy H 0, gdy B s wartości krytycznej Można też obliczyć p-wartości korzystając ze wzoru na rozkład dwumianowy z p=½. CRITICAL VALUES FOR THE SIGN TEST, N =.. Alpha Sided 0.00 0.0 0.0 0.0 0.00 0.00 Sided (0.0) (0.0) (0.0) (0.0) (0.00) (0.00) ----------------------------------------------------------- N ----............ 8 8 8 8.. 9 8 8 9 9 9. 0 9 9 0 0 0 0 9 0 0 0 0 3 0 3 3 3 3 3 3 3 3 3 8 3 9 0 8 8 8 8 8 9 3 8 9 9 0 8 9 9 0 0 This public domain table was made by William Knight <http://www.math.unb.ca/~knight>

CRITICAL VALUES FOR THE SIGN TEST, N =.. Alpha Sided 0.0 0.0 0.0 0.00 0.00 0.00 Sided (0.0) (0.0) (0.0) (0.0) (0.00) (0.00) 8 8 9 0 0 8 9 0 0 9 0 0 8 9 0 3 9 0 3 30 0 3 3 3 3 3 33 3 3 3 3 3 3 8 3 8 9 38 8 9 9 39 8 8 9 30 0 8 9 30 3 8 9 30 30 3 8 9 30 3 3 3 8 9 30 3 3 3 8 9 3 3 3 33 Dla testu jednostronnego albo H A jest π < 0. (w dowolnej parze druga obserwacja ma większą szansę być większa) (B s = N ), albo H A jest π > 0. (w dowolnej parze pierwsza obserwacja ma większą szansę być większa) (B s = N ) P-wartość Niech Y ma rozkład dwumianowy (n, 0.) Gdy H A jest π > 0., wtedy B s = N, i P- wartość wynosi Pr(Y B s ) Gdy H A jest π < 0., wtedy B s = N, i P- wartość wynosi Pr(Y B s ) Gdy H A jest π 0., wtedy B s = max(n, N ), i P-wartość wynosi Pr(Y B s ) Przykład: przeszczepy skóry Po dwóch stronach ciała ochotników zastosowano przeszczepy skóry. Jeden przeszczep ma dobre dopasowanie HLA z odbiorca, drugi nie. Obserwujemy czas do odrzucenia przeszczepu (nie ma on rozkładu normalnego, więc nie można stosować testu Studenta). Czy dobre dopasowanie HLA zwiększa czas przetrwania przeszczepu? dobre 3 9 93 3 0 3 9 0 8 złe 9 3 8 3 8 9 znak - -

Test znakowany Wilcoxona Testu znaków używamy, gdy dane nie mają rozkładu normalnego, lub dane zapisane są w postaci preferencji, a nie wielkości liczbowej, np. lepsze/gorsze, mniejsze/większe itp. Podobny do testu znaków, ale bardziej czuły Metoda Liczymy różnice w parach Znajdujemy wartość bezwzględną Przyporządkowujemy rangi wartościom bezwzględnym ( dla najmniejszej, n dla największej) Każdej randze przyporządkowujemy jej znak (,-) Obs Y Y d d Ranga Ranga Znakowana 33 8 8 W : suma rang dodatnich W - : suma rang ujemnych Ws : min(w, W - ) Odrzucamy H 0 gdy W s wartość krytyczna 3 39 9 0 38 0 0-9 - 9 3 - -3 Tabela wartości krytycznych jest dostępna w kartotece z wykładami. Źródło: 3 30 http://fsweb.berry.edu/academic/education/vbissonnette/tables/wilcox_t.pdf Przed & Po vs. Grupa kontrolna Czasami obserwujemy obiekty przed i po pewnym zabiegu i mierzymy wpływ zabiegu na poszczególne obiekty Dostajemy pary zależnych obserwacji Czasem parujemy podobne (ze względu na zmienne zakłócające) obiekty z grupy zabiegowej i kontrolnej Również dostajemy pary zależnych obserwacji Czasami obiektów w grupie kontrolnej i zabiegowej nie można w naturalny sposób połączyć w pary Takie obserwacje traktujemy jako dwie niezależne próby

Niekiedy oczekujemy, że obiekty w naturalny sposób się zmieniają w trakcie eksperymentu. Chcemy odróżnić zmiany wywołane zabiegiem od zmian wynikających z upływu czasu Obserwujemy grupę zabiegową i kontrolną przed i po zabiegu Obiekty w grupie kontrolnej dostarczają nam informacji, jakiej zmiany należy oczekiwać jedynie w wyniku upływu czasu. Obiekty w grupie zabiegowej dostarczają nam informacji o wpływie zabiegu Cztery grupy obserwacji Możemy porównać obiekty z grupy zabiegowej przed i po zabiegu za pomocą testu dla par. Podobnie obiekty z grupy kontrolnej możemy porównać przed i po zabiegu za pomocą testu dla par. Dowiemy się czy była zmienność w każdej z grup. Naprawdę interesuje nas jednak porównanie zmian wartości cechy (między grupą zabiegową i kontrolną) Zwykle w takim przypadku analizujemy różnice po-przed za pomocą testu dla dwu niezależnych prób (zabiegowej i kontrolnej)