Zajęcia 2
Plan dzisiejszych zajęć 1 Doświadczenia Idealne doświadczenie Nie-idealne doświadczenia 2
Idealne doświadczenie Nie-idealne doświadczenia Plan idealnego doświadczenia (eksperymentu) Plan doświadczenia powinien pozwalać na ewidentne rozróżnienie pomiędzy różnymi hipotezami Doświadczenia powinny być możliwe do powtórzenia (replikowalność) Doświadczenia powinny być dobrze kontrolowane Wynik doświadczenia powinien być zmierzony dokładnie i precyzyjnie. Dokładność oznacza, że średni wynik eksperymentu powinien być nieobciążony, precyzja, że metoda pomiaru pozwala na uchwycenie różnic między grupami poddanymi różnym oddziaływaniom (ang. treatments) jeżeli one występują.
Idealne doświadczenie Nie-idealne doświadczenia Znaczenie ilościowe idealnego eksperymentu Interwencje (oddziaływania) muszą być dobrze zdefiniowane oraz niezależne (nie bierzemy pod uwagę oddziaływania ze zmienną dawką, dose treatments) Wynik doświadczenia powinien być ilościowy Obiekty/ przedmioty o identycznych zestawach cech, które mogą mieć wpływ na wynik doświadczenia powinny być przydzielone do różnych grup Nie występuje efekt spill-over. Oznacza to, na przykład, że wynik poddania oddziaływaniu nie powinien zależeć od liczby jednostek/obietków poddanych temu oddziaływaniu.
Randomizacja Doświadczenia Idealne doświadczenie Nie-idealne doświadczenia Randomizacja Randomizacja jest procesem czynienia losowym. W doświadczeniach (eksperymentach) randomizacja jest procesem przypisywania jednostek do różnych oddziaływań. Randomizacja jest jednym z zabiegów metodologicznych stosowanych w celu zniwelowania wpływu niekontrolowanych zmiennych na wyniki eksperymentu W praktyce, zazwyczaj rozpatrywane są dwie grupy poddane różnym oddziaływaniom Grupa doświadczalna, którą badacze są bardziej zainteresowani jest nazywana grupą poddaną oddziaływaniu (ang. treatment group) a druga grupą kontrolną (ang. control group)
Idealne doświadczenie Nie-idealne doświadczenia Randomizowane kontrolowane badania kliniczne Randomizowane kontrolowane badania kliniczne (ang. Randomised Control Trials) to rodzaj ilościowych, porównawczych kontrolowanych eksperymentów (często medycznych), w których rozmiar efektu oddziaływania może być ustalony z mniejszym obciążeniem niż w badaniach obserwacyjnych Randomizacja zapewnia, że średnio pozostałe czynniki są równe pomiędzy grupami, a zatem różnice w wyniku mogą być przypisane do interwencji (oddziaływania) Randomizacja usuwa obciążenie związane z selekcją i pozwala na wykorzystanie klasycznych metod wnioskowania statystycznego
Randomizowane eksperymenty Idealne doświadczenie Nie-idealne doświadczenia Eksperymenty, w których jednostki są w sposób losowy przydzielone do grup poddanych różnym oddziaływaniom (ang. treatment groups) Eliminują obciążenie związane z selekcją, ale niekoniecznie są kontrolowane Brak kontroli oznacza, że inne czynniki które mogą wpływać na wynik eksperymentu niekoniecznie są równe pomiędzy grupami
Inne typy eksperymentów Idealne doświadczenie Nie-idealne doświadczenia Naturalne eksperymenty są sytuacjami, kiedy po interwencji jednorodna grupa sprzed interwencji jest podzielona na część poddaną interwencji i nie poddaną interwencji. Podział odbywa się w sposób samoczynny bez interwencji eksperymentatora. Doświadczenia polowe (ang. field experiments) są eksperymentami obserwowanymi w naturalnym środowisku. Zaletą jest to, że jednostki znajdują się w swoim naturalnym środowisku, ale trudne jest kontrolowanie tych eksperymentów, szczególnie oddzielne grup poddanych różnym oddziaływaniom
Neyman (1923) Doświadczenia On the Application of Probability Theory to Agricultural Experiments. Essay on Principles. Section 9. Jerzy Splawa-Neyman, D. M. Dąbrowska, T. S. Speed Statistical Science vol. 5, No 4. pp. 465-472.
Neyman (1923) Doświadczenia Neyman zaproponował model statystyczny dla porównania plonu różnych odmian wysianych na pewnej liczbie działek na polu W artykule zdefiniowane jest pojęcie prawdziwej wartości, we współczesnej literaturze naukowej jest ono dyskutowane jako wielkość kontrfaktyczna (ang. counterfactual) Neyman wyprowadził wzór na wariancję różnicy średnich plonów dwóch odmian
Plan eksperymentu (1) Rozważmy pole podzielone na m identycznych działek Niech U 1, U 2,... U m będą prawdziwymi plonami wybranej odmiany na każdej z tych działek Jeżeli wszystkie wartości U i są sobie równe, każda z nich może być nazwana przeciętnym plonem z pola. W przeciwnym przypadku za przeciętny plon z pola można uważać średnią arytmetyczną m k=1 y = U i m Dokładnie zmierzony plon z działki i będzie traktowany jako oszacowanie U i Obserwowane różnie pomiędzy plonami z różnych działek powinny zostać przypisane różnicom w warunkach glebowych
Plan eksperymentu (2). Porównanie odmian Niech v będzie liczbą odmian rośliny wysianej na każdej działce Plon odmiany i z kolejnych działek oznaczamy U i1, U i2,... U im Powyższy model jest równoważny modelowi urnowemu, w którym i-ta urna zawiera m kul, z numerami oznaczającymi nieznany potencjalny plon Oszacowaniem plonu i-tej odmiany na k-tej działce pola jest U ik Najlepszym oszacowaniem plonu i-tej odmiany na polu jest y i = m k=1 U ik m
Ważna analogia Doświadczenia Cel doświadczenia polowego, którym jest porównanie v odmian może być traktowany jako równoważny do problemu porównania liczb y 1, y 2,... y v lub ich oszacowań poprzez losowanie z urn Najprostszą metodą oszacowania y i jest losowanie κ kul z i-tej urny ze zwracaniem W ten sposób można uzyskać κ niezależnych wyników doświadczenia Średnia tych wyników na mocy prawa wielkich liczb będzie oszacowaniem wartości oczekiwanej doświadczenia Jedynym problemem z tym modelem jest fakt, iż w praktyce losowanie odbywa się bez zwracania.
Częściowe wnioski Plon z różnych działek może być traktowany jako niezależny pomiar jednej wartości - prawdziwego plonu (kontrfaktycznego plonu w dzisiejszej terminologii) z odmiany na polu Jest to podejście metodologicznie usprawiedliwione, ponieważ każda odmiana została wysiana na dużej liczbie identycznych działek
Gdy liczba pomiarów jest niepomijalna (1) Gdy proporcja pomiarów κ do liczby działek m jest relatywnie duża doświadczeń nie można traktować jako niezależnych Liczba pomiarów nie ma wpływu na oszacowanie średniej wartości plonu Niech σu 2 będzie wariancją pojedynczego pomiaru Wariancja doświadczenia wynosi m k=1 (U k y) 2 var = m κ κ(m 1) m = m κ κ(m 1) σ2 U Wraz z rosnącą liczbą pomiarów (kul) κ, wariancja znika 1 κ/m lim var = lim κ κ κ(1 1/m) = 0 Zatem średnia wartość wielu doświadczeń może być traktowana jako E(y) (wartość oczekiwana prawdziwego wyniku)
Gdy liczba pomiarów jest niepomijalna (2) Oszacowanie wariancji jest dane przez var = m κ κ(m 1) σ2 U Ponownie, gdy wartość κ (liczba pomiarów, kul) wzrasta, wariancja zanika Jednakże, gdy celem jest obliczenie różnicy w plonach dwóch odmian problem staje się bardziej skomplikowany
Różnica w plonach dwóch odmian Niech x i będzie średnią wartością κ pomiarów odnoszących się do odmiany i Niech x j będzie średnią wartością κ pomiarów odnoszących się do odmiany j Jest oczywiste, że E(x i x j ) = y i y j
Wariancja różnicy w plonach E(x i x j (y i y j )) 2 E(x i y i ) 2 + E(x j y j )) 2 2E(x i y i (x j y j )) σi 2 + σj 2 2[Ex ix j y i y j ] Ostatni wyraz powyższego równania jest równoważny do [Ex i x j y i y j ] = 1 m 1 rσ iσ j gdzie r jest wartością współczynnika korelacji pomiędzy plonami dwóch odmian na tej samej działce Zatem, w przypadku niepomijalnej liczby pomiarów wariancja jest dużo niższa niż ta obliczona ze standardowych wzorów.