JAK W PRAKTYCE OPTYMALNIE ZAPLANOWAĆ EKSPERYMENT BADAWCZY?

Podobne dokumenty
Statystyka i Analiza Danych

Wprowadzenie do analizy korelacji i regresji

JAK PORADZIĆ SOBIE Z NIEPOŻĄDANĄ ZMIENNOŚCIĄ TYPU SYSTEMATYCZNEGO W BADANIACH MEDYCZNYCH?

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII

ANALIZA SYSTEMU POMIAROWEGO (MSA)

Pobieranie prób i rozkład z próby

METODY STATYSTYCZNE W BIOLOGII

Analiza wariancji - ANOVA

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Analiza regresji - weryfikacja założeń

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Szkice rozwiązań z R:

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

3. Modele tendencji czasowej w prognozowaniu

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

LABORATORIUM Z FIZYKI

KIEDY I DLACZEGO STOSUJEMY ANALIZĘ KOWARIANCJI (ANCOVA)?

STATYSTYKA MATEMATYCZNA

Propensity Score Matching

Niepewność pomiaru. Wynik pomiaru X jest znany z możliwa do określenia niepewnością. jest bledem bezwzględnym pomiaru

Rozkład Gaussa i test χ2

Porównywanie populacji

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Wykład 10 Zrandomizowany plan blokowy

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012

Wykład 5: Statystyki opisowe (część 2)

Przemysław Majkut Gimnazjum N analiza efektów kształcenia na podstawie wyników egzaminów zewnętrznych

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Regresja linearyzowalna

ANALIZA WARIANCJI - KLASYFIKACJA WIELOCZYNNIKOWA

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Elementy statystyki STA - Wykład 5

ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel

Analiza wariancji - ANOVA

Opracowywanie wyników doświadczeń

Walidacja metod analitycznych Raport z walidacji

Testowanie hipotez statystycznych.

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013

Metrologia: organizacja eksperymentu pomiarowego

Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zachowania odbiorców. Grupa taryfowa G

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

Analiza wariancji. dr Janusz Górczyński

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

PDF created with FinePrint pdffactory Pro trial version

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH. Wprowadzenie do problematyki modelowania statystycznego

Metodologia badań psychologicznych

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

JAK WYZNACZA SIĘ PARAMETRY WALIDACYJNE

PLANOWANIE I ANALIZA EKSPERYMENTÓW

JAK EFEKTYWNIE I POPRAWNIE WYKONAĆ ANALIZĘ I RAPORT Z BADAŃ BIEGŁOŚCI I WALIDACJI PRAKTYCZNE WSKAZÓWKI

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Przykład 1. (A. Łomnicki)

3. Wojewódzkie zróżnicowanie zatrudnienia w ochronie zdrowia w latach Opis danych statystycznych

Liczba zadań a rzetelność testu na przykładzie testów biegłości językowej z języka angielskiego

Statystyka w pracy badawczej nauczyciela

WSPOMAGANIE ANALIZY DANYCH ZA POMOCĄ NARZĘDZI STATISTICA

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

Testy nieparametryczne

Statystyka matematyczna dla leśników

Badania efektywności systemu zarządzania jakością

Wykład 4 Związki i zależności

Oszacowanie i rozkład t

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Wnioskowanie statystyczne. Statystyka w 5

Ruch jednostajnie przyspieszony wyznaczenie przyspieszenia

Grupowanie materiału statystycznego

R-PEARSONA Zależność liniowa

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Niepewności pomiarów

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

166 Wstęp do statystyki matematycznej

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version

Zadania ze statystyki, cz.6

BADANIA PSZENICY Z PIKTOGRAMU W WYLATOWIE.

Hipotezy statystyczne

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Temat: SZACOWANIE NIEPEWNOŚCI POMIAROWYCH

Analiza sezonowości. Sezonowość może mieć charakter addytywny lub multiplikatywny

Wykład 2: Tworzenie danych

Zjawisko dopasowania w sytuacji komunikacyjnej. Patrycja Świeczkowska Michał Woźny

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych. Wykład tutora na bazie wykładu prof. Marka Stankiewicza

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO STATYSTYCZNA ANALIZA ZMIAN LICZBY HOTELI W POLSCE W LATACH

Statystyka i Analiza Danych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Analiza korespondencji

Analiza i monitoring środowiska

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Transkrypt:

JAK W PRAKTYCE OPTYMALNIE ZAPLANOWAĆ EKSPERYMENT BADAWCZY? Janusz Wątroba, StatSoft Polska Sp. z o.o. Jednym z kluczowych aspektów realizacji badania empirycznego jest jego poprawne zaplanowanie. Zadanie to stanowi spore wyzwanie zarówno dla początkujących, jak i doświadczonych badaczy, i wiąże się z podjęciem szeregu decyzji. Dobrym rozwiązaniem jest oparcie się na zasadach, które zostały sformułowanie w ramach dziedziny nazywanej planowaniem doświadczeń (ang. experimental design). Główną ideą przy planowaniu doświadczenia jest przełożenie poprawnie sformułowanego pytania badawczego na dobrze zaplanowany eksperyment [1, 2, 4]. Niestety nie we wszystkich obszarach, w których są prowadzone badania empiryczne, wspomniane wyżej zasady dają się łatwo zastosować. Podstawowa trudność polega na konieczności jednoczesnego uwzględnienia szeregu ograniczeń wynikających ze specyfiki badanych zjawisk. W praktyce sprowadza się to do konieczności przyjęcia pewnego kompromisu pomiędzy zakresem interesujących badacza pytań czy hipotez badawczych a możliwościami praktycznej realizacji badania. W trakcie wystąpienia zostanie zaprezentowany sposób podejścia do planowania eksperymentu dotyczącego wpływu wybranych zmian środowiskowych na zjawisko zapadania zwierząt w sen zimowy (tzw. hibernacja) na przykładzie chomików syryjskich [1]. Copyright StatSoft Polska 2017, info@danewiedzasukces.pl 37

Zwrócimy uwagę na kluczowe decyzje, które pojawiają się przy praktycznym stosowaniu zasad planowania eksperymentu naukowego. Statystyczne opracowanie wyników omawianego eksperymentu zostało przeprowadzone za pomocą opcji analizy dostępnych w środowisku programu Statistica. Wyzwania, przed którymi staje badacz przy planowaniu dobrego eksperymentu Problemy, które pojawiają się przed badaczem na etapie planowania eksperymentu naukowego, są w wielu dziedzinach badań empirycznych bardzo podobne. Najogólniej można je sprowadzić do dwóch zasadniczych kwestii: odpowiednie sformułowanie pytań badawczych, ustalenie najbardziej efektywnego sposobu zgromadzenia empirycznych danych. Dla ilustracji sposobu podejścia do powyższych zadań w niniejszym opracowaniu wykorzystano opis i wyniki eksperymentu, który został przytoczony w książce Cobba [1]. Eksperyment dotyczył oceny wpływu wybranych zmian środowiskowych na zjawisko zapadania zwierząt w sen zimowy. W badaniach wykorzystano chomiki syryjskie. Dzięki bardzo dobrze przemyślanym decyzjom badacz przeprowadził niezwykle efektywny eksperyment. Wykorzystując jedynie 8 osobników oraz 2 pomiary, na każdym z nich był w stanie uzyskać odpowiedź na pięć różnych pytań badawczych. Przy planowaniu eksperymentu badacz zastosował szereg pojęć i zagadnień, które zostały wprowadzone w obrębie działu statystyki stosowanej, określanego terminem: planowanie doświadczeń. Decyzje dotyczące treści eksperymentu Jak to zostało wyżej podkreślone na początku,, prawie każdego badania naukowego badacz powinien zadecydować, jakie pytanie ma postawić oraz jakie informacje dla uzyskania odpowiedzi na to pytanie będzie gromadził. Nie wystarczy jednak sformułować pytanie w sposób ogólny, np.: co sprawia, że zwierzęta zapadają w sen zimowy? Pytanie musi być 38 Copyright StatSoft Polska 2017, info@danewiedzasukces.pl

na tyle szczegółowe, aby można było zadecydować, jakie informacje będę potrzebne, aby na nie odpowiedzieć. Innymi słowy, badacz musi pójść na pewien kompromis. Pytanie należy postawić na tyle ogólne, aby było ważne poznawczo, a jednocześnie na tyle szczegółowo, aby eksperyment miał szansę dać na nie odpowiedź. Przy jego formułowaniu warto mieć na uwadze, że planowanie doświadczenia polega na przełożeniu dobrego pytania badawczego na dobry eksperyment. W przypadku opisywanego badania należało następnie zadecydować, jakie zmiany w środowisku zostaną wzięte pod uwagę. Okres zimowy przynosi dwie zasadnicze zmiany w środowisku: (1) stopniowy spadek temperatury oraz (2) skracanie się okresu oddziaływania światła na rośliny i zwierzęta w cyklu dobowym. Badacz postanowił skupić się na fizjologicznych reakcjach organizmu badanych zwierząt na zmianę czasu trwania okresów ciemności i światła. Kolejna z decyzji dotyczyła wyboru odpowiedniej miary, która umożliwiłaby ocenę wpływu długości dnia. Badacz oczywiście mógłby wziąć pod uwagę takie miary, jak: częstość skurczów serca lub częstość oddechu, które ulegają obniżeniu w stanie hibernacji. Jednak z biologicznego punktu widzenia taki eksperyment nie byłby niczym odkrywczym. W związku z tym badacz postanowił uwzględnić poziom aktywności nerwowej zwierzęcia. Dla jego oceny wybrał stężenie enzymu białkowego uczestniczącego w aktywnym transporcie kationów sodu i potasu, będącego częścią reakcji biochemicznej, zwanej pompą sodowo-potasową, która przekazuje impulsy nerwowe [3]. Jeśli rzeczywiście stężenie tego enzymu będzie zmieniać się wraz ze skracaniem dnia, to zmiana ta będzie dobrą miarą zmian, jakie zachodzą w aktywności nerwowej zwierzęcia. Warto dodać, że za badania nad tą cząsteczką Jens C. Skou otrzymał w 1997 roku nagrodę Nobla w dziedzinie chemii. Ostatnia decyzja co do treści eksperymentu dotyczyła wyboru gatunku zwierząt, które miały zostać poddane badaniom. Ze względu na posiadane środki, wielkość zwierzęcia oraz kilka innych powodów badacz wybrał chomiki syryjskie. Copyright StatSoft Polska 2017, info@danewiedzasukces.pl 39

Źródła zmienności wyników badania Zmienność wyników jest nieodłącznym elementem badań naukowych. Jest też główną przyczyną, dla której naukowcy potrzebują podejścia statystycznego zarówno na etapie planowania badań, jak i opracowywania ich wyników. Dobry scenariusz i analiza wyników badania umożliwia zidentyfikowanie zmienności związanej z interesującymi badacza warunkami jego realizacji, mimo występowania zmienności wyników pochodzącej z innych źródeł. Przy planowaniu dowolnego eksperymentu powinno się myśleć o zmienności, mając na uwadze dane, które planuje się uzyskać oraz sposoby ich wykorzystania. Aby zilustrować tę kwestię, przyjrzymy się fragmentowi danych, które uzyskał badacz w opisywanym badaniu. Tabela. 1. Stężenie badanego enzymu [mg/ml], oznaczane w sercach badanych osobników. Osobniki przetrzymywane w warunkach długiego dnia 1,49 1,53 1,56 1,79 Osobniki przetrzymywane w warunkach krótkiego dnia 1,39 1,49 1,26 1,29 Zebrane dane sugerują, że długość dnia wpływa na stężenie badanego enzymu. Średnia w przypadku długiego dnia wyniosła 1,59 mg/dl i była wyższa od średniej dla krótkiego dnia (1,35 mg/dl). Jednakże wartości pomiarów pokazują dużą zmienność. Przykładowo zakres wyników dla długich dni kształtuje się od 1,49 mg/dl do 1,79 mg/dl i obserwowana różnica 0,30 mg/dl jest większa od różnicy pomiędzy średnimi dla długich i krótkich dni. A zatem przy analizie danych trzeba oszacować, jaka część różnicy wynika z długości dnia, a jaka pochodzi z innych źródeł. W opisywanym eksperymencie można wymienić trzy źródła przyczyniające się do zmienności obserwowanej w otrzymanych wynikach. 1. Zmienność, która wynika z działania czynników będących przedmiotem badania. Jest to źródło zmienności oczekiwane przez badacza, a ocena wielkości wpływu długości dnia na stężenie enzymu była głównym celem eksperymentu. Jednak wybór warunków był 40 Copyright StatSoft Polska 2017, info@danewiedzasukces.pl

w opisywanym eksperymencie nieco bardziej złożony. W przypadku systemu nerwowego nie wszystkie organy wykazują się jednakową aktywnością. Badacz zdecydował się na uwzględnienie dwóch organów: serca i mózgu. Prowadzi to do dwóch kolejnych pytań, na które eksperyment miałby dać odpowiedź. Pierwsze z nich, bardziej oczywiste: czy występuje różnica w stężeniu badanego enzymu pomiędzy sercem i mózgiem? Odpowiedź na to pytanie jest z biologicznego punktu widzenia mało interesująca, ponieważ wyniki badań pokazują, że stężenie enzymu w mózgu jest wyższe. Pojawia się jednak drugie, bardziej interesujące pytanie: czy długość dnia oddziałuje na stężenie enzymu w sercu i mózgu w taki sam sposób. Biorąc pod uwagę różne role, jakie pełnią obydwa organy, można się spodziewać występowania różnic. Takie pytanie, dotyczące interakcji, jest niezwykle ważne w pracy badawczej. Odpowiedź na to pytanie wymaga specjalnego sposobu zaplanowania eksperymentu. 2. Zmienność, która powstaje w procesie pomiaru zmiennej zależnej (błąd pomiaru). Nie jest to pożądane źródło zmienności, ale w pracy badawczej przy dwóch pomiarach danej wielkości wykonanych w niemal identycznych warunkach prawie zawsze uzyskuje się różne wyniki. W związku z tym eksperyment powinien pozwolić na oszacowanie typowej wielkości różnic związanych z nieuniknioną zmiennością procesu pomiaru. W przypadku opisywanego eksperymentu, aby oznaczyć stężenie enzymu, trzeba było uśmiercić badane osobniki i wyizolować tkankę będącą przedmiotem zainteresowania. Następnie należało w kilku trudnych etapach rozpuścić enzym w cieczy i wreszcie na końcu oznaczyć stężenie enzymu za pomocą spektrofotometru, mierząc ilość światła zaabsorbowanego przez rozpuszczone cząsteczki. Na każdym etapie całego procesu mogą pojawić się nieprzewidziane okoliczności, które powodują powstanie błędów. 3. Zmienność związana z materiałem badawczym. Podobnie jak zmienność powstająca w procesie pomiaru również to źródło zmienności nie jest pożądane, ale jest nieuniknione. Nie ma dwóch osobników jednakowych pod względem biologicznym. Niektóre mają naturalnie podwyższone stężenie badanego enzymu. Można również oczekiwać, że środowisko, w którym przebywały badane zwierzęta, oraz ich Copyright StatSoft Polska 2017, info@danewiedzasukces.pl 41

zachowanie mogły mieć pewien wpływ na stężenie enzymu. Ponadto zdolność wytwarzania enzymu zależy do pewnego stopnia od diety. I wreszcie poziom aktywności nerwowej zależeć może również od poziomu środowiskowej stymulacji. Poniżej zestawiono niektóre ze źródeł zmienności, które występowały w opisywanym eksperymencie. Tabela. 2. Wybrane źródła zmienności w eksperymencie. 1. Warunki będące przedmiotem zainteresowania w badaniu a. Długość dnia długi versus krótki b. Organ serce versus mózg 2. Proces pomiaru a. Przygotowanie roztworu enzymu b. Kalibracja spektrofotometru 3. Materiał badawczy a. Różnice biologiczne pomiędzy badanymi osobnikami b. Różnice środowiskowe i różnice w zachowaniu W przedstawionym powyżej fragmencie traktowaliśmy zmienność z punktu widzenia źródeł pochodzenia. Dla dwóch spośród trzech omówionych źródeł okazało się, że są one niepożądane przez badacza. Aby przyjąć określoną strategię radzenia sobie z niepożądaną zmiennością, należy omówić różne sposoby, w jakich zmienność się przejawia. Rodzaje zmienności wyników badania Przy przeprowadzaniu eksperymentów badacz może napotkać trzy rodzaje zmienności wyników badania: 1. zaplanowana zmienność typu systematycznego, 2. zmienność typu losowego (przypadkowego) oraz 3. nieplanowana zmienność typu systematycznego. 42 Copyright StatSoft Polska 2017, info@danewiedzasukces.pl

Praktyczna użyteczność wyróżnienia tych trzech kategorii zmienności polega na tym, że badacz może w porę dostrzec nieplanowaną zmienność systematyczną, która jest niepożądana i przekształcić ją na zmienność tolerowaną (losową) lub nawet na zmienność pożądaną (zaplanowaną, systematyczną). Niekiedy udaje się też zredukować zakres zmienności losowej. Zaplanowana zmienność typu systematycznego jest rodzajem zmienności pożądanej przez badacza. Zawsze wynika ona z różnic związanych z warunkami kontrolowanymi w eksperymencie. W opisywanym przykładzie różnice w stężeniu branego pod uwagę enzymu wynikają z różnych długości dnia i różnych organów, które uwzględniono, i w obydwu przypadkach jest to zmienność zaplanowana i systematyczna. Jeśli występuje systematyczna zmienność tego rodzaju, wówczas oczekuje się, że wyniki badań będą się grupować w taki sposób, jak to zostało pokazane w tabeli 1 jedna grupa wyników dla długich dni i jedna dla krótkich. W opisywanym eksperymencie badacz już przed wykonaniem pomiarów spodziewał się, które pomiary będą występować w grupie oznaczającej długi dzień. Wynikało to z tego, że badacz był w stanie przypisać długość dnia do poszczególnych osobników. Podobnie mógł również wybrać określony organ i z góry wiedział, które pomiary będą należeć do grupy serce, a które do grupy mózg. Niestety w badaniach może również pojawić się nieplanowana zmienność typu systematycznego, pochodząca z innych źródeł niż warunki kontrolowane przez badacza. W opisywanym eksperymencie występowała systematyczna zmienność w obrębie materiału badawczego (różnice pomiędzy osobnikami) oraz zmienność związana z procesem pomiaru. Jak to zostanie opisane w dalszej części artykułu, jedna z najbardziej użytecznych strategii blokowanie pozwala niekiedy przekształcić to zróżnicowanie na planowaną zmienność systematyczną. Zmienność typu losowego jest rodzajem zmienności, z którą można sobie w pewien sposób poradzić. Zawsze zawiera ona nieplanowany składnik związany z procesem pomiaru, nazywany błędem pomiarowym. Zmienność tego typu charakteryzuje się dwiema własnościami, które umożliwiają jej ocenę, nawet w przypadku, gdy to niepożądane zróżnicowanie wyników się pojawi. Po pierwsze: nawet w przypadku braku losowego doboru obiektów do badań Copyright StatSoft Polska 2017, info@danewiedzasukces.pl 43

część błędów pomiaru będzie dodatnia, a część ujemna, i będą wykazywały tendencję do wzajemnego równoważenia się przy uśrednianiu wyników. Im więcej pomiarów jest branych pod uwagę przy obliczaniu średniej, tym mniejsza jej część ma charakter losowy i jednocześnie sama średnia dokładniej ujmuje przeciętny poziom branej pod uwagę wielkości. Po drugie: jeśli eksperyment zostanie dobrze zaplanowany, badacz będzie mógł wykorzystać pomiary do oszacowania zmienności typu losowego. W celu oszacowania typowej wielkości błędów losowych trzeba wykonać więcej niż jeden pomiar przy ustalonych warunkach. Nieplanowana zmienność typu systematycznego może być jedną z głównych przyczyn błędnych wniosków i może doprowadzić do niepowodzenia badań. Jeśli badacz nie wykaże odpowiedniej staranności, to eksperyment może zostać obarczony zmiennością tego typu, pochodzącą z materiału badawczego i procesu pomiarowego. Zmienność tego typu może również zostać wbudowana w kontrolowane w eksperymencie warunki. Główne niebezpieczeństwo polega na tym, że taka zmienność może obciążyć wyniki badania poprzez ich systematyczne podwyższenie lub obniżenie, czego badacz może zupełnie nie zauważyć. Wprowadzono dwie główne strategie postępowania z tego typu zmiennością: blokowanie i randomizację. Pierwsza z tych strategii polega na przekształceniu możliwego obciążenia wyników na planowaną zmienność typu systematycznego. Z kolei randomizacja polega na jego przekształceniu na planowaną zmienność typu losowego. Krótkie podsumowanie opisywanego eksperymentu Dzięki umiejętnemu zaplanowaniu eksperymentu badacz był w stanie uwzględnić pięć interesujących go pytań badawczych: 1. Czy długość dnia wpływa na stężenie badanego enzymu? Jeśli tak, to jak duża jest różnica? 2. Czy stężenia badanego enzymu w sercu i w mózgu różnią się? Jeśli tak, to jak duża jest różnica? 3. Czy różnica w stężeniu pomiędzy długimi dniami i krótkimi dniami jest taka sama w sercu i w mózgu? Jeśli nie, to jak kształtują się te różnice? 44 Copyright StatSoft Polska 2017, info@danewiedzasukces.pl

4. Czy jest możliwość oceny zmienności wewnątrzosobniczej? Jeśli tak, to jaki jest jej zakres? 5. Jak duży jest losowy błąd związany z procesem pomiaru stężenia badanego enzymu? Badacza najbardziej interesowała odpowiedź na trzy pierwsze pytania. Dwa ostatnie były związane ze zmiennością typu zakłócającego, której trudno uniknąć. Dużym wyzwaniem dla badacza było oddzielenie interesujących go efektów zróżnicowania wyników (długości dnia na stężenie enzymu w sercu i mózgu) od zmienności typu zakłócającego. Niektóre elementy eksperymentu badacz mógł kontrolować: każdemu z badanych osobników mógł przypisać odpowiednią długość dnia oraz wybrać organ, w obrębie którego było mierzone stężenie enzymu. Ogólna strategia badacza polegała na poddaniu kontroli wybranych czynników przy jednoczesnej randomizacji pozostałych źródeł zmienności. Jeśli to było możliwe, badacz starał się zmienić nieplanowaną zmienność typu systematycznego na planowaną zmienność typu systematycznego. Jeśli to nie było możliwe, to badacz zmieniał nieplanowaną zmienność typu systematycznego na planowaną zmienność typu losowego za pomocą randomizacji. Główne zasady planowania eksperymentów Po wybraniu pomiarów, kontrolowanych warunków i materiału badawczego kolejna decyzja badacza dotyczyła sposobu przypisania warunków eksperymentalnych do materiału badawczego. Trzy główne zasady takiego wyboru to: randomizacja, blokowanie oraz zestawienie badanych czynników w tzw. układzie krzyżowym. Randomizacja oznacza losowe przydzielenie poziomów badanych czynników do jednostek eksperymentalnych i jest stosowana w celu zapewnienia braku tendencyjności. Z tego powodu może być traktowana jako sposób zabezpieczenia się przed potencjalnymi, nieznanymi różnicami, które mogą występować pomiędzy jednostkami eksperymentalnymi i powinna być stosowana wszędzie tam, gdzie to jest możliwe [4]. Zastosowanie randomizacji jest warunkiem umożliwiającym przeprowadzenie wnioskowania statystycznego. Copyright StatSoft Polska 2017, info@danewiedzasukces.pl 45

W opisywanym eksperymencie zastosowanie randomizacji prowadzi do wystąpienia dwóch rodzajów błędu losowego pochodzących z dwóch różnych źródeł. Pierwszy to błąd pomiarowy, który zazwyczaj zachowuje się w sposób losowy, a drugi to błąd (odchylenie) związany z materiałem badawczym, którego zachowanie zostało sprowadzone do losowego poprzez losowe przypisanie długości dnia do poszczególnych osobników. Uogólniając, jeśli mamy do czynienia z materiałem badawczym, który można uznać za jednorodny, to zastosowanie losowego przypisania warunków eksperymentu do jednostek eksperymentalnych jest prawdopodobnie dobrym wyborem. Jeśli natomiast materiał charakteryzuje się dużą niejednorodnością, możemy starać się poprawić plan badania poprzez zastosowanie drugiej z podstawowych zasad, tzn. blokowania. Blokowanie. W niektórych sytuacjach może okazać się, że obserwacje tworzą pewne grupy, nazywane blokami, i co do których istnieje podejrzenie, że mogą w bardzo zbliżony sposób reagować na uwzględniane w eksperymencie poziomy czynników. Blok oznacza podzbiór jednostek eksperymentalnych lub fragment materiału doświadczalnego, w obrębie którego jednostki eksperymentalne charakteryzują się jednorodnością. W analizie danych eksperymentalnych zmienność związana z blokami może zostać wydzielona z całkowitej zmienności i w przypadku, gdy występują różnice pomiędzy blokami, zwiększa to precyzję eksperymentu [4]. Głównym celem stosowania blokowania jest przekształcenie nieplanowanej zmienności typu systematycznego na zaplanowaną zmienność typu systematycznego. W zależności od szczegółowych warunków, w jakich jest przeprowadzany eksperyment stosowane są dwie strategie uwzględniania bloków: losową i nielosową. W opisywanym eksperymencie zastosowano strategię bloków nielosowych. Trzecia z opisywanych zasad planowania eksperymentu dotyczy sposobu zestawienia uwzględnianych w badaniu czynników. Jeśli celem badacza jest porównanie jednoczesnego wpływu dwóch lub większej liczby zbiorów warunków eksperymentalnych, to powinien je zestawić w postaci układu krzyżowego, który pozwala analizować wszystkie kombinacje poziomów branych pod uwagę czynników. W opisywanym eksperymencie najciekawszym pytaniem było pytanie o efekt tzw. interakcji. Pytanie to brzmi: czy różnica w stężeniu 46 Copyright StatSoft Polska 2017, info@danewiedzasukces.pl

badanego enzymu pomiędzy osobnikami przetrzymywanymi w warunkach długiego i krótkiego dnia kształtuje się podobnie dla serca i mózgu? Zestawienie czynników w układzie krzyżowym można zastosować jednocześnie z randomizacją lub z blokowaniem lub z dowolnymi kombinacjami tych dwóch strategii. W opisywanym eksperymencie zastosowano wszystkie trzy z opisanych powyżej zasad: Zestawienie czynników w układzie krzyżowym jako badane warunki wystąpiły wszystkie możliwe kombinacje długości dnia i branych pod uwagę organów. Randomizacja zwierzęta zostały w sposób losowy przypisane do długich i krótkich dni. Blokowanie próbki tkanek z serca i mózgu zostały wstępnie potraktowane jako bloki (dla każdego z osobników pobierano dwie próbki). Wstępna analiza zebranych danych Do ilustracji sposobu przeprowadzenia wstępnej, nieformalnej analizy danych wykorzystano wyniki opisywanego eksperymentu, zamieszczone w książce Cobba [1]. Jeśli to tylko jest możliwe, warto zacząć analizę zebranych danych od prostych wykresów. W takiej sytuacji bardzo użytecznym wykresem okazuje się tzw. wykres surowych danych. Zamieszczono go poniżej (rys. 1). Wykres ilustruje zarówno średnie wyniki stężeń dla porównywanych kombinacji badanych czynników, jak i pojedyncze pomiary zebrane dla poszczególnych osobników. Widać wyraźnie, że wyniki oznaczeń uzyskane dla mózgu kształtują się na wyższym poziomie niż dla serca. Jeśli chodzi o długość dni, to jej różnicujący wpływ widać tylko dla mózgu. Copyright StatSoft Polska 2017, info@danewiedzasukces.pl 47

Rys. 1. Wykres surowych danych uzyskanych w opisywanym eksperymencie. Jednocześnie można zauważyć, że wyniki obserwowane dla mózgu charakteryzowały się zdecydowanie większym rozrzutem w porównaniu do rozrzutu wyników obserwowanego w sercu. Stosunkowo małe błędy wystąpiły dla niskich wartości stężeń badanego enzymu, które notowano w sercu, i zdecydowanie większe dla wysokich wartości stężeń, które notowano w mózgu. Jest to niekorzystne zjawisko powiązania wielkości średnich i wielkości rozrzutu. Jednym z często stosowanych sposobów radzenie sobie z tym zjawiskiem jest przekształcenie oryginalnych wyników badań na inną skalę. W opisywanym przykładzie zastosowano przekształcenie logarytmiczne (zastosowano logarytm dziesiętny). Poniżej zamieszczono wykres dla przekształconych danych (rys. 2). Po zastosowaniu przekształcenia logarytmicznego nie zmienił się w sposób zasadniczy ogólny obraz wpływu badanych w eksperymencie czynników na wyniki stężenia badanego enzymu, ale zostało znacznie ograniczone zjawisko powiązania wielkości średnich i wielkości rozrzutu. 48 Copyright StatSoft Polska 2017, info@danewiedzasukces.pl

Rys. 2. Wykres danych po przekształceniu logarytmicznym. Jednocześnie dzięki zastosowanemu zabiegowi badaczowi udało się zapewnić spełnienie założeń wymaganych przez metodę statystycznego opracowania wyników eksperymentu. Wyniki statystycznego opracowania wyników opisanego eksperymentu Zastosowanie przez badacza omówionych wcześniej zasad planowania eksperymentów pozwoliło na ustalenie układu (schematu) eksperymentu. Jest to tzw. układ powtarzanych pomiarów (ang. repeated measures design), znany też pod nazwą układu split-plot. Taki sposób zaplanowania eksperymentu implikuje sposób statystycznego opracowania jego wyników. Poniżej zamieszczono tabelę wyników analizy wariancji otrzymaną w wyniku obliczeń wykonanych w programie Statistica. Copyright StatSoft Polska 2017, info@danewiedzasukces.pl 49

Tabela 3. Wyniki analizy wariancji. Przedstawione w powyższej tabeli wyniki pozwalają na odniesienie się do postawionych w eksperymencie pytań badawczych. Jak widać, wpływ długości dni na przeciętny poziom badanego enzymu okazał się statystycznie nieistotny (p=0,108). Zróżnicowanie przeciętnych poziomów stężenia badanego enzymu pomiędzy uwzględnionymi w eksperymencie organami okazało się statystycznie istotne (p<0,001). Potwierdzono także istotny statystycznie efekt interakcji czynników: długość dnia i organ. Dla zilustrowania jego charakteru utworzono pokazany poniżej wykres. Rys. 3. Wykres interakcji średnich. 50 Copyright StatSoft Polska 2017, info@danewiedzasukces.pl

Wykres pokazuje, że w przypadku mózgu wyższe stężenie wystąpiło u zwierząt przetrzymywanych w warunkach krótkich dni, natomiast w przypadku serca obserwowano odwrotne zjawisko. Ponadto bezwzględna różnica stężeń w mózgu była większa niż dla serca. Poniżej zamieszczono wyniki testu porównań wielokrotnych Tukeya pozwalające ocenić statystyczną istotność szczegółowych różnic. Tabela. 4. Wyniki testów post-hoc Tukeya. Dla oceny wielkości różnic stężenia badanego enzymu dla poszczególnych kombinacji poziomów badanych w eksperymencie czynników poniżej zamieszczono również tabelę zawierającą odpowiednie wyniki obliczeń. Tabela. 5. Wyniki punktowej i przedziałowej oceny przeciętnego poziomu badanego enzymu. Podsumowanie Głównym celem artykułu było pokazanie przykładu efektywnego wykorzystania zasad planowania eksperymentów do uzyskania odpowiedzi na kilka pytań badawczych, które były przedmiotem zainteresowania badacza. W opisanym eksperymencie uzyskano odpowiedź na pięć pytań badawczych przy użyciu zaledwie 8 badanych zwierząt doświadczalnych. Copyright StatSoft Polska 2017, info@danewiedzasukces.pl 51

Przy okazji zwrócono uwagę na źródła zmienności wyników typowego eksperymentu badawczego oraz ich rodzaje. W oparciu o przykładowe dane liczbowe zilustrowano wstępną analizę wyników badania oraz zamieszczono wyniki zastosowania statystycznej metody analizy wariancji, które otrzymano w programie Statistica. Literatura 1. Cobb G.W. (1998) Introduction to Design and Analysis of Experiments, Springer-Verlag New York Inc. 2. Oehlert G. W. (2010) A First Course in Design and Analysis of Experiements, W. H. Freeman. 3. Pompa sodowo-potasowa, //pl.wikipedia.org/w/index.php?title=pompa_sodowo-potasowa&oldid=45381205 (ostatni dostęp lis. 8, 2017). 4. Welham S. J., Gezan S. A., Clark S. and Mead A. (2015) Statistical Methods in Biology. Design and Analysis of Experiments and Regression, CRC Press, Taylor and Francis Group. 52 Copyright StatSoft Polska 2017, info@danewiedzasukces.pl