Planowanie doświadczeń DPLD LMO Laboratoria z wykorzystaniem programu R



Podobne dokumenty
Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Analiza wariancji - ANOVA

Szkice rozwiązań z R:

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Analiza wariancji, część 2

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testy post-hoc. Wrocław, 6 czerwca 2016

Statystyka matematyczna Testowanie hipotez dla średnich w rozkładzie normalnym. Wrocław, r

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Zadanie 1. Analiza Analiza rozkładu

Testowanie hipotez statystycznych.

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Testowanie hipotez statystycznych.

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy

Statystyka matematyczna

Ekonometria. Zajęcia

Matematyka i statystyka matematyczna dla rolników w SGGW

PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK

Kolokwium ze statystyki matematycznej

WNIOSKOWANIE STATYSTYCZNE

Jednoczynnikowa analiza wariancji

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Środowisko R Założenie normalności metody nieparametryczne Wykład R4; Weryfikacja założenia o normalności rozkładu populacji

Prognozowanie na podstawie modelu ekonometrycznego

Analiza wariancji. dr Janusz Górczyński

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

t y x y'y x'x y'x x-x śr (x-x śr)^2

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Przedmiot statystyki. Graficzne przedstawienie danych.

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji.

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

MODELE LINIOWE. Dr Wioleta Drobik

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Ćwiczenia 7. Badanie istotności róŝnic część II.

3. Modele tendencji czasowej w prognozowaniu

Statystyka matematyczna dla leśników

Statystyczna analiza danych (molekularnych) analiza wariancji ANOVA

Wydział Matematyki. Testy zgodności. Wykład 03

Autor: Dariusz Piwczyński 1 Ćwiczenie: Doświadczenia 2-grupowe w układzie niezależnym i zależnym.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Wprowadzenie do analizy korelacji i regresji

ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

Wykład 10 Zrandomizowany plan blokowy

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Wykład 10 ( ). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

Analiza regresji - weryfikacja założeń

KARTA KURSU. Kod Punktacja ECTS* 1

Porównanie dwóch rozkładów normalnych

Regresja liniowa wprowadzenie

Przykłady bloków: Przykład. Przyporządkowanie. Wykład 9 Zrandomizowany plan blokowy

TECHNIKA DRZWI ZATRZAŚNIĘTE PRZED NOSEM

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Metody Ilościowe w Socjologii

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Zasady rzetelnego pomiaru efektywności transferu wiedzy w e-learningu akademickim

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Estymacja parametrów w modelu normalnym

Hipotezy statystyczne

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)

Test lewostronny dla hipotezy zerowej:

Statystyka i Analiza Danych

Quick Launch Manual:

Projektowanie badań i interpretacja wyników okiem biostatystyka. Warszawa, 15 marca 2016, Anna Marcisz

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

ANALIZA WARIANCJI - KLASYFIKACJA WIELOCZYNNIKOWA

Uwaga! Test studenta dla pojedynczej próby, niekierunkowy. Wykład 9: Testy Studenta. Test Studenta dla jednej próby, kierunkowy

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

5. Model sezonowości i autoregresji zmiennej prognozowanej

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria

Elementy statystyki STA - Wykład 5

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Transkrypt:

Planowanie doświadczeń DPLD LMO Laboratoria z wykorzystaniem programu R Literatura 1. Biecek P., Przewodnik po pakiecie R, GIS 2008. 2. Biecek P., Analiza danych z programem R. Modele liniowe z efektami stałymi, losowymi i mieszanymi, Wydawnictwo Naukowe PWN 2011. 3. Gągolewski M., Programowanie w języku R. Analiza danych, obliczenia, symulacje, Wydawnictwo Naukowe PWN 2014. 4. Górecki T., Podstawy statystyki z przykładami w R, BTC 2011. 5. Hay-Jahans C., An R companion to linear statistical models, Chapman & Hall 2012. 6. Komsta Ł., Wprowadzenie do środowiska R (http://www.r-project.org). p-wartość Definicja 1. p wartość jest najmniejszym poziomem istotności testu, przy którym odrzucamy hipotezę zerową. Jeśli p wartość jest mniejsza lub równa niż poziom istotności α, to odrzucamy H 0. Jeśli p wartość jest większa niż poziom istotności α, to nie ma podstaw do odrzucenia H 0. Układ bloków kompletnie zrandomizowanych Zadanie 1. Wykonano szereg doświadczeń w celu zbadania jakości mleka przewożonego trzema mi A, B i C (Quenouille M.H., Introductory Statistics, Oxford 1950). W każdym z dwunastu ośrodków, trzy metody przewozu mleka zostały zastosowane do trzech partii mleka (wybranych losowo). Otrzymane wyniki zostały zawarte w pliku metody przewozu.txt. (a) Na poziomie istotności α = 0,05, zweryfikuj hipotezę głoszącą, że ośrodki nie mają wpływu na jakość mleka. (b) Czy jakość mleka istotnie zależy od metody przewozu? Przyjmij poziom istotności α = 0,05. (c) Jeżeli metody przewozu różnią się istotnie wykorzystaj testy post hoc w celu określenia, które metody przewozu różnią się między sobą. (d) Wyznacz względną efektywność rozważanego doświadczenia założonego według układu bloków kompletnie zrandomizowanych wobec doświadczenia opartego na kompletnej randomizacji. (a)-(b) 2 2.4 1.22 4.661 0.0205 * osrodki 11 1912.2 173.84 666.738 <2e-16 *** Residuals 22 5.7 0.26 (c) trt means M 1 C 23.62500 a 2 A 23.41667 ab 3 B 23.00000 b (d) 204.7908 Zadanie 2. Badano wpływ metod sadzenia świerku pospolitego na sumę powierzchni przekrojów pierścieniowych (m 2 /ha). Doświadczenie założono w układzie bloków kompletnie zrandomizowanych, a wyniki zawarto w Tabeli 1. (a) Na poziomie istotności α = 0,05, zweryfikuj hipotezę głoszącą, że nie mają wpływu na sumę powierzchni przekrojów pierścieniowych. (b) Czy przekrojów pierścieniowych istotnie zależy od metody sadzenia? Przyjmij poziom istotności α = 0,05. 1

2 Narzędzia użyte do sadzenia Bloki I II III IV V Sadzarka L76 29,3 28,8 23,3 28,8 28,6 Sadzarka GNKp 26,1 26,6 25,4 21,0 26,7 Sadzarka Egedal 19,9 22,2 20,8 22,4 29,7 Łopata ogrodnicza 23,7 22,3 13,9 23,4 26,5 Łopata Junack 21,3 28,6 15,5 26,2 24,8 Tabela 1. Dane do zadania 2 (c) Jeżeli metody sadzenia różnią się istotnie wykorzystaj testy post hoc w celu określenia, które metody sadzenia różnią się między sobą. (d) Wyznacz względną efektywność rozważanego doświadczenia założonego według układu bloków kompletnie zrandomizowanych wobec doświadczenia opartego na kompletnej randomizacji. (a)-(b) 4 104.5 26.12 2.851 0.0585. 4 155.9 38.99 4.255 0.0156 * Residuals 16 146.6 9.16 (d) 1.511624 Zadanie 3. Doświadczenie odmianowe z sześcioma odmianami owsa, założone metodą bloków kompletnie zrandomizowanych przez Dział Hodowli i Genetyki Zbóż Państwowego Instytutu Naukowego Gospodarstwa Wiejskiego w Puławach, dostarczyło wielkości ów zawartych w pliku owies.rdata (Barbacki S., Ogólna metodyka doświadczeń polowych w zarysie, Puławy 1935). Z danych została usunięta obserwacja dla odmiany A w pierwszym bloku. Przyjąwszy poziom istotności 0,01 zweryfikować hipotezę o braku różnic pomiędzy badanymi odmianami owsa ze względu na. odmiana 5 20.33 4.067 14.08 1.45e-07 *** 7 15.83 2.261 7.83 1.07e-05 *** Residuals 35 10.11 0.289 p-wartość dla bloków = 1.604364e-05, p-wartość dla obiektów = 7.525411e-07 Kontrasty Zadanie 4. W 1974 roku Michael Eysenck opublikował w czasopiśmie Developmental Psychology wyniki badań dotyczących ubocznego uczenia werbalnego. W eksperymencie wzięło udział 100 osób, z czego połowę stanowili młodzi ludzie (w wieku studenckim), a drugą połowę osoby starsze (w wieku pięćdziesięciu i sześćdziesięciu lat). W obrębie każdej grupy wiekowej, pacjenci zostali przydzieleni do jednej z pięciu grup Instrukcji. Następnie podano im listę słów i powiedziano, aby postępowali zgodnie z instrukcjami podanymi wcześniej. Instrukcje były następujące: Liczenie (liczenie liter w każdym wymienionym słowie), Rymowanie (pomyśleć o słowie, które rymuje się z wskazanym słowem), Przymiotnik (pomyśleć o przymiotniku, który mógłby zmodyfikować dane słowo), Wyobraźnia (wyobrazić sobie obraz obiektu opisanego przez wymienione słowo), Kontrola (pamiętaj wymienione słowa aby później je powtórzyć). Każdy pacjent widział tę samą listę wyrazów trzy razy i powtarzał te instrukcje trzy razy. Instrukcje Liczenie i Rymowanie mają dać informację o powierzchownym poziomie przetwarzania semantycznego. Instrukcje Przymiotnik i Wyobraźnia mają informować o głębokim poziomie przetwarzania semantycznego, tj. liczenie i rymowanie nie wymagają od pacjenta znajomości

sensu słów z listy, podczas gdy instrukcje Przymiotnik i Wyobraźnia wymagają znajomości znaczenia słów. Pacjenci w grupie kontrolnej mieli tylko zapamiętać słowa i ewentualnie później je powtórzyć. Dane zawarte w pliku Eysenck.txt dotyczą tylko pacjentów młodszych i zostały uzyskane w oparciu o średnie i błędy standardowe otrzymane w pracy Eysencka M.W. (1974) Age differences in incidental learning. Developmental Psychology 10, 936 941. Należy wykonać następujące polecenia: (1) Porównaj dwie grupy powierzchownego uzyskiwania informacji z dwiema grupami głębokiego uzyskiwania informacji. (2) Porównaj dwie grupy głębokiego uzyskiwania informacji z grupą kontrolną. (3) Porównaj dwie grupy powierzchownego uzyskiwania informacji między sobą. (4) Porównaj dwie grupy głębokiego uzyskiwania informacji między sobą. W tym celu: (a) Zapisz odpowiednie hipotezy. (b) Wyraź je za pomocą kontrastów. (c) Czy ten układ kontrastów jest ortogonalny? (d) Przetestuj zaproponowane kontrasty. Instrukcja 4 1353.7 338.4 53.064 < 2e-16 *** Instrukcja: C1 1 837.2 837.2 131.272 6.19e-15 *** Instrukcja: C2 1 471.2 471.2 73.889 4.76e-11 *** Instrukcja: C3 1 6.0 6.0 0.949 0.335 Instrukcja: C4 1 39.2 39.2 6.146 0.017 * Residuals 45 287.0 6.4 Zadanie 5. W pliku danemieszkania.csv (Biecek P., Przewodnik po pakiecie R, GIS 2008) zawarte są informacje o pięciu parametrach 200 mieszkań z wrocławskiego rynku nieruchomości w roku 2004. Interesującym jest zbadanie czy cena zależy od tego, w której dzielnicy znajdują się mieszkania. Dokładniej chcemy przetestować następujące hipotezy: (1) Mieszkania w dzielnicy Biskupin są istotnie droższe od mieszkań w pozostałych dwóch dzielnicach (Krzyki i Srodmiescie). (2) Cena mieszkań w dzielnicy Krzyki różni się od ceny mieszkań w dzielnicy Srodmiescie. Wykonaj następujące polecenia: (a) Zapisz odpowiednie hipotezy. (b) Wyraź je za pomocą kontrastów. (c) Czy ten układ kontrastów jest ortogonalny? (d) Przetestuj zaproponowane kontrasty. dzielnica 2 1.800e+10 8.998e+09 5.046 0.00729 ** dzielnica: C1 1 1.771e+10 1.771e+10 9.929 0.00188 ** dzielnica: C2 1 2.892e+08 2.892e+08 0.162 0.68762 Residuals 197 3.513e+11 1.783e+09 Ogólne własności układów bloków Zadanie 6. Wykonaj zadania 1 3 z tematu Ogólne własności układów bloków z wykorzystaniem programu R. Ponadto sprawdź, czy dla układu rozważanego w zadaniu 1 zachodzą następujące własności: = R, DD = K, D = N, T = y, B = Dy. Układy zrównoważone o blokach niekompletnych i trójkowe układów bloków Zadanie 7. Wykonaj zadania 1 3 i 6 z tematów Układy zrównoważone o blokach niekompletnych i Trójkowe układy bloków z wykorzystaniem programu R. 3

Doświadczenia czynnikowe typu 2 k Zadanie 8. Wykonaj zadanie 4 z tematu Doświadczenia czynnikowe typu 2 k z wykorzystaniem programu R. 3 774 258 0.744 0.53808 A 1 3465 3465 9.986 0.00472 ** B 1 161170 161170 464.425 8.38e-16 *** C 1 278818 278818 803.437 < 2e-16 *** A:B 1 345 345 0.993 0.33040 A:C 1 810 810 2.334 0.14149 B:C 1 13986 13986 40.303 2.70e-06 *** A:B:C 1 124 124 0.357 0.55634 Residuals 21 7288 347 Zadanie 9. Rozlewnia napojów orzeźwiających jest zainteresowana otrzymaniem bardziej jednolitego wypełnienia butelek z napojem. Teoretycznie maszyny napełniające butelki działają poprawnie. Jednak w praktyce pojawiają się pewne wahania od docelowej ilości napoju w butelce. Rozlewnia chciałaby wykryć przyczyny tych wahań i wyeliminować je, o ile to możliwe. W tym celu rozważono doświadczenie czynnikowe typu 2 3, założone zgodnie z układem bloków kompletnie zrandomizowanych. Wyniki zawarto w Tabeli 2. Rozważono następujące czynniki: karbonatyzacja (czynnik A) o poziomach 10% i 12%, ciśnienie robocze w maszynie napełniającej (czynnik B) o poziomach 25 i 30 [psi], szybkość linii produkcyjnej (czynnik C) o poziomach 200 i 250 butelek wyprodukowanych na minutę. Natomiast obserwacje to odchylenia od docelowej ilości napoju w butelce. Nr obserwacji Nr kombinacji Karbonatyzacja Ciśnienie Szybkość Blok 1 Blok 2 3 1 10% 25 200 4 1 7 2 12% 25 200 1 1 8 3 10% 30 200 1 2 2 4 12% 30 200 5 2 6 5 10% 25 250 1 1 4 6 12% 25 250 3 3 1 7 10% 30 250 2 4 5 8 12% 30 250 11 5 Tabela 2. Dane do zadania 9 4 Zbadaj istotność bloków, efektów głównych czynników, oraz interakcji czynników. Przyjmij poziom istotności α = 0,05. 1 0.56 0.56 0.096 0.7655 A 1 52.56 52.56 8.988 0.0200 * B 1 33.06 33.06 5.653 0.0490 * C 1 45.56 45.56 7.791 0.0269 * A:B 1 7.56 7.56 1.293 0.2929 A:C 1 0.56 0.56 0.096 0.7655 B:C 1 5.06 5.06 0.866 0.3831 A:B:C 1 0.56 0.56 0.096 0.7655 Residuals 7 40.94 5.85

5 1.0 2.0 3.0 osrodki 2 4 6 8 12 0.5 1.5 2.5 3.5 osrodki 2 4 6 8 12 Rysunek 1. Wykres do zadania 1 (a) i (b) 95% family wise confidence level C B C A B A 1.0 0.5 0.0 0.5 1.0 Differences in mean levels of Rysunek 2. Wykres do zadania 1 (c)

6 Rysunek 3. Wykres do zadania 2 (a) i (b) odmiana 6 2 4 6 8 odmiana 6 2 4 6 8 Rysunek 4. Wykres do zadania 3

7 Liczba slów 5 10 15 20 Kontrola Liczenie Przymiotnik Rymowanie Wyobraznia Instrukcja Rysunek 5. Wykres do zadania 4 Cena 100000 200000 300000 Biskupin Krzyki Srodmiescie Dzielnica Rysunek 6. Wykres do zadania 5