Matematyka i statystyka matematyczna dla rolników w SGGW

Podobne dokumenty
1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych cd.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Elementy statystyki STA - Wykład 5

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Porównanie wielu rozkładów normalnych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Jednoczynnikowa analiza wariancji. Wnioskowanie dla jednoczynnikowej ANOV-y. Porównywanie poszczególnych średnich

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Testowanie hipotez statystycznych.

Analiza wariancji. dr Janusz Górczyński

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Wykład 3 Hipotezy statystyczne

Statystyka matematyczna dla leśników

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA

BADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Wykład dla studiów doktoranckich IMDiK PAN. Biostatystyka I. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych.

Testy post-hoc. Wrocław, 6 czerwca 2016

Analiza wariancji i kowariancji

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Temat: Zmienna losowa. Rozkład skokowy. Rozkład ciągły. Kody kolorów: Ŝółty nowe pojęcie pomarańczowy uwaga. Anna Rajfura, Matematyka

Estymacja punktowa i przedziałowa

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Statystyka matematyczna

Porównanie dwóch rozkładów normalnych

Wykład 11 Testowanie jednorodności

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

1 Estymacja przedziałowa

Metody Statystyczne. Metody Statystyczne

Statystyka matematyczna dla kierunku Rolnictwo w SGGW. BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH. ANALIZA KORELACJI PROSTEJ.

Przykład 1. (A. Łomnicki)

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Wydział Matematyki. Testy zgodności. Wykład 03

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Rozkłady statystyk z próby. Statystyka

Statystyka matematyczna. Wykład VI. Zesty zgodności

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Testowanie hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Analiza wariancji - ANOVA

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

hipotez statystycznych

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA 1

Hipotezy statystyczne

, a ilość poziomów czynnika A., b ilość poziomów czynnika B. gdzie

Hipotezy statystyczne

Weryfikacja hipotez statystycznych

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Zawartość. Zawartość

Zadania ze statystyki, cz.6

1 Weryfikacja hipotez statystycznych

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Analiza wariancji - ANOVA

Wnioskowanie statystyczne. Statystyka w 5

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Transkrypt:

Było: Testowanie hipotez (ogólnie): stawiamy hipotezę, wybieramy funkcję testową f (test statystyczny), przyjmujemy poziom istotności α; tym samym wyznaczamy obszar krytyczny testu (wartość krytyczną funkcji testowej f kryt ), losujemy próbę, wyliczamy wartość empiryczną funkcji testowej f emp, hipotezę odrzucamy, gdy wartość empiryczna f emp znajduje się w obszarze krytycznym; w przeciwnym przypadku hipotezy nie odrzucamy. Przykład na tablicy...

Przykład. Porównano pięć odmian pszenicy ozimej pod względem plonowania. W tabeli zapisano uzyskane wysokości plonów (w kg z poletka): Odmiana Plony poletko poletko 2 poletko 3 poletko 4 O,47,4,40,43 O2,0,5,30,7 O3,4,32,28,33 O4,9,25,26,2 O5,20,35,25,28

Cecha X i plon z poletka dla odminy Oi, i =, 2,..., 5, ZałoŜenia: X i ~ N (µ i, σ 2 ), i =, 2,..., 5; X, X 2,..., X 5 niezaleŝne zmienne losowe X X 2 X 3 X 5 X 4 µ µ 2 µ 3 µ 5 µ 4 wartości cechy X = X 2 = X 5 X 3 = X 4 µ = µ 2 = µ 5 µ 3 = µ 4 wartości cechy

Pytanie: Czy badane odmiany plonują na podobnym poziomie? µ = µ 2 = µ 3 = µ 4 = µ 5? Hipoteza: H 0 : µ = µ 2 = µ 3 = µ 4 = µ 5 (mówi o braku zróŝnicowania między pięcioma badanymi odmianami pod względem plonowania) Dygresja o czynnikach kształtujących plon...

WYKŁAD 0 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM - ANALIZA WARIANCJI

Terminologia stosowana w doświadczeniach czynnikowych: Problem badany w doświadczeniu: porównanie plonowania odmian O, O2,..., O5 pszenicy ozimej (badanie wpływu odmian O, O2,..., O5 na wysokość plonu) Cecha mierzona w doświadczeniu: X wielkość plonu z poletka. Badany czynnik: A - odmiana.

Dygresja:. Czy na wysokość plonowania wpływa odmiana? czynnik A 2. Czy na wysokość plonowania wpływa odmiana oraz nawoŝenie? czynnik A czynnik B 3. Czy na wysokość plonowania wpływa odmiana, nawoŝenie oraz termin siewu? czynnik A czynnik B czynnik C I ogólniej: moŝna badać wpływ jednego (A), dwóch (A, B), trzech (A, B, C) lub większej liczby czynników na wartość mierzonej cechy.

Terminologia cd.: Poziomy czynnika A (obiekty): poszczególne odmiany: O, O2,..., O5; w tym doświadczeniu porównujemy 5 odmian, czyli 5 poziomów czynnika A, lub inaczej 5 obiektów, ozn.: a liczba poziomów czynnika A, a = 5. Powtórzenia: kaŝda z odmian występuje na czterech poletkach, czyli w czterech powtórzeniach; liczba powtórzeń n = 4. Jednostki doświadczalne: poletka; liczba jednostek doświadczalnych N = 20 (ogólniej: N = a n, gdy liczba powtórzeń jest jednakowa dla kaŝdego poziomu czynnika A; N = n + n 2 +... + n a, gdy liczby powtórzeń nie są jednakowe dla wszystkich poziomów czynnika A). Układ doświadczalny (plan doświadczenia) opisuje sposób rozmieszczenia jednostek doświadczalnych na powierzchni doświadczalnej. Losowe przyporządkowanie obiektów do jednostek doświadczalnych nazywa się układem całkowicie losowym.

Przykład. W doświadczeniu polowym załoŝonym w układzie całkowicie losowym w czterech powtórzeniach porównano pięć odmian pszenicy ozimej pod względem plonowania. W tabeli zapisano wysokości plonów (w kg z poletka): Pytania: Odmiana Plony poletko poletko 2 poletko 3 poletko 4 O,47,4,40,43 O2,0,5,30,7 O3,4,32,28,33 O4,9,25,26,2 O5,20,35,25,28. Czy wszystkie badane odmiany plonują na podobnym poziomie? 2. Jeśli nie wszystkie, to które odmiany plonują podobnie?

Terminologia cd. Wyniki pomiaru cechy uzyskane w doświadczeniu przedstawia się w tabeli; takie zestawienie wyników nazywa się jednokierunkową klasyfikacją danych (jednokierunkowa bo doświadczenie jest jednoczynnikowe).

ij Jednokierunkowa klasyfikacja danych Poziomy czynnika A Nr powtórzenia (nr poletka) (odmiany) 2... n A A 2 M A a 2 2 22 a a2............ n 2 n 2 a n a - wartość cechy X mierzonej w doświadczeniu dla i tego obiektu w j - tym powtórzeniu (plon dla i-tej odmiany na j-tym poletku); i=, 2,..., a; j=, 2,..., n.

Cecha X badana w a populacjach: X, X 2,..., X a załoŝenia: X i ~ N (µ i, σ 2 ), i =, 2,..., a X, X 2,..., X a cechy (zmienne losowe) niezaleŝne hipoteza: H 0 : µ = µ 2 =... = µ a, a > 2 poziom istotności α (w przykładzie α = 0,05); metoda weryfikacji: analiza wariancji (jednoczynnikowa analizy wariancji); test statystyczny: F Fishera;

Tabela analizy wariancji (ANOVA Table) Źródła zmienności cechy X Source Czynnik A (odmiana) Between groups Błąd losowy Within groups Całkowita Total Sumy Stopnie kwadratów swobody Sum of Squares Df (degrees of freedom) SS A Df A = a - SS E Df E = N - a SS T N - Średni kwadrat F emp wartość p Mean Square F-Ratio p-value SS MS A = Df SS MS E = Df A A E E MS MS A E Wzory na sumy kwadratów...

Poziomy czynnika A Nr powtórzenia (nr poletka) (odmiany) 2... n średnie obiektowe A 2... = n n n j = j A 2 2 22... 2 2 = n 2 2 n 2 n j = 2 j M... A a a a2... a = n a a n a n a j = a j i-ta średnia obiektowa SS A =..., SS T =..., SS E =..., i = n i n i j= ij, średnia ogólna = N a n i i= j= ij

Tabela ANOVA dla omawianego przykładu Źródła Sumy Stopnie Średni zmienności kwadratów swobody kwadrat F emp wartość p cechy X SS Df MS Czynnik A (odmiana) 0,49 4 0, 0372 049, 0, 0373 = =, 27 0,0002 4 0, 0033 0, 049 5 Błąd losowy 0,049 5 = 0, 0033 Całkowita 0,98 9 F kryt = F α, a-, N-a Wnioskowanie : jeśli F emp > F kryt, to hipotezę zerową H 0 odrzucamy, w przeciwnym przypadku hipotezy zerowej nie moŝna odrzucić. Wnioskowanie 2: jeśli wartość p < α, to hipotezę zerową H 0 odrzucamy, w przeciwnym przypadku hipotezy zerowej nie moŝna odrzucić. W przykładzie F kryt = F 0,05, 4, 5 = 3,056, zatem H 0 odrzucamy.

Terminologia: Gdy odrzucimy hipotezę H 0, to mówimy, Ŝe stwierdzono statystycznie istotny wpływ czynnika A na badaną cechę albo, Ŝe czynnik A wpływa istotnie róŝnicująco na badaną cechę. Gdy nie odrzucimy hipotezy H 0, to mówimy, Ŝe nie stwierdzono statystycznie istotnego wpływu czynnika A na badaną cechę albo, Ŝe czynnik A nie wpływa istotnie róŝnicująco na badaną cechę. W przykładzie: stwierdzono statystycznie istotne zróŝnicowanie odmian pszenicy ze względu na wysokość plonu. Po odrzuceniu hipotezy zerowej stosuje się porównania szczegółowe.

ANOVA Table Analysis of Variance ----------------------------------------------------------------------------- Source Sum of Squares Df Mean Square F-Ratio P-Value ----------------------------------------------------------------------------- Between groups 0,4927 4 0,037375,5 0,0002 Within groups 0,04865 5 0,00324333 ----------------------------------------------------------------------------- Total (Corr.) 0,9792 9,5 Means and 95,0 Percent Tukey HSD Intervals,4 Plony,3,2, 2 3 4 5 odmiany

Dokończenie poprzedniego wykładu: ZałoŜenia:. cecha X ma rozkład dwupunktowy z nieznanym parametrem p, 2. cecha X 2 ma rozkład dwupunktowy z nieznanym parametrem p 2, 3. pobrano n elementową próbę losową z pierwszej populacji oraz n 2 elementową próbę losową z drugiej populacji, k i liczba elementów k i k + k 2 wyróŝnionych w i-tej próbie; p i =, p = n + n. n i 2 H 0 : p = p 2 (porównanie frakcji w dwóch populacjach), test przybliŝony u (dla duŝych prób), poziom istotności α. p p2 uemp = Funkcja testowa: ( ) p p + n n 2 Wnioskowanie: jeŝeli u emp u w przeciwnym przypadku H 0 nie moŝna odrzucić. α 2, to hipotezę H 0 odrzucamy,

Przykład. W dwóch dzielnicach miasta przeprowadzono ankietę na temat sortowania odpadków w gospodarstwach domowych. Otrzymano następujące wyniki: w pierwszej na 20 ankietowanych gospodarstw w 55 sortowano odpadki, natomiast w drugiej na 30 gospodarstw w 5 sortowano odpadki. Na poziomie istotności 0,0 zweryfikuj hipotezę o jednakowej frakcji gospodarstw sortujących odpadki w obu miastach. Dystrybuanta standardowego rozkładu normalnego X zmienna losowa, f() funkcja gęstości, F() dystrybuanta X~N (0, ), f () 2 = e, F()= 2π 2 0,00 0,0 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,50000 0,50399 0,50798 0,597 0,5595 0,5994 0,52392 0,52790 0,5388 0,53586 : 2,0 0,97725 0,97778 0,9783 0,97882 0,97932 0,97982 0,98030 0,98077 0,9824 0,9869 2, 0,9824 0,98257 0,98300 0,9834 0,98382 0,98422 0,9846 0,98500 0,98537 0,98574 2,2 0,9860 0,98645 0,98679 0,9873 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899 2,3 0,98928 0,98956 0,98983 0,9900 0,99036 0,9906 0,99086 0,99 0,9934 0,9958 2,4 0,9980 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,9936 2,5 0,99379 0,99396 0,9943 0,99430 0,99446 0,9946 0,99477 0,99492 0,99506 0,99520 2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,9962 0,99632 0,99643 2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,997 0,99720 0,99728 0,99736 2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,9978 0,99788 0,99795 0,9980 0,99807 f (t) dt