Statystyka matematyczna dla leśników

Podobne dokumenty
Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez statystycznych

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

166 Wstęp do statystyki matematycznej

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Statystyka matematyczna i ekonometria

Wykład 3 Hipotezy statystyczne

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Testowanie hipotez statystycznych

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

Testowanie hipotez statystycznych cd.

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Statystyka matematyczna i ekonometria

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Wydział Matematyki. Testy zgodności. Wykład 03

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Weryfikacja hipotez statystycznych

Hipotezy statystyczne

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Hipotezy statystyczne

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Testowanie hipotez statystycznych

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Testowanie hipotez statystycznych.

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Zawartość. Zawartość

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Statystyka matematyczna

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Weryfikacja hipotez statystycznych

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Testowanie hipotez statystycznych.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

WNIOSKOWANIE STATYSTYCZNE

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

STATYSTYKA MATEMATYCZNA

Prawdopodobieństwo i rozkład normalny cd.

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

STATYSTYKA MATEMATYCZNA

1 Estymacja przedziałowa

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Metody Statystyczne. Metody Statystyczne

Zadania ze statystyki, cz.6

Weryfikacja hipotez statystycznych testy t Studenta

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Transkrypt:

Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5

Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje hipotez, rodzaje testów Parametryczne testy istotności Testy zgodności

Testowanie hipotez statystycznych Teoria weryfikacji hipotez statystycznych jest ważnym działem wnioskowania statystycznego Podejmujemy tu określone decyzje statystyczne z określonym prawdopodobieństwem, to znaczy (podobnie, jak w estymacji statystycznej) - w warunkach niepewności

Próbkowanie POPULACJA PRÓBA Testowanie Parametr Statystyka

Hipotezy statystyczne Badając różne populacje i zjawiska stawiamy najczęściej tzw. hipotezy, czyli formułujemy przypuszczenia (założenia) dotyczące parametrów populacji lub rozkładów cechy

Hipotezy statystyczne hipotezy parametryczne (Hp), które dotyczą nieznanego poziomu parametrów populacji hipotezy nieparametryczne (Hnp), dotyczące nieznanej postaci funkcji rozkładu zmiennych w populacji

Hipotezy parametryczne Z reguły zapisane są w postaci krótkiego równania, np. µ = 44 µ = µ σ = σ

Hipotezy nieparametryczne Zwykle zapisane w postaci zdania, np. rozkład zmiennej x w populacji jest zgodny z rozkładem normalnym próby zostały pobrane z populacji o takich samych rozkładach...

Hipotezy statystyczne Hipoteza zerowa hipoteza podlegająca testowaniu Hipoteza alternatywna hipoteza rezerwowa na wypadek, gdyby hipoteza zerowa okazała się fałszywa Powyższe hipotezy mogą być zarówno parametryczne, jak i nieparametryczne

Hipotezy statystyczne hipotezy zerowe (H0), podlegające weryfikacji ich treścią jest założenie o braku różnic między parametrami (zerowe różnice) lub braku różnic między ogólnymi postaciami funkcji rozkładów. hipotezy alternatywne (H), konkurencyjne do zerowych przyjmowane w wypadku negatywnej weryfikacji H0

Hipotezy statystyczne H 0 : µ = 44 H 0 : µ = µ H 0 : rozkład zmiennej x w populacji jest zgodny z rozkładem normalnym

Hipotezy statystyczne H : µ 44 H : µ µ H : rozkład zmiennej x w populacji nie jest zgodny z rozkładem normalnym

W przypadku Hnp, H może mieć tylko jedną postać (porównywane funkcje rozkładu są różne). W przypadku Hp, H może być: - dwustronna (porównywane parametry są różne) - prawostronna (badany parametr jest większy od porównawczego) - lewostronna (badany parametr jest mniejszy od porównawczego) H Hp Hnp H 0 H H 0 H dwu- prawo- lewo-

Testy statystyczne Do weryfikacji hipotez służą specjalne narzędzia badawcze zwane testami statystycznymi Są to statystyki o określonym rozkładzie teoretycznym z próby (przypomnijmy sobie wykład o estymacji) o tym później

Próbkowanie POPULACJA PRÓBA Testowanie Parametr Statystyka Test statystyczny

Błędy w testach Hipoteza może być prawdziwa lub fałszywa Wynik testu może kazać hipotezę zaakceptować lub odrzucić W związku z tym

Błędy w testach

Jak uniknąć błędów? Konstrukcja testu: stosować testy, które podejmują tylko decyzję o odrzuceniu hipotezy lub stwierdzają brak podstaw do jej odrzucenia; w teście takim nie przyjmujemy hipotez Mały poziom istotności (Test istotności)

Stosując testy istotności unikamy błędu II rodzaju. Możemy popełnić błąd I rodzaju, ale prawdopodobieństwo popełnienia tego błędu będzie bardzo małe równe założonemu poziomowi istotności (zwykle 0,05 lub 0,0). Hipotezy parametryczne najczęściej dotyczą średnich, dlatego rozważania teoretyczne przeprowadzimy na przykładzie testu z (statystyki o rozkładzie normalnym). Na podstawie wyników próby obliczamy statystykę z i w rozkładzie tej statystyki (normalnym) wyznaczamy taki obszar wartości Q aby prawdopodobieństwo znalezienia się w tym obszarze było bardzo małe równe założonemu poziomowi istotności. P ( z Q) = α W zależności od postaci hipotezy alternatywnej obszar krytyczny testu przy założonym poziomie istotności może być: dwu-stronny, prawo-stronny lub lewo-stronny.

H 0 : µ=500 H : µ 500 z emp = x µ h σ n Z emp charakteryzuje się tym, że ma rozkład normalny N(0,), czyli o średniej = 0 i odchyleniu standardowym = (gdzie jednostką rozkładu jest odchylenie standardowe średniej z próby lub, jak kto woli, błąd standardowy

fz fz -α α/ α/ -α α Q -z α/ 0 z α/ Q z 0 z α Q z Jeżeli obliczona dla danego doświadczenia wartość testu znajdzie się w obszarze krytycznym Q to podejmujemy decyzję o odrzuceniu H 0 i przyjęciu H. Jeżeli nie to stwierdzamy, że brak podstaw do Q odrzucenia H 0.Dlaczego tak? α -z α fz -α 0 z

Zauważmy, że obszar krytyczny testu wyznaczamy dla bardzo małego prawdopodobieństwa (poziomu istotności α). Jeżeli założymy, że H 0 jest prawdziwa, to oznacza, zę prawdopodobieństwo otrzymania z n-elementowej próby wartości z w zakresie obszaru krytycznego Q (czyli poza przedziałem ufności dla z) będzie równe α, czyli bardzo małe. fz -α α/ α/ Q -z α/ 0 z α/ Q z

Zdarzenie takie raczej nie powinno wystąpić w jednym eksperymencie. Jeżeli zatem takie zdarzenie wystąpi, to będzie oznaczało, że miało ono większe prawdopodobieństwo, niż to, które przyjęliśmy zakładając prawdziwość H 0. fz -α α/ α/ Q -z α/ 0 z α/ Q z

Logiczne jest zatem potraktowanie H 0 jako fałszywej, jej odrzucenie i przyjęcie H. Prawdopodobieństwo pomyłki, czyli odrzucenia prawdziwej H 0 (błąd pierwszego rodzaju) jest równe α (praktycznie bliskie zeru, najczęściej α=0,05). fz -α α/ α/ Q -z α/ 0 z α/ Q z

Gdy empiryczna wartość z wystąpi poza obszarem krytycznym Q (czyli znajdzie się w przedziale ufności statystyki testowej z), to prawdopodobieństwo takiego zdarzenia, przy założeniu prawdziwości H 0, będzie równe -α(praktycznie bliskie ). Nie mamy podstaw do odrzucenia H 0. fz -α α/ α/ Q -z α/ 0 z α/ Q z

Parametryczne testy istotności: - dla średniej - stosowane w eksperymentach, w których hipoteza zerowa określa hipotetyczną wartość średniej µ h, z którą porównujemy średnią z n-elementowej próby ( x ). H H 0 : µ = : µ µ µ h h lub µ > µ h lub µ < Jeżeli rozkład zmiennej w populacji jest normalny znamy wariancję (σ ), H 0 testujemy za pomocą testu z, obszar krytyczny wyznaczamy z rozkładu normalnego dla założonego poziomu istotności α, a wartość empiryczną testu obliczamy ze wzoru: Jeżeli z z emp emp = x z µ σ α / h lub n z α µ h to H 0 odrzucamy

W przypadku stosowania dużych prób rozkład zmiennej w populacji nie musi być normalny i nie musimy znać wariancji dla populacji, przyjmujemy, ze s =σ. Jeżeli nie znamy wariancji dla populacji i dysponujemy wynikami małej próby, to tylko w przypadku, kiedy rozkład w populacji jest normalny, możemy do weryfikacji H 0 zastosować test t, a obszar krytyczny wyznaczyć z rozkładu Studenta dla założonego poziomu istotności α i liczby stopni swobody k = n -. Wartość empiryczną testu obliczamy: t emp = x µ h s n Jeżeli t emp t α / lub t przy k = n α to H 0 odrzucamy

- dla różnicy między dwiema średnimi - stosowany w doświadczeniach, w których porównujemy średnie dwóch populacji na podstawie n-elementowych prób pobranych z tych populacji. 0 lub lub : : µ µ µ µ µ µ µ µ < > = H H W przypadku dużych prób - test z : n s n s x x z emp + =

W przypadku małych prób - test t ale tylko jeżeli spełnione są dwa warunki: ) próby pochodzą z populacji o rozkładzie normalnym, ) wariancje w tych populacjach nie różnią się istotnie. ( ) ( ) + + + = n n n s n s n n x x t emp przy: k = n + n - Jeżeli n = n = n to wzór na błąd standardowy różnicy znacznie się upraszcza n s s x x t emp + =

- dla wariancji: 0 0,, : : H F F n k n k przy F to s s F dla n k n k przy F to s s F dla F H H emp emp emp emp α α α σ σ σ σ > = = = = = = > = F α F f (F) Jeżeli to odrzucamy Q

Test zgodności χ W przypadku testów nieparametrycznych weryfikuje się hipotezę dotyczącą rozkładu badanej cechy w populacji nie precyzując parametrów tego rozkładu. Statystyka stosowana tu ma rozkład asymptotyczny χ. Test ten pozwala na weryfikację hipotezy, że populacja ma określoną postać funkcji dystrybuanty. Wymaga dużej próby. H H 0 : : E E ( Gx Fx) = 0 ( rozklady zgodne) ( Gx Fx) 0 ( rozklady rozniace sie istotnie) Na podstawie wyników próby tworzymy szereg rozdzielczy (rozkład empiryczny) i po wyznaczeniu parametrów, odpowiedni rozkład teoretyczny (jeżeli normalny, to zgodnymi parametrami będą -średnia arytmetyczna i odchylenie standardowe). Musi być też spełniony warunek aby częstość porównywanych klas nie była mniejsza od 0. Zwykle łączymy skrajne klasy. Empiryczną wartość testu obliczamy wg. wzoru:

χ emp ( ' n n ) u = i χ α wyznaczamy z tablic rozkładu χ na podstawie założonego poziomu istotności α i liczby stopni swobody k = u - f - gdzie: u - liczba składników sumy, f - liczba zgodnych parametrów obydwu rozkładów. n ' i i Jeżeli: χ emp > χ α to H 0 odrzucamy, przyjmujemy H fχ χ α Q χ

Przykładowe pytania egzaminacyjne z tej części materiału. Rodzaje hipotez statystycznych.. Co to jest hipoteza zerowa a co hipoteza alternatywna? 3. Rodzaje błędów popełnianych podczas testowania hipotez. 4. Co to są testy istotności? 5. Jakiego błędu unikamy stosując testy istotności? 6. Jakie jest prawdopodobieństwo popełnienia błędu pierwszego rodzaju przy stosowaniu testów istotności? 7. Jakie testy mogą być stosowane przy porównywaniu dwóch średnich? 8. Do czego służy test zgodności χ? 9.

Dziękuję za uwagę!