Statystyka w przykładach

Podobne dokumenty
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Estymacja parametrów rozkładu cechy

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

1 Estymacja przedziałowa

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Estymacja punktowa i przedziałowa

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Wnioskowanie statystyczne. Statystyka w 5

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Przedziały ufności. Poziom istotności = α (zwykle 0.05) Poziom ufności = 1 α Przedział ufności dla parametru μ = taki przedział [a,b], dla którego

STATYSTYKA

Estymacja przedziałowa. Przedział ufności

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Testowanie hipotez statystycznych

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Spis treści 3 SPIS TREŚCI

Statystyka w analizie i planowaniu eksperymentu

1.1 Wstęp Literatura... 1

Rozkłady statystyk z próby

1 Podstawy rachunku prawdopodobieństwa

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Weryfikacja hipotez statystycznych

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

Testowanie hipotez statystycznych.

Komputerowa Analiza Danych Doświadczalnych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Statystyka w analizie i planowaniu eksperymentu

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Testowanie hipotez statystycznych.

Własności statystyczne regresji liniowej. Wykład 4

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Kolokwium ze statystyki matematycznej

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

STATYSTYKA MATEMATYCZNA

WYKŁAD 5 TEORIA ESTYMACJI II

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

166 Wstęp do statystyki matematycznej

Testowanie hipotez statystycznych.

Wykład 9 Wnioskowanie o średnich

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

Hipotezy statystyczne

Testowanie hipotez statystycznych.

Statystyka matematyczna dla leśników

Metody probabilistyczne

Statystyka matematyczna i ekonometria

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Zawartość. Zawartość

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Testowanie hipotez statystycznych

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Hipotezy statystyczne

Estymacja parametro w 1

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Estymacja parametrów w modelu normalnym

Na podstawie dokonanych obserwacji:

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Zmienna bazowa. 100(1 α)% przedział ufności dla µ: 100(α)% test hipotezy dla µ = µ 0; odrzucić, jeżeli Ȳ nie jest w przedziale

Statystyka matematyczna. Wykład VI. Zesty zgodności

Ważne rozkłady i twierdzenia c.d.

Testowanie hipotez statystycznych. Wprowadzenie

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

Pobieranie prób i rozkład z próby

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka w analizie i planowaniu eksperymentu

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Metody Statystyczne. Metody Statystyczne.

Centralne twierdzenie graniczne

Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych cd.

Statystyka dla doktorantów: Estymacja przedziałowa. Przemysław Borys Wydział Chemiczny Politechniki Śląskiej

Analiza niepewności pomiarów

Monte Carlo, bootstrap, jacknife

WSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Transkrypt:

w przykładach Tomasz Mostowski Zajęcia 10.04.2008

Plan Estymatory 1 Estymatory 2

Plan Estymatory 1 Estymatory 2

Własności estymatorów Zazwyczaj w badaniach potrzebujemy oszacować pewne parametry na podstawie próby. Każda wartość uzyskana na podstawie danych z próby nazwiemy statytsyka. Estymatorem nieznanego parametru θ nazwiemy dowolna statystykę T (X 1, X 2,..., X n ). Naturalnie chcemy, żeby nasz estymator był dobry. ) Estymator nieobciażony E ( θ = θ ( ) Estymator zgodny ε>0 lim n P θ θ ε = 0

Własności estymatorów Przykład estymatora zgodnego, ale obciażonego. Niech X U[0, a], T = max(x 1, X 2,..., X n ) E(T ) = E(max(X 1, X 2,..., X n )) = n n+1 a a Łatwo pokazać, że jest to estymator zgodny

Estymator efektywny Estymator efektywny to taki, który spośród wszystkich nieobciażonych ma najmniejsza wariancję. (Taki estymator nie zawsze istnieje). Można powiedzieć, że estymator ten jest najlepszy. Średnio nie mylimy się co do jego oszacowań, a jednocześnie popełniamy najmniejszy bład.

Plan Estymatory 1 Estymatory 2

Estymatory Badajac dane zazwyczaj chcemy uzyskać informacje na temat pewnych charakterystyk danych. Sprowadza się to do estymacji pewnych parametrów rozkładu. Np. Jaka jest średnia dzienna stopa zwrotu z indeksu WIG? Jakie jest ryzyko zwiazane z inwestycja w akcje pewnej spółki? Ile osób popiera działania rzadu?

Przykłady estymatorów punktowych Estymator wartości oczekiwanej w rozkładzie normalnym ˆµ = 1 n Xi. Można pokazać, że jest to estymator efektywny. Estymatorem wariancji w próbie jest S 2 = 1 ( n 1 Xi ( X) ) 2. Proszę zwrócić uwagę, że w mianowniku jest n 1. Jest to estymator nieobciażony. S 2 = 1 ( n Xi ( X) ) 2 jest estymatorem obiażonym, ale zgodnym.

Plan Estymatory 1 Estymatory 2

Przy estymacji punktowej pojawia się jednak wiele problemów Dla rozkładów ciagłych prawdopodobieństwo, że estymator jest rzeczywiście równy nieznanemu parametrowi wynosi 0. Estymator punktowy nie daje nam żadnej informacji odnośnie tego jak bardzo się mylimy w naszych szacunkach. Nie wiemy zatem jaka niepewnościa obarczona jest nasza prognoza.

Przy estymacji przedziałowej staramy się znaleźć liczby θ 1 i θ 2 dla nieznanego parametru θ, żeby P(θ 1 θ θ 2 ) = 1 α, gdzie α jest jakaś mała liczba. Intuicyjnie oznacza to, że losowy przedział (θ 1, θ 2 ) z dużym prawdopodobieństwem pokrywa nieznany parametr θ.

Przedział ufności dla wartości oczekiwanej z rozkładu normalnego Jeśli wiadomo, że X 1, X 2,..., X n pochodza ze standardowego rozkładu normalnego o niezanej wartości oczekiwanej i znanej wariancji σ 2, to (1 α)% przedział ufności ( dany jest wzorem ) X Φ(1 α/2)σ, X + Φ(1 α/2)σ Przedział nie musi być wybierany symetrycznie wokół wartości średniej. Możemy wziać właściwie dowolny przedział o zadanym prawdopodobieństwie

Przedział ufności dla wartości oczekiwanej z rozkładu normalnego W standardowym rozkładzie mamy np. takie przedziały dla próby n elementowej P( 1.64 X n n 1.64) = 0.9 P( X n n 1.28) = 0.9 P( 1.28 X n n ) = 0.9 Za wyborem pierwszego przemawia to, że jest on najkrótszy ze wszystkich.

Przedział ufności dla wartości oczekiwanej z rozkładu normalnego W rzeczywistości zazwyczaj nie znamy wariancji rozkładu Musimy wtedy posłużyć się estymatorem wariancji t = X µ S n n 1, ma rozkład t Studenta Przedział ( ufności dany jest wtedy wzorem X t(α/2, n 1)Sn, X ) + t(α/2, n 1)S n

rozkład t Studenta Estymatory

Przedział ufności dla wariancji Czasami potrzebujemy także uzyskać przedział ufności dla wariancji Jeśli dane pochodza z rozkładu normalnego, to zmienna χ = ns2 n ma rozkład chi kwadrat o n 1 stopniach σ 2 swobody. Tutaj S n = 1 ( n Xi ( X) ) 2 Przedział ufności dany jest wtedy wzorem ( nsn 2 χ 2 (1 α/2,n 1), nsn 2 χ 2 (α/2,n 1) χ 2 (p, n 1) oznacza p ty kwantyl rozkładu χ 2 )

Problemy z przedziałami ufności Dane na których pracujemy czasami odbiegaja od rozkładu normalnego. Estymator wariancji jest też nieodporny na obserwacje nietypowe outliery Oszacowane przedziały ufności dla statystyki t sa wtedy nieprecyzyjne Pomimo tego w praktyce często stosuje się przedziały oparte na tej statystyce

Problemy z przedziałami ufności Przedziały ufności dla wariancji Jeżeli rozkład zmiennej silnie odbiega od rozkładu normalnego, skonstruowany przedział ufności dla wariancji jest bezużyteczny! Paradoksalnie nie jest to wielki problem, gdyż jeśli rozkład silnie odbiega od normalnego, wtedy wariancja nie jest dobrym wskaźnikiem rozproszenia i zazwyczaj nie warto się nia zajmować.

Testy Estymatory Jednym z częstszych pytań w statystyce i ekonometrii jest to czy dane pochodza z konkretnego rozkładu (zazwyczaj normalnego). Testy możemy z grubsza podzielić na testy graficzne i formalne. Do najważniejszych formalnych należa Test Kołmogorowa Test Kołmogorowa Smirnowa Test Shapiro Wilka

Plan Estymatory 1 Estymatory 2

Estymatory Dokładne obejrzenie analizowanych danych zazwyczaj może nam dużo powiedzieć o charakterstyce danych i często oszczędzić dużo czasu Aby sprawdzić, czy dane pochodza z jakiegoś rozkładu można skorzystać z histogramu i wykresów typu quantile-quantile plot.

Histogram Estymatory

Histogram Estymatory

QQ Plot Estymatory

QQ Plot Estymatory

Plan Estymatory 1 Estymatory 2

Test Kołmogorowa i test Kołmogorowa-Smirnowa należa do szerokiej klasy testów nieparametrycznych. Sa to testy, w których nie zakładamy żadnej szczególnej postaci gęstości rozkładu, a wartości krytyczne testów sa zazwyczaj wyznaczone metodami Monte Carlo.

Test Kołmogorowa Estymatory W teście Kołmogorowa testujemy, czy dystrybuanta empiryczna odpowiada dystrybuancie teoretycznej testowa H 0 : F(x) = ˆF(x) H 1 : F(x) ˆF(x) D n = sup x ˆF n (x) F(x) D n bada jaka jest największa odległość pomiędzy dystrybuanta empiryczna i teoretyczna.

Test Kołmogorowa Smirnowa W teście tym badamy, czy dystrybuanty z dwóch prób sa sobie równe. testowa H 0 : F(x) = G(x) H 1 : F(x) G(x) D n,m = sup x ˆF n (x) G ˆ m (x) D n,m bada jaka jest największa odległość pomiędzy dwoma dystrybuantami empirycznymi.

Test Kołmogorowa Smirnowa

Plan Estymatory 1 Estymatory 2

Centralne Twierdzenie Graniczne Centralne Twierdzenie Graniczne jest jednym z najważniejszych twierdzeń w rachunku prawdopodobieństwa. Mówi nam ono nam m.in., że odpowiednio unormowana suma wielu zmiennych losowych o tym samym rozkładzie ma standardowy rozkład normlany ( lim n P X1 +X nσ 2 + +X n ) a = Φ(a), gdzie Φ(a) oznacza dystrybuante standardowego rozkładu normalnego.

Przykład CTG i generowanie rozkładu normalnego Jak już wiemy w komputerze najłatwiej generuje się rozkład jednostajny. Sumujac i odpowiednio normujac zmienne z rozkładu jednostajnego, powinniśmy uzyskać zmienne z rozkładu normalnego. Pokażemy, że suma zaledwie 12 zmiennych z rozkładu jednostajnego ma rozkład normalny U i U[0, 1] 12 X = U i 6 i=1 X N(0, 1)