WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD STATYSTYK Z PRÓBY

Podobne dokumenty
Rozkłady statystyk z próby. Statystyka

STATYSTYKA wykład 5-6

Wnioskowanie statystyczne. Statystyka w 5

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Rozkłady statystyk z próby

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Statystyka matematyczna

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Dokładne i graniczne rozkłady statystyk z próby

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

WYKŁAD 5 TEORIA ESTYMACJI II

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

L.Kowalski zadania z rachunku prawdopodobieństwa-zestaw 3 ZADANIA - ZESTAW 3

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Zadania ze statystyki, cz.6

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Estymacja punktowa i przedziałowa

Statystyka matematyczna

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Ćwiczenia 3 ROZKŁAD ZMIENNEJ LOSOWEJ JEDNOWYMIAROWEJ

Statystyka matematyczna dla leśników

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Pobieranie prób i rozkład z próby

Estymacja parametrów rozkładu cechy

Elektrotechnika II [ Laboratorium Grupa 1 ] 2016/2017 Zimowy. [ Laboratorium Grupa 2 ] 2016/2017 Zimowy

Testowanie hipotez statystycznych.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Metody Statystyczne. Metody Statystyczne.

Estymacja parametro w 1

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka w analizie i planowaniu eksperymentu

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Metody probabilistyczne

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

1.1 Wstęp Literatura... 1

L.Kowalski zadania ze statystyki matematycznej-zestaw 2 ZADANIA - ZESTAW 2

Weryfikacja hipotez statystycznych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Centralne twierdzenie graniczne

Wydział Matematyki. Testy zgodności. Wykład 03

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych.

Estymacja przedziałowa. Przedział ufności

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Przedziały ufności. Poziom istotności = α (zwykle 0.05) Poziom ufności = 1 α Przedział ufności dla parametru μ = taki przedział [a,b], dla którego

Statystyka matematyczna i ekonometria

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ESTYMACJA

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Teoria Estymacji. Do Powyżej

Zadanie Punkty Ocena

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez statystycznych cd.

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Podstawy statystyki - ćwiczenia r.

Metody Statystyczne. Metody Statystyczne

STATYSTYKA MATEMATYCZNA

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych.

1 Estymacja przedziałowa

Wybrane rozkłady zmiennych losowych. Statystyka

Wybrane rozkłady zmiennych losowych. Statystyka

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Metody probabilistyczne

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

LABORATORIUM 6 ESTYMACJA cz. 2

STATYSTYKA MATEMATYCZNA

g) wartość oczekiwaną (przeciętną) i wariancję zmiennej losowej K.

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Statystyka matematyczna

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Hipotezy statystyczne

Transkrypt:

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD STATYSTYK Z PRÓBY

Próba losowa prosta To taki dobór elementów z populacji, że każdy element miał takie samo prawdopodobieństwo znalezienia się w próbie Niezależne losowanie (czyli raz wylosowany element wraca do populacji i może ponownie brać udział w losowaniu) Musi być reprezentatywna

Przestrzeń próby losowej Zbiór wszystkich możliwych konkretnych prób losowych

Statystyka z próby To zmienna losowa Z n, która jest funkcją zmiennychx 1, X 2, X 3, X n, stanowiących próbę losową Np.: Średnia z próby wariancja z próby

Rozkład z próby Statystyka sama jest zmienną losową, czyli ma pewien rozkład Dokładny Graniczny - Mała próba - Duża próba - Ustalone n - n

Rozkład graniczny Inny rozkład niż normalny, często nieznany Zależny od liczebności próby i często zbieżny do rozkładu granicznego Przy dużej próbie upodabnia się do rozkładu normalnego o postaci N(m; δ n )

Rozkład graniczny dla rozkładu dwumianowego Duża próba dla rozkładu dwumianowego Rozkład ma w przybliżeniu postać rozkładu normalnego N p; p 1 p n

Rozkład średniej arytmetycznej Rozważmy cechę X która ma rozkład normalny X: N(m, δ) Losujemy próbę o wielkości n E( X) = E( 1 n i=1 n X i ) = 1 n i=1 n E(X i )= 1 n nm = m D 2 ( X)=D 2 ( 1 n D X = δ2 n X: N(m; δ n ) i=1 n = δ n X i ) = 1 n 2 i=1 n D 2 X i = 1 n 2 nδ2 = δ2 n

Rozkład średniej arytmetycznej z nieznanym odchyleniem standardowym X ma rozkład normalny X: N(m, δ) Znamy m, nie znamy δ Obliczamy (odczytujemy z treści zadania) odchylenie standardowe s dla próby Stopnie swobody v=n-1

Graniczny rozkład średniej z próby Dla dowolnego rozkładu X, znane m i δ, oraz przy n X~N(m; δ n )

Rozkład różnicy średnich arytmetycznych z dwóch populacji ze znanymi odchyleniami standardowymi X 1 : N(m 1 ; δ 1 ) X 2 : N(m 2 ; δ 2 ) X 1 X 2 : N m 1 m 2 ; δ 1 2 2 n 1 + δ 2 n 2 U = X 1 X 2 (m 1 m 2 ) δ 1 2 2 n1 +δ 2 n2 )

Rozkład różnicy średnich arytmetycznych z dwóch populacji z nieznanymi odchyleniami standardowymi X 1 : N(m 1 ; δ) X 2 : N(m 2 ; δ)

Rozkład graniczny różnicy średnich X 1 i X 2 mają dowolne rozkłady Znane nam są m 1, m 2, δ 1, δ 2 n 1, n 2 X 1 X 2 ~N m 1 m 2 ; δ 1 2 2 n 1 + δ 2 n 2

Rozkład wariancji z próby To pewne porównanie wariancji z próby do wariancji rozkładu

Rozkład ilorazu wariancji Aby porównać wariancję z dwóch prób, opieramy się na rozkładzie ich ilorazu

Zadanie 1 (2.25/33) Waga batoników,,bajkowy (w gramach) jest zmienną losową o rozkładzie N(100,2) a) Miłośnik,,Bajkowych reklamuje produkt, gdy tylko stwierdzi niedowagę co najmniej 5g. Jak często zdarza mu się składać reklamację? 95 100 P(X < 95) = P U < 2 = P U < 2,5 = = 1 ϕ 2,5 = 1 0, 9938 = 0,0062 Odp.: Reklamacja występuje przeciętnie 62 na 10 000 razy

b) Jakie są szanse, że klient trafi na batonik o wadze dokładnie 100,2 g? P(X=100,2)=0

c) Batoniki pakowane są w kartonie po 100 sztuk. Jeśli obliczana będzie przeciętna waga batonika w kartonie, to jaki rozkład ma taka średnia? Jakie jest prawdopodobieństwo, że średnia ta przekroczy 100,2 g? X: N(m; δ n ) 2 X: N 100; 100 = X: N 100; 0,2 100,2 100 P X > 100,2 = P U > 0,2 = 1 ϕ 1 = 1 0,8413 = 0,1587 = P U > 1 Odp.: Prawdopodobieństwo, że średnia przekroczy 100,2 g wynosi 15,87%.

Zadanie 2 (2.32/33) W pewnym kraju dwaj kandydaci, A i B, na prezydenta cieszą się jednakowym, 50-procentowym poparciem wyborców. a) Jakie jest prawdopodobieństwo, że wśród 5 przypadkowych osób, zapytanych o zdanie, 3 osoby będą popierać kandydata B, a 2 kandydata A? B sukces, n = 5, k = 3 P k = 3 = 5 3 0,53 0,5 5 2 = 0,3125 Odp.: Prawdopodobieństwo, że wśród 5 przypadkowych osób, zapytanych o zdanie, 3 osoby będą popierać kandydata B, a 2 kandydata A wynosi 31,25%

b) Jakie jest prawdopodobieństwo, że przedwyborczy sondaż przeprowadzony na 625-osobowej losowo wybranej próbie wyborców wskaże, że kandydat B ma poparcie wyższe niż 53%? n=625 E X = p = 0,5 D X = p(1 p) n X~N 0,5; 0,02 = P X > 0,53 = P U > 0,5(1 0,5) 625 0,53 0,5 0,02 = 0,02 = P U > 1,5 = 1 ϕ 1,5 = 0,0668 Odp.: Prawdopodobieństwo, że przedwyborczy sondaż przeprowadzony na 625-osobowej losowo wybranej próbie wyborców wskaże, że kandydat B ma poparcie wyższe niż 53% wynosi 6,68%.

Zadanie 3 (2.29/33) Miesięczne zużycie wody na osobę (w m 3 ) w gospodarstwach domowych na pewnym osiedlu ma rozkład N(10,4). Dokonano remontu sieci wodnokanalizacyjnej i zamontowano liczniki wody, co ograniczyło jej marnotrawstwo. Ocenia się, że miesięczne zużycie wody na osobę po remoncie ma rozkład N(8,3). Obliczyć prawdopodobieństwo, że średnie miesięczne zużycie wody przez 36 losowo wybranych osób zmniejszyło się co najmniej o 2,5m 2, w porównaniu ze średnim miesięcznym zużyciem wody przed remontem, również przez 36 innych, losowo wybranych osób.

P X 1 X 2 > 2,5 =? X 1 X 2 : N m 1 m 2 ; δ 1 2 2 n 1 + δ 2 n 2 X 1 X 2 : N 10 8; 4 2 36 + 32 36 X 1 X 2 : N 2; 5 6 P U > 2,5 2 5 6 = P U > 0,6 = 1 ϕ 0,6 = 1 0,7257 = 0,2743 Odp.: Prawdopodobieństwo, że średnie miesięczne zużycie wody przez 36 losowo wybranych osób zmniejszyło się co najmniej o 2,5m 2, w porównaniu ze średnim miesięcznym zużyciem wody przed remontem wynosi 27,43%.

Zadanie 4 (2.30/33) Zmienne X 1, X 2 mają rozkłady normalne odpowiednio N(100,10) i N(80,10). Przy założeniu, że pobrane niezależnie próby losowe liczyły po 25 jednostek, obliczyć wartość wyrażenia: P(17 < X 1 X 2 < 23). X 1 X 2 : N 100 80; 10 2 25 + 102 25 X 1 X 2 : N 20; 2 2 P(17 < X 1 X 2 < 23) = P X 1 X 2 < 23 P(X 1 X 2 < 17) = P U < 23 20 2 2 P U < 17 20 2 2 = 2ϕ 1,06 1 = 0,7108 Odp.: P 17 < X 1 X 2 < 23 = 0,7108 = ϕ 1,06 1 ϕ 1,06

Zadanie 5 (2.28/33) Zmienna losowa t Studenta jest określona przez 13 stopni swobody. Obliczyć poniższe prawdopodobieństwa i przedstawić graficznie: a) P t t α,v = α P t 2,16 = 0,05 b) P t < t α,v = 1 α P t < 2,16 = 0,95 c) P t t α,v = α 2 P t 2,16 = 0,025 d) P t < t α,v = 1 α 2 P t < 2,16 = 0,975

Zadanie 6 (2.45/37) Czas poświęcony na sprawdzanie pracy egzaminacyjnej ze statystyki (X - w min) ma nieznany rozkład, ale wiadomo, że jego wartość oczekiwana wynosi 20min, natomiast odchylenie standardowe 2min. a) Jaki rozkład ma zmienna Y (łączny czas sprawdzania egzaminu 100 studentów uczestniczących w wykładzie ze statystyki) i jakie są parametry tego rozkładu? Jakie jest uzasadnienie takiego rozumowania? m = 20, δ = 2, n = 100

(Przypomnienie) Graniczny rozkład średniej z próby Dla dowolnego rozkładu X i przy n X~N(m, δ n ) Y to suma z X 1, X 2, X 3, X n, Y~N(mn, δ n n)

Zadanie 6 (2.45/37) Czas poświęcony na sprawdzanie pracy egzaminacyjnej ze statystyki (X - w min) ma nieznany rozkład, ale wiadomo, ze jego wartość oczekiwana wynosi 20min, natomiast odchylenie standardowe 2min. a) Jaki rozkład ma zmienna Y (łączny czas sprawdzania egzaminu 100 studentów uczestniczących w wykładzie ze statystyki) i jakie są parametry tego rozkładu? Jakie jest uzasadnienie takiego rozumowania? m = 20, δ = 2, n = 100 Y~N 20 100; n duże 2 100 100 => Y~N 2000; 20

b)obliczyć prawdopodobieństwo, że abstrahując od zmęczenia wykładowcy, studenci poznają wyniki po 3 dniach, jeśli wykładowca poświęci na sprawdzanie prac 11 godzin dziennie (33 godziny=1980 min). P Y < 1980 =? P Y < 1980 = P U < 1980 2000 0,2 = 1 ϕ(1)=0,1587 =P U < 1 Odp.: Prawdopodobieństwo, że abstrahując od zmęczenia wykładowcy, studenci poznają wyniki po 3 dniach, jeśli wykładowca poświęci na sprawdzanie prac 11 godzin dziennie wynosi 15,87%.

c) Jaki rozkład i o jakich parametrach ma zmienna oznaczająca średni czas sprawdzania pracy obliczony dla 100 studentów? X~N(m; δ n ) X~N(20; 2 100 ) X~N(20; 0,2)

d) Obliczyć prawdopodobieństwo, że średni czas sprawdzania pracy dla 100 wylosowanych prac nie przekroczy 19,5 min. X~N(20; 0,2) 19,5 20 P X < 19,5 = P U < 0,2 = P U < 2,5 = 1 ϕ 2,5 = 0,0062 Odp.: Prawdopodobieństwo, że średni czas sprawdzania pracy dla 100 wylosowanych prac nie przekroczy 19,5 min wynosi 0,62%.

e) Skomentować relację między odchyleniem standardowym zmiennej X oraz odchyleniem standardowym średniej ze 100-elementowej próby. D X = 2 D X = 0,2 n = 100 D X = D X n

Zadanie 7 (2.46/37) Wielu licealistów w czasie wakacji pracuje przy zbiorach owoców. Średni zarobek w ciągu dnia to 80 zł, przy odchyleniu standardowym 10 zł. Obliczyć prawdopodobieństwo, że: a) Średnia wartość danych zarobków dla 100 losowo wybranych licealistów będzie zawierać się w przedziale od 79 do 82 zł. m = 80, δ = 10 X~N(80; 10 100 ) => X~N(80; 1) P 79 < X < 82 = P X < 82 P X < 79 = P U < 82 80 1 P U < 79 80 1 = ϕ 2 1 ϕ 1 = 0,8185 Odp.: Prawdopodobieństwo, że Średnia wartość danych zarobków dla 100 losowo wybranych licealistów będzie zawierać się w przedziale od 79 do 82 zł wynosi 81,85%.

b) Łączne zarobki 100 losowo wybranych licealistów przekroczą 7950 zł. 1. Y~N(8000; 100) P Y > 7950 =? 2. X~N(80; 1) P X > 79,5 =?

Dziękujemy za uwagę! Zadania zostały zaczerpnięte ze zbioru Statystyka. Lubię to! dr Marii Wieczorek. Anna Bylina Zofia Tokaj