Centralne twierdzenie graniczne

Podobne dokumenty
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Testowanie hipotez statystycznych.

Metody probabilistyczne

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015

Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017

Zmienne losowe. Powtórzenie. Dariusz Uciński. Wykład 1. Instytut Sterowania i Systemów Informatycznych Universytet Zielonogórski

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego

Wykład 6 Centralne Twierdzenie Graniczne. Rozkłady wielowymiarowe

Dokładne i graniczne rozkłady statystyk z próby

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Statystyka w analizie i planowaniu eksperymentu

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Statystyka w analizie i planowaniu eksperymentu

PEWNE FAKTY Z RACHUNKU PRAWDOPODOBIEŃSTWA

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Estymacja parametrów w modelu normalnym

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

Metody Statystyczne. Metody Statystyczne.

Statystyka. Wykład 2. Krzysztof Topolski. Wrocław, 11 października 2012

Matematyka dla biologów Zajęcia nr 13.

Statystyka matematyczna dla leśników

Testowanie hipotez statystycznych.

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Rachunek prawdopodobieństwa Rozdział 6: Twierdzenia graniczne.

Weryfikacja hipotez statystycznych

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Testowanie hipotez statystycznych.

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Wykłady 14 i 15. Zmienne losowe typu ciągłego

Metody probabilistyczne

Statystyka w analizie i planowaniu eksperymentu

Rozkłady statystyk z próby

Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Rachunek prawdopodobieństwa Rozdział 6: Twierdzenia graniczne.

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

Prawdopodobieństwo i statystyka

Rozkłady prawdopodobieństwa zmiennych losowych

Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

1.1 Wstęp Literatura... 1

Hipotezy statystyczne

Rozkłady statystyk z próby. Statystyka

Lista 5. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

WSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.

Testowanie hipotez statystycznych.

Szkice do zajęć z Przedmiotu Wyrównawczego

Zmienne losowe. dr Mariusz Grzadziel. rok akademicki 2016/2017 semestr letni. Katedra Matematyki, Uniwersytet Przyrodniczy we Wrocławiu

Testowanie hipotez statystycznych. Wprowadzenie

STATYSTYKA wykład 5-6

ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW

Elementy Rachunek prawdopodobieństwa

Prawdopodobieństwo i statystyka r.

Metody probabilistyczne

Hipotezy statystyczne

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wykład 3 Momenty zmiennych losowych.

Wykład 3 Momenty zmiennych losowych.

Przestrzeń probabilistyczna

STATYSTYKA

Estymacja parametrów rozkładu cechy

Zmienne losowe ciągłe i ich rozkłady

Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

II WYKŁAD STATYSTYKA. 12/03/2014 B8 sala 0.10B Godz. 15:15

Zmienne losowe. dr Mariusz Grządziel Wykład 12; 20 maja 2014

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

PRAWDOPODOBIEŃSTWO. ZMIENNA LOSOWA. TYPY ROZKŁADÓW

Zmienne losowe ciągłe i ich rozkłady

Wykład 13. Zmienne losowe typu ciągłego

Ważne rozkłady i twierdzenia

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyczna analiza danych

Testowanie hipotez statystycznych

Pobieranie prób i rozkład z próby

Generatory takie mają niestety okres, po którym sekwencja liczb powtarza się.

Prawdopodobieństwo i statystyka

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Wybrane rozkłady zmiennych losowych. Statystyka

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i statystyka

Statystyka i eksploracja danych

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD STATYSTYK Z PRÓBY

Transkrypt:

Instytut Sterowania i Systemów Informatycznych Universytet Zielonogórski Wykład 4

Ważne uzupełnienie Dwuwymiarowy rozkład normalny N (µ X, µ Y, σ X, σ Y, ρ): f XY (x, y) = 1 2πσ X σ Y 1 ρ 2 { [ (x ) 1 2 µx exp 2(1 ρ 2 ) σ X ( )( ) ( ) x µx y µy y 2 ]} µy 2ρ + σ X σ Y σ Y Można udowodnić, że X N (µ X, σ X ), Y N (µ Y, σ Y ) oraz ρ XY = ρ.

Ważne uzupełnienie Dwuwymiarowy rozkład normalny N (µ X, µ Y, σ X, σ Y, ρ): f XY (x, y) = 1 2πσ X σ Y 1 ρ 2 { [ (x ) 1 2 µx exp 2(1 ρ 2 ) σ X ( )( ) ( ) x µx y µy y 2 ]} µy 2ρ + σ X σ Y σ Y Można udowodnić, że X N (µ X, σ X ), Y N (µ Y, σ Y ) oraz ρ XY = ρ.

N (µ X, µ Y, σ X, σ Y, ρ) σ X = σ Y = 1, ρ = 0

N (µ X, µ Y, σ X, σ Y, ρ) σ X = σ Y = 1, ρ = 0.8

N (µ X, µ Y, σ X, σ Y, ρ) σ X = σ Y = 1, ρ = 0.9

Dwuwymiarowy rozkład normalny Twierdzenie Dla X i Y majacych dwuwumiarowy rozkład normalny zachodzi X, Y niezależne ρ = 0 Twierdzenie Para zmiennych losowych X i Y ma dwuwymiarowy rozkład normalny wtedy i tylko wtedy, gdy każda kombinacja liniowa ax + by (a, b dowolne stałe) ma rozkład normalny.

Dwuwymiarowy rozkład normalny Twierdzenie Dla X i Y majacych dwuwumiarowy rozkład normalny zachodzi X, Y niezależne ρ = 0 Twierdzenie Para zmiennych losowych X i Y ma dwuwymiarowy rozkład normalny wtedy i tylko wtedy, gdy każda kombinacja liniowa ax + by (a, b dowolne stałe) ma rozkład normalny.

Definicja Prosta próba losowa o liczności n nazywamy ciag niezależnych zmiennych losowych X 1, X 2,..., X n określonych na tej samej przestrzeni zdarzeń elementarnych S i takich, że każda ma ten sam rozkład. Pytanie: Co to jest próba reprezentatywna i jak ja wybierać? Statystyka zmienna losowa T (X 1,..., X n ) będaca funkcja próby

Definicja Prosta próba losowa o liczności n nazywamy ciag niezależnych zmiennych losowych X 1, X 2,..., X n określonych na tej samej przestrzeni zdarzeń elementarnych S i takich, że każda ma ten sam rozkład. Pytanie: Co to jest próba reprezentatywna i jak ja wybierać? Statystyka zmienna losowa T (X 1,..., X n ) będaca funkcja próby

Definicja Prosta próba losowa o liczności n nazywamy ciag niezależnych zmiennych losowych X 1, X 2,..., X n określonych na tej samej przestrzeni zdarzeń elementarnych S i takich, że każda ma ten sam rozkład. Pytanie: Co to jest próba reprezentatywna i jak ja wybierać? Statystyka zmienna losowa T (X 1,..., X n ) będaca funkcja próby

Definicja Średnia w proste próbie losowej X 1,..., X n o liczności n nazywamy statystykę Twierdzenie X = X 1 + X 2 +... X n n PRAWO WIELKICH LICZB. Niech X będzie zmienna losowa o skończonej wariancji, σ X <, i niech X 1,..., X n będzie prosta próba losowa z rozkładu zmiennej losowej X. Wówczas dla dowolnie małej dodatniej liczby ε prawdopodobieństwo P ( X należy do [µx ε, µ X + ε] ) jest bliskie 1 dla dużych liczności próby n.

Definicja Średnia w proste próbie losowej X 1,..., X n o liczności n nazywamy statystykę Twierdzenie X = X 1 + X 2 +... X n n PRAWO WIELKICH LICZB. Niech X będzie zmienna losowa o skończonej wariancji, σ X <, i niech X 1,..., X n będzie prosta próba losowa z rozkładu zmiennej losowej X. Wówczas dla dowolnie małej dodatniej liczby ε prawdopodobieństwo P ( X należy do [µx ε, µ X + ε] ) jest bliskie 1 dla dużych liczności próby n.

Stwierdzenie Zachodzi µ X = µ, σ X = σ n Przykład Wzrost dorosłych Polaków ma rozkład N (176 cm, 6.5 cm). Obliczyć prawdopodobieństwo, że średnia X dla prostej próby losowej o liczności 100 różni się od prawdziwej wartości µ = 176 cm o więcej niż 1.5 cm.

Stwierdzenie Zachodzi µ X = µ, σ X = σ n Przykład Wzrost dorosłych Polaków ma rozkład N (176 cm, 6.5 cm). Obliczyć prawdopodobieństwo, że średnia X dla prostej próby losowej o liczności 100 różni się od prawdziwej wartości µ = 176 cm o więcej niż 1.5 cm.

Przykład (c.d.) Średnia X ma rozkład normalny jako kombinacja liniowa zmiennych X 1,..., X n o rozkładzie normalnym. Co więcej, µ X = 176 oraz σ X = 6.5/ 100 = 0.65. P( X µ X > 1.5) = 1 P( X µ X 1.5) ( = 1 P 1.5 0.65 X µ X 0.65 = 1 P( 2.31 Z 2.31) ) 1.5 0.65 = 1 [ Φ(2.31) Φ( 2.31) ] = 0.0208 Pytanie: Jak postępować bez informacji o rozkładzie obserwacji?

Przykład (c.d.) Średnia X ma rozkład normalny jako kombinacja liniowa zmiennych X 1,..., X n o rozkładzie normalnym. Co więcej, µ X = 176 oraz σ X = 6.5/ 100 = 0.65. P( X µ X > 1.5) = 1 P( X µ X 1.5) ( = 1 P 1.5 0.65 X µ X 0.65 = 1 P( 2.31 Z 2.31) ) 1.5 0.65 = 1 [ Φ(2.31) Φ( 2.31) ] = 0.0208 Pytanie: Jak postępować bez informacji o rozkładzie obserwacji?

Przykład (c.d.) Średnia X ma rozkład normalny jako kombinacja liniowa zmiennych X 1,..., X n o rozkładzie normalnym. Co więcej, µ X = 176 oraz σ X = 6.5/ 100 = 0.65. P( X µ X > 1.5) = 1 P( X µ X 1.5) ( = 1 P 1.5 0.65 X µ X 0.65 = 1 P( 2.31 Z 2.31) ) 1.5 0.65 = 1 [ Φ(2.31) Φ( 2.31) ] = 0.0208 Pytanie: Jak postępować bez informacji o rozkładzie obserwacji?

Rozkład S 1 = X 1

Rozkład S 2 = X 1 + X 2

Rozkład S 2 = X 1 + X 2 + X 3

Rozkład S 2 = X 1 + X 2 + X 3 + X 4

Rozkład S 2 = X 1 + X 2 + X 3 + X 4 + X 5

Twierdzenie CENTRALNE TWIERDZENIE GRANICZNE. Niech X 1,..., X n będzie prosta próba losowa z rozkładu o średniej µ i skończonej wariancji σ 2. Wówczas dla dużych liczności próby n rozkład sumy S n := X 1 + + X n jest bliski N (nµ, nσ). Oznacza to, że rozkład standaryzowanej średniej ( X µ)/(σ/ n) jest bliski standaryzowanemu rozkładowi normalnemu N (0, 1). Ściślej, dla dowolnych liczb a i b (a b), i zmiennej Z o standardowym rozkładzie normalnym P ( a X ) µ σ/ n b P(a Z b) = Φ(b) Φ(a) dla n. Równoważnie, rozkład średniej X jest w przybliżeniu równy rozkładowi N (µ, σ/ n).

Twierdzenie CENTRALNE TWIERDZENIE GRANICZNE. Niech X 1,..., X n będzie prosta próba losowa z rozkładu o średniej µ i skończonej wariancji σ 2. Wówczas dla dużych liczności próby n rozkład sumy S n := X 1 + + X n jest bliski N (nµ, nσ). Oznacza to, że rozkład standaryzowanej średniej ( X µ)/(σ/ n) jest bliski standaryzowanemu rozkładowi normalnemu N (0, 1). Ściślej, dla dowolnych liczb a i b (a b), i zmiennej Z o standardowym rozkładzie normalnym P ( a X ) µ σ/ n b P(a Z b) = Φ(b) Φ(a) dla n. Równoważnie, rozkład średniej X jest w przybliżeniu równy rozkładowi N (µ, σ/ n).

Twierdzenie CENTRALNE TWIERDZENIE GRANICZNE. Niech X 1,..., X n będzie prosta próba losowa z rozkładu o średniej µ i skończonej wariancji σ 2. Wówczas dla dużych liczności próby n rozkład sumy S n := X 1 + + X n jest bliski N (nµ, nσ). Oznacza to, że rozkład standaryzowanej średniej ( X µ)/(σ/ n) jest bliski standaryzowanemu rozkładowi normalnemu N (0, 1). Ściślej, dla dowolnych liczb a i b (a b), i zmiennej Z o standardowym rozkładzie normalnym P ( a X ) µ σ/ n b P(a Z b) = Φ(b) Φ(a) dla n. Równoważnie, rozkład średniej X jest w przybliżeniu równy rozkładowi N (µ, σ/ n).

Twierdzenie CENTRALNE TWIERDZENIE GRANICZNE. Niech X 1,..., X n będzie prosta próba losowa z rozkładu o średniej µ i skończonej wariancji σ 2. Wówczas dla dużych liczności próby n rozkład sumy S n := X 1 + + X n jest bliski N (nµ, nσ). Oznacza to, że rozkład standaryzowanej średniej ( X µ)/(σ/ n) jest bliski standaryzowanemu rozkładowi normalnemu N (0, 1). Ściślej, dla dowolnych liczb a i b (a b), i zmiennej Z o standardowym rozkładzie normalnym P ( a X ) µ σ/ n b P(a Z b) = Φ(b) Φ(a) dla n. Równoważnie, rozkład średniej X jest w przybliżeniu równy rozkładowi N (µ, σ/ n).

Przykład Przyjmijmy, że rozkład codziennego dojazdu do pracy jest w przybliżeniu rozkładem jednostajnym na odcinku [0.5 godz., 1 godz.] i że czasy dojazdów w różne dni sa niezależne. Ile w przybliżeniu wynosi prawdopodobieńtstwo zdarzenia, że średni dzienny dojazd w ciagu 30 dni przekroczy 48 minut? Niech X i czas dojazdu w i-tym dniu, i = 1,..., 30. Mamy µ Xi = 0.5 + 1 2 = 3 4, σ2 X i = (1 0.5)2 12 = 1 48

Przykład Przyjmijmy, że rozkład codziennego dojazdu do pracy jest w przybliżeniu rozkładem jednostajnym na odcinku [0.5 godz., 1 godz.] i że czasy dojazdów w różne dni sa niezależne. Ile w przybliżeniu wynosi prawdopodobieńtstwo zdarzenia, że średni dzienny dojazd w ciagu 30 dni przekroczy 48 minut? Niech X i czas dojazdu w i-tym dniu, i = 1,..., 30. Mamy µ Xi = 0.5 + 1 2 = 3 4, σ2 X i = (1 0.5)2 12 = 1 48

Przykład (c.d.) Interesuje nas prawdopodobieństwo P( X > 0.8) (48 minut to 0.8 godz.). ( Z CTG wiemy, że średnia X ma w przybliżeniu ) 3 rozkład N 4, 1 30 48. W konsekwencji, P( X > 0.8) = P X 3/4 1 30 48 > P(Z > 1.89) = 0.03 0.8 3/4 1 30 48

Przykład (c.d.) Interesuje nas prawdopodobieństwo P( X > 0.8) (48 minut to 0.8 godz.). ( Z CTG wiemy, że średnia X ma w przybliżeniu ) 3 rozkład N 4, 1 30 48. W konsekwencji, P( X > 0.8) = P X 3/4 1 30 48 > P(Z > 1.89) = 0.03 0.8 3/4 1 30 48

Rozważmy sytuację, gdy zmienna losowa X, z rozkładu której pochodzi rozważana próba losowa, przyjmuje tylko dwie wartości: 1 i 0. Oznaczmy p = P(x = 1), q = 1 p = P(X = 0) Interpretacja: Część jednostek w populacji ma pewna własność (dla nich X = 1), a częsć nie (dla nich X = 0). Liczbę p nazywa się proporcja. Przypomnijmy, że µ X = p oraz σ 2 X = pq = p(1 p).

Rozważmy sytuację, gdy zmienna losowa X, z rozkładu której pochodzi rozważana próba losowa, przyjmuje tylko dwie wartości: 1 i 0. Oznaczmy p = P(x = 1), q = 1 p = P(X = 0) Interpretacja: Część jednostek w populacji ma pewna własność (dla nich X = 1), a częsć nie (dla nich X = 0). Liczbę p nazywa się proporcja. Przypomnijmy, że µ X = p oraz σ 2 X = pq = p(1 p).

Rozważmy sytuację, gdy zmienna losowa X, z rozkładu której pochodzi rozważana próba losowa, przyjmuje tylko dwie wartości: 1 i 0. Oznaczmy p = P(x = 1), q = 1 p = P(X = 0) Interpretacja: Część jednostek w populacji ma pewna własność (dla nich X = 1), a częsć nie (dla nich X = 0). Liczbę p nazywa się proporcja. Przypomnijmy, że µ X = p oraz σ 2 X = pq = p(1 p).

Przykłady: populacja elementów wyprodukowanych w pewnej w danym miesiacu, z których pewna proporcja p jest wadliwa; populacja Polaków, z których pewna proporcja p jest leworęczna; populacja studentów szkół wyższych w Polsce, z których pewna proporcja p nie zdała przynajmniej jednego egzaminu w poprzednim semestrze. Definicja Częstościa występowania w prostej próbie losowej nazywamy statystykę ni=1 X i ˆp = n gdzie: X 1,..., X n prosta próba losowa z rozkładu dwupunktowego o wartościach 0 i 1.

Przykłady: populacja elementów wyprodukowanych w pewnej w danym miesiacu, z których pewna proporcja p jest wadliwa; populacja Polaków, z których pewna proporcja p jest leworęczna; populacja studentów szkół wyższych w Polsce, z których pewna proporcja p nie zdała przynajmniej jednego egzaminu w poprzednim semestrze. Definicja Częstościa występowania w prostej próbie losowej nazywamy statystykę ni=1 X i ˆp = n gdzie: X 1,..., X n prosta próba losowa z rozkładu dwupunktowego o wartościach 0 i 1.

Twierdzenie Dla dowolnych rzeczywistych a i b gdy n. P a ˆp p p(1 p) n b Φ(b) Φ(a) Do samodzielnego opracowania: nierówność Czebyszewa poprawka w przybliżeniu normalnym metody zbierania danych

Twierdzenie Dla dowolnych rzeczywistych a i b gdy n. P a ˆp p p(1 p) n b Φ(b) Φ(a) Do samodzielnego opracowania: nierówność Czebyszewa poprawka w przybliżeniu normalnym metody zbierania danych