Wykład 6 Centralne Twierdzenie Graniczne. Rozkłady wielowymiarowe

Podobne dokumenty
Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A

Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład

12DRAP - parametry rozkładów wielowymiarowych

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Wykład 3 Jednowymiarowe zmienne losowe

Y \ X , 2 0, 1 0, 1 1 0, 1 0, 3 0, 2. E(XY ) = i,j. x i y j p ij. i wtedy. x i y j p (X) = i,j. y j p (Y ) i wtedy

Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne

Centralne twierdzenie graniczne

P (A B) = P (A), P (B) = P (A), skąd P (A B) = P (A) P (B). P (A)

Rachunek prawdopodobieństwa Rozdział 6: Twierdzenia graniczne.

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

Rozkłady prawdopodobieństwa zmiennych losowych

Procesy stochastyczne

Rachunek prawdopodobieństwa Rozdział 6: Twierdzenia graniczne.

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

Procesy stochastyczne

Szkice do zajęć z Przedmiotu Wyrównawczego

Wartość oczekiwana Mediana i dominanta Wariancja Nierówności związane z momentami. Momenty zmiennych losowych Momenty wektorów losowych

Podstawowe modele probabilistyczne

Prawa wielkich liczb, centralne twierdzenia graniczne

Metody probabilistyczne

Zestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) =

4,5. Dyskretne zmienne losowe (17.03; 31.03)

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Dyskretne zmienne losowe

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

WYKŁAD 2. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Prawdopodobieństwo i statystyka

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Deska Galtona. Adam Osękowski. Instytut Matematyki, Wydział Matematyki, Informatyki i Mechaniki Uniwersytet Warszawski

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Ważne rozkłady i twierdzenia c.d.

5 Przegląd najważniejszych rozkładów

Rozkłady statystyk z próby

Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

1 Zmienne losowe wielowymiarowe.

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Wstęp do Rachunku Prawdopodobieństwa, IIr. WMS

Wykład 7: Warunkowa wartość oczekiwana. Rozkłady warunkowe.

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

Rozdział 1. Zmienne losowe, ich rozkłady i charakterystyki. 1.1 Definicja zmiennej losowej

Oznacza to, że chcemy znaleźć minimum, a właściwie wartość najmniejszą funkcji

1 Gaussowskie zmienne losowe

Rozkłady łaczne wielu zmiennych losowych

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,

Ważne rozkłady i twierdzenia

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

WYKŁAD 3. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe

6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego

Wykład 11: Martyngały: definicja, twierdzenia o zbieżności

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty

Komputerowa analiza danych doświadczalnych

Statystyka i eksploracja danych

Komputerowa analiza danych doświadczalnych

Rachunek Prawdopodobieństwa Rozdział 5. Rozkłady łączne

Zagadnienia brzegowe dla równań eliptycznych

Testowanie hipotez statystycznych.

PEWNE FAKTY Z RACHUNKU PRAWDOPODOBIEŃSTWA

WYKŁAD 2 i 3. Podstawowe pojęcia związane z prawdopodobieństwem. Podstawy teoretyczne. autor: Maciej Zięba. Politechnika Wrocławska

Matematyka dla biologów Zajęcia nr 13.

RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 3.

Prawdopodobieństwo i statystyka

Rachunek prawdopodobieństwa - Teoria - Przypomnienie.. A i B są niezależne, gdy P(A B) = P(A)P(B). P(A B i )P(B i )

Komputerowa Analiza Danych Doświadczalnych

Laboratorium nr 7. Zmienne losowe typu skokowego.

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Wybrane rozkłady zmiennych losowych. Statystyka

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014

Lista 5. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Metody Statystyczne. Metody Statystyczne.

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Rachunek prawdopodobieństwa 1B; zadania egzaminacyjne.

Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.

III. ZMIENNE LOSOWE JEDNOWYMIAROWE

Spis treści 3 SPIS TREŚCI

STATYSTYKA wykład 5-6

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i statystyka

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

Przestrzeń probabilistyczna

Funkcja tworząca Funkcja charakterystyczna. Definicja i własności Funkcja tworząca momenty

Matematyka dla biologów Zajęcia nr 12.

Rachunek prawdopodobieństwa i statystyka

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Rachunek prawdopodobieństwa Rozdział 3. Prawdopodobieństwo warunkowe i niezależność zdarzeń.

Przykłady 6.1 : charakterystyki liczbowe rozkładów dyskretnych

Rachunek prawdopodobieństwa i statystyka

Metody probabilistyczne

Ćwiczenia: Ukryte procesy Markowa lista 1 kierunek: matematyka, specjalność: analiza danych i modelowanie, studia II

Biostatystyka, # 3 /Weterynaria I/

Niezależność zmiennych, funkcje i charakterystyki wektora losowego, centralne twierdzenia graniczne

Rozkłady wielu zmiennych

Wykład 3 Momenty zmiennych losowych.

Matematyka dyskretna

Aby przygotować się do kolokwiów oraz do egzaminów należy ponownie przeanalizować zadania

Transkrypt:

Wykład 6 Centralne Twierdzenie Graniczne. Rozkłady wielowymiarowe Nierówność Czebyszewa Niech X będzie zmienną losową o skończonej wariancji V ar(x). Wtedy wartość oczekiwana E(X) też jest skończona i dla każdego t > 0 zachodzi nierówność: Równoważnie: P ( X E(X) > t) V ar(x) t 2. P ( X E(X) t) V ar(x) t 2. Zastosowanie nierówności Czebyszewa Chcemy wykonać 0 000 rzutów symetryczną moneta. Jakie jest prawdopodobieństwo tego, że liczba uzyskanych orłów będzie zawarta w przedziale: [4000, 6000]? [40, 50]? [4900, 500]? [49, 5]? Rozwiązanie Liczba orłów w 0 000 rzutów ma rozkład Bernoulliego z parametrami p = 2 Stąd oraz n = 0 000. Zatem,00000000000000 ( ) ( ) 0 000 0 000 P (S 0 000 = k) = = p k. k 2 P (4000 S 0 000 6000) = 6000 k=4000 (4 zer) wynik programu Mathematica p k = W przypadku przedziału [40, 50] wynik taki sam. W przypadku przedziału [4900, 500] 0,95557420095392. W przypadku przedziału [49, ] 0,687479048932. W przypadku przedziału [48, 5] 0,99738926209332. A gdy nie mamy komputera? Zastosujemy nierówność Czebyszewa dla E(S n ) = np = 00, V ar(s n ) = np( p) = 20. P (4000 S 0 000 6000) = = P ( S 0 000 00 000) 20 000 2 = 25 = 0, 9975. 0000

P (40 S 0 000 50) = = P ( S 0 000 00 0) 20 0 2 = = 0, 99. 00 P (4900 S 0 000 500) = = P ( S 0 000 00 00) 20 00 2 = = 0, 75. 4 Czy to przypadek? Powróćmy do obliczeń dokładnych: dla odchylenia liczby orłów od średniej 00: o ± dostaliśmy prawdopodobieństwo 0,687479048932; o ±00 dostaliśmy prawdopodobieństwo 0,95557420095392; o ± dostaliśmy prawdopodobieństwo 0,99738926209332. Podobne liczby już spotkaliśmy. Kiedy? Tutaj mamy σ = 20 =. Deska Galtona Przy doświadczeniu z deską Galtona Słupki wskazujące częstości kul w kolejnych przegródkach układały się w kształcie krzywej Gaussa. Tak jest nie tylko dla monety z p = 2, ale ogólnie w przypadku schematu Bernoulliego (po odpowiednim unormowaniu). Odkryto to w XVIII wieku. Twierdzenie de Moivre a Laplace a Jeżeli S n oznacza liczbę sukcesów w schemacie Bernoulliego z parametrami n oraz p (0, ), to dla dowolnych a < b mamy lim P n ( a < S ) n np b < b = e x2 2 dx = Φ(b) Φ(a). np( p) a 2π Zastosowanie do zadania. W zadaniu mieliśmy n = 0 000, p = 2, skąd E(S 0 000) = 00 i np( p) =. Zatem twierdzenie de Moivre a Laplace a mówi, że P (4000 S 0 000 6000) = ( 4000 00 = P S ) 0 000 00 6000 00 ( P ( 20 Z 20) = Podobnie P (4900 S 0 000 500) = ( 4900 00 = P S ) 0 000 00 500 00 ( P ( 2 Z 2) = 0, 95... 2

P (49 S 0 000 ) = ( 49 00 = P S ) 0 000 00 00 ( P ( Z ) = 0, 68... Kiedy wolno stosować twierdzenie de Moivre a Laplace a? Zauważmy, że równość mamy dopiero w granicy! Okazuje się jednak, że zbieżność jest zwykle tak szybka, iż dla n > 30 mamy całkiem niezłe przybliżenia. Centralne Twierdzenie Graniczne Jeżeli X, X 2,..., X n,... są niezależnymi zmiennymi losowymi o jednakowym rozkładzie, o średniej E(X ) i wariancji σ 2 to dla dowolnych a < b mamy Co znaczy w praktyce CTG? ( lim P a < X +... + X n ne(x ) n σ n b a 2π e x2 2 dx = Φ(b) Φ(a). ) < b = CTG mówi, że gdy dodajemy dużo niezależnych zmiennych o jednakowym rozkładzie, to odpowiednio unormowana suma ma w przybliżeniu rozkład normalny. Twierdzenie wyjaśna więc, dlaczego rozkład normalny jest tak powszechny (jest normalny ). Na przykład, na błąd pomiaru wpływ ma wiele niezleżnych czynników, które się sumują. Na wzrost człowieka też. A na wagę człowieka? Wektor losowy Załóżmy, że dane są dwie zmienne losowe X i Y oraz ich łączny rozkład, to znaczy opisane są wartości obu zmiennych i prawdopodobieństwa z jakimi te wartości są przyjmowane: po wszystkich możliwych x i, y j oraz i, j P (X = x i, Y = y j ) = p ij Wektor losowy Takie zmienne możemy zapisać w postaci wektora o dwóch współrzędnych (X, Y ): P ((X, Y ) = (x i, y j )) = p ij. Wektor losowy Gdy wektor (X, Y ) przyjmuje tylko skończenie wiele wartości, to jego rozkład wygodnie jest przedstawić za pomocą tabelki: Y \ X 0 2 3

Jakie liczby mogą pojawić się w pustych miejscach tabelki? Wektor losowy Załóżmy, że dany jest wektor (X, Y ) i jego rozkład Y \ X 0 2 0, 2 0, 0, 0, 0, 3 0, 2 Jakie wartości przyjmuje X, a jakie Y? Z jakimi prawdopodobieństwami? Zadanie: Opisać rozkłady zmiennych X i Y. Rozwiązanie Y \ X 0 2 0, 2 0, 0, 0, 0, 3 0, 2 Rozkład zmiennej X możemy przedstawić w tabelce: x i 0 2 p i 0, 3 0, 4 0, 3 Rozkłady brzegowe Rozkład pojedynczej zmiennej X (lub Y ) nazywamy rozkładem brzegowym wektora (X, Y ). W rozważanym zadaniu mamy Dla zmiennej X: Dla zmiennej Y : x i 0 2 p i 0, 3 0, 4 0, 3 y j p j 0, 4 0, 6 Obliczenia dla rozkładów brzegowych Znając rozkłady brzegowe wektora (X, Y ), to znaczy rozkłady zmiennych X oraz Y, możemy obliczyć ich: wartości oczekiwane, wariancje, inne parametry. Ponieważ x i 0 2 p i 0, 3 0, 4 0, 3, więc E(X) = 0 0, 3 + 0, 4 + 2 0, 3 =, V ar(x) = (0 ) 2 0, 3 + ( ) 2 0, 4 + (2 ) 2 0, 3 = 0, 3 + 0, 3 = 0, 6. Podobnie liczymy E(Y ) =... oraz V ar(y ) =... Rozkład sumy X + Y Gdy dany jest rozkład łączny (X, Y ), to możemy łatwo obliczyć rozkłady 4

sumy X + Y, różnicy X Y, iloczynu XY, ilorazu X/Y (o ile mianownik nie zeruje się). W naszym przykładzie X + Y przyjmuje wartości, 0,, 2, 3 z prawdopodobieństwami... Niezależność zmiennych Znając rozkład wektora (X, Y ) czyli rozkład łączny pary X, Y, możemy badać niezależność zmiennych X i Y. Czy zmienne, opisane w tabelce są niezależne? Jak łatwo poznać z tabelki, czy zmienne są niezależne? Czy X i Y są niezależne? Przypomnijmy definicję niezależności zmiennych o rozkładach dyskretnych: X i Y są niezależne, gdy dla wszystkich możliwych wartości x i, y j, jakie te zmienne przyjmują zachodzi równość Czy nasze zmienne X, Y mają tę własność? P (X = x i, Y = y j ) = P (X = x i ) P (Y = y j ). Sprawdźmy: P ((X, Y ) = (0, )) = 0, 2 P (X = 0) P (Y = ) = 0, 3 0, 4 = 0, 2. Te zmienne są zależne! Niezależność zmiennych zadanych tabelką Zmienne X i Y są niezależne, gdy rozkład łączny jest produktem rozkładów brzegowych, to znaczy prawdopodobieństwa w tabelce są iloczynami odpowiednich prawdopodobieństw brzegowych. Jakie liczby należy wpisać w tabelkę, aby dla X i Y o zadanych rozkładach brzegowych zmienne te były niezależne? Rozkład wektora losowego (X, Y, Z) W przypadku wektorów o większej liczbie współrzędnych wszystkie rachunki są analogiczne, ale dłuższe. A rozkład wektora (X, Y, Z) powinien być zadany tabelką trójwymiarową. Kowariancja Miarą zależności zmiennych jest ich kowariancja Wiemy już, jak obliczyć E(X) i E(Y ). cov(x, Y ) = E(XY ) E(X)E(Y ). Znając rozkład wektora (X, Y ) (czyli wartości w tabelce), możemy obliczyć E(XY ): 5

E(XY ) = i,j x i y j p ij. W naszym zadaniu E(XY ) = = 0 + ( ) 0, + 2 ( ) 0, + 0 + 0, 3 + 2 0, 2 = 0, 4, skąd cov(x, Y ) = 0, 4 0, 2 = 0, 2. Współczynnik korelacji Ponieważ kowariancja może być bardzo duża, więc normuje się ją, dzieląc przez pierwiastek z iloczynu wariancji: W naszym zadaniu ρ XY = cov(x, Y ) E(XY ) E(X)E(Y ) =. V ar(x)v ar(y ) V ar(x)v ar(y ) ρ XY =... Współczynnik korelacji jest zawarty pomiędzy i : ρ xy. Gdy ρ XY = ±, to zmienne są bardzo silnie zależne: albo Y = ax + b albo X = AY + B. Gdy zmienne X i Y są niezależne, to cov(x, Y ) = 0, ale nie na odwrót! 6