Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A Zad. 1. Korzystając z podanych poniżej mini-tablic, oblicz pierwszy, drugi i trzeci kwartyl rozkładu N(10, 2 ). Rozwiązanie. Najpierw ogólny komentarz do WSZYSTKICH rozwiązań WSZYSTKICH kolokwiów (nie tylko z matematyki): Zadaniem Studenta jest przekonać Sprawdzającego, że Student WIE, o czym pisze. W tym celu bardzo pomocne, powiem więcej, NIEZBĘDNE, są krótkie zdania wyjaśniajace. Proszę sprawdzić poniżej, jak wyglądają takie zdania. Teraz już rozwiązanie Zad. 1.: Pierwszy kwartyl rozkładu zmiennej X, to taka liczba q 1, dla której P (X < q 1 ) = 1 (jeden warunek wystarczy, bo rozpatrywany rozkład ma ciągłą i ściśle 4 rosnącą dystrybuantę). A ponieważ, gdy X N(10, 2 ), to X 10 N(0, 1), więc ( 1 X 10 4 = P (X < q 1) = P < q ) ( 1 10 = P Z < q 1 10 gdzie Z N(0, 1). Z tablic P (Z < 0, 674) = 3 4, zatem P (Z < 0, 674) = 1 4, skąd q 1 10 = 0, 674, czyli q 1 = 10 0, 674 = 6, 63. Oczywiście z symetrii gęstości rozkładu względem prostej x = 10 mamy q 2 = 10, a analogiczny rachunek dla q 3 daje q 3 = 10 + 0, 674 = 13, 37. Opis najczęstszych błędów, jakie popełniali studenci rozwiązując to zadanie na drugim kolokwium: Najczęściej studenci nie mieli pojęcia, co to jest pierwszy (a zatem i inne) kwartyl i usiłowali obliczyć P (Z < 1 ). Proszę chwilę zastanowić się nad definicją kwartyli (i mediany). Co ma być 4 równe 1, 1 czy też 3? Oczywiście prawdopodobieństwo pewnego zdarzenia! 4 2 4 Za taki błąd w rozwiązaniu grozi komentarz KBZ (kompletny brak zrozumienia) i oczywiście ZERO punktów. W II kolokwium było mnóstwo KBZ, ale nie wspomniałem o nich (poza dwoma) przy ogłaszaniu wyników, bo nie miały one wpływu na zaliczenie (0-2 pkt z I kolokwium i KBZ z II oznacza, że Student KOMPLETNIE NICZEGO nie umie). ),
Y/X 1 0 1 2 0, 2 0 0, 1 2 0, 2 0, 4 0, 1 Oblicz wariancje zmiennych X i Y i zbadaj, czy te zmienne są niezależne. Rozwiązanie. Liczę rozkłady brzegowe (oczywiście można je dopisać na brzegu tabelki, ale tu, dla Państwa wygody, zapiszę je w oddzielnych tabelkach): X x i 1 0 1 p i 0, 4 0, 4 0, 2, Y y i 2 2 p i 0, 3 0, 7, Wartość oczekiwaną liczymy ze wzoru E(X) = i x i p i natomiast na wariancję mamy dwa różne wzory: V ar(x) = i(x i E(X)) 2 p i lub V ar(x) = E(X 2 ) (E(X)) 2. Z tych wzorów E(X) = ( 1) 0, 4 + 0 + 1 0, 2 = 0, 2, E(Y ) = ( 2) 0, 3 + 2 0, 7 = 0, 8. Wariancję łatwiej obliczyć, korzystając z drugiego wzoru: E(X 2 ) = ( 1) 2 0, 4+0+(1) 2 0, 2 = 1 0, 6 = 0, 6, skąd V ar(x) = 0, 6 ( 0, 2) 2 = 0, 6 0, 04 = 0, 6. Podobnie E(Y 2 ) = ( 2) 2 0, 3 + (2) 2 0, 7 = 4 1 = 4, skąd V ar(x) = 4 (0, 8) 2 = 4 0, 64 = 3, 36. Zmienne X i Y są niezależne, gdy dla wszystkich par i, j zachodzi równość ( ) P ((X, Y ) = (x i, y j )) = P (X = x i ) P (Y = y j ). Jeśli więc nawet dla jednej pary taka równość nie jest spełniona, to zmienne są zależne. Sprawdzamy: P ((X, Y ) = ( 1, 2)) = 0, 2, natomiast P (X = 1) P (Y = 2) = 0, 4 0, 3 = 0, 12 0, 2, więc X i Y są zależne. Opis najczęstszych błędów, jakie popełniali studenci rozwiązując to zadanie na drugim kolokwium: Najczęściej studenci nie potrafili zapisać warunku ( ). Pojawiały się napisy typu (cytuję) P (X, Y ) = P (X)P (Y ), które nie mają sensu probabilistycznego. Aby pisać P (...) z sensem, w nawiasie musimy umieścić zdarzenie, zatem np. P (X = x 1 ) lub P (Y > 3) itp. A co oznacza P (X)? Nie definiowałem tego! Wydaje mi się, że błąd pochodzi z pomieszania pojęć, bo w części prac pojawił sie warunek E(X, Y ) = E(X)E(Y ), w którym lewa strona jest wektorem, jako wartość oczekiwana wektora losowego, a prawa iloczynem dwóch liczb, czyli liczbą. Zatem ten warunek nie ma matematycznego sensu! Wektor, zwłaszcza dwuwymiarowy, nie jest skalarem! Jak uczyłem (wraz z dowodem podanym na wykładzie): Gdy X i Y są niezależne i mają wartości oczekiwane, to E(X Y ) = E(X)E(Y ), ale nie na odwrót, więc tego warunku nie można przyjąć za defincję niezależności zmiennych (poza tym zmienne mogą nie mieć wartości oczekiwanych). Zatem napisy zacytowanego powyżej typu znów świadczą o KBZ... W matematyce, jak i w innych sprawach, diabeł zawsze siedzi w szczegółach!
Zad. 3. Mamy dodać 1200 liczb rzeczywistych, wybranych losowo i niezależnie. Każdą z nich zaokrąglamy najpierw do najbliższej całkowitej, popełniajac przy tym błąd o średniej zero i wariancji 1, a potem dodajemy otrzymane liczby całkowite. Oszacuj prawdopodobieństwo zdarzenia: suma 12 zaokrągleń będzie różnić się od prawdziwej wartości sumy o więcej niż 20. Wsk. Niech X k oznacza błąd zaokrąglenia k tej liczby. Zastosuj Centralne Twierdzenie Graniczne. Rozwiązanie. Zastosujmy się do wskazówki To uwaga dla Państwa, tego nie trzeba pisać na kolokwium! Niech X k oznacza błąd zaokrąglenia k tej liczby. Błąd sumy to suma błędów, więc musimy oszacować P ( X 1 +... + X 1200 > 20). UWAGA! Błąd może być dodatni lub ujemny! Niemal nikt nie rozważał wartości bezwzględnej! Na mocy CTG, gdy zmienne są niezależne i mają taki sam rozkład o skończonej wariancji (a więc i wartości oczekiwanej), to dla dużych n mamy P a < X 1 +... + X n n E(X 1 ) n V ar(x 1 ) U nas E(X k ) = 0, a V ar(x k ) = 1, więc w naszym zadaniu 12 P ( X 1 +... + X 1200 > 20) = < b Φ(b) Φ(a). P (X 1 +... + X 1200 < 20) + P (X 1 +... + X 1200 > 20) = 2P (X 1 +... + X 1200 > 20) = 2P X 1 +... + X 1200 0 > 20 0 2(1 Φ(2)) = 2 0, 023 = 0, 046. 1200 1 100 12 Najczęstsze błędy w tym zadaniu omówiłem powyżej. t 0 0, 0, 674 1 1, 2 2, 3 3, 4 Φ(t) 0, 0, 691 0, 7 0, 841 0, 933 0, 977 0, 994 0, 9986 0, 9997 0, 99997
Zestaw B miał zadania bardzo podobne do A, więc ich nie omawiam szczegółowo. Tylko w wielkim skrócie: Zad. 1. Zmienna X ma rozkład normalny N(6, 3 2 ). Korzystając z podanych poniżej mini-tablic, oblicz: P (X > 0), P ( 3 < X 3) oraz znajdź takie a, dla którego P (X > a) = 3 4. Komentarz: Tu trzeba skorzystać z własności: gdy X N(m, σ 2 ), to X m σ N(0, 1). Y/X 2 2 2 0, 1 0, 3 0 0, 1 0, 1 1 0, 3 0, 1 Oblicz wariancje zmiennych X i Y i zbadaj, czy te zmienne są niezależne. Komentarz: Dokładnie jak w zestawie A. Zad. 3. Czas pracy (do chwili stępienia) noża pewnej obrabiarki ma rozkład o średniej 1 h i wariancji 4 h 2. Gdy taki nóż stępi się, natychmiast jest zastępowany nowym i obrabiarka pracuje dalej. Fabryka ma w zapasie łącznie 100 takich noży. Oszacuj prawdopodobieństwo zdarzenia: z tym zapasem noży obrabiarka będzie pracować co najwyżej 10 godzin. Wskazówka: Niech X k oznacza czas pracy noża numer k. Zastosuj Centralne Twierdzenie Graniczne. Komentarz: Początek dokładnie, jak w zestawie A, tyle że w tym przypadku m = E(X k ) = 1, a σ = V ar(x) = 2 (a nie 4, jak pisało wiele osób!) W CTG w mianowniku mamy albo n V ar(x) albo σ n, co jest tym samym, ale nie wolno pisać ani n σ, ani nv ar(x). Potem P (X 1 +... + X 100 10) = ( ) X1 +... + X 100 1 100 10 100 = P Φ(2, ) = 0, 994. 100 4 400 t 0 0, 0, 674 1 1, 2 2, 3 3, 4 Φ(t) 0, 0, 691 0, 7 0, 841 0, 933 0, 977 0, 994 0, 9986 0, 9997 0, 99997
Zestaw C Zad. 1. Korzystając z podanych poniżej mini-tablic, oblicz a) trzeci kwartyl rozkładu N(1, 2 2 ); b) P (X 6), gdy X ma rozkład N(3, 1). Rozwiązanie: Jak w zestawie A. a) Oblicz E(X) i V ar(x). Y/X 3 1 1 3 0 0, 2 0, 2 0, 2 0, 2 1 0, 02 0, 04 0, 06 0, 08 Rozwiązanie: Jak w zestawie A. b) Wykaż, że zmienne X i Y są zależne, a następnie opisz taki sposób wypełnienia tabelki prawdopodobieństw, aby wektor (X, Y ) nie zmienił swoich rozkładów brzegowych, ale aby zmienne X i Y były niezależne. Rozwiązanie: Musi być spełniony warunek ( ) z zad. 2 zestaw A, więc p ij = p i p j. Na przykład P ((X, Y ) = ( 3, 1)) = P (X = 3)P (X = 1) = 0, 22 0, 8, analogicznie tworzymy wszystkie inne liczby z tabelki. Zad. 3. Oblicz wartość oczekiwaną liczby sukcesów w 4800 próbach Bernoulliego z parametrem p = 1 4. Korzystając z twierdzenia de Moivre a Laplace a oszacuj prawdopodobieństwo zdarzenia: w 4800 próbach Bernoulliego z parametrem p = 1/4 liczba sukcesów odchyli się od wartości oczekiwanej o mniej niż 90. Rozwiązanie: Tw. de Moivre a Laplace a P a < S n np np(1 p) < b Φ(b) Φ(a). A tym zdaniu E(S n ) = np = 4800 1 = 1200, natomiast np(1 p) = 4800 1 4 Stąd P ( S 4800 1200 < 90) = P ( 90 < S 4800 1200 < 90) = ( P 90 30 < S 4800 1200 < 90 ) Φ(3) Φ( 3) 0, 997. 900 30 4 3 4 = 900 = 30. t 0 0, 0, 674 1 1, 2 2, 3 3, 4 Φ(t) 0, 0, 691 0, 7 0, 841 0, 933 0, 977 0, 994 0, 9986 0, 9997 0, 99997
Zestaw D analogiczny do zestawu C, więc podaję tylko końcowe obliczenie w zadaniu 3. Zad. 1. Korzystając z podanych poniżej mini-tablic, oblicz a) pierwszy kwartyl rozkładu N(2, ( 3) 2 ); b) P (2 < X < 10), gdy X ma rozkład N(8, 2 2 ). Y/X 3 1 1 3 0 0, 1 0, 3 0, 3 0, 1 1 0, 0 0, 0 0, 0 0, 0 a) Oblicz E(X) i V ar(x). b) Wykaż, że zmienne X i Y są zależne, a następnie opisz taki sposób wypełnienia tabelki prawdopodobieństw, aby wektor (X, Y ) nie zmienił swoich rozkładów brzegowych, ale aby zmienne X i Y były niezależne. Zad. 3. Oblicz wartość oczekiwaną liczby sukcesów w 1800 prób Bernoulliego z parametrem p = 2. 3 Korzystając z twierdzenia de Moivre a Laplace a oszacuj prawdopodobieństwo zdarzenia: w 1800 próbach Bernoulliego z parametrem p = 2 liczba sukcesów będzie zawarta w przedziale 3 (wartość średnia 60, wartość średnia+40). Rzowiązanie: Jak w zestawie C, ale tutaj n = 1800, p = 2, więc E(S 3 1800) = np = 1800 2 = 1200 3 oraz np(1 p) = 400 = 20. I dalej P P (1200 60 < S 1800 < 1200 + 40) = P ( 60 < S 1800 1200 < 40) = ( 60 20 < S 4800 1200 < 40 ) Φ(2) Φ( 3) 0, 977 (1 0, 9986). 400 20 t 0 0, 0, 674 1 1, 2 2, 3 3, 4 Φ(t) 0, 0, 691 0, 7 0, 841 0, 933 0, 977 0, 994 0, 9986 0, 9997 0, 99997