Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Podobne dokumenty
Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

Statystyka matematyczna

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 2 i 3 Zmienna losowa

Biostatystyka, # 3 /Weterynaria I/

Zmienne losowe ciągłe i ich rozkłady

Przestrzeń probabilistyczna

Rachunek prawdopodobieństwa i statystyka

Temat: Zmienna losowa. Rozkład skokowy. Rozkład ciągły. Kody kolorów: Ŝółty nowe pojęcie pomarańczowy uwaga. Anna Rajfura, Matematyka

Rozkłady prawdopodobieństwa

PEWNE FAKTY Z RACHUNKU PRAWDOPODOBIEŃSTWA

Prawdopodobieństwo i statystyka

Matematyka z el. statystyki, # 3 /Geodezja i kartografia II/

Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa

Rachunek prawdopodobieństwa i statystyka

III. ZMIENNE LOSOWE JEDNOWYMIAROWE

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

Zmienne losowe ciągłe i ich rozkłady

Zwiększenie wartości zmiennej losowej o wartość stałą: Y=X+a EY=EX+a D 2 Y=D 2 X

Ważne rozkłady i twierdzenia

Prawdopodobieństwo i statystyka

g) wartość oczekiwaną (przeciętną) i wariancję zmiennej losowej K.

Rachunek Prawdopodobieństwa i Statystyka

Literatura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.

PODSTAWOWE ROZKŁADY ZMIENNYCH LOSOWYCH

Statystyka matematyczna dla leśników

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

Zestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) =

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Statystyka matematyczna

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Rozkłady prawdopodobieństwa zmiennych losowych

Najczęściej spotykane rozkłady dyskretne:

Statystyka. Magdalena Jakubek. kwiecień 2017

STATYSTYKA MATEMATYCZNA dla ZPM I dr inż Krzysztof Bryś wyk lad 1,2 KLASYCZNY RACHUNEK PRAWDOPODOBIEŃSTWA

Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

Rozkłady zmiennych losowych

II WYKŁAD STATYSTYKA. 12/03/2014 B8 sala 0.10B Godz. 15:15

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Jednowymiarowa zmienna losowa

Statystyka w analizie i planowaniu eksperymentu

Estymacja przedziałowa. Przedział ufności

Wykład 3 Jednowymiarowe zmienne losowe

Rozdział 1. Zmienne losowe, ich rozkłady i charakterystyki. 1.1 Definicja zmiennej losowej

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady statystyk z próby

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

WYKŁAD 2. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

Zmienne losowe. Rozkład prawdopodobieństwa i dystrybuanta. Wartość oczekiwana i wariancja zmiennej losowej

Elementy Rachunek prawdopodobieństwa

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Wybrane rozkłady zmiennych losowych. Statystyka

STYSTYSTYKA dla ZOM II dr inż Krzysztof Bryś Wykad 1

Ćwiczenia 7 - Zmienna losowa i jej rozkład. Parametry rozkładu.

Ćwiczenia 3 ROZKŁAD ZMIENNEJ LOSOWEJ JEDNOWYMIAROWEJ

Zadania ze statystyki, cz.6

Wybrane rozkłady zmiennych losowych. Statystyka

PRAWDOPODOBIEŃSTWO. ZMIENNA LOSOWA. TYPY ROZKŁADÓW

Ważne rozkłady i twierdzenia c.d.

Weryfikacja hipotez statystycznych

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

Zmienna losowa. Rozkład skokowy

1 Elementy kombinatoryki i teorii prawdopodobieństwa

Matematyka dla biologów Zajęcia nr 13.

6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Wybrane rozkłady zmiennych losowych i ich charakterystyki

1.1 Wstęp Literatura... 1

Zmienne losowe. Rozkład zmiennej losowej

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

07DRAP - Zmienne losowe: dyskretne i ciągłe

Centralne twierdzenie graniczne

L.Kowalski zadania z rachunku prawdopodobieństwa-zestaw 3 ZADANIA - ZESTAW 3

Statystyka w analizie i planowaniu eksperymentu

Zawartość. Zawartość

Zmienne losowe dyskretne i Zmienne losowe ciągłe Rozkład Normalny

WSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.

Prawa wielkich liczb, centralne twierdzenia graniczne

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Kwantyle. Kwantyl rzędu p rozkładu prawdopodobieństwa to taka liczba x p. , że. Możemy go obliczyć z dystrybuanty: P(X x p.

METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych

Laboratorium nr 7. Zmienne losowe typu skokowego.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

STATYSTYKA MATEMATYCZNA

= = a na podstawie zadania 6 po p. 3.6 wiemy, że. b 1. a 2 ab b 2

Statystyka i eksploracja danych

Metody probabilistyczne

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

STATYSTYKA MATEMATYCZNA

Transkrypt:

Statystyka Wydział Zarządzania Uniwersytetu Łódzkiego 2017

Podstawowe rozkłady zmiennych losowych

Rozkłady zmiennych skokowych

Rozkład zero-jedynkowy Rozpatrujemy doświadczenie, którego rezultatem może być zdarzenie A lub zdarzenie do niego przeciwne Ā. Niech: P(A) = p, P(A) = 1 p. Na zbiorze zdarzeń elementarnych tego doświadczenia definiujemy zmienną losową X w następujący sposób: X(ω ) = 1, gdy ω A, 0, gdy ω A. Rozkład prawdopodobieństwa tej zmiennej dany jest funkcją prawdopodobieństwa: P(X = 1) = p, P(X = 0) = 1 p.

Rozkład zero-jedynkowy Wartość oczekiwana tej zmiennej jest równa E(X) = 1 p + 0 (1 p) = p. Wariancja i odchylenie standardowe są równe: Var(X) = (1 p) 2 p + (0 p) 2 (1 p) = p(1 p), SD(X) = p(1 p).

Przykład. Agent ubezpieczeniowy wie (z doświadczenia), że prawdopodobieństwo sfinalizowania umowy w czasie umówionego spotkania wynosi 0,2. Agent umawia się na jedno spotkanie dziennie. Liczba zawieranych dziennie umów jest zmienną losową X o rozkładzie zero-jedynkowym z parametrem p = 0,2. Jej rozkład dany jest funkcją prawdopodobieństwa określoną za pomocą tabeli: Liczba umów zawartych w ciągu dnia 0 1 Prawdopodobieństwo 0,8 0,2 E(X) = p = 0,2, SD(X) = 0,2 (1 0,2) = 0,4. Agent zawiera dziennie średnio 0,2 ± 0,4 umowy.

Rozkład dwumianowy (Bernoulliego) Rozpatrujemy doświadczenie zwane schematem Bernoulliego. Polega ono, jak wiemy, na n-krotnym powtarzaniu tego samego doświadczenia, kończącego się wyłącznie dwoma wynikami: albo sukcesem, z prawdopodobieństwem p, albo porażką, z prawdopodobieństwem q = 1 - p. Na zbiorze zdarzeń elementarnych tego doświadczenia określamy zmienną losową X jako liczbę uzyskanych sukcesów w n próbach. Zgodnie z tym co powiedzieliśmy o prawdopodobieństwie takiego zdarzenia, rozkład zmiennej losowej X opisuje funkcja prawdopodobieństwa dana wzorem: P(X = k) = n k pk q n k, k = 0,1,2,,n.

Rozkład dwumianowy (Bernoulliego) Można łatwo pokazać, że wartość oczekiwana i odchylenie standardowe zmiennej losowej o rozkładzie dwumianowym są dane wzorami: E(X) = np, SD(X) = npq. Zauważmy również, że z formalnego punktu widzenia, zmienną losową X można traktować jako sumę n niezależnych zerojedynkowych: X 1, X 2,, X n o rozkładzie zero-jedynkowym z tym samym parametrem p: X = X 1 + X 2 + + X n.

Przykład. Nasz Agent postanowił umawiać się na 6 spotkań dziennie. Liczba zawieranych dziennie umów jest zmienną losową X o rozkładzie dwumianowym z parametrami p = 0,2 i n = 6. Jej rozkład dany jest funkcją prawdopodobieństwa: P(X = k) = 6 k 0,2k 0,8 6 k, k = 0,1,,6. Obliczone na podstawie tego wzoru prawdopodobieństwa podajemy w poniższej tabeli: Liczba umów zawartych w ciągu dnia, k Prawdopodobieństwo P(X = k) 0 1 2 3 4 5 6 0,26214 0,39322 0,24576 0,08192 0,01536 0,00154 0,00006

Zgodnie ze wzorem na wartość oczekiwaną i odchylenie standardowe zmiennej losowej o rozkładzie dwumianowym mamy E(X) = np = 6 0,2 = 1,2, SD(X) = 6 0,2 0,8 = 0,98. Agent zawiera dziennie średnio 1,2 ± 0,98 umowy. 0,4 Wykres funkcji prawdopodobieństwa 0,3 0,2 0,1 0 0 1 2 3 4 5 6

Rozkłady Bernoulliego w n = 20 próbach z różnymi parametrami p 0,3 p = 0,2 p = 0,4 p = 0.5 p = 0,9 0,225 0,15 0,075 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Rozkłady Bernoulliego z parametrem p = 0,5 i w różnych parametrach n n = 5 n = 15 n = 50 n = 75 0,4 0,3 0,2 0,1 0 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64

Rozkład Poissona Jeśli zmienna losowa jest liczbą zajść pewnego zdarzenia losowego w określonym przedziale czasu, np. liczbą awarii urządzenia w ciągu tygodnia, liczbą wypadków samochodowych w ciągu miesiąca, to jej rozkład opisuje funkcja prawdopodobieństwa postaci: P(X = k) = µ k e µ, k = 0,1,2,3, k! gdzie μ jest wartością oczekiwaną rozkładu i jednocześnie jego wariancją: E(X) = µ, Var(X) = µ.

Przykład. W pewnym przedsiębiorstwie zaobserwowano, że w ciągu miesiąca zdarzają się średnio 2 wypadki. Oznaczmy przez X zmienną losową, która jest liczbą wypadków w losowo wybranym miesiącu. Zmienna ta (teoretycznie) może przyjmować każdą wartość k = 0, 1, 2,. Prawdopodobieństwa odpowiadające poszczególnym wartościom k obliczamy, korzystając z funkcji prawdopodobieństwa rozkładu Poissona, przyjmując parametr μ = 2. Prawdopodobieństwo, że w losowo wybranym miesiącu nie będzie wypadków wynosi: P(X = 0) = 20 e 2 0! = 1 e 2 = 0,135. Prawdopodobieństwo, że w losowo wybranym miesiącu będą 4 wypadki jest równe: P(X = 4) = 24 e 2 4! = 2 3e 2 = 0,09.

Rozkład Poissona Rozkład Poissona jest też dobrym przybliżeniem rozkładu dwumianowego, gdy liczba doświadczeń n jest duża (n > 20), a prawdopodobieństwo sukcesu p jest niewielkie (p < 0,05) oraz przy rosnącej liczbie prób iloczyn np jest stały (lub zmierza do stałej). Wówczas przyjmuje się μ = np. Poniżej oba rozkłady dla parametrów: n = 100, p = 0,01 0,4 R. dwumianowy R. Poissona 0,3 0,2 0,1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Rozkład hipergeometryczny Rozważmy eksperyment polegający na losowaniu ze zwracaniem n elementów z populacji liczącej N elementów. Wiemy, że w populacji frakcja interesujących nas elementów wynosi p = R/N. Jeśli zmienna losowa X zlicza interesujące nas elementy w pobranej próbie, to podlega ona rozkładowi dwumianowemu z parametrami n i p. Odmienną sytuację mamy wtedy, gdy losujemy próbę bez zwracania (p zmienia się, bo nie zwracamy). Opisana zmienna losowa X podlega wówczas rozkładowi hipergeometrycznemu. R k N R n k P(X = k) =, k = 0,1,2,...,min{R,n}. N n

Przykład. W tym roku na rynek kapitałowy w Polsce weszło 10 nowych spółek, ale tylko 3 z nich (jak wiemy z doświadczenia) będą miały zadowalające wyniki. Takie spółki będziemy traktować jako wyróżnione przez inwestorów, a zakup ich akcji jako sukces. Pewna osoba zakupiła cztery akcje różnych spółek. Niech zmienną losową X będzie liczba akcji spółek dobrze prosperujących wśród wszystkich zakupionych akcji. Zmienna X może przyjmować wartości k = 0, 1, 2, 3 (tylko 3 spółki mają dodatni wynik finansowy) z prawdopodobieństwami opisanymi rozkładem hipergeometrycznym (osoba nie kupowała dwa razy akcji tej samej spółki) P(X = 0) = P(X = 2) = 3 0 10 3 4 0 = 0,17, P(X = 1) = 10 4 3 2 10 3 4 2 = 0,3, P(X = 3) = 10 4 3 1 10 3 4 1 = 0,5, 10 4 3 3 10 3 4 3 = 0,03. 10 4

Poniżej podana jest tabela rozkładu prawdopodobieństwa zmiennej losowej X: x i 0 1 2 3 p i 0,17 0,5 0,3 0,03 Jakie jest prawdopodobieństwo, że wśród zakupionych akcji czterech spółek znajdą się przynajmniej dwie akcje społek dobrze prosperujących? Prawdopodobieństwo to policzymy następująco P(X 2) = P(X = 2) + P(X = 3) = 0,3+ 0,03 = 0,33. 0,5 0,4 0,3 0,2 0,1 0 0 1 2 3

Rozkład hipergeometryczny Wartość oczekiwana i wariancja zmiennej o rozkładzie hipergeometrycznym dane są wzorami: E(X) = np = nr N, Var(X) = np(1 p) 1 n N 1 1 N. Jeżeli liczebność populacji N rośnie, to rozkład hipergeometryczny jest zbieżny do rozkładu dwumianowego: P(X = k) = lim N R k N R n k N n = n k pk (1 p) n k.

Rozkład geometryczny Jeśli w doświadczeniu losowym schematu Bernoulliego zamiast liczbą sukcesów będziemy się interesowali zmienną losową X, będącą liczbą doświadczeń aż do pojawienia się pierwszego sukcesu, to określimy rozkład geometryczny. Funkcja prawdopodobieństwa tego rozkładu to: P(X = k) = pq k 1, k = 0,1,2, gdzie p - prawdopodobieństwo sukcesu w pojedynczej próbie, q = 1 - p - prawdopodobieństwo porażki.

Rozkład geometryczny Wartość oczekiwana i wariancja zmiennej losowej o rozkładzie geometrycznym wyrażają się wzorami: E(X) = 1 p, Var(X) = q p 2. 0,5 0,4 0,3 0,2 0,1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Przykład. Najnowsze badania wskazują na 14% procentowy udział Pepsi-Coli w rynku napojów bezalkoholowych i 36% udział Coca-Coli. Firma badająca rynek chce przeprowadzić test smakowy na konsumentach Pepsi. Potencjalnych uczestników badania wybiera się przez losowe odsiewanie konsumentów napojów bezalkoholowych dotąd, aż trafi się na konsumenta Pepsi-Coli. Jakie jest prawdopodobieństwo, że pierwszy losowo wybrany konsument będzie konsumentem Pepsi? Jakie jest prawdopodobieństwo, że trzeba będzie zbadać dwóch, trzech, czterech konsumentów, by trafić na pierwszego konsumenta Pepsi? To, że pierwsza zbadana osoba okaże się konsumentem Pepsi jest sukcesem w naszym doświadczeniu. Jego prawdopodobieństwo wynosi p = 0,14. Korzystając z funkcji prawdopodobieństwa mamy: P(X = 1) = pq 1 1 = p = 0,14, P(X = 2) = pq 2 1 = 0,14 0,86 = 0,12, P(X = 3) = pq 3 1 = 0,14 0,86 2 = 0,1 P(X = 4) = pq 4 1 = 0,14 0,86 3 = 0,09.

Rozkłady zmiennych ciągłych

Rozkład jednostajny w przedziale Zmienna losowa X ma rozkład jednostajny w przedziale [a, b], jeśli jej funkcja gęstości określona jest wzorem: f (x) = 0 dla x < a 1 b a dla a x b 0 dla x > b 1/(b-a) a b

Rozkład jednostajny w przedziale Wartość oczekiwana i wariancja tej zmiennej losowej wynoszą: E(X) = Var(X) = xf (x)dx = a + b 2, (x E(X)) 2 f (x)dx = (b a)2 12 Dystrybuanta rozkładu tej zmiennej losowej jest dana wzorem:. F(x) = P(X x) = 0 dla x < a x a b a dla a x b 1 dla x > b 0 1 a b

Przykład. Czas oczekiwania na to, aby prowadzący ćwiczenia podał ocenę z kolokwium jest zmienną losową o rozkładzie jednostajnym w przedziale [3 dni, 8 dni]. Jaki jest przeciętny czas oczekiwania na ocenę? Zgodnie ze wcześniej podanym wzorem: E(X) = a + b 2 = 3+ 8 2 = 5,5, Var(X) = (b a)2 12 = 52 12 = 2,08. Zatem SD(X) = Var(X) = 1,44, więc przeciętny czas oczekiwania na ocenę szacujemy na 5 dni 12 godzin z odchyleniem plus minus 1 dzień 10,5 godziny.

Rozkład wykładniczy Zmienna losowa X ma rozkład wykładniczy, jeśli jej funkcja gęstości określona jest wzorem: f (x) = y λ 0 dla x < 0 λe λx dla x 0 0 x

Rozkład wykładniczy Rozkład wykładniczy ma zmienna losowa X będąca odstępem czasu między zajściem dwóch zdarzeń, które charakteryzuje rozkład Poissona. Na przykład, jeśli liczba samochodów, które przybywają do stacji obsługi w ciągu minuty ma rozkład Poissona, to odcinek czasu między przybyciem dwóch kolejnych samochodów (mierzony na skali ciągłej) ma rozkład wykładniczy. Dystrybuanta rozkładu wykładniczego jest postaci: F(x) = 0 dla x < 0 1 e λx dla x 0 Wartość oczekiwana i wariancja wynoszą: E(X) = 1/λ, Var(X) = 1/λ.

Przykład.Czas jaki maszyna działa zanim ulegnie awarii (czyli odstęp między kolejnymi awariami) ma rozkład wykładniczy z parametrem λ = 2 godziny. Jakie jest prawdopodobieństwo bezawaryjnej pracy maszyny przez co najmniej jedną godzinę? jaki jest średni odstęp między awariami? Interesuje nas pole pod wykresem funkcji gęstości na prawo od punktu x = 1. Korzystając z dystrybuanty mamy P(X > 1) = 1 P(X 1) = 1 F(1) = 1 (1 e 2 ) = 0,1353. Średnim odstępem między awariami jest E(X) = 1/2 godziny. y 2 P(X>1) 0 1 x

Rozkład normalny (Gaussa) Zmienna losowa X ma rozkład normalny z parametrami μ i σ, jeśli jej funkcja gęstości określona jest wzorem: f (x) = 1 (x µ)2 exp σ 2π 2σ 2, < x < +. f(x) μ

f(x) σ 1 2π μ-σ μ μ+σ

Rozkład normalny (Gaussa) f (x) = 1 (x µ)2 exp σ 2π 2σ 2, < x < +. Wartość oczekiwana i odchylenie standardowe zmiennej X mającej rozkład normalny wynoszą: E(X) = µ, SD(X) = σ. Fakt, że zmienna losowa X ma rozkład normalny z wartością oczekiwaną μ i odchyleniem standardowym σ zapisujemy jako: X ~ N(µ,σ ).

Rozkład normalny (Gaussa) Dystrybuanta zmiennej losowej o rozkładzie normalnym N(μ, σ) jest określona wzorem F(x) = σ 1 2π x (t µ)2 exp 2σ 2 dt, < x < +. f(x) F(x) = P(X x) μ x

N(5,1) N(5,2) N(10,2) 0,4 0,3 0,2 0,1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Standaryzowany rozkład normalny Zmienna losowa Z ma rozkład normalny standaryzowany, gdy ma parametry μ = 0 i σ = 1, tzn. Z ~ N(0, 1). Wtedy funkcja gęstości jest postaci f (x) = 1 x2 exp 2π 2, < x < +. f(x) 0

0,4 f(x) 0-3 -2-1 0 1 2 3 68,3% 95,4% 99,7%

0,4 f(x) 0-2,58-1,96-1,64 0 1,64 1,96 2,58 90% 95% 99%

Krzywa y = f(x) jest symetryczna względem osi y, Pole pod całą krzywą jest równe 1, Pola zaciemnione na rysunku są równe, Pole pod lewym ogonem jest równe F(-z), a pod prawym ogonem jest równe 1 - F(z). 0,4 f(x) P(Z < -z) P(Z > z) = 1 - P(Z z) 0 -z 0 z

Niech F będzie dystrybuantą zmiennej losowej Z o standardowym rozkładzie normalnym. Wtedy zachodzą wzory: F(-z) = 1 - F(z), P( -z < Z < z ) = F(z) - F(-z) = 2F(z) - 1. 0,4 f(x) P(Z < -z) P(Z > z) = 1 - P(Z z) 0 -z 0 z

Standaryzowany rozkład normalny Wartości dystrybuanty rozkładu normalnego zostały ułożone w tablice postaci: x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537

Standaryzowany rozkład normalny Przykład. F(-0,32) = 1 - F(0,32)=1-0,62552 = 0,37448; P(-0,5 < Z < 0,5) = 2F(0,5) - 1 =2 0,69146-1=0,38292. x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537

Znajdowanie prawdopodobieństw w tablicach standaryzowanego rozkładu normalnego 1. Znajdziemy prawdopodobieństwo, że wartość standaryzowanej normalnej zmiennej losowej znajdzie się między 0 a 1,56. P(0 < Z < 1,56) = F(1,56) F(0) = 0,94062 0,5 = 0,44062 x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189 1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408 1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449 1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327 1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062 1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670

1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214 1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298 Znajdowanie prawdopodobieństw w tablicach 1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147 standaryzowanego rozkładu normalnego 1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774 1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189 1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408 1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449 2. Znajdziemy prawdopodobieństwo, że wartość standaryzowanej normalnej zmiennej losowej będzie mniejsza od -2,47. 1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327 1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062 P(Z < 2,47) = P(Z > 2,47) = 1 P(Z 2,47) = 1 F(2,47) = 1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670 1 0,99324 = 0,00676 2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169 2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574 2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899 x 2,3 0,00 0,98928 0,01 0,98956 0,02 0,98983 0,03 0,99010 0,04 0,99036 0,05 0,99061 0,06 0,99086 0,07 0,99111 0,08 0,99134 0,09 0,99158 2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361 2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520 2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643 2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736 2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807

Znajdowanie wartości z przy danym prawdopodobieństwie 1. Znajdziemy taką wartość standaryzowanej zmiennej losowej normalnej Z, by prawdopodobieństwo, że zmienna Z przyjmie wartość mniejszą od z było równe 0,40. P(Z < z) = 0,40 Z własności dystrybuanty zmiennej losowej Z wynika, że poszukiwane z < 0. P(Z < z) = P(Z > z) = 1 P(Z z) = 1 F( z). Stąd należy rozwiązać równanie lub równoważnie 1 F( z) = 0,4 F( z) = 0,6

Znajdowanie wartości z przy danym prawdopodobieństwie F( z) = 0,6 x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409 Stąd -z = 0,26, a więc poszukiwana wartość z, to z = -0,26.

Znajdowanie wartości z przy danym prawdopodobieństwie 2. Znajdziemy przedział położony symetrycznie wokół 0, któremu odpowiada prawdopodobieństwo 0,80 znalezienia wartości standaryzowanej normalnej zmiennej losowej w tym przedziale. Szukamy zatem z takiego, że P( z < Z < z) = 0,8 Z własności dystrybuanty zmiennej losowej Z wynika, że poszukiwane z < 0. Szukamy więc takiego z, że P( z < Z < z) = 2F(z) 1 2F(z) 1 = 0,8

Znajdowanie wartości z przy danym prawdopodobieństwie Równanie jest równoważne równaniu 2F(z) 1 = 0,8 F(z) = 0,9 x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147 0,91309 0,91466 0,91621 0,91774 Stąd poszukiwana wartość z, to z = 1,29 czyli 1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189 1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408 P( 1,29 < Z < 1,29) = 0,8 1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449 1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327 1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062

Przekształcenia normalnej zmiennej losowej Niech X będzie zmienną losową o rozkładzie normalnym z parametrami μ i σ, czyli X ~ N(μ, σ). Wówczas zmienna losowa Z określona wzorem Z = X µ σ ma standaryzowany rozkład normalny, czyli Z ~ N(0, 1). Przekształceniem odwrotnym jest X = µ + Zσ. Przy powyższych przekształceniach prawdopodobieństwa się nie zmieniają. To tłumaczy fakt, że tablice skonstruowano tylko dla standaryzowanego rozkładu normalnego.

P(X < b) = P X µ < b µ σ σ = P Z < b µ σ P(X > a) = P X µ > a µ σ σ = P Z < a µ σ P(a < X < b) = P a µ < X µ < b µ σ σ σ = P a µ < Z < b µ σ σ

Korzystanie z przekształcenia rozkładu normalnego 1. Niech X ~ N(50, 10). Znajdziemy prawdopodobieństwo, że wartości zmiennej X są większe od 60, czyli P(X > 60). P(X > 60) = P X 50 10 > 60 50 = P(Z > 1) = 10 = 1 P(Z 1) = 1 F(1) = 1 0,84 = 0,16. x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214

Korzystanie z przekształcenia rozkładu normalnego 2. Przypuśćmy, że wiemy iż pewna zmienna X ~ N(120, σ), czyni nie znamy σ. Wiemy natomiast, że P(X > 125) = 0,05. Ile wynosi σ? P(X > 125) = P Z > 125 120 σ = P Z > 5 σ = 1 P Z 5 σ Otrzymujemy więc równanie równoważne z równaniem 0,05 = 1 F 5 σ F 5 σ = 0,95.

Korzystanie z przekształcenia rozkładu normalnego F 5 σ = 0,95. 0,91774 1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189 x 1,5 0,00 0,93319 0,01 0,93448 0,02 0,93574 0,03 0,93699 0,04 0,93822 0,05 0,93943 0,06 0,94062 0,07 0,94179 0,08 0,94295 0,09 0,94408 1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449 1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327 Stąd odszukujemy, że skąd 1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062 5 1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670 σ = 1,64, 2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169 2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574 2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899 σ = 5 1,64 = 3,05. 2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158 2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361

Rozkład chi-kwadrat (χ 2 ) Rozkład chi-kwadrat z k stopniami swobody ma zmienna losowa χ 2 postaci χ 2 = X 1 2 + X 2 2 + + X k 2, gdzie X i są niezależnymi standaryzowanymi zmiennymi losowymi normalnymi. f(x) E(χ 2 ) = k, 0,3 SD(χ 2 ) = 2k. 0 0 1 2 3 4 5 6 7 8 9

Wykresy funkcji gęstości rozkładu chi-kwadrat dla różnych stopni swobody 0,3 0 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 3 stopnie swobody 5 stopni swobody 10 stopni swobody

Rozkład t Studenta postaci Rozkład t Studenta z k stopniami swobody ma zmienna losowa t t = Z χ 2 k, gdzie Z i χ 2 są niezależnymi zmiennymi losowymi: Z ma standaryzowany rozkład normalny, χ 2 ma rozkład chi-kwadrat z k stopniami swobody. 0

Rozkład t Studenta Wartość oczekiwana i odchylenie standardowe zmiennej t: E(t) = 0, SD(t) = k/(k - 2). Dla dużych k rozkład t Studenta jest zbliżony do standaryzowanego rozkładu normalnego. 0

Krytyczne wartości t α/2 w rozkładzie t Studenta Stopnie swobody t 0,1 t 0,05 t 0,025 t 0,01 t 0,005 1 3,078 6,314 12,706 31,821 63,657 2 1,886 2,920 4,303 6,965 9,925 3 1,638 2,353 3,182 4,541 5,841 4 1,533 2,132 2,776 3,747 4,604 5 1,476 2,015 2,571 3,365 4,032 6 1,440 1,943 2,447 3,143 3,707 7 1,415 1,895 2,365 2,998 3,499 8 1,397 1,860 2,306 2,896 3,355 9 1,383 1,833 2,262 2,821 3,250 10 1,372 1,812 2,228 2,764 3,169 P(t > t α /2 ) = α / 2 0 t α/2