Rozkład normalny
Rozkład normalny jest niezwykle ważnym rozkładem prawdopodobieństwa w wielu dziedzinach. Nazywa się go także rozkładem Gaussa, w szczególności w fizyce i inżynierii. W zasadzie jest to rodzina nieskończenie wielu rozkładów, definiowanych dwoma parametrami: średnią (odpowiada za położenie rozkładu) i odchyleniem standardowym (skala). Standardowy rozkład normalny to rozkład normalny ze średnią zero i odchyleniem standardowym jeden. Ponieważ wykres funkcji gęstości rozkładu normalnego przypomina dzwon, często nazywa się go krzywą dzwonową. Z Wikipedii, wolnej encyklopedii.
Historia Rozkład normalny został po raz pierwszy przedstawiony przez de Moivre'a w artykule w 1773 (przedrukowany w drugim wydaniu Doktryny szans 1738) w kontekście aproksymacji niektórych rozkładów dwumianowych dla dużych n. Wyniki tych badań zostały rozwinięte przez Laplace'a w książce Analityczna teoria prawdopodobieństwa (181) i teraz są nazywane twierdzeniem de Moivre'a-Laplace'a. Laplace użył rozkładu normalnego w analizie błędów pojawiających się w eksperymentach. Ważna w teorii prawdopodobieństwa Metoda najmniejszych kwadratów została wprowadzona przez Legendre'a w 1805. Gauss, który twierdził, że używał tej metody od 1794, uzasadnił ją silnie w 1809 dzięki założeniu o normalnym rozkładzie błędów. Nazwa krzywa dzwonowa pochodzi od Joufretta, który użył terminu powierzchnia dzwonowa w 187 dla dwuwymiarowego rozkładu normalnego z niezależnymi składnikami. Nazwa rozkład normalny została wymyślona jednocześnie przez Charlesa S. Peirce'a, Francisa Galtona i Wilhelma Lexisa około roku 1875. Ta terminologia nie jest najlepsza, gdyż sugeruje, że wszystko ma rozkład normalny 3
Typ rozkładu: ciągły Wartość oczekiwana: µ Wariancja: σ Moda: µ Mediana: µ Skośność: 0 Kurtoza: 0 4
Funkcja gęstości Funkcja gęstości dla rozkładu normalnego ze średnią µ i odchyleniem standardowym σ (równoważnie: wariancją σ ) jest przykładem funkcji Gaussa. (Zobacz też: funkcja potęgowa i pi). Jeśli zmienna losowa X ma ten rozkład, piszemy X ~ N(µ, σ ). Jeśli µ = 0 i σ = 1, rozkład nazywamy standardowym rozkładem normalnym, którego funkcja gęstości opisana jest wzorem: 5
6
We wszystkich rozkładach normalnych funkcja gęstości jest symetryczna względem wartości średniej rozkładu. Około 68% pola pod wykresem krzywej znajduje się w odległości jednego odchylenia standardowego od średniej, około 95,5% w odległości dwóch odchyleń standardowych i około 99,7% w odległości trzech (reguła trzech sigm). Punkt przegięcia krzywej znajduje się w odległości jednego odchylenia standardowego od średniej. 7
Dystrybuanta Dystrybuanta jest definiowana jako prawdopodobieństwo tego, że zmienna X ma wartości mniejsze od x i w kategoriach funkcji gęstości wyrażana jest wzorem: Aby uzyskać wzór na dystrybuantę standardowego rozkładu normalnego, tradycyjnie oznaczaną jako Φ, wystarczy podstawić pod ogólny wzór wartości µ = 0 i σ = 1, 8
Wykres dystrybuanty Dystrybuanta rozkładu normalnego 9
Własności 1. Jeśli X ~ N(µ, σ ) i a i b są liczbami rzeczywistymi, to ax + b ~ N(aµ + b, (aσ) ).. Jeśli X 1 ~ N(µ 1, σ 1 ) i X ~ N(µ, σ ), i X 1 i X są niezależne, to X 1 + X ~ N(µ 1 + µ, σ 1 + σ ). 3. Jeśli X 1,..., X n są niezależnymi zmiennymi losowymi o standardowym rozkładzie normalnym, to X 1 +... + X n ma rozkład chi-kwadrat z n stopniami swobody. 10
Standaryzowanie zmiennych losowych o rozkładzie normalnym Konsekwencją własności 1 jest możliwość przekształcenia wszystkich zmiennych losowych o rozkładzie normalnym do standardowego rozkładu normalnego. Jeśli X ma rozkład normalny ze średnią µ i wariancją σ, wtedy: Z jest zmienną losową o standardowym rozkładzie normalnym N(0, 1). Odwrotnie, jeśli Z jest zmienną losową o standardowym rozkładzie normalnym, to: jest zmienną o rozkładzie normalnym ze średnią µ i wariancją σ. Standardowy rozkład normalny został stablicowany i inne rozkłady normalne są prostymi transformacjami rozkładu standardowego. W ten sposób możemy używać tablic dystrybuanty rozkładu normalnego do wyznaczenia wartości dystrybuanty rozkładu normalnego o dowolnych parametrach. 11
f(u) 1- a µ b P ( a < X < b) = 1 1
f(u) 1- u µ=0 u X µ P u < < u = 1 σ (0,1) 13
Obliczanie: P( u < X < u ) = 1 Krok I: P( X ) < u = 1 f(u) 1- u µ=0 u 14
Krok II: P( X < u ) = f(u) 1- u µ=0 u 15
Krok III: P( u < X < u )= = P ( X < u ) P( X < u ) f(u) 1- u µ=0 u 16
Symetria: f(u) 1- u µ=0 u P( u < X < u )= P ( X < u ) P( X< u ) = = P ( X < u ) P( X> u ) = = P ( X < u ) [ 1 P ( X < u )] = P X u ( < ) 17 1
P( u < X < u )= P( X u ) 1 < Każde wyrażenie postaci P ( X < u ) Nazywane jest dystrybuantą i często oznaczane dla rozkładu normalnego Φ X ( u ) Wartości dystrybuanty dla rozkładu N(0, 1) są tablicowane. Można je także odczytywać posługując się arkuszem kalkulacyjnym. 18
np. Φ X ( u ) Dla u równego 1,36 odpowiednio z tablic x 0 0.01 0.0 0.03 0.04 0.05 0.06 0.07 0.08 0.09 --- ------------------------------------------------------------------- 0.0 0.500 0.504 0.508 0.51 0.516 0.50 0.54 0.58 0.53 0.536 0.1 0.540 0.544 0.548 0.55 0.556 0.560 0.564 0.567 0.571 0.575 0. 0.579 0.583 0.587 0.591 0.595 0.599 0.603 0.606 0.610 0.614 0.3 0.618 0.6 0.66 0.69 0.633 0.637 0.641 0.644 0.648 0.65 0.4 0.655 0.659 0.663 0.666 0.670 0.674 0.677 0.681 0.684 0.688 0.5 0.691 0.695 0.698 0.70 0.705 0.709 0.71 0.716 0.719 0.7 0.6 0.76 0.79 0.73 0.736 0.739 0.74 0.745 0.749 0.75 0.755 0.7 0.758 0.761 0.764 0.767 0.770 0.773 0.776 0.779 0.78 0.785 0.8 0.788 0.791 0.794 0.797 0.800 0.80 0.805 0.808 0.811 0.813 0.9 0.816 0.819 0.81 0.84 0.86 0.89 0.831 0.834 0.836 0.839 1.0 0.841 0.844 0.846 0.848 0.851 0.853 0.855 0.858 0.860 0.86 1.1 0.864 0.867 0.869 0.871 0.873 0.875 0.877 0.879 0.881 0.883 1. 0.885 0.887 0.889 0.891 0.893 0.894 0.896 0.898 0.900 0.901 1.3 0.903 0.905 0.907 0.908 0.910 0.911 0.913 0.915 0.916 0.918 1.4 0.919 0.91 0.9 0.94 0.95 0.96 0.98 0.99 0.931 0.93 1.5 0.933 0.934 0.936 0.937 0.938 0.939 0.941 0.94 0.943 0.944 1.6 0.945 0.946 0.947 0.948 0.949 0.951 0.95 0.953 0.954 0.954 1.7 0.955 0.956 0.957 0.958 0.959 0.960 0.961 0.96 0.96 0.963 1.8 0.964 0.965 0.966 0.966 0.967 0.968 0.969 0.969 0.970 0.971 1.9 0.971 0.97 0.973 0.973 0.974 0.974 0.975 0.976 0.976 0.977.0 0.977 0.978 0.978 0.979 0.979 0.980 0.980 0.981 0.981 0.98.1 0.98 0.983 0.983 0.983 0.984 0.984 0.985 0.985 0.985 0.986. 0.986 0.986 0.987 0.987 0.987 0.988 0.988 0.988 0.989 0.989.3 0.989 0.990 0.990 0.990 0.990 0.991 0.991 0.991 0.991 0.99.4 0.99 0.99 0.99 0.99 0.993 0.993 0.993 0.993 0.993 0.994.5 0.994 0.994 0.994 0.994 0.994 0.995 0.995 0.995 0.995 0.995.6 0.995 0.995 0.996 0.996 0.996 0.996 0.996 0.996 0.996 0.996.7 0.997 0.997 0.997 0.997 0.997 0.997 0.997 0.997 0.997 0.997.8 0.997 0.998 0.998 0.998 0.998 0.998 0.998 0.998 0.998 0.998.9 0.998 0.998 0.998 0.998 0.998 0.998 0.998 0.999 0.999 0.999 3.0 0.999 0.999 0.999 0.999 0.999 0.999 0.999 0.999 0.999 0.999 19
Dla u równego 1,36 odpowiednio z arkusza Excel 0
Przykład obliczeń: Niech X~N(5, 4). Obliczyć Standaryzujemy: P( 3< X < 0) = 3 5 X 5 0 5 P( 3< X < 0) = P = ( < 5, 4 ) < < P X ( 0,1) 4 4 4 ( < 3,75) Zapisujemy jako różnicę dystrybuant: Φ(3,75) = Φ( ) = [1 Φ ()] =Φ() 1 = 0,9999+ 0,977 1= 0,977 x 0 0.01 0.0 0.03 0.04 --- --------------------------------- 1.9 0.971 0.97 0.973 0.973 0.974.0 0.977 0.978 0.978 0.979 0.979.1 0.98 0.983 0.983 0.983 0.984. 0.986 0.986 0.987 0.987 0.987.3 0.989 0.990 0.990 0.990 0.990.4 0.99 0.99 0.99 0.99 0.993.5 0.994 0.994 0.994 0.994 0.994.6 0.995 0.995 0.996 0.996 0.996.7 0.997 0.997 0.997 0.997 0.997.8 0.997 0.998 0.998 0.998 0.998.9 0.998 0.998 0.998 0.998 0.998 1 3.0 0.999 0.999 0.999 0.999 0.999
Przykład obliczeń Excel: Niech X~N(5, 4). Obliczyć P( 3< X < 0) = = 0,99991 = 0,075 = 0,977
Centralne twierdzenie graniczne Jedną z najważniejszych własności rozkładu normalnego jest fakt, że, przy pewnych założeniach, rozkład sumy dużej liczby zmiennych losowych jest w przybliżeniu normalny. Jest to tak zwane centralne twierdzenie graniczne. W praktyce twierdzenie to ma zastosowanie jeśli chcemy użyć rozkładu normalnego jako przybliżenia dla innych rozkładów. Rozkład dwumianowy z parametrami n i p jest w przybliżeniu normalny dla dużych n i p nie leżących zbyt blisko 1 lub 0. Przybliżony rozkład ma średnią równą µ = np i odchylenie standardowe σ = (n p (1 - p)) 1/. Rozkład Poissona z parametrem λ jest w przybliżeniu normalny dla dużych wartości λ. Przybliżony rozkład normalny ma średnią µ = λ i odchylenie standardowe σ = λ. Dokładność przybliżenia tych rozkładów zależy od celu użycia przybliżenia i tempa zbieżności do rozkładu normalnego. Zazwyczaj takie przybliżenia są mniej dokładne w ogonach rozkładów. 3