Wykład 3. Rozkład normalny

Funkcje gęstości Rozkład normalny Reguła 68-95-99.7 % Wykład 3 Rozkład normalny Standardowy rozkład normalny Prawdopodobieństwa i kwantyle dla rozkładu normalnego

Funkcja gęstości

Frakcja studentów z vocabulary score 6:

Krzywa gęstości (wykres y=f(x)) Zawsze powyżej osi poziomej, Pole pod wykresem równe 1. Matematycznie:

Wykres gęstości rozkładu normalnego

Rozkład skośny w prawo

Średnia to punkt równowagi obszaru poniżej wykresu gęstości. Oznaczenie: μ.

Zdefiniuj matematycznie następujące własności funkcji gęstości: Mediana punkt równego podziału pola pod wykresem: Średnia punkt równowagi obszaru pod wykresem: Prawdopodobieństwo otrzymania wartości z zakresu (a,b):

Rozkłady normalne z różnymi σ oraz μ.

Parametry rozkładu (modelu) a statystyki danych (obserwacji) μ średnia rozkładu σ odchylenie standardowe rozkładu średnia z obserwacji (średnia próbkowa) x s próbkowe odchylenie standardowe Obserwujemy / obliczamy (co?): Jesteśmy zainteresowani (czym?):

Wzór na gęstość rozkładu normalnego: 1 1 x 2 f ( x) e 2 2

Reguła 68-95-99.7 % dla rozkładu normalnego Około 68% obserwacji mieści się w granicach ±σ od μ. Około 95% obserwacji mieści się w granicach ±2σ od μ. Około 99,7% obserwacji mieści się w granicach ±3σ od μ.

Przykład Wzrost kobiet w wieku od 18 do 24 lat. Normalny z μ = 64,5, σ = 2,5 cali. Znajdź zakresy dla środkowych 99%, 95%, 68% populacji:

Standaryzacja z-score standaryzowana wartość x a (z = ile standardowych odchyleń od średniej) z x Przykład: Oblicz standardowe wyniki dla młodych kobiet o wzroście 70 cali; 60 cali wysokości.

Obliczanie prawdopodobieństw dla rozkładu normalnego Standaryzowane wartości dla każdego rozkładu zawsze mają średnią 0 i odchylenie standardowe 1. Jeśli pierwotny rozkład (X) jest normalny, to standaryzowane wartości mają rozkład normalny (Z) ze średnią 0 i odchyleniem standardowym 1: (X) N (μ, σ) --- standaryzacja ---> N (0,1) (Z) Standaryzacja: Z = (X-μ) / σ, tj. X = μ + σz. Prawdopodobieństwa dla N (0,1) są w tabelach.

Przykłady: Jaka część obserwacji standardowej zmiennej normalnej Z przyjmuje wartości: mniejsze niż 2.2? większe niż -2.05?

Jaki jest odsetek tych młodych kobiet, które mają mniej niż 70 cm wzrostu?

Przykład: W 2000 r. liczba uczniów piszących SAT była w przybliżeniu normalna ze średnią 1019 i odchyleniem standardowym 209. Jaki procent wszystkich uczniów miał wyniki SAT: co najmniej 820? (= minimum wymagane od zawodników Division I dla przystąpienia do zawodów w pierwszym roku studiów) między 720 a 820? (częściowo zakwalifikowani)

Odwrotny odczyt w tabeli normalnej Dla jakiego z mamy P (Z <z) = 0.95? Dla jakiego z mamy P (Z> z) = 0.01? Pierwsze z to 95-ty kwantyl, z 95, dla N (0,1). Drugie z to 99-ty kwantyl, z 99.

Kwantyle rozkładu N(µ,σ): x p =µ+σ *z p Obliczyć 95. i 99. kwantyl rozkładu SAT.

Przykład (cd.) Jak wysoki musi być wynik studenta, aby był w 20% najlepszych wyników SAT? Podsumowanie: w obliczeniach używaj z=(x-μ)/σ lub x=μ+σz.

Wykresy kwantyl-kwantyl Jeśli punkty leżą blisko linii prostej, to rozkład danych jest zbliżony do normalnego. Konstrukcja: uporządkuj dane rosnąco i znajdź odpowiednie kwantyle próbkowe; znajdź z-score dla tych kwantyli (na przykład z-score dla 5-tego kwantyla wynosi z = -1,645); narysuj każdy punkt danych w odniesieniu do odpowiedniego z. Interpretacja: ogony rozkładu itp...

Dane Newcomba

Dane Newcomba bez obserwacji odstających

Zakupy w supermarkecie: skośność (ciężki prawy ogon)

Współczynnik IQ dla studentów 7-mej klasy (lekkie ogony)