Matematyka stosowana i metody numeryczne

Podobne dokumenty
Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Statystyka. Magdalena Jakubek. kwiecień 2017

1 Podstawy rachunku prawdopodobieństwa

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Statystyka. Opisowa analiza zjawisk masowych

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

WYKŁAD 2. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Elementy Rachunek prawdopodobieństwa

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

W1. Wprowadzenie. Statystyka opisowa

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Rozdział 1. Zmienne losowe, ich rozkłady i charakterystyki. 1.1 Definicja zmiennej losowej

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Statystyka matematyczna dla leśników

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Próba własności i parametry

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Opisowa analiza struktury zjawisk statystycznych

Zmienne losowe. Statystyka w 3

Pozyskiwanie wiedzy z danych

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Literatura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.

Komputerowa analiza danych doświadczalnych

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Jednowymiarowa zmienna losowa

Statystyczne metody analizy danych

STATYSTYKA I DOŚWIADCZALNICTWO

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Parametry statystyczne

PRAWDOPODOBIEŃSTWO. ZMIENNA LOSOWA. TYPY ROZKŁADÓW

Analiza struktury i przeciętnego poziomu cechy

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

Statystyka Matematyczna Anna Janicka

Statystyka matematyczna i ekonometria

Statystyka opisowa. Robert Pietrzykowski.

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

1.1 Wstęp Literatura... 1

Miary statystyczne w badaniach pedagogicznych

Statystyka Opisowa z Demografią oraz Biostatystyka. Zmienne losowe. Aleksander Denisiuk. denisjuk@euh-e.edu.pl

Statystyka w pracy badawczej nauczyciela

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Wskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

STATYSTYKA MATEMATYCZNA dla ZPM I dr inż Krzysztof Bryś wyk lad 1,2 KLASYCZNY RACHUNEK PRAWDOPODOBIEŃSTWA

Rozkłady prawdopodobieństwa zmiennych losowych

Rachunek prawdopodobieństwa i statystyka

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 1 i 2

Rozkłady zmiennych losowych

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Rachunek Prawdopodobieństwa i Statystyka

Wykład 3 Jednowymiarowe zmienne losowe

Estymacja parametrów rozkładu cechy

RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 3.

Temat: Zmienna losowa. Rozkład skokowy. Rozkład ciągły. Kody kolorów: Ŝółty nowe pojęcie pomarańczowy uwaga. Anna Rajfura, Matematyka

STYSTYSTYKA dla ZOM II dr inż Krzysztof Bryś Wykad 1

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

P (A B) = P (A), P (B) = P (A), skąd P (A B) = P (A) P (B). P (A)

(C. Gauss, P. Laplace, Bernoulli, R. Fisher, J. Spława-Neyman) Wikipedia 2008

Komputerowa analiza danych doświadczalnych

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe

II WYKŁAD STATYSTYKA. 12/03/2014 B8 sala 0.10B Godz. 15:15

Rachunek prawdopodobieństwa (Elektronika, studia niestacjonarne) Wykład 3

Biostatystyka, # 1 /Weterynaria I/

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

Zmienne losowe ciągłe i ich rozkłady

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Z poprzedniego wykładu

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Transkrypt:

Adam Wosatko Magdalena Jakubek Piotr Pluciński Matematyka stosowana i metody numeryczne Konspekt z wykładu 4 Podstawy statystyki 4. Wstęp Statystyka nauka o metodach badań właściwości populacji (zbiorowości), które można wyrazić za pomocą liczb lub w sposób opisowy. Głównym zadaniem statystyki jest wykrycie prawidłowości występujących w zjawiskach powiązanych z daną populacją. Zakres zastosowań: sposób gromadzenia, prezentacji, analizy, przetwarzania i interpretacji danych, zrozumienie i klasyfikacja zachodzących procesów (zjawisk), przewidywanie przyszłych procesów (zjawisk) i podejmowanie decyzji. Klasyfikacja danych: Dane pierwotne wcześniej nie istniały i są zbierane specjalnie dla potrzeb prowadzonego badania. Zaletą jest ich aktualność i dopasowanie do celu analizy, a wadę stanowią koszty (również rozumiane jako czas) pozyskania. Dane wtórne istniały wcześniej i są przetworzone na potrzeby nowego, innego badania. Zaletą jest niski koszt ich pozyskania, a wadą może być ich niedopasowanie oraz anachroniczność. Dane wewnętrzne pochodzą z organizacji prowadzącej badanie, również na zlecenie. Dane zewnętrzne uzyskuje się ze źródeł zewnętrznych, np. krajowych (publikowanych przez GUS) lub zagranicznych. Obserwacja statystyczna jest to gromadzenie informacji o właściwościach poszczególnych jednostek zbiorowości, czyli o cechach zmiennych. Wyniki obserwacji statystycznej można przedstawić w formie: szeregów statystycznych (szereg szczegółowy uporządkowany), tablic statystycznych (prostych, złożonych), wykresów statystycznych (punktowych, obrazkowych, powierzchniowych histogramów, liniowych, mapowych złożonych).

Badanie statystyczne jest to zespół czynności zmierzających do uzyskania za pomocą metod statystycznych informacji charakteryzujących badaną zbiorowość statystyczną. Badanie statystyczne może być: pełne obejmuje całą populację (zbiorowość), częściowe dotyczy wybranej części populacji, nazywanej także próbą statystyczą, np. wybierani są tylko studenci. Zbiorowość statystyczna (populacja) jest to zbiór jednostek statystycznych, które nie są identyczne, ale stanowią jedną logiczną całość. Zbiorowość może składać się z osób, rzeczy lub zdarzeń. Zbiorowość statystyczna musi być precyzyjnie określana pod względem rzeczowym, przestrzennym i czasowym. Cechy statystyczne (zmienne) są to właściwości, którymi poszczególne jednostki statystyczne różnią się między sobą, przyjmując odmienne warianty cechy. Cecha statystyczna stanowi przedmiot badania statystycznego. Wyróżnia się cechy: mierzalne wyrażone za pomocą liczb: skokowe skończone, przeliczalne liczby wartości w pewnym przedziale, np. liczby pracowników małych przedsiębiorstw, ciągłe nieprzeliczalnie wiele wartości, np. objętości zużytej wody w mieszkaniach osiedla, quasi-ciągłe (prawie ciągłe) cechy skokowe, ale ze względu na duże liczby wartości potraktowane są jak ciągłe, np. ceny tony stali na przestrzeni pięćdziesięciolecia, niemierzalne (jakościowe, opisowe) wyrażone w sposób opisowy (warianty, kategorie), np. wykształcenie mieszkańców kraju (cecha wielodzielna), płeć (cecha dwudzielna). Rozkład cechy statystycznej stanowi uporządkowany zbiór wartości cechy z przyporządkowanymi im liczebnościami czyli liczbą jednostek przyjmujących daną wartość cechy. Wyróżnia się: szereg punktowy dla cechy mierzalnej skokowej, szereg przedziałowy dla cechy mierzalnej ciągłej. Rozkład cechy oznacza przyporządkowanie liczby obserwacji odpowiednim wartościom cechy zmiennej. Opis struktury zbiorowości statystycznej określony jest przez parametry (dla populacji) lub statystyki (dla próby).

Parametry określające charakterystyki liczbowe: X badana cecha zmienna, x i wartość cechy i-tej jednostki w szeregu punktowym, ˆx i środki i-tych przedziałów w szeregu przedziałowym, k liczba przedziałów, N liczebność populacji, n i liczebność i-tego przedziału: n i = N, i f i = n i N W i = n i N 00% N(x i ) = F (x i ) = j:x j x i n j j:x j x i f j częstość (frakcje): i wskaźnik struktury, f i =, liczebności skumulowane, częstości skumulowane dystrybuanta. 4. Miary opisu populacji Moment zwykły rzędu r dla szeregu punktowego i przedziałowego: m r = N (x i ) r n i m r = N i= (ˆx i ) r n i i= Moment centralny rzędu r szeregu punktowego i przedziałowego: µ r = N (x i µ) r n i µ r = N i= (ˆx i µ) r n i i= Średnia arytmetyczna jest to suma wartości cechy mierzalnej jednostek populacji podzielona przez liczbę tych jednostek: µ = x = N µ = x = N i= x i ˆx i n i i= Średnia arytmetyczna nazywana jest również wartością przeciętną, wartością średnią, wartością oczekiwaną, nadzieją matematyczną. Inne oznaczenia: E(X), m, m. Średnia arytmetyczna stanowi moment zwykły rzędu (m ). 3

Średnia harmoniczna to odwrotność średniej arytmetycznej, obliczonej z odwrotności wartości cechy: µ H = x H = N i= µ H = x H = N i= x i n i ˆx i Wariancja (dyspersja) jest to średnia arytmetyczna kwadratów odchyleń wartości jednostek cechy od wartości średniej dla populacji: σ = N σ = N (x i µ) i= (ˆx i µ) n i i= Wariancja stanowi moment drugi centralny. Odchylenie standardowe informuje o przeciętnym odchyleniu wartości cechy od średniej arytmetycznej i liczy się go jako pierwiastek kwadratowy z wariancji: σ = σ Asymetria informuje o tym czy i jakie wartości cechy przeważają w rozkładzie populacji: µ 3 = N µ 3 = N i= i= (x i µ) 3, γ 3 = µ 3 σ 3 (ˆx i µ) 3 n i, γ 3 = µ 3 σ 3 µ 3 < 0 lub γ 3 < 0 rozkład jest lewostronnie asymetryczny, µ 3 = 0 lub γ 3 = 0 rozkład jest symetryczny, µ 3 > 0 lub 0 < γ 3 rozkład jest prawostronnie asymetryczny. Asymetria stanowi moment trzeci centralny. 4

Miara skupienia i odpowiadający jej współczynnik skupienia czyli kurtoza: µ 4 = N µ 4 = N i= i= (x i µ) 4, γ 4 = µ 4 (σ ) (ˆx i µ) 4 n i, γ 4 = µ 4 (σ ) Miara skupienia stanowi moment czwarty centralny. Kurtoza zwana także koncentracją oznacza stopień skupienia się rozkładu wartości cechy wokół średniej arytmetycznej. γ 4 < 3 rozkład jest spłaszczony, γ 4 = 3 rozkład jest normalny, γ 4 > 3 rozkład jest wysmukły. Dominanta D(x) zwana także modą albo wartością modalną jest to wartość, która najczęściej występuje (jest najbardziej liczna) w populacji. W szeregu punktowym wyznaczenie dominanty sprowadza się do jej odpowiedniego wskazania. W szeregu przedziałowym wskazujemy przedział dominanty D(x) i wyznaczamy przybliżoną wartość na podstawie interpolacji liniowej. Kwantyle to cała grupa miar, które są pozycyjnymi miarami położenia. Dzielą one uporządkowaną (według rosnących wartości cechy) populację na liczebnie równe części, które nazywa się grupami kwantylowymi. Wśród kwantyli wyróżnia się: mediana dzieli populację na części, kwartyle dzielą populację na 4 części, kwintyle dzielą populację na 5 części, decyle dzielą populację na 0 części, centyle (percentyle) dzielą populację na 00 części. Najczęściej wykorzystywany kwantyl to mediana M(x), która dzieli populację na dwie równe części, a więc jest drugim kwartylem populacji. Mediana jest wyznaczana następująco: populacja o liczebności nieparzystej: M(x) = x N+, populacja o liczebności parzystej: M(x) = (x N + x N+ M(x) = x pm + ( N m + i= )/, n i ) h m n m gdzie: m numer przedziału mediany, x pm dolna granica przedziału mediany, N/ pozycja mediany, m i= n i liczebność wszystkich przedziałów poprzedzających przedział mediany, h m rozpiętość przedziału mediany, n m liczebność przedziału mediany. 5

4.3 Elementy probabilistyki Wnioskowanie statystyczne to uogólnienie wyników uzyskanych z próby losowej na całą populację generalną przy założeniu, że dobór próby podlega pewnym regułom obiektywnym. Sprowadza się ono do analizy zdarzeń losowych. Zdarzenie losowe to wynik doświadczenia, które może być wielokrotnie powtarzane i nie da się przewidzieć jego wyniku, a możliwość zajścia tego zdarzenia określone jest przez jego prawdopodobieństwo. Przykład: Jednokrotny rzut kostką. Zdarzenie: liczba oczek wynosi 3 może być zrealizowane tylko na sposób zdarzenie elementarne, liczba oczek > 4 może być zrealizowane tylko na sposoby, liczba oczek < nie może być zrealizowane zdarzenie niemożliwe, liczba oczek jest parzysta lub nieparzysta zdarzenie jest zawsze zrealizowane zdarzenie pewne. Zbiór zdarzeń elementarnych to taki zbiór zdarzeń, które się wzajemnie wykluczają oraz wyczerpują wszystkie możliwości czyli w każdym możliwym przypadku przynajmniej jedno z nich musi zachodzić). Zbiór ten stanowi przestrzeń zdarzeń elementarnych Ω. Zdarzenie losowe stanowi dowolny podzbiór zdarzeń elementarnych. Dla jednokrotnego rzutu kostką zbiór ten wynosi 6 zdarzeń elementarnych, a dla dwukrotnego rzutu kostką ( rzuty po kolei!) 36 zdarzeń elementarnych. Jeżeli przestrzeń zdarzeń elementarnych Ω jest skończona i składa się z n elementów, natomiast zdarzenie A składa się z m zdarzeń elementarnych (jednakowo możliwych) to prawdopodobieństwo zdarzenia A: P (A) = m n Zmienna losowa X odpowiednik pojęcia cechy statystycznej i jednoznaczna funkcja, która przyporządkowuje wartości liczbowe x zdarzeniom elementarnym (wynikom doświadczenia losowego) ω, a więc przekształca przestrzeń zdarzeń elementarnych Ω w przestrzeń liczb rzeczywistych R. Dzięki wprowadzeniu pojęcia zmiennej losowej X, prawdopodobieństwo zdarzenia P (A) można zastąpić prawdopodobieństwem P (x) przyjęcia przez zmienną losową określonej wartości x ze zbioru X. Zmienna losowa i rozkład jej prawdopodobieństwa pozwalają zapisać pewne procesy (zjawiska) w postaci modeli matematycznych. 6

Zmienną losową: określamy dla argumentu w postaci zdarzenia elementarnego ω, zapisujemy bez argumentu jako X, zamiast X(ω), oznaczamy tylko dużą literą czyli X, Y,.... Zmienna losowa może być typu: skokowego (dyskretnego) przyjmuje tylko przeliczalny zbiór wartości (czyli zmienia się skokowo): x i, P (x i ), ciągłego przyjmuje dowolne wartości z przedziału zmienności (czyli zmienia się w sposób ciągły): x, P (x 0 < X < x 0 + x), P (x i ) = n(x i) dla N N gdzie: n(x i ) liczba zdarzeń, którym przypisana jest zmienna x i, N liczba wszystkich zdarzeń. 4.4 Rozkłady zmiennej losowej Funkcja rozkładu prawdopodobieństwa (inne nazwy: rozkład prawdopodobieństwa, funkcja prawdopodobieństwa ) odnosi się tylko do przypadku zmiennych dyskretnych. Jeżeli x, x,, x k, jest skończonym lub przeliczalnym zbiorem wartości zmiennej losowej X to funkcja P (X = x i ) = P ({ω : X(ω) = x i }) = p(x i ) = p i > 0 przyporządkowuje temu zbiorowi odpowiednie prawdopodobieństwa p, p,, p k,, gdzie: p i = dla i N i Funkcja gęstości prawdopodobieństwa prawdopodobieństwo, że zmienna losowa trafi do przedziału x, x jest równe polu pod krzywą gęstości między punktami x, x : x x f(x)dx P (x X x ) f f(x) x x x Właściwości funkcji gęstości prawdopodobieństwa: f(x) 0, f(x) jest unormowana tj. + f(x)dx =. 7

Dystrybuanta F(x) stanowi prawdopodobieństwo tego, że zmienna losowa X przyjmie wartość mniejszą od x. Dystrybuanta zmiennej losowej typu skokowego: F (x) = P (X x) = x i x P (X = x i ) = x i x p i Dystrybuanta zmiennej losowej typu ciągłego: F (x) P (X x) = x f(t)dt 0 F (x) i F (x) jest niemalejącą funkcją, P (x X x ) = F (x ) F (x ), x, x R, f(x) = df (x) dx, F ( ) = lim x F (x) = 0 i F (+ ) = lim x + F (x) =, + f(t)dt = F (+ ) F ( ) =. 4.4. Rozkład dwumianowy (Bernoulliego) Zmienna losowa skokowa X przyjmuje wartości, które są liczbami całkowitymi nieujemnymi k {0,,,..., n, n}. Funkcja rozkładu prawdopodobieństwa jest określona następująco: ( ) n P n (k) = p k q n k, k = 0,,, n, k gdzie: p (0, ) jest ustalone, q = p, n N. Otrzymujemy prawdopodobieństwo uzyskania k sukcesów w n próbach. Dystrybuanta: F (x) = k<x P n (k) = n k<x ( ) n p k q n k k

Przykład: Doświadczenie polega na trzykrotnym rzucie monetą. Zmienną losową X jest liczba wyrzuconych orłów i może przyjmować wartości k = 0,,, 3. Zbiór zdarzeń Liczba Prawdopodobieństwo elementarnych orłów k P (X = k) (R,R,R) 0 / (R,R,O), (R,O,R), (O,R,R) 3/ (R,O,O), (O,R,O), (O,O,R) 3/ (O,O,O) 3 / Dystrybuanta: 0 dla x < 0 dla 0 x < 4 F (x) = dla x < 7 dla x < 3 dla x 3 P (X = x i ) F (x) 7 3 0 3 x 0 3 Funkcja prawdopodobieństwa i dystrybuanta. x 4.4. Rozkład normalny (Gaussa) Najważniejsze rozkłady zmiennej losowej typu ciągłego: Rozkład jednostajny Rozkład normalny (Gaussa) Rozkład log-normalny (logarytmiczno normalny) Rozkład Gumbela Rozkład Weibulla 9

Gęstość rozkładu normalnego (rozkładu Gaussa) wyznacza funkcja: f(x) = (x µ) e σ = πσ σ π e ( x µ σ ) gdzie µ, σ R, σ > 0 są ustalonymi parametrami, które określają odpowiednio położenie środka (przesunięcie krzywej) i szerokość (smukłość) krzywej Gaussa. Wartość funkcji gęstości jest niezerowa dla dowolnego x. Jeżeli zmienna losowa X ma rozkład normalny wówczas mówimy, że jest normalną zmienną losową. Rozkład Gaussa oznaczamy N(µ, σ). Dystrybuanta F (x) dla rozkładu normalnego: F (x) = σ π x e ( t µ σ ) dt. f(x) σ π F (x) 0.5 µ µ σ µ + σ x Funkcja gęstości prawdopodobieństwa i dystrybuanta. µ x W praktyce można założyć, że dane statystyczne mają rozkład normalny, mimo, że przedział zmiennych losowych dla funkcji gęstości f(x) nie jest ograniczony. W rzeczywistości dane cechy są ograniczone, ale rozkład normalny daje wystarczająco dobre przybliżenie do oszacowania przedziału ufności: 6% wartości cechy leży w odległości σ od wartości średniej µ, 95.5% wartości cechy leży w odległości σ od wartości średniej µ, 99.7% wartości cechy leży w odległości 3 σ od wartości średniej µ. Ostatnia właściwość jest nazywana regułą trzech sigm. Przedział ufności z prawdopodobieństwem 95% (np. potrzebny do wyznaczenia wytrzymałości gwarantowanej betonu na ściskanie) zawiera się w [µ.95996 σ, µ +.95996 σ]. 0