Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe

Podobne dokumenty
Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe

Rachunek Prawdopodobieństwa i Statystyka

Zmienne losowe ciągłe i ich rozkłady

Zmienne losowe ciągłe i ich rozkłady

Zmienne losowe. Statystyka w 3

Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład

Zmienne losowe. Rozkład prawdopodobieństwa i dystrybuanta. Wartość oczekiwana i wariancja zmiennej losowej

Wykład 3 Jednowymiarowe zmienne losowe

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

Rozdział 1. Zmienne losowe, ich rozkłady i charakterystyki. 1.1 Definicja zmiennej losowej

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 3.

Prawdopodobieństwo i statystyka

1 Zmienne losowe wielowymiarowe.

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Rachunek prawdopodobieństwa i statystyka

Rozkłady prawdopodobieństwa zmiennych losowych

Statystyka i eksploracja danych

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

WYKŁAD 2. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych

Rachunek prawdopodobieństwa i statystyka

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

Przestrzeń probabilistyczna

Komputerowa analiza danych doświadczalnych

Prawdopodobieństwo i statystyka

Wybrane rozkłady zmiennych losowych. Statystyka

Wybrane rozkłady zmiennych losowych. Statystyka

Literatura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.

Statystyka. Magdalena Jakubek. kwiecień 2017

1 Podstawy rachunku prawdopodobieństwa

Rozkłady statystyk z próby

Rozkłady dwóch zmiennych losowych

Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,

Statystyka matematyczna

Wykład 2 Zmienne losowe i ich rozkłady

Prawdopodobieństwo i statystyka

Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa

Matematyka z el. statystyki, # 3 /Geodezja i kartografia II/

Jednowymiarowa zmienna losowa

Zestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) =

Zmienne losowe. Powtórzenie. Dariusz Uciński. Wykład 1. Instytut Sterowania i Systemów Informatycznych Universytet Zielonogórski

Komputerowa analiza danych doświadczalnych

Biostatystyka, # 3 /Weterynaria I/

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Prawa wielkich liczb, centralne twierdzenia graniczne

III. ZMIENNE LOSOWE JEDNOWYMIAROWE

Rachunek Prawdopodobieństwa Rozdział 5. Rozkłady łączne

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

KURS PRAWDOPODOBIEŃSTWO

Pojęcie przestrzeni probabilistycznej

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne

Rozkłady wielu zmiennych

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

Komputerowa analiza danych doświadczalnych. Wykład dr inż. Łukasz Graczykowski

Statystyka matematyczna dla leśników

Elementy Rachunek prawdopodobieństwa

PEWNE FAKTY Z RACHUNKU PRAWDOPODOBIEŃSTWA

Centralne twierdzenie graniczne

= = a na podstawie zadania 6 po p. 3.6 wiemy, że. b 1. a 2 ab b 2

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

W2 Podstawy rachunku prawdopodobieństwa (przypomnienie)

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Rachunek prawdopodobieństwa i statystyka

Kwantyle. Kwantyl rzędu p rozkładu prawdopodobieństwa to taka liczba x p. , że. Możemy go obliczyć z dystrybuanty: P(X x p.

Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.

STATYSTYKA MATEMATYCZNA

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

Wykład 6 Centralne Twierdzenie Graniczne. Rozkłady wielowymiarowe

Statystyka opisowa- cd.

Funkcje charakterystyczne zmiennych losowych, linie regresji 1-go i 2-go rodzaju

Wynik pomiaru jako zmienna losowa

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty

Lista 6. Kamil Matuszewski 13 kwietnia D n =

Statystyka Opisowa z Demografią oraz Biostatystyka. Zmienne losowe. Aleksander Denisiuk. denisjuk@euh-e.edu.pl

Szkice do zajęć z Przedmiotu Wyrównawczego

Rozkłady zmiennych losowych

STATYSTYKA MATEMATYCZNA

Ważne rozkłady i twierdzenia

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Całka podwójna po prostokącie

Z Wikipedii, wolnej encyklopedii.

Prawdopodobieństwo i statystyka

Rachunek prawdopodobieństwa (Elektronika, studia niestacjonarne) Wykład 3

Zmienne losowe. dr Mariusz Grzadziel. rok akademicki 2016/2017 semestr letni. Katedra Matematyki, Uniwersytet Przyrodniczy we Wrocławiu

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 2 i 3 Zmienna losowa

Wykład 3 Momenty zmiennych losowych.

Zmienne losowe. dr Mariusz Grządziel Wykład 12; 20 maja 2014

Wykład 3 Momenty zmiennych losowych.

Statystyka i eksploracja danych

Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki

Inteligentna analiza danych

Wskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii

Matematyka stosowana i metody numeryczne

Transkrypt:

Rachunek Prawdopodobieństwa istatystyka W4 Rozkład normalny Parametry rozkładu zmienne losowe Zmienne losowe wielowymiarowe Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Rozkład normalny - standaryzaca Standaryzaca polega na sprowadzeniu dowolnego rozkładu normalnego N(µ,σ, o danych parametrach µi σ do rozkładu standaryzowanego (modelowego o wartości oczekiwane µ 0 i odchyleniu standardowym σ 1. Zmienną X zastępue zmienna standaryzowana U, która ma rozkład N(0,1. Wtedy otrzymamy następuące zależności: u x σ µ f(x ϕ(u, F(x Φ(u, czyli: P( X x F( x x µ Φ( σ

Własności dystrybuanty standaryzowanego rozkładu normalnego: ( ( ( 1 ( 1 ( ( 1 ( ( ( ( ( ( u u U P u u U P u U P u u u U P u u U P x X P x F Φ > Φ > Φ Φ Φ

gdzie Φ(u oznacza wartości dystrybuanty standaryzowanego rozkładu normalnego N(0,1. Wartości te znadziemy w tablicach statystycznych Φ Φ < Φ Φ < < < σ µ σ µ σ µ σ µ σ µ σ µ σ µ σ µ σ µ a b a F b F b X a P a b b U a P b X a P b X a P ( ( ( ( Obliczanie prawdopodobieństwa w rozkładzie normalnym Obliczanie prawdopodobieństwa, że zmienna losowa X, o rozkładzie N (µ, σ, przymie wartości z przedziału (a,b

Zadanie: Wzrost kobiet w pewne populaci ma rozkład normalny N(165,15. Oznacza to, iż zmienna losowa aką est wzrost kobiet ma rozkład normalny ze średnią równą 165 cm odchyleniem standardowym równym 15 cm. Jaki est udział w populaci kobiet o wzroście: a do 160 cm, b w przedziale 165-170 cm, c powyże 175 cm d dokładnie 150 cm

Rozwiązanie: a poniże 160 cm X 165 160 165 P( X 160 P P( U 0,33 15 15 Φ( 0,33 1 Φ(0,33 1 0,6293 0,3707 innym sposobem 160 165 P( X 160 F(160 Φ 15 Φ( 0,33 1 Φ(0,33 1 0,6293 0,3707

Rozwiązanie: b w przedziale 165-170 cm 165 165 X P(165 < X 170 P < 15 P(0 < U 0,33 Φ(0,33 Φ(0 165 170 165 15 15 0,6293 0,5 0,1293 P( X 1 c powyże 175 cm. X 165 175 165 > 175 P > P( U > 0,67 15 15 P( U 0,67 1 Φ(0,67 1 0,748571 0,251429 d dokładnie 150 cm. P( X 150 P(150 X 150 F(150 F(150 0

Parametry pozycyne rozkładu zmienne losowe Moda Dominanta. Mediana. Modą Mo ( DominantąDo zmienne losowe X nazywamy tę wartość zmienne losowe, które odpowiada: Nawiększe prawdopodobieństwo w przypadku zmienne dyskretne Maksimum lokalne funkci gęstości w przypadku zmienne losowe ciągłe. Medianą Me zmienne losowe X nazywamy wartość x, spełniaącą nierówności P(X x 0,5 i P (X x 0,5 natomiast dla dystrybuanty mamy 0,5 F(x 0,5+P(Xx dla zmienne dyskretne F(x0,5 dla zmienne ciągłe

Symetria rozkładu zmienne losowe Zmienna losowa ma rozkład symetryczny eśli istniee taka wartość a, że: W przypadku zmienne dyskretne każdemu punktowi skokowemu x i a odpowiada punkt x a, taki, że P(X x i P(Xx oraz a- x i x -a W przypadku zmienne losowe ciągłe o funkci gęstości f(x : f(a-xf(a+x dla każdego x w punktach ciągłości f(x. Punkt a nosi nazwę środka symetrii, a prosta xa est osią symetrii rozkładu zmienne losowe. Jeśli rozkład est symetryczny, to środkiem symetrii est wartość oczekiwana W rozkładzie symetrycznym wszystkie momenty centralne nieparzystego rzędu równe są zero

Asymetria rozkładu zmienne losowe Zmienna losowa ma rozkład asymetryczny eśli nie istniee taka wartość a (taki punkt a, który spełnia warunki rozkładu symetrycznego. Ze względu na to, że w rozkładzie asymetrycznym momenty centralne rzędu nieparzystego są różne od zera, do określenia współczynnika asymetrii (skośności rozkładu wykorzystue się trzeci moment centralny µ 3, mianowicie γ D µ 3 ( 3 X Jeśli γ>0, asymetria rozkładu est dodatnia prawostronna (wydłużenie w kierunku dużych wartości Jeśli γ<0, asymetria rozkładu est uemna - lewostronna (wydłużenie w kierunku małych wartości

Wyznaczyćwskaźniki położenia zmienne X: wartośćoczekiwaną, modę, medianę, kwantylrzędu 0,75, Dla zmienne losowe, które funkca gęstości dana est wzorem f ( x x 2 + 2 3 0 0 < x < 1 wprzeciwnymprzypadku E(X 7/12 Mo 1 Me obliczę z równania F(Me 1/2; Me 9/24 Q 3 F(Q 3 3/4 stąd Q 3 41/64

Zmienna losowa wielowymiarowa Dana est przestrzeń probabilistyczna (Ω, S, P i w te przestrzeni n zmiennych losowych X 1,X 2,...,X n Definica Uporządkowany układ n zmiennych losowych, oznaczony X (X 1,X 2,...,X n nazywamy wektorem losowym lub n -wymiarową zmienną losową, co oznacza, że każdemu zdarzeniu ω Ω przyporządkowano punkt przestrzeni euklidesowe R n FunkcęP X (A P({ω: X(ω A} nazywamy rozkładem prawdopodobieństwa wektora losowego X, a ego dystrybuanta est określona wzorem F X (x P(X 1 <x 1,X 2 <x 2,...,X n <x n

Przykłady Badamy trzy cechy człowieka : wiek, ω 1 [18,100] [lat] wzrost, ω 2 [140, 210][cm] waga, ω 3 [40,150][kg] ω (ω 1, ω 2, ω 3 Ω Zmienne losowe definiuę następuąco: X 1 ( ω ω 1 X 2 ( ω ω 2... X n ( ω ω n

Tablicowa reprezentaca dwuwymiarowego rozkładu zmienne losowe skokowe Yy 1 Y y 2 Y y 3 Y y 4 Y y 5 Y y 6 Rozkład brzegowy zmienne X X x 1 p 11 p 12 p 13 p 14 p 15 p 16 p 1. X x 2 p 21 p 22 p 23 p 24 p 25 p 26 p 2. X x 1 p3. p 31............... Rozkład brzegowy zmienne Y p p.2 p.3 p.4 p.5 p.6.1 1

Dwuwymiarowa zmienna losowa (para zmiennych typu skokowego Def. Dwuwymiarowa zmienna losowa est typu skokowego eśli przymue skończoną lub co nawyże przeliczaną liczbę wartości (x 1,y, (i,1,2,. odpowiednio z prawdopodobieństwami p i, Zachodzi przy tym warunek: (* p 1 i gdzie p i i ( X x, Y y ( i, 1,2,... P i Uwaga, w celu właściwe interpretaci wartości p i,, należy pamiętać, że zapis (Xx i,yy oznacza iloczyn zdarzeń Xx i i Yy

Niezależność zmiennych losowych typu skokowego Para (X, Y est dwuwymiarową zmienną losową typu skokowego, Zmienne X i Y nazywamy niezależnymi, eśli dla każde pary wartości (x i, y spełniony est warunek: P(Xx i,yy P(Xx i *P(Yy czyli p i p i. * p. Oznacza to, że zmienne losowe X i Y są niezależne eśli prawdopodobieństwa w łącznym rozkładzie tych zmiennych są równe iloczynowi odpowiednich prawdopodobieństw ich rozkładów brzegowych. Dla zmiennych niezależnych musi być spełniony warunek: pi P ( X xi Y y pi. P( X x p oraz pi P ( Y y X xi p. P( Y y p. i. i

Dystrybuanta dwuwymiarowe zmienne losowe Dystrybuantą dwuwymiarowe zmienne losowe nazywamy funkcę rzeczywistą określoną wzorem: dla zmienne losowe typu skokowego F ( x, y pi x i x y y dla zmienne losowe typu ciągłego (, (, (, F x y P X x Y y f u v dudv x y

Rozkład dwuwymiarowe zmienne losowe typu ciągłego Funkcą gęstości dwuwymiarowe zmienne losowe (X,Y typu ciągłego nazywamy funkcę rzeczywistą określoną wzorem:, ( f x, y lim x 0 y 0 o następuących własnościach: f ( x y, 0 dla x, y R ( < < +, < < + P x X x x y Y y y x y x2 y2 + ( f x, y d x d y 1 (, (, f x y dxdy P x < X x y < Y y x1 y1 + 1 2 1 2

Dwuwymiarowy rozkład normalny Funkca gęstości dwuwymiarowego rozkładu normalnego N(µ1,µ2,σ1,σ2,ρ

Brzegowe funkce gęstości + ( ( f1 x f x, y dy; + ( (, f2 y f x y dx

Warunkowe funkce gęstości: ( / f x y (, ( y f x y f 2 ; ( / f y x f ( x, y ( x f 1

Niezależnośćdwuwymiarowych zmiennych losowych ciągłych Zmienne losowe X i Y typu ciągłego są niezależne, eśli dla dowolne pary liczb rzeczywistych (x,y zachodzi równość: ( x, y f ( x f ( y f 1 2

Momenty zwykłe dwuwymiarowe zmienne losowe Momentem zwykłym rzędu kl, dwuwymiarowe zmienne losowe (X, Y nazywamy wyrażenie m kl E ( k l X Y i x k y l x f i k y ( x, l p i y dxdy Na przykład ( XY E ( X E ( Y m 10 01 m 11 E m

Parametry rozkładu dwuwymiarowe zmienne losowe typu skokowego Wartością oczekiwaną dwuwymiarowe zmienne losowe typu skokowego nazywamy wyrażenie: E ( X, Y E ( X E ( Y x i y p i i Wariancą dwuwymiarowe zmienne losowe typu skokowego nazywamy wyrażenie: D 2 ( [ ( ] 2 [ ( ] 2 X, Y E X E X Y E Y i 2 [ x E( X ] y E( Y i [ ] 2 pi

Momenty centralne dwuwymiarowe zmienne losowe Momentem centralnym rzędu k+l (k,l 0,1,2,... dwuwymiarowego rozkładu zmienne losowe (X,Y nazywamy wyrażenie µ i kl E ( x i ( x m k l ( X m ( Y m m 10 10 k k 10 Wzór dla zmienne skokowe ( y Wzór dla zmienne ciągłe ( y m m 01 01 l l 01 p i f ( x, y dxdy

Parametry dwuwymiarowych zmiennych losowych Kowarianca Def. Kowariancą zmienne losowe dwuwymiarowe (X,Y nazywamy wyrażenie: cov cov ( X, Y E ([ X E ( X ][ Y E ( Y ] ( X, Y cov xy µ 11 σ xy

Wzory na obliczanie kowarianci cov( dla zmienne losowe skokowe X, Y i dla zmienne losowe ciągłe [ x E ( X ] y E ( Y i [ ] p i σ xy + + ( x m ( y m f ( x dx dy dla danych empirycznych 1 n S ( x x ( y y xy i i n i 1 Jeśli zmienne X i Y są niezależne to cov(x,y0, Twierdzenie odwrotne w ogólności nie est prawdziwe x y

Parametry dwuwymiarowych zmiennych losowych Współczynnik korelaci liniowe ρ cov( D( X X, Y D( Y ρ µ 11 µ 02 µ 20

Współczynnik korelaci liniowe Współczynnik korelaci opisue siłę liniowego związku pomiędzy dwiema zmiennymi. Przymue on wartości z przedziału domkniętego <-1; 1>. Wartość -1 oznacza występowanie doskonałe korelaci uemne (to znaczy sytuacę, w które punkty leżą dokładnie na proste, skierowane w dół, a wartość 1 oznacza doskonałą korelacę dodatnią (punkty leżą dokładnie na proste, skierowane w górę. Wartość 0 oznacza brak korelaci liniowe

Przykłady układów punktów przy różnych wartościach współczynnika korelaci liniowe

Analiza rozkładu łącznego zmienne dwuwymiarowe (X,Y Y pęknięcie Y zgorzelina Y mat.pow Y wżery Y skaza Y inne Rozkład zmienne X X duże 0.05 0.01 0.02 0.01 0.11 0.06 0.26 X średnie 0.1 0.03 0.06 0.02 0.09 0.03 0.33 X małe 0.1 0.06 0.01 0.03 0.20 0.01 0.41 Rozkład zmienne Y 0.25 0.1 0.09 0.06 0.40 0.10 1 Rozkłady brzegowe zmiennych losowych Y i X

Analiza rozkładu łącznego (JPD zmienne dwuwymiarowe (X,Y Na podstawie tablicy JPD można obliczać prawdopodobieństwa dowolnych zdarzeń losowych (każde zdarzenie est sumą zdarzeń elementarnych/atomowych W wierszu oraz kolumnie i tabeli JPD, znadue się prawdopodobieństwo zdarzenia atomowego polegaącego na ednoczesnym przyęciu wartości y i przez zmienną Y oraz wartości x przez zmienną X, np. P(X średnia,y skaza 0.09. W ostatnim wierszu tabeli nr 1 zamieszczono rozkład zmienne Y, który uzyskue się w wyniku sumowania wartości pól w kolumnach, W ostatnie kolumnie zamieszczono rozkład zmienne X, uzyskany w wyniku sumowania wartości pól w wierszach, są to rozkłady brzegowe zmienne (X,Y. Suma prawdopodobieństw wszystkich zdarzeń atomowych wynosi 1 (est to warunek konieczny, wynikaący z definici rozkładu prawdopodobieństw

Zastosowania tablicowe reprezentaci JPD Prawdopodobieństwo zdarzenia polegaącego na tym, że wylosowano wyrób ze skazą lub akąkolwiek małą wadą (Y skaza lub X mała można obliczyć z tabeli JPD dodaąc wszystkie wartości w kolumnie Y skaza i wierszu X mała, licząc zawartość pola na przecięciu kolumny skaza i wiersza mała tylko eden raz. 0.1 + 0.06 + 0.01 + 0.03 + 0.2 +0.01+ 0.09 + 0.11 0.61 Wynik ten est taki sam ak dla prawdopodobieństwa sumy zdarzeń (X Y, bo: P (X Y P(X + P(Y P(X,Y 0.41 + 0.4-0.2 0.61

Prawdopodobieństwo warunkowe Prawdopodobieństwo łączne Prawdopodobieństwa warunkowe można obliczyć korzystaąc z tablicy JPD, np. P(pęknięcie/małe P(pęknięcie,małe : P(małe 0,1 : 0,41 0,244 P(małe/pęknięcie P(pęknięcie,małe :P(pęknięcie 0,1: 0,25 0,4 Prawdopodobieństwo łączne: P(A,B P(A B P(A/B * P(B

Zadanie Dany est rozkład zmienne losowe (X,Y X Y 1 2 3 3 0,2 0,2 0 4 0,1 0,2 0,3 1. Znaleźć rozkłady brzegowe i obliczyć E(X i D(X. 2. Wyznaczyć rozkład warunkowy P(X/Y1 i obliczyć wartość oczekiwaną w tym rozkładzie. 3. O czym świadczy porównanie wyników E(X i E(X/Y1?