METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych

Podobne dokumenty
Wybrane rozkłady zmiennych losowych. Statystyka

Wybrane rozkłady zmiennych losowych. Statystyka

Zmienne losowe. Statystyka w 3

Rozkłady zmiennych losowych

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

Elementy Rachunek prawdopodobieństwa

WYKŁAD 2. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

Statystyka. Zmienne losowe

Rozkłady statystyk z próby

III. ZMIENNE LOSOWE JEDNOWYMIAROWE

Statystyka opisowa- cd.

Rozkłady prawdopodobieństwa zmiennych losowych

Rachunek Prawdopodobieństwa i Statystyka

Zwiększenie wartości zmiennej losowej o wartość stałą: Y=X+a EY=EX+a D 2 Y=D 2 X

Komputerowa analiza danych doświadczalnych

Zmienne losowe ciągłe i ich rozkłady

1 Podstawy rachunku prawdopodobieństwa

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Statystyka matematyczna

Wykład 3 Jednowymiarowe zmienne losowe

Jednowymiarowa zmienna losowa

Z Wikipedii, wolnej encyklopedii.

KURS PRAWDOPODOBIEŃSTWO

Ćwiczenia 3 ROZKŁAD ZMIENNEJ LOSOWEJ JEDNOWYMIAROWEJ

Statystyka matematyczna dla leśników

Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe

P (A B) = P (A), P (B) = P (A), skąd P (A B) = P (A) P (B). P (A)

Zmienne losowe ciągłe i ich rozkłady

Prawdopodobieństwo i statystyka

Biostatystyka, # 3 /Weterynaria I/

PEWNE FAKTY Z RACHUNKU PRAWDOPODOBIEŃSTWA

Statystyka opisowa. Robert Pietrzykowski.

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Kwantyle. Kwantyl rzędu p rozkładu prawdopodobieństwa to taka liczba x p. , że. Możemy go obliczyć z dystrybuanty: P(X x p.

Zestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) =

Literatura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Zmienna losowa i jej rozkład

Zmienne losowe. Powtórzenie. Dariusz Uciński. Wykład 1. Instytut Sterowania i Systemów Informatycznych Universytet Zielonogórski

Matematyka z el. statystyki, # 3 /Geodezja i kartografia II/

Statystyczna analiza danych

Rozdział 1. Zmienne losowe, ich rozkłady i charakterystyki. 1.1 Definicja zmiennej losowej

Rozkłady zmiennych losowych

Temat: Zmienna losowa. Rozkład skokowy. Rozkład ciągły. Kody kolorów: Ŝółty nowe pojęcie pomarańczowy uwaga. Anna Rajfura, Matematyka

Statystyka matematyczna

Przestrzeń probabilistyczna

Komputerowa analiza danych doświadczalnych

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Prawdopodobieństwo i statystyka

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty

18. Obliczyć. 9. Obliczyć iloczyn macierzy i. 10. Transponować macierz. 11. Transponować macierz. A następnie podać wymiar powstałej macierzy.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 1 i 2

Ważne rozkłady i twierdzenia

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

Statystyka i eksploracja danych

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

STATYSTYKA MATEMATYCZNA dla ZPM I dr inż Krzysztof Bryś wyk lad 1,2 KLASYCZNY RACHUNEK PRAWDOPODOBIEŃSTWA

STYSTYSTYKA dla ZOM II dr inż Krzysztof Bryś Wykad 1

Statystyka. Magdalena Jakubek. kwiecień 2017

STATYSTYKA wykład 5-6

II WYKŁAD STATYSTYKA. 12/03/2014 B8 sala 0.10B Godz. 15:15

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Rachunek prawdopodobieństwa i statystyka

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Z poprzedniego wykładu

Zmienne losowe. Rozkład prawdopodobieństwa i dystrybuanta. Wartość oczekiwana i wariancja zmiennej losowej

Prawa wielkich liczb, centralne twierdzenia graniczne

Komputerowa analiza danych doświadczalnych

Rachunek prawdopodobieństwa i statystyka

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Ważne rozkłady i twierdzenia c.d.

Parametry statystyczne

Rozkład zajęć, statystyka matematyczna, Rok akademicki 2015/16, semestr letni, Grupy dla powtarzających (C15; C16)

Matematyka 2. dr inż. Rajmund Stasiewicz

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa

L.Kowalski zadania z rachunku prawdopodobieństwa-zestaw 3 ZADANIA - ZESTAW 3

Statystyka Opisowa z Demografią oraz Biostatystyka. Zmienne losowe. Aleksander Denisiuk. denisjuk@euh-e.edu.pl

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Zmienna losowa. Rozkład skokowy

Zadania zestaw 1: Zadania zestaw 2

Zadania o numerze 4 z zestawów licencjat 2014.

Pozyskiwanie wiedzy z danych

g) wartość oczekiwaną (przeciętną) i wariancję zmiennej losowej K.

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Zmienne losowe. dr Mariusz Grzadziel. rok akademicki 2016/2017 semestr letni. Katedra Matematyki, Uniwersytet Przyrodniczy we Wrocławiu

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Weryfikacja hipotez statystycznych

Wynik pomiaru jako zmienna losowa

Transkrypt:

METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład - Parametry i wybrane rozkłady zmiennych losowych

Parametry zmiennej losowej EX wartość oczekiwana D X wariancja DX odchylenie standardowe inne, np. kwantyle, mediana, wartość modalna itd.

Wartość oczekiwana EX i i f p i dla zm.losowej skokowej ( ) d dla zm.losowej ciaglej Wartość oczekiwana EX wyznacza położenie najbardziej prawdopodobnej wartości zmiennej losowej

Wartość oczekiwana,,6,6,,6, i i i p EX,6 ) (, ) (, 5 ) ( ) ( 5 5 d d f EX,,8,,,,6

,5 7,5,95,5,95 }, {9,6 {,7} },5 {,65 )}, (, ) 5,6 {(,8,9} {,6 )},5 (,5,5) {(,5 )},5 (, ) 8,5 8 {(, }, {, )} ) (,5 ) ( (,5 ),5 {(,5,5,,,5 [,5 ),5 (, ) (, ),5 (,5 ) ( 8 8 d d d d f EX Wartość oczekiwana,5,,5,,5-6 8 f()

Wariancja D X ( i EX ) pi i i ( EX ) f ( ) d i p i - EX f ( ) d EX dla skokowej dla ciaglej Wariancja jest miarą rozrzutu wartości zmiennej losowej wokół wartości oczekiwanej

Wariancja,5,,8,6,,,6, EX p X D i i i,,6 ) ( ) (,,6,,6 6 5,6 ) ( ) ( 6 5 6 5 5 d EX d f EX,,8,,,,6

,67 6,6 6,67 6,6 9,5,5 8} 79, {,8} {.8 },5 {,5,5,)} 5,6 ( 5,),8 {(,8},8 {,5)},5 ( 8),5 {(,5,5 )},5 (, ) 8,5 8 {(, }, {, )} ) (,5 ) ( (,5 ),5 {(,5,5,5,,,5 [,5,5 ),5 (, ) (, ),5 (,5 ) ( 8 8 d d d EX d f X D Wariancja,5,,5,,5-6 8 f()

Odchylenie standardowe DX D X Wskaźnik zmienności,6,6,,5 f(),,5,,5-6 8 VX DX EX EX,,6,5 D X,5,,67 DX,78,,88 VX,668,,58

Kwantyle Kwantylem rzędu q zmiennej losowej X jest taka liczba q, że P( X ) q czyli F( ) q q Kwantyl rzędu / nazywamy medianą (Me), lub inaczej wartością środkową (ED 5 - dosis effectiva - mediana dawek efektywnych, LD 5 - dosis lethal - mediana dawek śmiertelnych - w medycynie czy przy truciznach). Kwantyle k / dla k=,, to kwartyle Kwantyle k / dla k=,...9 to decyle Kwantyle k / dla k=,...99 to centyle q

Kwantyle,5,,5,,5-6 8 f() F(=,5 )=,5 8 dla 8 dla dla - dla - dla F,6,5,,,,5,5,5 ) (,5,5,5,5,5,5,5,5,5,5,5,6,5),5) /(,5 (,5,5,5,5) (,5,5,5

Wartość środkowa - mediana Mediana (Me) to kwantyl rzędu,5 P( X czyli F(,5,5 ) ),5,5 Jeżeli EX = Me symetryczny to rozkład zmiennej losowej jest

Wartość modalna Wartość modalna (Mo) to taka wartość zmiennej losowej X dla której funkcja gęstości przyjmuje maksimum lokalne. Rozkład może być jedno i wielomodalny

Współczynnik asymetrii Współczynnik asymetrii (skośności) rozkładu zmiennej losowej X : ( i EX ) pi / D X dla skokowej i ( EX ) f ( ) d / D X dla ciaglej Dla rozkładów jednomodalnych: EX Mo DX Gdy = to rozkład symetryczny

Przykład W klatce znajdują się cztery białe myszy i dwie szare. Myszy przechodzą tunelem do innej klatki, przy czym zakładamy, że wchodzą do tunelu niezależnie. Wartością zmiennej losowej jest numer pierwszej szarej myszy przechodzącej tunelem. Wyznaczyć rozkład zmiennej losowej. Obliczyć EX, DX zmiennej losowej 5 5 /5 /5 /5 /5 /5 D 5 EX 5 5 5 5 8 9 8 5 5 5 5 X 5 5 5 5 6 7 5 5 9 9 7 5 5 5 5 5 5 9 9 5 7 5 5 6 9 9 9

Przykład Dla jakiej wartości parametru A dana funkcja może być funkcją gęstości zmiennej losowej X. Obliczyć EX, DX f A ( ) dla dla pozostalych A 6 6 6 6 6 6 ) ( d d d f EX 8 7 6 5 6 6 69 9 5 9 6 5 6 6 69 9 5 6 69 6 69 ) ( 5 d d X E d f X D

Wybrane rozkłady

Rozkład dwupunktowy Zmienna losowa przyjmuje tylko dwie wartości: wartość z prawdopodobieństwem p i wartość z prawdopodobieństwem - p i p i -p p suma

Rozkład dwupunktowy Funkcja rozkładu prawdopodobieństwa p dla f ( ) oraz p p dla

Rozkład dwupunktowy Dystrybuanta F( ) p dla dla dla

Rozkład dwupunktowy Parametry EX = p D X = p(-p)

Rozkład dwupunktowy Przykładem cechy opisywanej przy pomocy rozkładu dwupunktowego może być: stan zdrowia (zdrowy i chory), płeć (samiec czy samica), przeżywalność (żyje lub nie żyje), rogatość (rogaty czy bezrożny) i wiele innych. Przykładem może być również para alleli w locus, przy założeniu istnienia tylko dwóch alleli

Rozkład dwumianowy (Bernoulli ego) Wykonujemy n niezależnych doświadczeń w nie zmienionym schemacie. W każdym z doświadczeń może pojawić się sukces ( ) z prawdopodobieństwem p albo porażka ( ) z prawdopodobieństwem -p. Wartościami zmiennej losowej jest liczba sukcesów k =,,...,n uzyskanych w takiej serii doświadczeń. Rozkład dwumianowy jest zatem sumą n zmiennych zerojedynkowych.

Rozkład dwumianowy (Bernoulli ego) Prawdopodobieństwo każdej wartości zmiennej losowej obliczamy posługując się wzorem: n k n k Pn p( X k), p ( p) gdy p oraz k k,... n

Trójkąt Pascala n k 6 5 5 6 5 5 6 7 5 5 7 8 8 56 7 56 8 8 9 6 8 8 6 9 5 96 96 5

Rozkład dwumianowy (Bernoulli ego) Wiadomo, że wśród cieląt 7% jest odpornych na dany rodzaj infekcji. Niech zmienną losową będzie liczba odpornych spośród czterech cieląt. P( X P( X ) (,7) ) (,7) (,) (,),8,8,7,7,756 P( X P( X ) (,7) ) (,7) (,) (,) 6,9,9,66,,,6 P( X ) (,7) (,),,

Rozkład dwumianowy (Bernoulli ego),5,,5,,5,,5,,5

Rozkład dwumianowy (Bernoulli ego),7599,8,87,8 ) ( dla dla dla dla dla dla F

Rozkład dwumianowy (Bernoulli ego) Parametry zmiennej o tym rozkładzie EX n p D X n p ( p) EX,7,8 D X,7 (,7),8

Rozkład dwumianowy (Bernoulli ego) p=,5 n=7,,5 i p i,785,56875,665,775,775 5,665 6,56875 7,785,,5,,5 5 6 7 Rozkład jest symetryczny

Rozkład geometryczny Rozkład geometryczny wynik ciągu niezależnych doświadczeń, które powtarzane są tak długo, aż pojawi się sukces z prawdopodobieństwem p. Seria składa się zatem z (k + ) doświadczeń, w tym k - porażek i jednego sukcesu. Wartością zmiennej losowej jest liczba doświadczeń poprzedzających sukces, (tzn. czas oczekiwania na sukces). Zmienna losowa ma nieskończenie wiele wartości. P p k ( k) ( p) p oraz p k,,...

Rozkład geometryczny Załóżmy, że każdorazowe szczepienie powoduje odporność u 6% zwierząt, a efekty kolejnych szczepień są niezależne. Ile razy powinno się szczepić cielęta, aby uzyskać co najmniej 95% odpornych zwierząt? F() (-; ) ; ),6 ; ),8 ; ),96 ; ),97 ; 5),98976 5; 6),9959............ i P(X= i ),6,,96,8,56 5,6..................

Rozkład Poisson a Rozkład Poisson a jest rozkładem granicznym dla ciągu zmiennych losowych mających rozkład dwumianowy. Wraz ze wzrostem długości serii (n) maleje prawdopodobieństwo sukcesu (p), tak, że np = const. np tzn. lim P ( k) P ( k) P ( k) k e k! n Dla rozkładu granicznego seria niezależnych doświadczeń musi być długa (minimum ), a prawdopodobieństwo sukcesu niewielkie. Parametrem rozkładu Poisson a jest = np, iloczyn długości serii (n) i prawdopodobieństwa sukcesu (p). Wartościami zmiennej, tak jak w rozkładzie Bernoulli ego, jest liczba sukcesów k =,,,... Zbiór wartości jest nieskończony i przeliczalny. Prawdopodobieństwo oblicza się ze wzoru: n, p

Rozkład Poisson a Przykładem zjawisk, które można opisywać rozkładem Poisson a jest liczba wypadków w jednostce czasu, liczba bakterii w danej objętości, liczba zachorowań na rzadkie choroby, czy liczba awarii jakiegoś urządzenia w danym przedziale czasu. Jedynym parametrem rozkładu Poisson a jest. Jest ona zarówno wartością oczekiwaną jak i wariancją zmiennej losowej: EX D X

Rozkład Poisson a PRZYKŁAD Wiadomo, że prawdopodobieństwo pojawienia się genetycznej wady włosa w okrywie lisów jest równe,. Właściciel fermy złożonej z 8 lisów chce uzyskać informację jakie jest prawdopodobieństwo, że na jego fermie znajdzie co najmniej trzy lisy z wadą. długość serii n=8, prawdopodobieństwa pojawiania się wady p =, Zatem = 8, =, P( X ) P( X ) ( P( X ) P( X ) P( X )) (,76,9,87),799,697 P( X ) k e k!,! e,,76

Rozkład Poisson a = i pi,558,76757,76757,87,95 5,689 6,98 7,79 8,8597 9,995,89,69,6,8,

Rozkład Poisson a,,,,,,, 5 6 7 8 9

Rozkład Poisson a

Przykład Średnia liczba bakterii w kropli substancji jest równa,5. Z ilu kropli należy utworzyć próbkę substancji, aby z prawdopodobieństwem,95 znalazła się w niej co najmniej jedna bakteria? Rozkład liczby bakterii w kropli wody jest rozkładem Poisson a o =,5, w dwóch kroplach wody liczba bakterii będzie miała rozkład o =, itd. Trzeba obliczyć liczbę kropli, aby P(X>) było równe 95%. P(X>) = - P(X=) Skoro P(X>) =,95 to (PX=) = P(X>) =,95 =,5 L. kropli 5 6 7 8 9,5,,5,,5,,5,,5 5, P(X=),665,679,,5,8,98,,8,,67

Rozkład jednostajny Zmienna losowa, która przyjmuje dowolną wartość z przedziału (a ; b) z jednakowym prawdopodobieństwem f ( ) b a dla dla ( a; b) ( a; b)

Rozkład jednostajny Dystrybuanta F( ) b a a dla dla dla a ( a; b) b)

Rozkład jednostajny Parametry EX a b ( ) D X ( b a)

Rozkład normalny Rozkład normalny z wielu względów jest najważniejszym rozkładem zmiennej losowej ciągłej. Cechy bezpośrednio mierzone, takie jak masy, wysokości, długości, powierzchnie, objętości, wydajności mają rozkład normalny. Błędy losowe mają rozkład normalny. Ponadto wiele rozkładów dąży do rozkładu normalnego w określonych warunkach, czyli rozkład ten jest graniczny dla wielu innych rozkładów.

Rozkład normalny Funkcja gęstości rozkładu normalnego określona dla wszystkich liczb rzeczywistych f ( m) ( ) e Dwa parametry rozkładu normalnego: EX m D X DX

Rozkład normalny Funkcja gęstości rozkładu normalnego określona dla wszystkich liczb rzeczywistych f ( m) ( ) e Dwa parametry rozkładu normalnego: EX m D X DX

Rozkład normalny różne m,5-6 - - 6

Różne wartości odchylenia standardowego,5,5-6 - - 6

Rozkład normalny każdy rozkład jest jednoznacznie określony przez swoje dwa parametry: wartość oczekiwaną m i odchylenie standardowe, co zapisujemy: X~N(m ; ), jest symetryczny względem prostej =m, funkcja gęstości osiąga maksimum dla EX, stąd wartość oczekiwana, modalna i mediana są sobie równe jest określony dla liczb rzeczywistych prawdopodobieństwo występowania wartości zmiennej losowej w przedziałach liczbowych o końcach wyznaczonych przez parametry rozkładu (m i ) jest jednakowe dla każdej zmiennej o rozkładzie normalnym. Zasada ta nazywana jest regułą trzech sigm tzn: P( m X P( m P( m m ),686 X m ),95 X m ),997

Rozkład normalny reguła trzech sigm 99,7% 95,% 68,6% P( m P( m P( m X m ),686 X m ),95 X m ),997 Podobnie wartość dystrybuanty dla wartości zmiennej losowej wyznaczonej przez parametry jej rozkładu jest jednakowa dla każdej zmiennej o rozkładzie normalnym, tzn: Jeżeli X ~N(m ; ) oraz X ~N(m ; ) to F(X = m + k ) = F(X = m + k ).

Standaryzacja Przekształcenie zwane standaryzacją, jest liniowym przekształceniem, w wyniku którego uzyskujemy zmienną losową o wartości oczekiwanej równej zero i odchyleniu standardowym równym jeden. Jeśli zmienna X~N(m;) to zmienna U zdefiniowana jako ma rozkład normalny o parametrach i, czyli zmienna U~N( ; ). U X m

Standaryzacja i p i,5,5,5,,,8 D X 9,88 5,5,5 6,5 7,5,5 7,5 DX,8,5,5 5 EX,5 9,65 u i p i -,99,5 -,79,7 -,78, -,56,9 D X,75,5,8,768,8,5,89,995 DX,769,5,659,699 EX

Przykład Obliczyć P(7<X<6) wiedząc, że zmienna X~N( ; ). dla zm. los. ciągłej P(7<X<6) = F(X=6) - F(X=7) 6 F( X 6) F( U ) F( U,5),9 7 F( X 7) F( U ) F( U,75) F( U,75),77,66 P( 7 X 6) F( X 6) F( X 7),9,66,766

Przykład Wzrost mężczyzn podlega rozkładowi normalnemu o średniej 8 cm, przy czym,5% mężczyzn jest niższych niż 7, cm. Jaki procent mężczyzn jest wyższy niż 85 cm? P( X 7,) F( X 7,),5 7, 8 F( X 7,) F( U ) 9,8 z tablic U,96 5,5 85 8 P( X 85) F( X 85) FU F( U ),8,587 5

Dystrybuanta rozkładu normalnego

Gyps fulvus