Statystyka matematyczna dla leśników

Podobne dokumenty
STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

WYKŁAD 2. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Biostatystyka, # 3 /Weterynaria I/

Temat: Zmienna losowa. Rozkład skokowy. Rozkład ciągły. Kody kolorów: Ŝółty nowe pojęcie pomarańczowy uwaga. Anna Rajfura, Matematyka

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

STATYSTYKA MATEMATYCZNA

Zmienna losowa. Rozkład skokowy

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

Spis treści 3 SPIS TREŚCI

STATYSTYKA MATEMATYCZNA

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

Elementy Rachunek prawdopodobieństwa

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Matematyka z el. statystyki, # 3 /Geodezja i kartografia II/

Statystyka. Magdalena Jakubek. kwiecień 2017

Zmienne losowe ciągłe i ich rozkłady

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

STATYSTYKA I DOŚWIADCZALNICTWO

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Jednowymiarowa zmienna losowa

Rachunek Prawdopodobieństwa i Statystyka

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Rozkłady zmiennych losowych

PRAWDOPODOBIEŃSTWO. ZMIENNA LOSOWA. TYPY ROZKŁADÓW

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 2 i 3 Zmienna losowa

Prawdopodobieństwo i statystyka

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Przestrzeń probabilistyczna

Wybrane rozkłady zmiennych losowych. Statystyka

Literatura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.

PEWNE FAKTY Z RACHUNKU PRAWDOPODOBIEŃSTWA

II WYKŁAD STATYSTYKA. 12/03/2014 B8 sala 0.10B Godz. 15:15

Komputerowa analiza danych doświadczalnych

Ważne rozkłady i twierdzenia

Statystyka i eksploracja danych

Wybrane rozkłady zmiennych losowych. Statystyka

Statystyka matematyczna

Zmienne losowe ciągłe i ich rozkłady

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Rozkłady prawdopodobieństwa zmiennych losowych

Centralne twierdzenie graniczne

(C. Gauss, P. Laplace, Bernoulli, R. Fisher, J. Spława-Neyman) Wikipedia 2008

Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

W2 Podstawy rachunku prawdopodobieństwa (przypomnienie)

WSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.

Prawdopodobieństwo i statystyka

Zwiększenie wartości zmiennej losowej o wartość stałą: Y=X+a EY=EX+a D 2 Y=D 2 X

Prawa wielkich liczb, centralne twierdzenia graniczne

Statystyka matematyczna dla leśników

Wykład 3 Jednowymiarowe zmienne losowe

Ważne rozkłady i twierdzenia c.d.

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Rozdział 1. Zmienne losowe, ich rozkłady i charakterystyki. 1.1 Definicja zmiennej losowej

METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

4,5. Dyskretne zmienne losowe (17.03; 31.03)

Dyskretne zmienne losowe

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Zmienne losowe. Rozkład prawdopodobieństwa i dystrybuanta. Wartość oczekiwana i wariancja zmiennej losowej

Rozkłady statystyk z próby

Zestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) =

Rachunek prawdopodobieństwa i statystyka

Rachunek prawdopodobieństwa i statystyka

III. ZMIENNE LOSOWE JEDNOWYMIAROWE

Rozkłady prawdopodobieństwa

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Komputerowa Analiza Danych Doświadczalnych

Zmienne losowe. Powtórzenie. Dariusz Uciński. Wykład 1. Instytut Sterowania i Systemów Informatycznych Universytet Zielonogórski

1 Elementy kombinatoryki i teorii prawdopodobieństwa

Statystyka matematyczna

Matematyka 2. dr inż. Rajmund Stasiewicz

Zmienne losowe. Statystyka w 3

Statystyka w analizie i planowaniu eksperymentu

6.4 Podstawowe metody statystyczne

1.1 Wstęp Literatura... 1

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Metody probabilistyczne opracowane notatki 1. Zdefiniuj zmienną losową, rozkład prawdopodobieństwa. Przy jakich założeniach funkcje: F(x) = sin(x),

6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty

Metody Statystyczne. Metody Statystyczne.

Matematyka stosowana i metody numeryczne

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,

Komputerowa analiza danych doświadczalnych

STATYSTYKA wykład 1. Wanda Olech. Katedra Genetyki i Ogólnej Hodowli Zwierząt

Statystyka Opisowa z Demografią oraz Biostatystyka. Zmienne losowe. Aleksander Denisiuk. denisjuk@euh-e.edu.pl

Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Z poprzedniego wykładu

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Statystyka matematyczna i ekonometria

Statystyka w analizie i planowaniu eksperymentu

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Matematyka dla biologów Zajęcia nr 13.

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

Transkrypt:

Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 2013/2014 Wykład 3

Zmienna losowa i jej rozkłady Zdarzenia losowe Pojęcie prawdopodobieństwa Prawo wielkich liczb Zmienne losowe Rozkłady teoretyczne zmiennych losowych

Zanim zajmiemy się wnioskowaniem statystycznym musimy uświadomić sobie, że nigdy w 100% nie będziemy pewni czy jest ono prawdziwe czy fałszywe. Możemy tylko takiego czy innego wyniku wnioskowania oczekiwać z określonym prawdopodobieństwem. To znaczy, że rezultat wnioskowania jest zdarzeniem losowym. Musimy zatem zapoznać się z pojęciem zdarzenia losowego i jego prawdopodobieństwa.

Zdarzenia losowe (przypadkowe) to takie zdarzenia, które w danym kompleksie warunków mogą zajść lub nie zajść i mają określone prawdopodobieństwo zajścia lub niezajścia. W każdym eksperymencie (doświadczeniu, badaniu) statystycznym można wyróżnić zbiór wszystkich możliwych, oddzielnych i nie dających rozłożyć się na prostsze wyników obserwacji. Zbiór taki nazywamy zbiorem zdarzeń elementarnych (ZZE). Np. rzut kostką: ZZE to 1,2,3,4,5,6, ale uzyskanie jednego z tych możliwych zdarzeń jest zdarzeniem losowym.

Prawdopodobieństwo zdarzenia losowego jest teoretycznym odpowiednikiem (względnej) częstości empirycznej (empirycznego prawdopodobieństwa). Definicja klasyczna (na podstawie Laplace`a 1812) Prawdopodobieństwem P zdarzenia losowego A nazywamy iloraz liczby zdarzeń elementarnych sprzyjających zdarzeniu A oraz liczby wszystkich zdarzeń elementarnych, jednakowo możliwych i wzajemnie się wykluczających. P ( A) = a a + b P ( A) 1 P( B) = 1 P( A) 0

Szereg rozdzielczy x i n i Σn i p i Σp i 4 6 8 10 12 14 16 23 82 73 45 24 2 1 23 105 178 223 247 249 250 0,092 0,328 0,292 0,180 0,096 0,008 0,004 0,092 0,420 0,712 0,892 0,988 0,996 1,000 Σ 250 1,000

Definicja matematyczna (na podstawie von Misesa) Prawdopodobieństwo zdarzenia losowego A jest granicą, do jakiej dąży częstość empiryczna, przy założeniu, że liczebność jednostek obserwacji dąży do nieskończoności. lim n p i = P ( A) Definicja współczesna (na podstawie Kołmogorowa) (Prawdopodobieństwo jest tu rozumiane jako miara na podzbiorach zbioru zdarzeń elementarnych. Definicja zapisywana jest w formie aksjomatów wynikających z teorii klasycznej Laplace`a) * Każdemu zdarzeniu losowemu A odpowiada określona liczba P(A) zwana prawdopodobieństwem zdarzenia losowego A zawierająca się w granicach przedziału liczbowego od 0 do 1 ( A) 1 0 P

** Prawdopodobieństwo zdarzenia pewnego (obejmującego wszystkie elementy zbioru Ω) równa się jedności P( Ω) = 1 *** Jeżeli A 1, A 2,..., A n,... jest ciągiem zdarzeń losowych parami wykluczających się, to prawdopodobieństwo sumy tych zdarzeń jest równe sumie prawdopodobieństw tych zdarzeń P ( A A + + A +...) = P( A ) + P( A ) +... + P( A )... 1 + 2... n 1 2 n +

Prawo wielkich liczb leży u podstaw badania prawidłowości statystycznych. Po raz pierwszy opublikowane jako tzw. Złote twierdzenie Bernoulliego w 1713 roku. W okresach późniejszych bardziej uogólniane przez Poissona, Czebyszewa i innych. Wzrostowi liczby jednostek obserwacji (ściślej - liczby niezależnych doświadczeń) odpowiada wzrastające prawdopodobieństwo zmniejszania się bezwzględnej różnicy między częstością empiryczną z próby a nieznanym co do poziomu prawdopodobieństwem danego zdarzenia losowego. lim n P { p P( A) ε} = 1 i n i = N p i

Na podstawie tego prawa formułowane są ogólniejsze twierdzenia dotyczące procesów masowych. Np.: Duża liczebność (masowość) próby powoduje, że odchylenia na (+) i na (-) między częstością empiryczną i prawdopodobieństwem mają tendencje do zmniejszania się. Tendencja ta nie występuje w przypadku małych prób. Prawo wielkich liczb może być rozszerzane i na inne, poza prawdopodobieństwem, parametry zbiorowości generalnej. Np.: Wartość liczbowa średniej arytmetycznej z próby (x) jest tym lepszym oszacowaniem średniej populacji generalnej (µ) im liczebność losowej próby jest większa. { x } µ ε 1 lim P = = n (uogólnienie Czebyszewa)

Zmienne losowe: Zmienna losowa (X) jest teoretycznym odpowiednikiem (modelem) cechy statystycznej. Warianty cechy statystycznej pojawiają się z określoną częstością empiryczną (szereg rozdzielczy) a realizacjom zmiennej losowej odpowiadają prawdopodobieństwa wyznaczone przez odpowiednią funkcję. Definicja wg. podręcznika prof. Bruchwalda: Zmienną losową (X) nazywamy funkcję o wartościach rzeczywistych określoną na zbiorze zdarzeń elementarnych taką, że dla dowolnych stałych a < b jest określone prawdopodobieństwo, iż a < X <= b. Podobnie, jak w przypadku cech statystycznych, zmienne losowe dzielimy na skokowe (dyskretne) (X s ) oraz ciągłe (X c ).

Skokowe to takie, których zbiór możliwych realizacji jest skończony (x 1, x 2, x 3,..., x k ) lub przeliczalny (x 1, x 2, x 3,...). ( X x ) p s i i P = = Czyli zmienna losowa skokowa przyjmuje wartości liczbowe (x i ) z prawdopodobieństwem (p i ) (gdzie i = 1, 2, 3,..., k lub i= 1, 2, 3,... ) Ciągłe to takie, dla których istnieje taka nieujemna funkcja f(x) zwana funkcją gęstości prawdopodobieństwa, że dla dowolnych przedziałów (x 1i < x 2i ) zachodzi: x P ( x X < x ) = f ( x) dx = p 1i c 2i i < 2 x i 1i natomiast: P( X = x ) = 0 c i

Do metod prezentacji wnioskowania statystycznego niezbędne jest pojęcie rozkładu zmiennej losowej: W przypadku zmiennych losowych skokowych, odpowiednia dla danej zmiennej funkcja określa rozkład prawdopodobieństwa wszystkich możliwych realizacji tej zmiennej P(X s = x i ) = p i. Dla zmiennych losowych ciągłych funkcja określa gęstość prawdopodobieństwa, gdyż P(X c = x i ) = 0. Liczba wszystkich możliwych zdarzeń dla X c jest nieskończona. f ( x) = lim x 0 P ( x < X < x + x) c x

Ważnym pojęciem w statystyce jest dystrybuanta zmiennej losowej odpowiednik dystrybuanty empirycznej: - dla Xs (skokowej): F ( x) P( X x) = P( X = x ) - dla Xc (ciągłej): F = s x x ( x) = P( X < x) = f ( x) dx c Dystrybuanta zmiennej losowej F(x) jest to prawdopodobieństwo tego, że ta zmienna losowa przyjmie wartości <= x. i x s i

Wskaźniki charakteryzujące zmienne losowe: Wartość oczekiwana (nadzieja matematyczna) - odpowiednik średniej arytmetycznej dla populacji: - dla (X s ): EX = x s i p i ni 1 pi = i = µ N x n i N - dla (X c ): EX c + = x f ( x) dx

Wariancja zmiennej losowej: = - skokowej 2 D X ( ) s xi EX s pi 2 - ciągłej D 2 X + 2 c ) = f ( x dx ( x EX ) c Teoretyczne rozkłady zmiennej losowej skokowej - rozkład dwumianowy: gdzie: q = 1 - p k = 0, 1, 2,..., n P ( ) k ( n k ) X = k = p q s n k

Rozkład dwumianowy Przykład funkcji rozkładu prawdopodobieństwa Opisuje prawdopodobieństwo uzyskania k sukcesów w n niezależnych próbach, gdzie prawdopodobieństwo sukcesu w jednej próbie wynosi p

Rozkład dwumianowy

Rozkład dwumianowy

Własności (r-d dwum.) Wykres funkcji rozkładu jest symetryczny dla p = 0.5 dla p < 0.5 rozkład jest skośny dodatnio dla p > 0.5 rozkład jest skośny ujemnie

Własności (r-d dwum.) Wartość oczekiwana E(X) = n * p Wariancja D 2 X = n p q Odchylenie standardowe

EX = np D 2 X = npq DX = npq Dwumian Newtona: przykłady: ( q + p) n n k = n! k!( n k)! p = 0,5 n = 10 Binomial Distribution 0,25 0,2 Event prob.,trials 0,5,10 probability 0,15 0,1 0,05 0 0 1 2 3 4 5 6 7 8 9 10 x

p = 0,2 n = 10 Binomial Distribution probability 0,4 0,3 0,2 0,1 Event prob.,trials 0,2,10 0 0 1 2 3 4 5 6 7 8 9 10 x p = 0,7 n = 10 Binomial Distribution probability 0,3 0,25 0,2 0,15 0,1 0,05 0 0 1 2 3 4 5 6 7 8 9 10 x Event prob.,trials 0,7,10

p = 0,2 n = 50 0,15 probability 0,12 0,09 0,06 0,03 Binomial Distribution Event prob.,trials 0,2,50 0 0 10 20 30 40 50 x inne rozkłady zmiennej losowej skokowej: - Poissona P k λ k! ( = ) = e λ X k dla: k = 0, 1, 2,... λ >= 0 EX 2 = D X = λ

Przykłady: rozkład dwumianowy x i n i k i n i k i P(X=k) n 4 23 0 0 0.1177 29.4 6 82 1 82 0.3025 75.6 8 73 2 146 0.3242 81.0 10 45 3 135 0.1852 46.3 12 24 4 96 0.0595 14.9 14 2 5 10 0.0102 2.6 16 1 6 6 0.0007 0.2 suma 250 475 1.0000 250 µ = σ = 7.80 2.35 k p = nik N = k n = i = 1.90 6 475 250 = = 1.90 0.3167 0.3 EX p = = np EX n

geometryczny: ( X = n) = pq n 1 P dla: n = 1, 2, 3,... EX 1 p p 2 1 = D X = 2 p q = 1-p Teoretyczne rozkłady zmiennej losowej ciągłej: - rozkład normalny: f ( x µ ) 1 2 2σ ( x) = e σ 2Π 2 dla: < x < + σ > 0 EX = µ DX = σ

Rozkład normalny Najczęściej stosowany rozkład w statystyce Podstawa wielu metod statystycznych: estymacji, testów, regresji, korelacji, analizy wariancji,...

Rozkład normalny Opisuje zmienne, które mogą przybierać postać nieskończonej liczby niezależnych zdarzeń losowych Przykład rozkładu zmiennej ciągłej Jego funkcję gęstości prawdopodobieństwa można opisać następująco:

Rozkład normalny gdzie: x - zmienna µ -średnia arytmetyczna σ - odchylenie standardowe

Rozkład normalny

Własności (r-d normalny) Wartość funkcji gęstości rośnie dla x<µ i maleje dla x>µ Funkcja gęstości ma maksimum w punkcie x = µ Wartość oczekiwana zmiennej X wynosi E(X)=µ Wariancja zmiennej X równa jest D2X = σ2

Własności (r-d normalny) dla x = µ funkcja gęstości ma wartość rozkład ma 2 punkty przegięcia dla x=µ - σ i x = µ + σ rozkład normalny jest symetryczny, a oś symetrii zdefiniowana jest jako x = µ

Własności (r-d normalny) Im wariancja / odchylenie standardowe jest mniejsze, tym funkcja gęstości jest węższa funkcja prawdopodobieństwa (dystrybuanta) jest całką z funkcji gęstości prawdopodobieństwa

Własności (r-d normalny)

Standaryzowany r.n. Każdy rozkład normalny może być znormalizowany, tj. doprowadzony do postaci rozkładu o średniej 0 i odchyleniu standardowym 1: N(0,1). Wartość oczekiwana standaryzowanego r- du normalnego równa jest zero (EZ = 0) a odchylenie standardowe równe jest 1 (D 2 Z = 1).

Standaryzowany r.n. Standaryzacja to zamiana zmiennej x na z, gdzie: Funkcja gęstości prawdopodobieństwa tej funkcji:

f(x) N(20;2) z x µ = σ σ σ f ( z) = 1 2Π e 1 2 z 2 14 16 18 20 22 24 26 x µ f(z) N(0;1) F( z) = 1 2Π z e 1 2 z 2 dz -3-2 -1 0 1 2 3 z

F(z) 1 F( z) = 1 2Π z e 1 2 z 2 dz 0.5-3 -2-1 0 1 2 3 z Inne rozkłady zmiennej losowej ciągłej: - jednostajny - gamma - beta - wykładniczy

Standaryzowany r.n.

Własności (r-d normalny) Pomiędzy µ -σ i µ + σ znajduje się około 68% wszystkich wartości zmiennej W przedziale od µ - 2*σ do µ + 2*σ jest około 95% wszystkich wartości zmiennej W przedziale od µ - 3*σ do µ + 3*σ mamy około 99,7% wszystkich obserwacji

Rozkład skumulowany cumulative histogram 250 frequency 200 150 100 50 0 0 3 6 9 12 15 18 dk

Rozkład skumulowany

Rozkład skumulowany

Rozkład skumulowany

Rozkład skumulowany

rozkład normalny x i n i x gi x ig - µ z i =(x gi -µ)/σ F(x gi ) F(x gi ) F(x gi-1 ) n i x< 3 0 0.0207 5.2 3-4.8-2.04 0.0207 4 23 0.0963 24.1 5-2.8-1.19 0.1170 6 82 0.2499 62.5 7-0.8-0.34 0.3669 8 73 0.3281 82.0 9 1.2 0.51 0.6950 10 45 0.2181 54.5 11 3.2 1.36 0.9131 12 24 0.0733 18.3 13 5.2 2.21 0.9864 14 2 0.0125 3.1 15 7.2 3.06 0.9989 16 1 0.0011 0.3 17 9.2 3.91 1.0000 x>17 0 0.0000 0.0 suma 250 1.0000 250 µ = 7.80 σ = 2.35

Porównanie częstości empirycznych z teoretycznymi 90 80 70 60 50 40 30 20 10 0 n 0 2 4 6 8 10 12 14 16 18 20 x ne ndw nnor

90 80 70 60 50 40 30 20 10 0 0 2 4 6 8 10 12 14 16 18 20 ne ndw 90 80 70 60 50 40 30 20 10 0 0 2 4 6 8 10 12 14 16 18 20 ne nnor

Co to jest zdarzenie losowe? Przykłady. Klasyczna definicja prawdopodobieństwa. Współczesna definicja prawdopodobieństwa. Co to jest zmienna losowa? Typy zmiennych losowych. Co to jest gęstość prawdopodobieństwa zmiennej losowej? Co to jest dystrybuanta zmiennej losowej? Charakterystyka rozkładu dwumianowego. Wyznaczanie częstości teoretycznych zgodnych z rozkładem dwumianowym. Charakterystyka rozkładu normalnego. Wyznaczanie częstości teoretycznych zgodnych z rozkładem normalnym.

Dziękuję za uwagę!