STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

Podobne dokumenty
Statystyka matematyczna dla leśników

WYKŁAD 2. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Temat: Zmienna losowa. Rozkład skokowy. Rozkład ciągły. Kody kolorów: Ŝółty nowe pojęcie pomarańczowy uwaga. Anna Rajfura, Matematyka

Biostatystyka, # 3 /Weterynaria I/

Literatura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.

Elementy Rachunek prawdopodobieństwa

PRAWDOPODOBIEŃSTWO. ZMIENNA LOSOWA. TYPY ROZKŁADÓW

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

Prawdopodobieństwo i statystyka

Matematyka z el. statystyki, # 3 /Geodezja i kartografia II/

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

Spis treści 3 SPIS TREŚCI

Zmienna losowa. Rozkład skokowy

(C. Gauss, P. Laplace, Bernoulli, R. Fisher, J. Spława-Neyman) Wikipedia 2008

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

Statystyka i eksploracja danych

Statystyka. Magdalena Jakubek. kwiecień 2017

Zmienne losowe ciągłe i ich rozkłady

STATYSTYKA I DOŚWIADCZALNICTWO

Rachunek Prawdopodobieństwa i Statystyka

Rachunek prawdopodobieństwa i statystyka

PEWNE FAKTY Z RACHUNKU PRAWDOPODOBIEŃSTWA

Przestrzeń probabilistyczna

W2 Podstawy rachunku prawdopodobieństwa (przypomnienie)

Centralne twierdzenie graniczne

Prawa wielkich liczb, centralne twierdzenia graniczne

II WYKŁAD STATYSTYKA. 12/03/2014 B8 sala 0.10B Godz. 15:15

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 2 i 3 Zmienna losowa

Rozkłady zmiennych losowych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Zmienne losowe ciągłe i ich rozkłady

Prawdopodobieństwo i statystyka

4,5. Dyskretne zmienne losowe (17.03; 31.03)

Jednowymiarowa zmienna losowa

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Dyskretne zmienne losowe

Rozkłady prawdopodobieństwa zmiennych losowych

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Rachunek prawdopodobieństwa i statystyka

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

Statystyka w analizie i planowaniu eksperymentu

Zestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) =

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Ważne rozkłady i twierdzenia

Matematyka stosowana i metody numeryczne

WSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.

Statystyka Opisowa z Demografią oraz Biostatystyka. Zmienne losowe. Aleksander Denisiuk. denisjuk@euh-e.edu.pl

Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Rozdział 1. Zmienne losowe, ich rozkłady i charakterystyki. 1.1 Definicja zmiennej losowej

Rozkłady prawdopodobieństwa

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Zmienne losowe. Rozkład prawdopodobieństwa i dystrybuanta. Wartość oczekiwana i wariancja zmiennej losowej

Wykład 3 Jednowymiarowe zmienne losowe

Zmienne losowe. Powtórzenie. Dariusz Uciński. Wykład 1. Instytut Sterowania i Systemów Informatycznych Universytet Zielonogórski

Rozkłady statystyk z próby

Komputerowa analiza danych doświadczalnych

Wybrane rozkłady zmiennych losowych. Statystyka

STATYSTYKA wykład 1. Wanda Olech. Katedra Genetyki i Ogólnej Hodowli Zwierząt

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Wybrane rozkłady zmiennych losowych. Statystyka

Zadania o numerze 4 z zestawów licencjat 2014.

Zwiększenie wartości zmiennej losowej o wartość stałą: Y=X+a EY=EX+a D 2 Y=D 2 X

Statystyka w analizie i planowaniu eksperymentu

Statystyka matematyczna

Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014

Elementy rachunku prawdopodobieństwa. Statystyka matematyczna. w zastosowaniach

Matematyka dla biologów Zajęcia nr 13.

1.1 Wstęp Literatura... 1

Wykład 2 Zmienne losowe i ich rozkłady

Wykład 13. Podstawowe pojęcia rachunku prawdopodobieństwa

Zmienne losowe. Statystyka w 3

1 Elementy kombinatoryki i teorii prawdopodobieństwa

Metody probabilistyczne opracowane notatki 1. Zdefiniuj zmienną losową, rozkład prawdopodobieństwa. Przy jakich założeniach funkcje: F(x) = sin(x),

Kwantyle. Kwantyl rzędu p rozkładu prawdopodobieństwa to taka liczba x p. , że. Możemy go obliczyć z dystrybuanty: P(X x p.

Komputerowa Analiza Danych Doświadczalnych

STATYSTYKA MATEMATYCZNA

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

P (A B) = P (A), P (B) = P (A), skąd P (A B) = P (A) P (B). P (A)

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

III. ZMIENNE LOSOWE JEDNOWYMIAROWE

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

zdarzenie losowe - zdarzenie którego przebiegu czy wyniku nie da się przewidzieć na pewno.

Matematyka 2. dr inż. Rajmund Stasiewicz

Metody probabilistyczne

STATYSTYKA MATEMATYCZNA

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

6.4 Podstawowe metody statystyczne

6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Wstęp do rachunku prawdopodobieństwa. Cz. 1 / William Feller. wyd. 6, dodr. 4. Warszawa, Spis treści

Wykład 3 Momenty zmiennych losowych.

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Wykład 3 Momenty zmiennych losowych.

Transkrypt:

STATYSTYKA MATEMATYCZNA rachunek prawdopodobieństwa

treść Zdarzenia losowe pojęcie prawdopodobieństwa prawo wielkich liczb zmienne losowe rozkłady teoretyczne zmiennych losowych

Zanim zajmiemy się wnioskowaniem statystycznym musimy uświadomić sobie, Ŝe nigdy w 100% nie będziemy pewni czy jest ono prawdziwe czy fałszywe. MoŜemy tylko takiego czy innego wyniku wnioskowania oczekiwać z określonym prawdopodobieństwem. To znaczy, Ŝe rezultat wnioskowania jest zdarzeniem losowym. Musimy zatem zapoznać się z pojęciem zdarzenia losowego i jego prawdopodobieństwa. Zdarzenia losowe (przypadkowe) to takie zdarzenia, które w danym kompleksie warunków mogą zajść lub nie zajść i mają określone prawdopodobieństwo zajścia lub niezajścia. W kaŝdym eksperymencie (doświadczeniu, badaniu) statystycznym moŝna wyróŝnić zbiór wszystkich moŝliwych, oddzielnych i nie dających rozłoŝyć się na prostsze wyników obserwacji. Zbiór taki nazywamy zbiorem zdarzeń elementarnych. Np. rzut kostką: ZZE to 1,,3,4,5,6 ale uzyskanie jednego z tych moŝliwych zdarzeń jest zdarzeniem losowym.

Prawdopodobieństwo zdarzenia losowego jest teoretycznym odpowiednikiem (względnej) częstości empirycznej (empirycznego prawdopodobieństwa). Definicja klasyczna (na podstawie Laplace`a 181) Prawdopodobieństwem P zdarzenia losowego A nazywamy iloraz liczby zdarzeń elementarnych sprzyjających zdarzeniu A oraz liczby wszystkich zdarzeń elementarnych, jednakowo moŝliwych i wzajemnie się wykluczających. P ( A) a a + b P ( A) 1 P( B) 1 P( A) 0

Definicja matematyczna (na podstawie von Misesa) Prawdopodobieństwo zdarzenia losowego A jest granicą do jakiej dąŝy częstość empiryczna, przy załoŝeniu, Ŝe liczebność jednostek obserwacji dąŝy do nieskończoności. lim n p i P( A) Definicja współczesna (na podstawie Kołmogorowa) (Prawdopodobieństwo jest tu rozumiane jako miara na podzbiorach zbioru zdarzeń elementarnych. Definicja zapisywana jest w formie aksjomatów wynikających z teorii klasycznej Laplace`a) * KaŜdemu zdarzeniu losowemu A odpowiada określona liczba P(A) zwana prawdopodobieństwem zdarzenia losowego A zawierająca się w granicach przedziału liczbowego od 0 do 1 ( A) 1 0 P

** Prawdopodobieństwo zdarzenia pewnego (obejmującego wszystkie elementy zbioru Ω) równa się jedności P( Ω) 1 *** JeŜeli A 1, A,..., A n,... jest ciągiem zdarzeń losowych parami wykluczających się, to prawdopodobieństwo sumy tych zdarzeń jest równe sumie prawdopodobieństw tych zdarzeń P ( A A + + A +...) P( A ) + P( A ) +... + P( A )... 1 +... n 1 n +

Prawo wielkich liczb leŝy u podstaw badania prawidłowości statystycznych. Po raz pierwszy opublikowane jako tzw. Złote twierdzenie Bernoulliego w 1713 roku. W okresach późniejszych bardziej uogólniane przez Poissona, Czebyszewa i innych. Wzrostowi liczby jednostek obserwacji (ściślej - liczby niezaleŝnych doświadczeń) odpowiada wzrastające prawdopodobieństwo zmniejszania się bezwzględnej róŝnicy między częstością empiryczną z próby a nieznanym co do poziomu prawdopodobieństwem danego zdarzenia losowego. lim n P { p P( A) ε} 1 i n i N p i

Na podstawie tego prawa formułowane są ogólniejsze twierdzenia dotyczące procesów masowych. Np.: DuŜa liczebność (masowość) próby powoduje, Ŝe odchylenia na (+) i na (-) między częstością empiryczną i prawdopodobieństwem mają tendencje do zmniejszania się. Tendencja ta nie występuje w przypadku małych prób. Prawo wielkich liczb moŝe być rozszerzane i na inne, poza prawdopodobieństwem, parametry zbiorowości generalnej. Np.: Wartość liczbowa średniej arytmetycznej z próby (x) jest tym lepszym oszacowaniem średniej populacji generalnej (µ) im liczebność losowej próby jest większa. { x } µ ε 1 lim P n (uogólnienie Czebyszewa)

Zmienne losowe: Zmienna losowa (X) jest teoretycznym odpowiednikiem (modelem) cechy statystycznej. Warianty cechy statystycznej pojawiają się z określoną częstością empiryczną (szereg rozdzielczy) a realizacjom zmiennej losowej odpowiadają prawdopodobieństwa wyznaczone przez odpowiednią funkcję. Definicja wg. podręcznika prof. Bruchwalda: Zmienną losową (X) nazywamy funkcję o wartościach rzeczywistych określoną na zbiorze zdarzeń elementarnych taką, Ŝe dla dowolnych stałych a < b jest określone prawdopodobieństwo, iŝ a < X < b. Podobnie jak w przypadku cech statystycznych zmienne losowe dzielimy na skokowe (dyskretne) (X s ) oraz ciągłe (X c ).

Skokowe to takie, których zbiór moŝliwych realizacji jest skończony (x 1, x, x 3,..., x k ) lub przeliczalny (x 1, x, x 3,...). ( X x ) p s i i P Czyli zmienna losowa skokowa przyjmuje wartości liczbowe (x i ) z prawdopodobieństwem (p i ) (gdzie i 1,, 3,..., k lub i 1,, 3,... ) Ciągłe to takie, dla których istnieje taka nieujemna funkcja f(x) zwana funkcją gęstości prawdopodobieństwa, Ŝe dla dowolnych przedziałów (x 1i < x i ) zachodzi: x P ( x X < x ) f ( x) dx p 1i c i i < x i 1i natomiast: P( X x ) 0 c i

Do metod prezentacji wnioskowania statystycznego niezbędne jest pojęcie rozkładu zmiennej losowej: W przypadku zmiennych losowych skokowych, odpowiednia dla danej zmiennej funkcja określa rozkład prawdopodobieństwa wszystkich moŝliwych realizacji tej zmiennej P(X s x i ) p i. Dla zmiennych losowych ciągłych funkcja określa gęstość prawdopodobieństwa, gdyŝ P(X c x i ) 0. Liczba wszystkich moŝliwych zdarzeń dla X c jest nieskończona. f ( x) lim x 0 P ( x < X < x + x) c x

WaŜnym pojęciem w statystyce jest dystrybuanta zmiennej losowej odpowiednik dystrybuanty empirycznej: - dla Xs (skokowej): F ( x) P( X x) P( X x ) - dla Xc (ciągłej): F s x x ( x) P( X < x) f ( x) dx c Dystrybuanta zmiennej losowej F(x) jest to prawdopodobieństwo tego, Ŝe ta zmienna losowa przyjmie wartości < x. i x s i

Wskaźniki charakteryzujące zmienne losowe: Wartość oczekiwana (nadzieja matematyczna) odpowiednik średniej arytmetycznej dla populacji: - dla (X s ): EX x s i p i ni 1 pi i µ N x n i N - dla (X c ): EX c + x f ( x) dx

Wariancja zmiennej losowej: - skokowej D X ( ) s xi EX s pi - ciągłej D X + c ) f ( x dx ( x EX ) c Teoretyczne rozkłady zmiennej losowej skokowej - rozkład dwumianowy: gdzie: q 1 - p k 0, 1,,..., n P ( ) k ( n k ) X k p q s n k

EX np D X npq DX npq Dwumian Newtona: przykłady: ( q + p) n n k k n ( n k) p 0,5 n 10 Binomial Distribution 0,5 0, Event prob.,trials 0,5,10 probability 0,15 0,1 0,05 0 0 1 3 4 5 6 7 8 9 10 x

p 0, n 10 Binomial Distribution probability 0,4 0,3 0, 0,1 Event prob.,trials 0,,10 0 0 1 3 4 5 6 7 8 9 10 x p 0,7 n 10 Binomial Distribution probability 0,3 0,5 0, 0,15 0,1 0,05 0 0 1 3 4 5 6 7 8 9 10 x Event prob.,trials 0,7,10

p 0, n 50 0,15 probability 0,1 0,09 0,06 0,03 Binomial Distribution Event prob.,trials 0,,50 0 0 10 0 30 40 50 x inne rozkłady zmiennej losowej skokowej: - Poissona P k λ k ( ) λ X k e dla: k 0, 1,,... λ > 0 EX D X λ

geometryczny: ( X n) pq n 1 P dla: n 1,, 3,... EX 1 p 1 D X p p q 1-p Teoretyczne rozkłady zmiennej losowej ciągłej: - rozkład normalny: f ( x µ ) 1 σ ( x) e σ Π dla: < x < + σ > 0 EX µ DX σ

f(x) N(0;) z x µ σ σ σ f ( z) 1 Π e 1 z 14 16 18 0 4 6 x µ f(z) N(0;1) F( z) 1 Π z e 1 z dz -3 - -1 0 1 3 z

F(z) 1 F( z) 1 Π z e 1 z dz 0.5-3 - -1 0 1 3 z Inne rozkłady zmiennej losowej ciągłej: - jednostajny - gamma - beta - wykładniczy

Przykłady: rozkład dwumianowy x i n i k i n i k i P(Xk) n 4 3 0 0 0.1177 9.4 6 8 1 8 0.305 75.6 8 73 146 0.34 81.0 10 45 3 135 0.185 46.3 1 4 4 96 0.0595 14.9 14 5 10 0.010.6 16 1 6 6 0.0007 0. suma 50 475 1.0000 50 µ σ 7.80.35 k p nik N k n i 1.90 6 475 50 1.90 0.3167 0.3 EX p np EX n

rozkład normalny x i n i x gi x ig - µ z i (x gi -µ)/σ F(x gi ) F(x gi ) F(x gi-1 ) n i x< 3 0 0.007 5. 3-4.8 -.04 0.007 4 3 0.0963 4.1 5 -.8-1.19 0.1170 6 8 0.499 6.5 7-0.8-0.34 0.3669 8 73 0.381 8.0 9 1. 0.51 0.6950 10 45 0.181 54.5 11 3. 1.36 0.9131 1 4 0.0733 18.3 13 5..1 0.9864 14 0.015 3.1 15 7. 3.06 0.9989 16 1 0.0011 0.3 17 9. 3.91 1.0000 x>17 0 0.0000 0.0 suma 50 1.0000 50 µ 7.80 σ.35

Porównanie częstości empirycznych z teoretycznymi 90 80 70 60 50 40 30 0 10 0 n 0 4 6 8 10 1 14 16 18 0 x ne ndw nnor

90 80 70 60 50 40 30 0 10 0 0 4 6 8 10 1 14 16 18 0 ne ndw 90 80 70 60 50 40 30 0 10 0 0 4 6 8 10 1 14 16 18 0 ne nnor