Prawdopodobieństwo i statystyka

Wykład I: Formalizm teorii prawdopodonieństwa 6 października 2014

Forma zaliczenia przedmiotu Forma zaliczenia Literatura Dostępność treści wykładów 1 Zaliczenie ćwiczeń rachunkowych. 2 Egzamin dwuczęściowy: Egzamin pisemny (rozwiązywanie zadań). Egzamin ustny z teorii. 3 Do wykładu są prowadzone kursy wyrównawcze, gdzie osoby mające trudności z rachunkami, będą mogły uzupełnić swoje umiejętności. 4 Podstawą zajęć wyrównawczych jest opracowanie Statystyka i eksploracja danych. Repetytorium z teorii prawdopodobieństwa.

Forma zaliczenia Literatura Dostępność treści wykładów

Literatura podstawowa Forma zaliczenia Literatura Dostępność treści wykładów 1 J. Jakubowski i R. Sztencel Wstęp do teorii prawdopodobieństwa, Script, Warszawa 2004. 2 W. Niemiro Rachunek prawdopodobieństwa i statystyka matematyczna, Szkoła Nauk Ścisłych, Warszawa 1999.

Literatura uzupełniająca Forma zaliczenia Literatura Dostępność treści wykładów 1 J.L Johnson Probability and Statistics for Computer Science, Wiley 2003. 2 R. Zieliński Siedem wykładów wprowadzających do statystyki matematycznej, PWN Warszawa 1990.

Forma zaliczenia Literatura Dostępność treści wykładów Zagadnienia omawiane na wykładach będą dostępne: na mojej stronie www.mat.umk/ adjakubo; w opracowaniu Statystyka i eksploracja danych w bibliotece WMiI.

Co to jest... Informacje ogólne Co to jest... Prognozy wyborcze Rachunek prawdopodobieństwa to sztuka (umiejętność) obliczania prawdopodobieństw zdarzeń. Teoria prawdopodobieństwa to dział matematyki, na którym opierają się praktyczne obliczenia dokonywane w rachunku prawdopodobieństwa. Statystyka to sztuka (umiejętność) wnioskowania na podstawie próby losowej. Statystyka matematyczna to dział matematyki, który rozwija metody uzasadniające poprawność wnioskowania statystycznego. Eksploracja danych (drążenie danych, ekstrakcja danych) to umiejętność wydobywania użytecznych informacji z wielkich zbiorów danych.

Co to jest... Prognozy wyborcze Przykład. Wybory parlamentarne 9 października 2011 OBOP PKW 7.10.11 wyniki PO 39,5% 39,18% PiS 29,1% 28,89% RP 10,3% 10,02% SLD 9,2% 8,24% PSL 8,7% 8,36% PJN 1,8% 2,19% Frekwencja 47,5% 48,87 %

Co to jest... Prognozy wyborcze Przykład. Wybory parlamentarne 9 października 2011 OBOP Exit pools PKW wyniki PO 39,6% 39,18% PiS 30,1% 28,89% RP 10,1% 10,02% SLD 7,7% 8,24% PSL 8,2% 8,36% PJN 2,2% 2,19% Frekwencja 47,7% 48,87 %

Co to jest... Prognozy wyborcze Przykład. Wybory parlamentarne 9 października 2011 Homo Homini Exit pools PKW wyniki PO 37,3% 39,18% PiS 29,1% 28,89% RP 8,6% 10,02% SLD 11,6% 8,24% PSL 9,5% 8,36% PJN 2,3% 2,19%

Słowniczek TP Przykłady Słowniczek teorii prawdopodobieństwa Definicja przestrzeni probabilistycznej Przestrzenią probabilistyczną nazywamy trójkę (Ω, F, P), gdzie Ω jest zbiorem zdarzeń elementarnych (inaczej: elementy ω zbioru Ω nazywamy zdarzeniami elementarnymi). F jest σ-algebrą podzbiorów zbioru Ω. Elementy F nazywamy zdarzeniami. P : F [0, 1] jest prawdopodobieństwem na (Ω, F).

Interpretacja formalizmu Słowniczek TP Przykłady Ω to zbiór wszystkich możliwych wyników eksperymentu losowego. Zdarzenia (elementy F) reprezentują fakty, których zajście możemy stwierdzić, tzn. dla A F zawsze możemy powiedzieć, czy wynik ω A, czy ω A. W ten sposób F reprezentuje całość wiedzy, którą możemy uzyskać w wyniku realizacji eksperymentu losowego. F nigdy nie może zajść (jest zdarzeniem niemożliwym ), więc P( ) = 0. Ale idziemy dalej: P(A) = 0 oznacza, że zdarzenie A jest niemożliwe, choć może być A. Ω F zachodzi zawsze (jest zdarzeniem pewnym ), więc P(Ω) = 1. Podobnie: P(A) = 1 oznacza, że zdarzenie A jest pewne, choć może być A Ω.

Definicje matematyczne Słowniczek TP Przykłady Stwierdzenie F jest σ-algebrą oznacza, że: 1 F, Ω F. 2 Jeżeli A F, to również A c F. 3 Jeżeli A 1, A 2,... F, to j=1 A j F. Zauważmy związki działań na zbiorach i działań logicznych na faktach. Może być F = 2 Ω, ale w ogólności F 2 Ω (interpretacja!).

Definicje matematyczne - cd. Słowniczek TP Przykłady Stwierdzenie P : F [0, 1] jest prawdopodobieństwem oznacza, że: 1 P( ) = 0, P(Ω) = 1. 2 Jeżeli zdarzenia A 1, A 2,..., A n są parami rozłączne (tzn. A i A j = dla i, j = 1, 2,...., n, i j), to P( n A j ) = j=1 n P(A j ). 3 Jeżeli zdarzenia A 1, A 2,... F tworzą ciąg wstępujący (tzn. A i A i+1 dla i = 1, 2,....), to P( j=1 j=1 A j ) = lim P(A j ). j

Definicje matematyczne - cd. Słowniczek TP Przykłady Własność P( n j=1 A j ) = n j=1 P(A j ) dla ciągów parami rozłącznych nazywamy addytywnością prawdopodobieństwa. Własność P( j=1 A j) = lim j P(A j ) dla ciągów rosnących nazywamy ciągłością z dołu prawdopodobieństwa. Warunki 1-3 w powyższej definicji nie są minimalne. Minimalny zbiór warunków określający prawdopodobieństwo możemy zapisać np. tak: P(Ω) = 1. Jeżeli A 1, A 2,..., są parami rozłączne, to P( A j ) = P(A j ). j=1 (prawdopodobieństwo jest σ- addytywne). Zauważmy, że P( A j ) na sens w obu przypadkach, bo F jest σ-algebrą. j=1

Własności prawdopodobieństwa Słowniczek TP Przykłady Twierdzenie (Własności prawdopodobieństwa) 1 Jeżeli A, B F, A B, to P(A) P(B). 2 Jeżeli A, B F, A B, to P(B \ A) = P(B) P(A). 3 W szczególności, jeżeli A F, to P(A c ) = 1 P(A). 4 (Własność subaddytywności) Dla dowolnych A 1, A 2,... F P( j A j ) j P(A j ). 5 (Ciągłość z góry). Jeżeli zbiory A 1, A 2,... F są zstępujące, tzn. A 1 A 2..., to P( j=1 A j ) = lim P(A j ). j

Zasada włączen i wyłączeń Słowniczek TP Przykłady Twierdzenie (Zasada włączeń i wyłączeń) Dla dowolnych A 1, A 2,..., A n F n n P( A j ) = P(A j ) j=1 + j=1 1 i<j n 1 i<j<k n P(A i A j ) P(A i A j A k )... + ( 1) n+1 P(A 1 A 2... A n ).

Przykłady Informacje ogólne Słowniczek TP Przykłady Klasyczna definicja prawdopodobieństwa. Niech Ω będzie zbiorem skończonym i niech F = 2 Ω. Określamy P(A) = #A #Ω. ( Zasada racji dostatecznej Laplace a.) Prawdopodobieństwo dyskretne. Niech Ω 0 = {ω 1, ω 2,...} będzie podzbiorem przeliczalnym zbioru Ω. Niech p 1, p 2,... 0, j p j = 1. Przyjmując z definicji 0, określamy P(A) = p j. (F = 2 Ω!) {j : ω j A}

Przykłady cd. Informacje ogólne Słowniczek TP Przykłady Niech Ω = R 1 i p(x) 0 będzie funkcją na R 1 taką, że p(x) dx = 1. Określamy: + P((a, b]) = b a p(x) dx, a < b, a, b R 1. Jak wygląda F? To problem badany przez teorię miary i całki Lebesgue a. Można pokazać, że nie istnieje prawdopodobieństwo Q : 2 R1 [0, 1] pokrywające się z P na odcinkach. Z drugiej strony istnieje σ-algebra B 1 (tzw. zbiorów borelowskich) na którą można rozszerzyć funkcję P, tak aby spełnione były własności prawdopodobieństwa.