STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. opulacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne 6. Testy nieparametryczne 7. Korelacja i regresja liniowa i nieliniowa 8. Analiza wariancji Copyright 2010, Joanna Szyda
RAWDOODOBIEŃSTWO
WSTĘ 1. o co nam prawdopodobieństwo? 2. Co to jest prawdopodobieństwo? 3. Symbole i definicje 4. Obliczanie prawdopodobieństwa brzegowego, warunkowego, łącznego 5. Wzór Bayesa 6. Zdarzenia zależne i niezależne 7. Elementy kombinatoryki
o co jest nam prawdopodobieństwo? Statystyka matematyczna umożliwia wnioskowanie ogólne (na temat całej populacji) na podstawie próby rzykład? Np. ięć kotek pewnej rasy urodziło kocięta. Było ich w sumie 23, czyli średnio jedna kotka miała 4,6 kotka. ytania: Czy ten wynik to czysty przypadek, czy norma? Ile kociąt w jednym miocie uzyskuje się w tej rasie kotów? ięć kotek to próba; wszystkie kotki (samice) tej rasy - populacja Żeby uzyskać odpowiedzi, trzeba znać prawdopodobieństwa: urodzenia się 1 kotka, 2 kotków. n (najwyższej zaobserwowanej liczby kotków), czyli: zbiór prawdopodobieństw dla wszystkich wartości cechy o nazwie liczba kociąt w miocie ; inaczej rozkład cechy
CO TO JEST RAWDOODOBIEŃSTWO (probability)? rawdopodobieństwo popularnie: przypuszczalna możliwość lub częstość: dziś prawdopodobnie będzie padał śnieg rawdopodobieństwo w praktyce, badaniach: obserwowana wielokrotnie częstość zdarzenia w 1 na 100 wyźrebień klaczy pełnej krwi angielskiej rodzą się bliźnięta rawdopodobieństwo w analizie statystycznej określenie rozkładów zmiennych losowych (cech) wnioskowanie statystyczne (np. testowanie hipotez)
CO TO JEST RAWDOODOBIEŃSTWO? Definicja klasyczna, tzw. prawdopodobieństwo a posteriori liczba zdarzeń elementarnych sprzyjających zdarzeniu A (sukcesów) A k n liczba wszystkich zdarzeń elementarnych (prób) RZYKŁAD?
CO TO JEST RAWDOODOBIEŃSTWO? rawdopodobieństwo wystąpienia zdarzenia A oznaczamy A) przyjmuje wartości od 0 do 1 kiedy A) 1? kiedy A) 0? (A - zdarzenie pewne) (A - zdarzenie niemożliwe)
RACHUNEK RAWDOODOBIEŃSTWA - symbole SUMA ZDARZEŃ A lub B: AB ILOCZYN ZDARZEŃ A i B: AB ZDARZENIE RZECIWNE (nie A): A RZYKŁADY?
RAWDOODOBIEŃSTWO - definicje RAWDOODOBIEŃSTWO WARUNKOWE (conditional probability) prawdopodobieństwo zdarzenia A pod warunkiem, że zaszło zdarzenie B ( A B ) RAWDOODOBIEŃSTWO BRZEGOWE (marginal probability) prawdopodobieństwo konkretnego zdarzenia, np. B osoba jest chora, spośród całego zbioru rozpatrywanych zdarzeń, np. A jest kobietą, C jest niska, D ma ponad 50 lat, itp., uwzględniające zależności między zdarzeniami różnych typów
RAWDOODOBIEŃSTWO definicje rawdopodobieństwo brzegowe trzeba czasem obliczać jako RAWDOODOBIEŃSTWO CAŁKOWITE (total probability) Jeśli zdarzenie B warunkują dwa wykluczające się zdarzenia (A i nie A), to: B) A) B / A) A) B / A) RZYKŁAD: obliczanie prawdopodobieństwa natrafienia w populacji na osobę chorą, jeśli częstość choroby określona została osobno u kobiet i u mężczyzn Według teorii jest to tzw. prawdopodobieństwo a priori
OBLICZANIE RAWDOODOBIEŃSTWA Journal of sychiatric Research (2003) Carter i wsp. wystąpienie choroby afektywnej dwubiegunowej w zależności od wieku... i uwarunkowań rodzinnych 318 pacjentów wystąpienie choroby dwubiegunowej historia choroby w rodzinie <18 lat (E) 18 lat (L) nie występuje (A) 28 35 63 dwubiegunowa (B) 19 38 57 jednobiegunowa (C) 41 44 85 jedno- i dwubiegunowa (D) 53 60 113 141 177 318 Copyright 2009, Joanna Szyda
RAWDOODOBIEŃSTWO BRZEGOWE (marginal probability) wystąpienie choroby dwubiegunowej historia choroby w rodzinie <18 lat (E) 18 lat (L) nie występuje (A) 28 35 63 dwubiegunowa (B) 19 38 57 jednobiegunowa (C) 41 44 85 jedno- i dwubiegunowa (D) 53 60 113 141 177 318 rawdopodobieństwo, że losowo wybrany chory na chorobę dwubiegunową ma poniżej 18 lat, E) 141 E 0. 4434 318 rawdopodobieństwo, że losowo wybrany chory jest dzieckiem zdrowych rodziców, A) 63 318 A 0. 1981 Copyright 2009, Joanna Szyda
ZDARZENIA DOEŁNIAJĄCE SIĘ (complementary events) wystąpienie choroby dwubiegunowej historia choroby w rodzinie <18 lat (E) 18 lat (L) nie występuje (A) 28 35 63 dwubiegunowa (B) 19 38 57 jednobiegunowa (C) 41 44 85 jedno- i dwubiegunowa (D) 53 60 113 141 177 318 rawdopodobieństwo, że losowo wybrany chory ma poniżej 18 lat, E) 141 318 E 0. 4434 rawdopodobieństwo, że losowo wybrany chory ma co najmniej 18 lat, L) 177 E E L E 0. 5566 318 E) E ) 1 1 Copyright 2009, Joanna Szyda
RAWDOODOBIEŃSTWO WARUNKOWE (conditional prob.) wystąpienie choroby dwubiegunowej historia choroby w rodzinie <18 lat (E) 18 lat (L) nie wystepuje (A) 28 35 63 dwubiegunowa (B) 19 38 57 jednobiegunowa (C) 41 44 85 jedno- i dwubiegunowa (D) 53 60 113 141 177 318 rawdopodobieństwo, że losowo wybrany chory poniżej 18 lat pochodzi ze zdrowej rodziny Warunek chory ma poniżej 18 lat rawdopodobieństwo zdarzenia A pod warunkiem, że zaszło zdarzenie E, A/E) 28 141 A / E 0. 1986 Copyright 2009, Joanna Szyda
RAWDOODOBIEŃSTWO ŁĄCZNE (joint probability) wystąpienie choroby dwubiegunowej historia choroby w rodzinie <18 lat (E) 18 lat (L) nie wystepuje (A) 28 35 63 dwubiegunowa (B) 19 38 57 jednobiegunowa (C) 41 44 85 jedno- i dwubiegunowa (D) 53 60 113 141 177 318 rawdopodobieństwo, że losowo wybrany chory ma poniżej 18 lat i pochodzi ze zdrowej rodziny Tu brak warunku, wybór spośród wszystkich chorych rawdopodobieństwo łącznego zajścia zdarzeń A i E, AE) prawdopodobieństwo iloczynu zdarzeń 28 318 AE A E 0. 0881 Copyright 2009, Joanna Szyda
WZÓR BAYESA prawdopodobieństwo warunkowe prawdopodobieństwo łączne A E AE) E) prawdopodobieństwo brzegowe
WZÓR BAYESA przekształcenie Obliczanie prawdopodobieństwa łącznego (prawdopodobieństwa iloczynu zdarzeń) A E A/ E) E)
WZÓR BAYESA wykorzystanie w przykładzie wystąpienie choroby dwubiegunowej historia choroby w rodzinie <18 lat (E) 18 lat (L) nie występuje (A) 28 35 63 dwubiegunowa (B) 19 38 57 jednobiegunowa (C) 41 44 85 jedno- i dwubiegunowa (D) 53 60 113 141 177 318 rawdopodobieństwo, że losowo wybrany chory poniżej 18 lat pochodzi ze zdrowej rodziny AE) E) 28 318 141 318 A E 0. 1986 rawdopodobieństwo, że losowo wybrany chory ma poniżej 18 lat i pochodzi ze zdrowej rodziny 28 141 141 318 AE A E) E) 0. 0881 Copyright 2009, Joanna Szyda
RAWDOODOBIEŃSTWO SUMY wystąpienie choroby dwubiegunowej historia choroby w rodzinie <18 lat (E) 18 lat (L) nie wystepuje (A) 28 35 63 dwubiegunowa (B) 19 38 57 jednobiegunowa (C) 41 44 85 jedno- i dwubiegunowa (D) 53 60 113 141 177 318 rawdopodobieństwo, że losowo wybrany chory ma powyżej 18 lat L) lub że losowo wybrany chory pochodzi ze zdrowej rodziny A); L A) 177 318 63 318 35 318 L A L A LA 0. 64 Copyright 2009, Joanna Szyda
ZDARZENIA ZALEŻNE I NIEZALEŻNE A B A B ZDARZENIA NIEZALEŻNE ZDARZENIA ZALEŻNE rawdopodobieństwo łączne (prawdopodobieństwo iloczynu zdarzeń A i B) A B A) B) A B A B) B) bo: A B A B) B) A) B) Copyright 2009, Joanna Szyda
ZDARZENIA ZALEŻNE I NIEZALEŻNE A B A B ZDARZENIA NIEZALEŻNE (independent events) ZDARZENIA ZALEŻNE (dependent events) rawdopodobieństwo warunkowe A B A bo: A B AB) B) AB) B) A) B) B) A B A) Copyright 2009, Joanna Szyda
ZDARZENIA ZALEŻNE I NIEZALEŻNE A B A B ZDARZENIA NIEZALEŻNE ZDARZENIA ZALEŻNE rawdopodobieństwo sumy zdarzeń A B A) B) A) B) A B A) B) A B) Kiedy A B A) B)??? RZYKŁAD? Zdarzenia ROZŁĄCZNE to nie to samo co NIEZALEŻNE Copyright 2009, Joanna Szyda
WZÓR BAYESA ogólne zastosowanie prawdopodobieństwo warunkowe prawdopodobieństwo łączne A B A B) B) prawdopodobieństwo (brzegowe) całkowite
WZÓR BAYESA ogólne zastosowanie prawdopodobieństwo warunkowe prawdopodobieństwo łączne A B A) B A B) / A) A) B / A) prawdopodobieństwo całkowite
KOMBINATORYKA
ERMUTACJE Liczba możliwych zestawień wszystkich n elementów zbioru z uwzględnieniem kolejności n! 3! 123 6 Copyright 2009, Joanna Szyda
WARIACJE Liczba wszystkich możliwych zestawień k elementów ze zbioru n elementów z uwzględnieniem kolejności n! 3! 6 n k! 1! Copyright 2009, Joanna Szyda
KOMBINACJE Liczba możliwych k-elementowych podzbiorów zbioru n elementów (bez uwzględnienia kolejności) n k k! n! n k! 3! 2!1! 6 2 3 Copyright 2009, Joanna Szyda
KOMBINATORYKA o co nam znajomość kombinatoryki? M.in. żeby łatwo określać liczbę zdarzeń będących wynikiem np. kombinacji, a w efekcie określać częstość (prawdopodobieństwo a posteriori) konkretnych zdarzeń rzykład: Jakie jest prawdodobieństwo trafienia szóstki w Lotto? Liczba WSZYSTKICH możliwych szóstek: 49 6 k! n! n k! 49! 6!(49 6)!? Obliczenia na ćwiczeniach ZARASZAM!!!
ODSUMOWANIE 1. o co nam prawdopodobieństwo? 2. Co to jest prawdopodobieństwo? 3. Symbole i definicje 4. Obliczanie prawdopodobieństwa brzegowego, warunkowego, łącznego 5. Wzór Bayesa 6. Zdarzenia zależne i niezależne 7. Elementy kombinatoryki