Fundamentals of Biostatistics. Brooks/Cole CENGAGE Learning,

Podobne dokumenty
Baza dla predykcji medycznej

Fundamentals of Biostatistics. Brooks/Cole CENGAGE Learning, 2011

10/15/2016. Reguła. Czułość PV(+) Bayesa. Swoistość PV(-)

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Statystyka i eksploracja danych

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

W1. Wprowadzenie. Statystyka opisowa

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Pozyskiwanie wiedzy z danych

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Zadania o numerze 4 z zestawów licencjat 2014.

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

laboratoria 24 zaliczenie z oceną

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Laboratorium 3 - statystyka opisowa

Statystyka matematyczna i ekonometria

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Opis przedmiotu. Karta przedmiotu - Probabilistyka I Katalog ECTS Politechniki Warszawskiej

Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa

Opis przedmiotu: Probabilistyka I

Rozkład materiału nauczania

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu

Weryfikacja hipotez statystycznych

METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Prawdopodobieństwo i statystyka

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Testowanie hipotez statystycznych.

Statystyka opisowa. Robert Pietrzykowski.

Wybrane rozkłady zmiennych losowych. Statystyka

Statystyka Matematyczna Anna Janicka

1 Podstawy rachunku prawdopodobieństwa

Wykład 2. Zdarzenia niezależne i prawdopodobieństwo całkowite

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Biostatystyka, # 3 /Weterynaria I/

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Statystyka matematyczna dla leśników

STATYSTYKA MATEMATYCZNA

1.1 Rachunek prawdopodobieństwa

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Literatura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

You created this PDF from an application that is not licensed to print to novapdf printer (

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Prawdopodobieństwo i statystyka

Rozkład Gaussa i test χ2

Wybrane rozkłady zmiennych losowych. Statystyka

Parametry statystyczne

reguła mnożenia ilustracja zbioru wyników doświadczenia za pomocą drzewa reguła dodawania definicja n! liczba permutacji zbioru n-elementowego

Spacery losowe generowanie realizacji procesu losowego

Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport

CZEŚĆ PIERWSZA. Wymagania na poszczególne oceny,,matematyka wokół nas Klasa III I. POTĘGI

Spis treści 3 SPIS TREŚCI

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

STATYSTYKA MATEMATYCZNA

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Testowanie hipotez statystycznych.

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Kolokwium ze statystyki matematycznej

Podstawy metod probabilistycznych. dr Adam Kiersztyn

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Pobieranie prób i rozkład z próby

Wykład 4: Statystyki opisowe (część 1)

Matematyka ubezpieczeń majątkowych r.

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Zadania ze statystyki, cz.6

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

(C. Gauss, P. Laplace, Bernoulli, R. Fisher, J. Spława-Neyman) Wikipedia 2008

Statystyka opisowa- cd.

CZĘŚĆ I: ISTOTNE STATYSTYKI DOTYCZĄCE STATYSTYKI

WYMAGANIA Z MATEMATYKI NA POSZCZEGÓLNE OCENY KLASYFIKACYJNE DLA UCZNIÓW KLAS TRZECICH. Sposoby sprawdzania wiedzy i umiejętności uczniów

Transkrypt:

ernard Rosner Fundamentals of iostatistics rooks/cole CENGGE Learning, 2011 http://www.cengage.com/resource_uploads/downloads/0538733497_267933.pdf ntoni Lemańczyk UM oznań, oznan, 2008 Geoffry R. Norman i David Streiner, iostatistics: The are Essentials MH US, 3 edition 2007 1 rof. Danuta Makowiec Instytut Fizyki Teoretyczne i strofizyki, UG Kontakt: pok. 353, tel.: 58 523 2466, e-mail danuta.makowiec at gmail.com http://www.fizdm.strony.ug.edu.pl/me/biostatystyka_2016.html 1

opulaca statystyczna : zbiorowość na akie prowadzi się badania statystyczne roektowanie badania : czy będzie to badanie obserwacyne? czy będzie to kontrolowany eksperyment? a może tylko ankieta? akie rodzae zmiennych opisuą cechę: zależne czy niezależne określenie relaci przyczynowo - skutkowe pomiędzy zmiennymi? kategoryczne wartości nie wyznaczaą porządku czy ilościowe wartości można uporządkować? a eśli ilościowe to czy dyskretne czy ciągłe? pozwolą na uzyskanie odpowiedzi? iostatystyka 3 / 2016_10_06 róbkowanie populaci. Konsekwentne zbieranie założonych danych w próbie. iostatystyka 4 / 2016_10_06 2

rzetworzenie zebranych w próbie danych: zestawienia graficzne histogramy, wykresy pudełkowe, itp. i tabele by uzyskać opis dominuących własności oraz dziwnych skraności interpretaca rezultatów iostatystyka 5 / 2016_10_06 Miary lokalizaci danych : moda średnia arytmetyczna średnia geometryczna mediana Miary rozproszenia danych: zakres percentylev p kwantyle, kwartyle Q i odstęp interkwartylowy IQR warianca var= s 2 odchylenie standardowe s Techniki graficzne prezentaci danych: rozkład częstości wykres słupkowy wykres łodyga-liść wykres pudełkowy Rodza danych kategoryczne porządkowe interwałowe ilorazowe Zalecane miary lokalizaci moda moda mediana średnia moda mediana średnia moda mediana Zalecane miary rozprosze-nia zakres _ s, zakres IQR s, zakres, IQR iostatystyka 6 / 2016_10_06 3

Wąs 95 percentyla Kwartyl górny: Q 3 Średnia arytmetyczna + Mediana: kwartyl drugi: Q 2 Kwartyl dolny: Q 1 Wąs 5 percentyla iostatystyka 7 / 2016_10_06 Histogram, a także wykres pudełkowy uawniaą symetrie lub e brak w uzyskanych danych. Jeśli dane są symetryczne to nalepsze miary lokalizaci to średnia arytmetyczna i warianca odchylenie standardowe. odstawowe narzędzie statystyki: rachunek prawdopodobieństwa iostatystyka 8 / 2016_10_06 Zmienna losowa: Zmienna opisywana przez rozkład prawdopodobieństwa: dyskretny np. rozkład dwumianowy ciągły np.rozkład normalny 4

Estymaca Testowanie hipotez iostatystyka 9 / 2016_10_06 elementy rachunku prawdopodobieństwa Dlaczego? omiar to taka operaca, które wyniku nie znamy przed e wykonaniem, ale umiemy go przewidzieć. robabilistyczne widzenia pomiaru opiera się na założeniach: a o istnieniu przestrzeni stanów pomiaru, Ω, zbioru wszystkich możliwych wyników pomiaru funkci prawdopodobieństwa określone na te przestrzeni : a dla dowolnego pomiaru, [0,1] b 1 c dla i, iostatystyka 10 / 2016_10_06 b częstościowym ustaleniu funkci prawdopodobieństwa wielokrotne powtórzenie pomiaru, zliczenie ego wyników pozwala na ustalenie lim n n n 5

elementy rachunku prawdopodobieństwa rzestrzeń stanów pomiaru D: Ω ={0,1,2,.,89,90,91,, 500} mmhg Zdarzenia elementarne wzaemnie się wykluczaą Zdarzenia elementarne wyczerpuą wszystkie możliwości Załóżmy, że szerokie pomiary D ludności pozwoliły ustalić D= k dla każdego k=0,1,2, 500 mmhg Zatem na mocy własności funkci prawdopodobieństwa: rawdopodobieństwo zdarzenia = { 80 DS 90} { } 1 0 D 500 :80 D 90 500 500 k 0 { D k} D k k 0 90 90 k 80 { D k} D k k 80 iostatystyka 11 / 2016_10_06 elementy rachunku prawdopodobieństwa Niech ={ D <90} to ciśnienie normatywne = { 90 D < 95} to ciśnienie graniczne Zdarzenia i są wzaemnie wykluczaące się. Zdarzenia te nie mogą występować ednocześnie Niech =0.7, =0.1 Wówczas 0. 8 Niech C ={ D 90} D= { 75 D 100} C i D nie są wzaemnie wykluczaące się. C est zdarzeniem komplementarnym do, co oznaczamy C = ~ Wówczas C 0.3 rawdopodobieństwa zdarzenia D w oparciu o posiadane dane nie umiemy obliczyć. iostatystyka 12 / 2016_10_06 6

elementy rachunku prawdopodobieństwa Niech: M={ mama ma D 95} T={ tata ma D 95} M=0.1 T=0.2 M T? Zdarzenia i nazywamy niezależnymi eżeli prawdopodobieństwo wystąpienia ednoczesnego obu zdarzeń est iloczynem prawdopodobieństw tych zdarzeń: i = Uogólnienie prawa lub interakca i dodawania Jeśli i są zdarzeniami z te same fizycznie przestrzeni probabilistyczne iostatystyka 13 / 2016_10_06 interakca i Jeśli przestrzenie zdarzeń i są różne to interakca i, rawdopodobieństwo przekrou zbiorów rawdopodobieństwo łączne zdarzeń elementy rachunku prawdopodobieństwa Dwie zmienne i o następuących zbiorach wartości,..., : a1, a2 ak : b1, b2,..., bm przy czym zarówno { ai} ak i { bi} są zestawami zbiorów wzaemnie rozłącznych i wyczerpuących, odpowiadaących wartościom i, czyli 1 { a 1 { b,.. b } 1,.. ak} a i i1.. K 1 M b i i1.. M Do opisu łącznego obu zmiennych i stosue się prawdopodobieństwo łączne { = a i, =b } określone na iloczynie kartezańskim wartości poszczególnych zmiennych. iostatystyka 14 / 2016_10_06 Warto pamiętać, że: i, i a, b 1 i a, b b i a, b a i o : wyczerpane są wszystkie możliwe wartości wyczerpane są wartości zmienne wyczerpane są wartości zmienne 7

Definica Zmienne i nazywamy niezależnymi, eśli wiedza o wyniku edne z nich nie dostarcza nowe informaci o zmienne drugie. Matematycznie własność ta wyraża się ako,= rawo dodawania obserwaci niezależnych: Jeżeli obserwace i są niezależne to 1 iostatystyka 15 / 2016_10_06 elementy rachunku prawdopodobieństwa rzykład: M=0.1 T=0.2 nie M 95 M Ω mama nie T nie M, nie T M, nie T 95 T nie M, T M, T M, T M * T 0.02 ~ M, T ~ M * T 0.18 M,~ T M * ~ T 0.08 ~ M,~ T ~ M * ~ T 0.72 iostatystyka 16 / 2016_10_06 Ω tata M T M T T M 0.28 8

Definica: rawdopodobieństwem wystąpienia zdarzenia przy warunku, że wystąpiło zdarzenie nazywamy wielkość:, Ω 1 3 2 1 2 3? iostatystyka 17 / 2016_10_06 Zestaw wyczerpuący zdarzeń wzaemnie wykluczaących się : 1, 2, k - edno ze zdarzeń 1, 2, k musi wystąpić - żadne dwa z nich nie może wystąpić ednocześnie rawdopodobieństwo całkowite Dla zadanego zestawu wyczerpuącego zdarzeń wzaemnie wykluczaących się : 1, 2, k, prawdopodobieństwo dowolnego zdarzenia est średnią ważoną prawdopodobieństw warunkowych zdarzenia przy zadanym i : k i1 i i iostatystyka 18 / 2016_10_06 Szczególny przypadek podziału przestrzeni stanów: i ~ ~ ~ 9

Niech: poawienie się raka piersi w przeciągu dwóch lat po mammografii pozytywny wynik mammografii Wiemy, że spośród 100 000 kobiet z negatywnym wynikiem mammografii u 20 kobiet w przeciągu dwóch lat poawi się rak piersi. Zatem ~ =0.0002 u 1 kobiety spośród 10 z pozytywnym wynikiem mammografii poawi się rak piersi. Zatem = 0.1 Zdarzenia i są silnie zależne bo RR względne ryzyko est: RR 500 ~ Jeśli 7% populaci kobiet uzyskue pozytywny wynik mammografii, to ~ ~ iostatystyka 19 / 2016_10_06 Co czytamy: Kobiety z pozytywnym wynikiem mammografii maą 500 razy większe prawdopodobieństwo zachorowania na raka w przeciągu dwóch lat niż kobiety z negatywnym wynikiem mammografii = 0.00719=0.719% zachorue na raka piersi w przeciągu dwóch lat Test przesiewowy: rodza strategicznego badania prowadzonego wśród osób nieposiadaących obawów dane choroby w celu e wykrycia i wczesnego leczenia. rzewidywanie w oparciu o wynik testu przesiewowego: Wartością predykcyną dodatnią V+ testu nazywamy prawdopodobieństwo tego, ze osoba est chora, eśli wynik testu est dodatni: V+ = chory test+ Wartością predykcyną uemną V- testu nazywamy prawdopodobieństwo tego, ze osoba nie est chora, eśli wynik testu est uemny: V- = nie chory test- rzykład z mammografii: V+=rak piersi w przeciągu 2 lat mammografia+= =0.1 V-=nie ma raka piersi w przeciągu 2 lat mammografia-= ~ ~= 1- ~ =.9998 iostatystyka 20 / 2016_10_06 Im V- wyższe, test est lepszy!!! 10

Symptom zestaw symptomów może wyznaczać test przesiewowy V+ = est chory est symptom V- = nie est chory brak symptomu Idealne testy: V+ i V- bliskie 1 V+ wyższe, to test est lepszy Czułość symptomu zestawu symptomów to prawdopodobieństwo, że ten symptom est obecny, gdy osoba est chora. Czyli est symptom est chory Swoistość symptomu zestawu symptomów to prawdopodobieństwo, że ten symptom nie est obecny, gdy osoba est nie chora. Czyli brak symptomu nie est chory iostatystyka 21 / 2016_10_06 X, Y Y, X X Y Y Y Y, X X, Y Y X X X X, Y Y, X X Y Y Y X X iostatystyka 22 / 2016_10_06 Reguła ayesa pozwala odwrócić warunek, ale musi być znane Y 11

12 =symptom = choroba ~ ~ ~ ~ Czułość Swoistość V+ V- Reguła ayesa ~ ~ V 1-1 * * specificity sensitivity sensitivity V * 1 *1- *1- sensitivity specificity specificity V iostatystyka 23 / 2016_10_06