Wykład 12: Tablice wielodzielcze

Podobne dokumenty
Badanie zależności zmiennych kolumnowej i wierszowej:

Rozkłady dwuwymiarowe. Tablice dwudzielcze. Przykład (wstępny):

Wykład 11: Dane jakościowe. Rozkład χ 2. Test zgodności chi-kwadrat

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Testowanie hipotez statystycznych.

Wykład 14 Test chi-kwadrat zgodności

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Założenia: wyniki są binarne próby są niezależne liczba prób n ustalona przed pomiarem to samo prawdopodobieństwo sukcesu we wszystkich próbach

NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR

Wykład 8 Dane kategoryczne

Wykład 10 Zrandomizowany plan blokowy

Estymacja parametrów rozkładu cechy

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Rozkłady statystyk z próby

Wykład 9 Wnioskowanie o średnich

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

1.1 Wstęp Literatura... 1

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Statystyka matematyczna dla leśników

Uwaga! Test studenta dla pojedynczej próby, niekierunkowy. Wykład 9: Testy Studenta. Test Studenta dla jednej próby, kierunkowy

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Wszystkie wyniki w postaci ułamków należy podawać z dokładnością do czterech miejsc po przecinku!

Wnioskowanie statystyczne. Statystyka w 5

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Wykład 3 Hipotezy statystyczne

Estymacja parametrów w modelu normalnym

Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny?

Wykład 11 Testowanie jednorodności

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Zadania ze statystyki cz.5 I rok socjologii miary związków między zmiennymi jakościowymi

Testowanie hipotez statystycznych

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Weryfikacja hipotez statystycznych

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Testowanie hipotez statystycznych.

Zawartość. Zawartość

Prawdopodobieństwo i statystyka r.

Testowanie hipotez statystycznych

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Statystyka matematyczna i ekonometria

Oszacowanie i rozkład t

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

STATYSTYKA MATEMATYCZNA

Własności statystyczne regresji liniowej. Wykład 4

1 Estymacja przedziałowa

Wykład 9 Testy rangowe w problemie dwóch prób

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Przykład 1. (A. Łomnicki)

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

STATYSTYKA

Komputerowa Analiza Danych Doświadczalnych

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

Testowanie hipotez statystycznych cd.

Zadania ze statystyki, cz.6

Wykład 10 Testy jednorodności rozkładów

Rozkłady statystyk z próby. Statystyka

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Testy nieparametryczne

TABLICE PODSTAWOWYCH ROZKŁADÓW PRAWDOPODOBIEŃSTWA. T4. Tablica kwantyli rozkładu chi-kwadrat (I część - poziomy kwantyli 0,5)

Testowanie hipotez statystycznych.

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Wykład 8: Testy istotności

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Przykłady bloków: Przykład. Przyporządkowanie. Wykład 9 Zrandomizowany plan blokowy

Estymacja punktowa i przedziałowa

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Testowanie hipotez statystycznych

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Przykłady bloków: Przykład. Przyporządkowanie. Wykład 10 Zrandomizowany plan blokowy

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Testowanie hipotez statystycznych

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Wydział Matematyki. Testy zgodności. Wykład 03

Spis treści 3 SPIS TREŚCI

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

Metody Statystyczne. Metody Statystyczne.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Transkrypt:

Wykład 12: Tablice wielodzielcze Drosophila melanogaster Krzyżówka wsteczna (CcNn i ccnn) Kolor oczu czerwone fioletowe Rozmiar skrzydła normalne 39 11 mniejsze 18 32

Zródło:http://pl.wikipedia.org/wiki/Plik:Drosophila_melanogaster1.jpg

Badanie zależności zmiennych kolumnowej i wierszowej: Tutaj zmiennymi badanymi są: H 0 : zmienne są niezależne Obok obserwowanych liczności, ozn. O, Rozważamy liczności oczekiwane przy H 0 : E : suma wiersza suma kolumny liczba wszystkich obserwacji

Uzupełniamy tabelę wartościami oczekiwanymi przy Ho: Kolor oczu Suma czerwone fioletowe Kształt skrzydła normalne 39 ( ) 11 ( ) 50 mniejsze 18 ( ) 32 ( ) 50 Suma 57 43 100

Czy w badanej populacji kolor oczu i kształt skrzydła są zmiennymi niezależnymi? H 0 : kolor oczu i rozmiar skrzydła są niezależne H A : kolor oczu i rozmiar skrzydła są zależne Zastosujemy test chi-kwadrat dla niezależności: 2 s = (O-E) 2 /E ma przy H 0 tzw. rozkład 2 1. Testujemy na poziomie = 0.05; odrzucamy gdy 2 s > 3.84 = 2 krytyczne Tutaj 2 s =... Wniosek:...

Rozkłady brzegowe i warunkowe: Opisz rozkład koloru oczu w danych: Opisz rozkład kształtu skrzydeł w danych: Opisz rozkład koloru oczu w danych dla normalnego kształtu skrzydeł:

Dyskusja rozkładów brzegowych i warunkowych w populacji: p 1 := Pr(czerwone oczy normalne skrzydła), p 2 := Pr(czerwone oczy mniejsze skrzydła) H 0 : (kolor oczu i rozmiar skrzydła są niezależne) jest równoważna równości p 1 = p 2 H A : (kolor oczu i rozmiar skrzydła są zmiennymi zależnymi) oznacza, że p 1 p 2 Estymatorami p 1 i p 2 są: ˆp ˆp 1 2 Omówimy później przedziały ufności dla p 1 -p 2.

Uwagi: Nie możemy powiedzieć, że krótsze skrzydła powodują, że muszka ma fioletowe oczy. Prawidłowy wniosek to obserwacja, że kolor oczu i kształt skrzydła są zmiennymi zależnymi, albo że u muszek z normalnymi skrzydłami częściej występują czerwone oczy niż u muszek z mniejszymi skrzydłami. Nie możemy formułować wniosku przyczynowego, także dlatego, że nie kontrolujemy analizowanych zmiennych, a jedynie je obserwujemy. W tym wypadku zależność wynika z faktu, że geny determinujące kształt oczu i rozmiar skrzydła leżą na jednym chromosomie.

Rozkład chi-kwadrat Definicja: Jeżeli Z 1,, Z d są niezależne i mają rozkład N(0,1), to X = Z 1 + + Z d ma rozkład χ 2. d

Funkcje gęstości rozkładów chi-kwadrat z df=2 and 4 stopniami swobody:

Tablice wielodzielcze: r k r rzędów, k kolumn: r k Analiza analogiczna do tablic 2 2. Przykład: 3 4 (r = 3 ; k = 4 )

Kolor włosów Suma Brązowe Czarne Jasne Rude Kolor oczu Brązowe 438 (331.7) 288 (154.1) 115 (356.5) 16 (14.6) 857 Szare/ Zielone Niebies kie 1387 (1212.3) 807 (1088.0) 746 (563.3) 189 (505.6) 946 (1303.0) 1768 (1169.5) 53 (53.4) 47 (48.0) 3132 2811 Suma 2632 1223 2829 116 6800

Pytanie naukowe: Czy kolor oczu i włosów są zmiennymi zależnymi? H 0 : Kolor włosów i kolor oczu to zmienne niezależne H A : Kolor oczu i kolor włosów to zmienne zależne Wykonujemy test niezależności chi-kwadrat df = (r-1)(k-1) = 2 = (O-E) 2 /E ma przy H 0 rozkład 2 6.

Testujemy na poziomie =.0005. Wartość krytyczna 2 6 =... 2 s =... Wniosek... Tablica wartości krytycznych z książki ``Introduction to the Practice of Statistics, D.S. Moore, G. P. McCabe

Estymator dla Pr(Oczy niebieskie) =... Estymator dla Pr(Oczy niebieskie włosy brązowe) =... Estymator dla Pr(Oczy niebieskie czarne włosy) =... Estymator dla Pr(Oczy niebieskie jasne włosy) =... Estymator dla Pr(Oczy niebieskie rude włosy) =...

Uwagi: Testowanie niezależności odpowiada testowaniu, że odpowiednie p-stwa warunkowe są te same w każdej klasie. Gdy testujemy niezależność w dużych tabelach, to na ogół nie zapisujemy H 0 za pomocą prawdopodobieństw warunkowych. Założenia: Próby proste z odpowiednich populacji (reprezentatywne, niezależne, losowe) "E" w każdej komórce musi być 5

Przykład (Aspiryna): 21,996 amerykańskich mężczyzn lekarzy w średnim wieku Połowa brała aspirynę, połowa-placebo. Po trzech latach, 139 spośród biorących aspirynę i 239 spośród biorących placebo miało atak serca. Zbadaj zależność pomiędzy braniem aspiryny i występowaniem ataku serca.

Dyskusja W artykule prasowym czytamy, że 80% pieszych będących ofiarami nocnych wypadków samochodowych nosiło ciemne ubrania, a 20% jasne ubrania. Wyciągnięto wniosek, że w nocy bezpieczniej jest nosić jasne ubrania. Czy przeprowadzone badania upoważniają do takiej konkluzji?

Przedziały ufności dla różnicy między p-stwami warunkowymi W tabelach 2x2, wyrażamy H 0 jako p 1 = p 2 Przykład z aspiryną: p 1 = Pr(atak serca aspiryna), p 2 = Pr(atak serca placebo).

SE pˆ (1 pˆ ) (1 1 1 2 2 1, SE2, n1 n2 pˆ pˆ ) SE SE 2 1 SE 2 2 Przybliżony 95% PU dla p 1 -p 2 wynosi ( p ˆ pˆ ) 1.96 1 2 SE W przykładzie z aspiryną: pˆ 1 pˆ 2 SE

PU dla p 1 -p 2 wynosi:... Mamy 95% pewności, że częstość ataku serca przy regularnym pobieraniu (odpowiedniej dozy aspiryny) zmniejsza się od... do... punktów procentowych (na przestrzeni 3 lat). W ogólności do konstrukcji przedziałów ufności na poziomie (1 ) stosujemy Z /2 (zamiast 1.96).

Uwagi: W teście chi-kwadrat w tablicach wielodzielczych i dla przedziałów ufności dla różnicy proporcji stosujemy przybliżenie rozkładem normalnym. Obowiązują zwykłe warunki sformułowane wcześniej. Ważne jest zwłaszcza, aby próba była reprezentacyjna i losowa.

Dokładny test Fishera Stosujemy dla małych rozmiarów prób Przykład: ECMO ECMO to ``nowa procedura służąca ratowaniu noworodków cierpiących na poważne zaburzenia pracy układu oddechowego. CMT konwencjonalna terapia

Zabieg Wynik CMT ECMO Suma Zgon 4 1 5 Przeżycie 6 28 34 Suma 10 29 39

H 0 : wynik nie zależy od zabiegu Znajdziemy warunkowe prawdopodobieństwo zaobserwowanych wyników przy ustalonych ``sumach w rzędach i kolumnach (przy H 0 ). Przypomnijmy symbol Newtona - n k Na tyle sposobów można wybrać zbiór k elementowy ze zbioru n elementowego

Na ile sposobów dokładnie 4 dzieci spośród 5 z tych które miały umrzeć mogło przypadkowo zostać przyporządkowanych do grupy CMT:... Na ile sposobów dokładnie 6 dzieci spośród 34 z tych które miały przeżyć mogło przypadkowo zostać przyporządkowanych do grupy CMT:... Na ile sposobów 10 dzieci spośród 39 mogło przypadkowo zostać przyporządkowanych do grupy CMT:...

H A : ECMO jest lepsza niż CMT Przypadki bardziej ekstremalne w kierunku alternatywy # liczba śmierci = CMT:4, ECMO:1 CMT:5, ECMO:0 P-wartość =... Wniosek:...