Badanie zależności zmiennych kolumnowej i wierszowej:



Podobne dokumenty
Wykład 12: Tablice wielodzielcze

Rozkłady dwuwymiarowe. Tablice dwudzielcze. Przykład (wstępny):

Wykład 11: Dane jakościowe. Rozkład χ 2. Test zgodności chi-kwadrat

Wykład 14 Test chi-kwadrat zgodności

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Testowanie hipotez statystycznych.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Wykład 10 Zrandomizowany plan blokowy

Rozkłady statystyk z próby

NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR

Wykład 9 Wnioskowanie o średnich

Założenia: wyniki są binarne próby są niezależne liczba prób n ustalona przed pomiarem to samo prawdopodobieństwo sukcesu we wszystkich próbach

Wykład 8 Dane kategoryczne

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Uwaga! Test studenta dla pojedynczej próby, niekierunkowy. Wykład 9: Testy Studenta. Test Studenta dla jednej próby, kierunkowy

Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny?

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Estymacja parametrów w modelu normalnym

Statystyka matematyczna dla leśników

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Wnioskowanie statystyczne. Statystyka w 5

Testowanie hipotez statystycznych cd.

Testowanie hipotez statystycznych.

Prawdopodobieństwo i statystyka r.

Oszacowanie i rozkład t

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

STATYSTYKA MATEMATYCZNA

Estymacja parametrów rozkładu cechy

Wykład 9 Testy rangowe w problemie dwóch prób

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

1.1 Wstęp Literatura... 1

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Testy nieparametryczne

Testowanie hipotez statystycznych

Zadania ze statystyki, cz.6

Wykład 10 Testy jednorodności rozkładów

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Wykład 12 Testowanie hipotez dla współczynnika korelacji

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

Testowanie hipotez statystycznych.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Wykład 12 Testowanie hipotez dla współczynnika korelacji

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Wykład 8: Testy istotności

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

Wykład 3 Hipotezy statystyczne

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Spis treści 3 SPIS TREŚCI

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady statystyk z próby. Statystyka

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Wszystkie wyniki w postaci ułamków należy podawać z dokładnością do czterech miejsc po przecinku!

Weryfikacja hipotez statystycznych

Zadania ze statystyki cz.5 I rok socjologii miary związków między zmiennymi jakościowymi

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Metody Statystyczne. Metody Statystyczne.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka matematyczna i ekonometria

Przykłady bloków: Przykład. Przyporządkowanie. Wykład 9 Zrandomizowany plan blokowy

STATYSTYKA

STATYSTYKA wykład 5-6

Prawdopodobieństwo i rozkład normalny cd.

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

METODY STATYSTYCZNE W BIOLOGII

Centralne twierdzenie graniczne

166 Wstęp do statystyki matematycznej

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Kolokwium ze statystyki matematycznej

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Metody probabilistyczne

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Własności statystyczne regresji liniowej. Wykład 4

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Analizy wariancji ANOVA (analysis of variance)

a) Zapisz genotyp tego mężczyzny... oraz zaznacz poniżej (A, B, C lub D), jaki procent gamet tego mężczyzny będzie miało genotyp ax b.

Wykład 11 Testowanie jednorodności

Y \ X , 2 0, 1 0, 1 1 0, 1 0, 3 0, 2. E(XY ) = i,j. x i y j p ij. i wtedy. x i y j p (X) = i,j. y j p (Y ) i wtedy

Zawartość. Zawartość

Testowanie hipotez statystycznych

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Transkrypt:

Wykład : Tablice wielodzielcze Zródło:http://pl.wikipedia.org/wiki/Plik:Drosophila_melanogaster.jpg Drosophila melanogaster Krzyżówka wsteczna (CcNn i ccnn) Kolor oczu czerwone fioletowe Rozmiar skrzydła normalne 39 mniejsze 8 3 Badanie zależności zmiennych kolumnowej i wierszowej: Tutaj zmiennymi badanymi są: H 0 : zmienne są niezależne Obok obserwowanych liczności, ozn. O, Rozważamy liczności oczekiwane przy H 0 : suma wiersza suma kolumny E : liczba wszystkich obserwacji Uzupełniamy tabelę wartościami oczekiwanymi przy Ho: Kształt skrzydła Kolor oczu czerwone fioletowe normalne 39 ( ) ( ) 50 mniejsze 8 ( ) 3 ( ) 50 Suma Suma 57 43 00 Czy w badanej populacji kolor oczu i kształt skrzydła są zmiennymi niezależnymi? H 0 : kolor oczu i rozmiar skrzydła są niezależne H A : kolor oczu i rozmiar skrzydła są zależne Zastosujemy test chi-kwadrat dla niezależności: s = (O-E) /E ma przy H 0 tzw. rozkład. Testujemy na poziomie = 0.05; odrzucamy gdy s > 3.84 = krytyczne Tutaj s =... Wniosek:... Rozkłady brzegowe i warunkowe: Opisz rozkład koloru oczu w danych: Opisz rozkład kształtu skrzydeł w danych: Opisz rozkład koloru oczu w danych dla normalnego kształtu skrzydeł:

Dyskusja rozkładów brzegowych i warunkowych w populacji: p := Pr(czerwone oczy normalne skrzydła), p := Pr(czerwone oczy mniejsze skrzydła) H 0 : (kolor oczu i rozmiar skrzydła są niezależne) jest równoważna równości p = p H A : (kolor oczu i rozmiar skrzydła są zmiennymi zależnymi) oznacza, że p p Estymatorami p i p są: ˆp ˆp Omówimy później przedziały ufności dla p -p. Nie możemy powiedzieć, że krótsze skrzydła powodują, że muszka ma fioletowe oczy. Prawidłowy wniosek to obserwacja, że kolor oczu i kształt skrzydła są zmiennymi zależnymi, albo że u muszek z normalnymi skrzydłami częściej występują czerwone oczy niż u muszek z mniejszymi skrzydłami. Nie możemy formułować wniosku przyczynowego, także dlatego, że nie kontrolujemy analizowanych zmiennych, a jedynie je obserwujemy. W tym wypadku zależność wynika z faktu, że geny determinujące kształt oczu i rozmiar skrzydła leżą na jednym chromosomie. Rozkład chi-kwadrat Funkcje gęstości rozkładów chi-kwadrat z df= and 4 stopniami swobody: Definicja: Jeżeli Z,, Z d są niezależne i mają rozkład N(0,), to = + + ma rozkład d. Tablice wielodzielcze: rk r rzędów, k kolumn: rk Analiza analogiczna do tablic. Przykład: 34 (r = 3 ; k = 4 )

Kolor włosów Brązowe Czarne Jasne Rude Suma Pytanie naukowe: Czy kolor oczu i włosów są zmiennymi zależnymi? Kolor oczu Brązowe Szare/ Zielone Niebies kie 438 (33.7) 387 (.3) 807 (088.0) 88 (54.) 746 (563.3) 89 (505.6) 5 (356.5) 946 (303.0) 768 (69.5) 6 (4.6) 53 (53.4) 47 (48.0) 857 33 8 Suma 63 3 89 6 6800 H 0 : Kolor włosów i kolor oczu to zmienne niezależne H A : Kolor oczu i kolor włosów to zmienne zależne Wykonujemy test niezależności chi-kwadrat df = (r-)(k-) = = (O-E) /E ma przy H 0 rozkład 6. Testujemy na poziomie =.0005. Wartość krytyczna 6 =... s =... Wniosek... Tablica wartości krytycznych z książki ``Introduction to the Practice of Statistics, D.S. Moore, G. P. McCabe Estymator dla Pr(Oczy niebieskie) =... Estymator dla Pr(Oczy niebieskie włosy brązowe) =... Estymator dla Pr(Oczy niebieskie czarne Estymator dla Pr(Oczy niebieskie jasne Estymator dla Pr(Oczy niebieskie rude Testowanie niezależności odpowiada testowaniu, że odpowiednie p-stwa warunkowe są te same w każdej klasie. Gdy testujemy niezależność w dużych tabelach, to na ogół nie zapisujemy H 0 za pomocą prawdopodobieństw warunkowych. Założenia: Próby proste z odpowiednich populacji (reprezentatywne, niezależne, losowe) "E" w każdej komórce musi być 5 Przykład (Aspiryna):,996 amerykańskich mężczyzn lekarzy w średnim wieku Połowa brała aspirynę, połowa-placebo. Po trzech latach, 39 spośród biorących aspirynę i 39 spośród biorących placebo miało atak serca. Zbadaj zależność pomiędzy braniem aspiryny i występowaniem ataku serca. 3

Dyskusja W artykule prasowym czytamy, że 80% pieszych będących ofiarami nocnych wypadków samochodowych nosiło ciemne ubrania, a 0% jasne ubrania. Wyciągnięto wniosek, że w nocy bezpieczniej jest nosić jasne ubrania. Czy przeprowadzone badania upoważniają do takiej konkluzji? Przedziały ufności dla różnicy między p-stwami warunkowymi W tabelach x, wyrażamy H 0 jako p = p Przykład z aspiryną: p = Pr(atak serca aspiryna), p = Pr(atak serca placebo). pˆ ( pˆ ),, n n Przybliżony 95% PU dla p -p wynosi W przykładzie z aspiryną: pˆ ( pˆ ) p ˆ pˆ ).96 ( pˆ pˆ PU dla p -p wynosi:... Mamy 95% pewności, że częstość ataku serca przy regularnym pobieraniu (odpowiedniej dozy aspiryny) zmniejsza się od... do... punktów procentowych (na przestrzeni 3 lat). W ogólności do konstrukcji przedziałów ufności na poziomie ( ) stosujemy Z / (zamiast.96). W teście chi-kwadrat w tablicach wielodzielczych i dla przedziałów ufności dla różnicy proporcji stosujemy przybliżenie rozkładem normalnym. Obowiązują zwykłe warunki sformułowane wcześniej. Ważne jest zwłaszcza, aby próba była reprezentacyjna i losowa. 4

Dokładny test Fishera Stosujemy dla małych rozmiarów prób Przykład: ECMO ECMO to ``nowa procedura służąca ratowaniu noworodków cierpiących na poważne zaburzenia pracy układu oddechowego. CMT konwencjonalna terapia Zabieg Wynik CMT ECMO Suma Zgon 4 5 Przeżycie 6 8 34 Suma 0 9 39 H 0 : wynik nie zależy od zabiegu Znajdziemy warunkowe prawdopodobieństwo zaobserwowanych wyników przy ustalonych ``sumach w rzędach i kolumnach (przy H 0 ). Przypomnijmy symbol Newtona - n k Na tyle sposobów można wybrać zbiór k elementowy ze zbioru n elementowego Na ile sposobów dokładnie 4 dzieci spośród 5 z tych które miały umrzeć mogło Na ile sposobów dokładnie 6 dzieci spośród 34 z tych które miały przeżyć mogło Na ile sposobów 0 dzieci spośród 39 mogło H A : ECMO jest lepsza niż CMT Przypadki bardziej ekstremalne w kierunku alternatywy # liczba śmierci = CMT:4, ECMO: CMT:5, ECMO:0 P-wartość =... Wniosek:... 5