Rozkłady dwuwymiarowe. Tablice dwudzielcze. Przykład (wstępny):

Podobne dokumenty
Badanie zależności zmiennych kolumnowej i wierszowej:

Wykład 12: Tablice wielodzielcze

Wykład 11: Dane jakościowe. Rozkład χ 2. Test zgodności chi-kwadrat

Wykład 14 Test chi-kwadrat zgodności

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Prawdopodobieństwo i statystyka r.

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Uwaga! Test studenta dla pojedynczej próby, niekierunkowy. Wykład 9: Testy Studenta. Test Studenta dla jednej próby, kierunkowy

NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez statystycznych.

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Wykład 8 Dane kategoryczne

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Statystyka matematyczna dla leśników

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych.

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Wykład 10 Zrandomizowany plan blokowy

Testowanie hipotez statystycznych.

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyczna analiza danych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Testy nieparametryczne

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Testowanie hipotez statystycznych cd.

Analiza autokorelacji

Wykład 11 Testowanie jednorodności

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Metody Statystyczne. Metody Statystyczne

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Zawartość. Zawartość

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Prawdopodobeństwo, test χ 2

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Badanie zależności pomiędzy zmiennymi

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny?

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Testowanie hipotez statystycznych

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Weryfikacja hipotez statystycznych

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

Estymacja parametrów rozkładu cechy

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Matematyka i statystyka matematyczna dla rolników w SGGW

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

1.1 Wstęp Literatura... 1

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Spis treści 3 SPIS TREŚCI

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Statystyka matematyczna Test χ 2. Wrocław, r

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji

Zadania ze statystyki, cz.6

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Przykład 1. (A. Łomnicki)

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Rozdział 8. Regresja. Definiowanie modelu

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

PDF created with FinePrint pdffactory Pro trial version

Transkrypt:

Rozkłady dwuwymiarowe Rozkłady brzegowe Rozkłady warunkowe Niezależność Kowariancja Współczynnik korelacji (Przykłady na tablicy) Tablice dwudzielcze Najprostsze tablice 2x2 : dwa rzędy i dwie kolumny Dane jakościowe z czterema klasami, które można połączyć w pary. Dwie typowe sytuacje: Dwie niezależne próby; w każdej obserwujemy jedną cechę o dwu wartościach Jedna próba; obserwujemy dwie różne cechy, z których każda może przyjmować dwie wartości. Przykład sytuacji 1 Próby to lekarstwo i placebo (lub dowolne dwa zabiegi); obserwowana zmienna to poprawa lub brak poprawy. próby samce" i samice" (dowolne dwie grupy, które chcemy porównać); obserwowana zmienna np. kolor oczu, ``fioletowe i czerwone. Przykład sytuacji 2 obserwujemy kolor oczu" (czerwone/fioletowe) i kształt skrzydła" (normalny/mniejszy) Oberwujemy, czy ludzie palą i czy ćwiczą 4 klasy; obserwacje w tabeli 2x2 Kszatłt skrzydła : Kolor oczu czerwone normalne 39 11 mniejsze 18 32 fioletowe Testujemy niezależność zmiennych definiujących rzędy i kolumny. W tym przypadku będzie to odpowiadać testowaniu hipotezy, czy oba geny leżą na innych chromosomach. Obserwowane Przykład (wstępny): zabieg Lekarstwo Placebo Wynik Poprawa 15 4 19 Brak poprawy 11 17 28 Suma 26 21 47 Suma p 1 = P(P L)-p-stwo, że nastąpi poprawa, jeżeli pacjent bierze lekarstwo p 2 = P(P Pl)-p-stwo, że nastąpi poprawa, jeżeli pacjent bierze placebo H 0 : p 1 = p 2 H A : p 1 p 2 ( lub p 1 > p 2 ) Poziom istotności α =0.01 1

W przeciwieństwie do testu zgodności, nie mamy hipotetycznych wartości dla p. Zamiast tego H 0 mówi, że oba p-stwa warunkowe są takie same, i.e. wynik i ``zabieg to zmienne niezależne H A mówi, że p-stwa warunkowe są różne, co oznacza, że zmienne ``zabieg i wynik są zależne. ˆp 1 = ˆp 2 = Jakich wartości oczekiwalibyśmy, gdyby H 0 była prawdziwa? Poprawa nastąpiła u 19 pacjentów. Jest to 19/47 = 40.4% wszystkich badanych. 26 pacjentów brało lekarstwo. Jeżeli H 0 jest prawdziwa, to u około 40.4% z nich powinna nastąpić poprawa. Podobnie liczba pacjentów, u których nastąpiła poprawa mimo, że brali placebo powinna być bliska... Ponadto oczekujemy, że nie nastąpiła poprawa u... osób biorących lekarstwo i u... osób biorących placebo. Te oczekiwane wartości umieszczamy w podobnej tabeli. Oczekiwane zabieg Suma Lekarstwo Placebo Wynik Poprawa 10.5 8.5 19 Brak poprawy 15.5 12.5 28 Suma 26 21 47 Łączymy obie tabele: Ogólnie: E = (suma w rzędzie)(suma w kolumnie)/(całkowita suma ) Dla każdej z czterech klas. Aby stosować test chi-kwadrat, w każdej klasie E powinno być nie mniejsze niż 5. Oberwowane (Oczekiwane) zabieg Suma Lekarstwo Placebo Wynik Poprawa 15 (10.5) 4 (8.5) 19 Brak poprawy 11 (15.5) 17 (12.5) 28 Suma 26 21 47 2

Czy u pacjentów biorących lekarstwo poprawa występuje częściej niż u pacjentów biorących placebo? p 1 = p-stwo poprawy u pacjentów biorących lekarstwo p 2 = p-stwo poprawy u pacjentów biorących placebo H 0 : p 1 = p 2 ; p-stwo poprawy jest takie samo w obu grupach (albo: wynik i zabieg są niezależne). H A : p 1 > p 2 ; p-stwo poprawy jest większe u pacjentów biorących lekarstwo Stosujemy test χ 2 dla niezależności X 2 s = Σ (O-E) 2 /E przy H 0 ma rozkład χ 2 1. Testujemy na poziomie istotności α = 0.01; odrzucamy H 0 gdy X 2 s >... [używamy kolumny 0.02 bo alternatywa jest kierunkowa] [Ponieważ alternatywa jest kierunkowa musimy wykonać kolejny krok] pˆ... 1 pˆ 2... Χ 2 s =... ˆp 1 ˆp 2 Stopnie swobody df = 1 dla tabeli 2x2. Ogólnie (#rzędów-1)(#kolumn-1) Wniosek:... Wartości krytyczne: Gdy H A jest niekierunkowa szukamy w kolumnie α, gdy jest kierunkowa w kolumnie 2α. Co oznacza odrzucenie H 0? Czasami trzeba być ostrożnym przy formułowaniu wniosków. Gdy odrzucamy H 0, to mamy przesłanki, aby przypuszczać, że zmienne nie są niezależne. To jednak nie zawsze odpowiada związkowi przyczynowemu! Nasze badanie wskazuje, że stan pacjentów biorących lekarstwo częściej się poprawia, niż stan pacjentów biorących placebo. Tutaj kontrolowaliśmy zabieg, więc możemy przypuszczać, że istnieje związek przyczynowy. Gdybyśmy jednak testowali niezależność koloru oczu i kształtu skrzydeł u muszek owocówek nie moglibyśmy stwierdzić związku przyczynowego (np. Kolor oczu wpływa na kształt skrzydeł??). Możemy tylko powiedzieć, że oba fenotypy są zmiennymi zależnymi. 3

Przykład z muszkami (krzyżówka wsteczna CcNn z ccnn) Uzupełniamy tabelkę wartościami oczekiwanymi przy Ho Kolor oczu Suma Kolor oczu czerwone fioletowe Rozmiar skrzydła czerwone fioletowe normalne 39 11 mniejsze 18 32 Kształt skrzydła normalne 39 ( ) 11 ( ) 50 mniejsze 18 ( ) 32 ( ) 50 Suma 57 43 100 Czy w badanej populacji muszek kolor oczu i kształt skrzydła są zmiennymi niezależnymi? p 1 = Pr(czerwone oczy normalne skrzydła), p 2 = Pr(czerwone oczy mniejsze skrzydła), H 0 : p 1 = p 2 ; kolor oczu i rozmiar skrzydła są niezależne H A : p 1 p 2 ; kolor oczu i rozmiar skrzydła są zmiennymi zależnymi Można obliczyć, że: ˆp 1 ˆp 2 Zastosujemy test chi-kwadrat dla niezależności Χ 2 s = Σ (O-E) 2 /E ma przy H 0 rozkład χ 2 1. Testujemy na poziomie α = 0.05; odrzucamy gdy Χ 2 s > 3.84 = Χ 2 krytyczne X 2 =... Wniosek:... Nie możemy jednak powiedzieć, że czerwone oczy powodują, że muszka ma normalne skrzydła. Prawidłowy wniosek to obserwacja, że kolor oczu i kształt skrzydła są zmiennymi zależnymi, albo że u muszek z normalnymi skrzydłami częściej występują czerwone oczy niż u muszek z mniejszymi skrzydłami. Nie możemy formułować wniosku przyczynowego, ponieważ nie kontrolujemy analizowanych zmiennych, a jedynie je obserwujemy. [W tym wypadku zależność wynika z faktu, że geny determinujące kształt oczu i rozmiar skrzydła leżą na jednym chromosomie.] Tablice wielodzielcze: r k r rzędów, k kolumn: r k Analiza analogiczna do tablic 2 2. Przykład: 3 4 (r = 3 ; k = 4 ) 4

Kolor oczu Brązowe Szare/ Zielone Niebies kie Kolor włosów Brązowe Czarne Jasne 438 (331.7) 1387 (1212.3) 807 (1088.0) 288 (154.1) 746 (563.3) 189 (505.6) 115 (356.5) 946 (1303.0) 1768 (1169.5) Rude 16 (14.6) 53 (53.4) 47 (48.0) Suma 857 3132 2811 Suma 2632 1223 2829 116 6800 Czy kolor oczu i włosów są zmiennymi zależnymi? H 0 : Kolor włosów i kolor oczu to zmienne niezależne H A : Kolor oczu i kolor włosów to zmienne zależne Wykonujemy test niezależności chi-kwadrat Χ 2 = Σ(O-E) 2 /E ma przy H 0 rozkład χ 2 6. df = (r-1)(k-1) = (2)(3) = 6 Testujemy na poziomie α =.0005. Wartość krytyczna χ 2 6 =... Χ 2 s =... Wniosek... Estymator dla Pr(Oczy niebieskie) =... Estymator dla Pr(Oczy niebieskie włosy brązowe) =... Estymator dla Pr(Oczy niebieskie czarne włosy) =... Estymator dla Pr(Oczy niebieskie jasne włosy) =... Estymator dla Pr(Oczy niebieskie rude włosy) =... Testowanie niezależności odpowiada testowaniu, że odpowiednie p-stwa warunkowe są te same w każdej klasie. Gdy testujemy niezależność w dużych tabelach, to na ogół nie zapisujemy H 0 za pomocą prawdopodobieństw warunkowych. Przypomnienie założeń: Próby losowe Obserwacje niezależne "E" w każdej komórce musi być 5 Dokładny test Fishera Stosujemy dla małych rozmiarów prób Przykład : ECMO ECMO to ``nowa procedura służąca ratowaniu noworodków cierpiących na poważne zaburzenia pracy układu oddechowego. CMT konwencjonalna terapia 5

Zabieg Wynik CMT ECMO Suma Zgon 4 1 5 Życie 6 28 34 Suma 10 29 39 H 0 : wynik nie zależy od zabiegu Znajdziemy warunkowe prawdopodobieństwo zaobserwowanych wyników przy ustalonych ``sumach w rzędach i kolumnach (przy H 0 ). Przypomnijmy symbol Newtona - n k Na tyle sposobów można wybrać zbiór k elementowy ze zbioru n elementowego Na ile sposobów dokładnie 4 dzieci spośród 5 z tych które miały umrzeć mogło przypadkowo zostać przyporządkowanych do grupy CMT:... Na ile sposobów dokładnie 6 dzieci spośród 34 z tych które miały przeżyć mogło przypadkowo zostać przyporządkowanych do grupy CMT:... H A : ECMO jest lepsza niż CMT Przypadki bardziej ekstremalne w kierunku alternatywy # liczba śmierci = CMT:4, ECMO:1 CMT:5, ECMO:0 Na ile sposobów 10 dzieci spośród 39 mogło przypadkowo zostać przyporządkowanych do grupy CMT:... P-wartość =... Wniosek:... 6