PODSTAWY STATYSTYKI SEMINARIUM 2 ! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE

Podobne dokumenty
Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Statystyka matematyczna dla leśników

SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE

WNIOSKOWANIE STATYSTYCZNE

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka matematyczna i ekonometria

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Testowanie hipotez statystycznych.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Testy nieparametryczne

Statystyka matematyczna i ekonometria

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

JEDNOCZYNNIKOWA ANOVA

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Prawdopodobieństwo i rozkład normalny cd.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Spis treści 3 SPIS TREŚCI

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

166 Wstęp do statystyki matematycznej

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

PDF created with FinePrint pdffactory Pro trial version

Jednoczynnikowa analiza wariancji

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

STATYSTYKA MATEMATYCZNA

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Testowanie hipotez statystycznych.

STATYSTYKA MATEMATYCZNA

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Rozkład Gaussa i test χ2

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

Przykład 1. (A. Łomnicki)

GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Testowanie hipotez statystycznych

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Testowanie hipotez statystycznych cd.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

METODY STATYSTYCZNE W BIOLOGII

PODSTAWY STATYSTYKI SEMINARIUM 3 ! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE

Analiza wariancji. dr Janusz Górczyński

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Zadania ze statystyki, cz.6

Wydział Matematyki. Testy zgodności. Wykład 03

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

WNIOSKOWANIE STATYSTYCZNE

Żródło:

Zadania ze statystyki cz.8. Zadanie 1.

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

METODY STATYSTYCZNE W BIOLOGII

Elementy statystyki STA - Wykład 5

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Testowanie hipotez statystycznych

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka i Analiza Danych

Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych

Statystyka Matematyczna Anna Janicka

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Wnioskowanie statystyczne. Statystyka w 5

Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

Testowanie hipotez statystycznych

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Metodologia badań psychologicznych. Wykład 12. Korelacje

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

METODY STATYSTYCZNE W BIOLOGII

Transkrypt:

STUDIUM DOKTORANCKIE KATOWICE, 2011/12 PODSTAWY STATYSTYKI SEMINARIUM 2! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE Jan E. Zejda Katedra Epidemiologii WLK, SUM

TREŚĆ SEMINARIUM 2 Statystyka Analityczna Część IA - zarys metodologii badań naukowych - hipotezy badawcze - testowanie hipotez proste testy statystycznej znamienności różnic proste testy statystycznej znamienności zależności - minimalna niezbędna liczebność próby

TREŚĆ SEMINARIUM 2 Statystyka Analityczna Część IA - zarys metodologii badań naukowych - hipotezy badawcze - testowanie hipotez proste testy statystycznej znamienności różnic proste testy statystycznej znamienności zależności - minimalna niezbędna liczebność próby

METODOLOGIA BADAŃ NAUKOWYCH Nauka zajmująca się tworzeniem i doskonaleniem metod badań naukowych w ramach różnych dziedzin, dla umożliwienia ciągłego ich rozwoju

PODSTAWOWE ZADANIE METODOLOGII BADAŃ NAUKOWYCH wypracowywanie optymalnych zasad poznania naukowego (poprzez prowadzenie badań) Badanie naukowe jest zorganizowaną, celową i systematyczną metodą postępowania mającego na celu poznanie rzeczywistości.

PODZIAŁ BADAŃ NAUKOWYCH Nauki Empiryczne systematyczna obserwacja, eksperyment Nauki Nieempiryczne dowodzenie twierdzeń bez wymogu obserwacji Nauki empiryczne odwołują się do kanonu doświadczenia, dostępnego dzięki procesom postrzegania w trakcie tzw. obserwacji lub tzw. eksperymentu. Nauki nieempiryczne charakteryzują się dowodzeniem twierdzeń bez wymogu gromadzenia informacji na drodze bezpośredniej obserwacji. NAUKI PRZYRODNICZE I SPOŁECZNE SĄ NAUKAMI EMPIRYCZNYMI

DWIE GŁÓWNE METODY POZNANIA NAUKOWEGO SCHEMAT DEDUKCJI Teoria Hipoteza Obserwacja Weryfikacja SCHEMAT INDUKCJI Obserwacja Prawidłowość Hipoteza Teoria

SYSTEM EPISTEMOLOGICZNY POPPER a -rozwój wiedzy jest możliwy przez żmudną procedurę obalania kolejnych (niesłusznych) teorii; -odrzucanie teorii jest możliwe pod warunkiem, że została ona wcześniej sformułowana; -sformułowanie problemu wymaga kreatywnego spojrzenia, często aktywizującego wyobraźnię badacza. Filozofia Poppera wprowadziła na dobre element niepewności w dociekaniach naukowych. Autor był bardziej radykalny w sądach wiedza jego zdaniem ma zawsze charakter tymczasowy, hipotetyczny, a to czego możemy od badań naukowych oczekiwać, to najwyżej eliminacja teorii, których fałszywość można udowodnić (http://plato.stanford.edu/entries/popper).

DWA PROSTE PRZESŁANIA KONCEPCJI FALSYFIKACJI żmudny proces falsyfikacji wiedzie do sytuacji, w której ostają się jedynie te teorie, które przeszły bardzo wyrafinowaną procedurę testowania; immanentną cechą działalności naukowej jest kreatywność, inwencja w proponowaniu wyjaśnień zjawisk, których natura nie jest jeszcze znana. Obie właściwości powinny także towarzyszyć praktycznym aspektom metodologii badań naukowych, muszą być brane pod uwagę w procesie poznania naukowego

PROCES POZNANIA NAUKOWEGO W PRAKTYCE Gruntowna wiedza Dobry warsztat ( dobra praktyka epidemiologiczna ) Twórcze wykorzystanie informacji (interpretacja) Inwencja, iluminacja, przypadek Umiejętne komunikowanie wyników

PROCES POZNANIA A PROTOKÓŁ BADAWCZY Typowy Proces Badania Naukowego Układ Protokołu Badawczego określenie problemu badawczego sformułowanie pytań badawczych/hipotez określenie sposobu uzyskania odpowiedzi wybór źródła danych pomiary analiza danych prezentacja wyników interpretacja wyników opracowanie raportu uzasadnienie podjęcia badania (wstęp) cel badania materiał i metoda wyniki badania omówienie (dyskusja) i wnioski

CEL - cel ukryty w tekście wprowadzenia - cel ogólnikowy - cel w formie pytania lub hipotezy? Dobrze Sformułowany Cel - konkretny i precyzyjny - oryginalny lub zapowiadający nowe spojrzenie - interesujący dla czytelnika Pożądany Model jedna praca = jeden główny cel (mogą mu towarzyszyć jeden, dwa cele poboczne) Częste Problemy

SENSOWNE PYTANIA BADAWCZE PRECYZYJNE, KLAROWNE, UMOŻLIWIJĄCE JEDNOZNACZNĄ ODPOWIEDŹ TRZY PODSTAWOWE TYPY PYTAŃ P. opisowe: jak jest?, jak dużo? P. odnośnie różnicy/zależności: korelacja?, różnica? P. odnośnie związku przyczynowo-skutkowego: czy powoduje? czy wynika z? Rozwiązanie problemu zależy od gradacji kolejnych pytań PERSPEKTYWA STATYSTYCZNA ZWIĄZEK P-S OPIS % sukcesu, masa itp. w grupie RDS+ % sukcesu, masa itp. w grupie RDS- (w. średnia, zakres, odchylenie standardowe, itp.) RÓŻNICA/ZALEŻNOŚĆ różnica pomiędzy % sukcesu w grupach RDS* i RDS+, różnice w zakresie innych cech, pomiar ryzyka I oczywiście to, co wcześniej po lewej stronie Kontrola czynników zakłócających (analiza stratyfikacyjna, analiza wielu zmiennych, itp.) I oczywiście to, co wcześniej po lewej stronie Niech wasza mowa będzie: tak, tak; nie, nie (Mt: 5, 37)

TREŚĆ SEMINARIUM 2 Statystyka Analityczna Część IA - zarys metodologii badań naukowych - hipotezy badawcze - testowanie hipotez proste testy statystycznej znamienności różnic proste testy statystycznej znamienności zależności - minimalna niezbędna liczebność próby

DWA OBSZARY STATYSTYKI -1- -2- Statystyka Opisowa Statystyka Analityczna (ile?, jak często?) ( charakterystyka ) Testowanie Hipotez Modelowanie Związków Przyczynowo-Skutkowych Ocena Wiarygodności Pomiaru itp.

WERYFIKUJ WERYFIKOWALNE! od hipotezy koncepcyjnej, poprzez hipotezę naukową, do hipotezy statystycznej

(sąd, HIPOTEZA d, testowalne stwierdzenie) Hipoteza: Częstość występowania otyłości zależy od tradycji żywieniowych Hipoteza musi podlegać weryfikacji albo się ostanie jako prawdziwa, albo zostanie uznana za fałszywą: jak weryfikować zależność od tradycji? Hipoteza: Częstość występowania otyłości jest większa wśród osób preferujących tradycyjny styl żywienia Skąd pewność, że częstość jest większa a nie mniejsza? Hipoteza: Częstość występowania otyłości różni się pomiędzy grupami o różnym stylu żywienia Problem: na gruncie metodologii badań naukowych nie jest możliwe weryfikowanie hipotezy zakładającej różnicę (dowód słuszności tego stwierdzenia wykracza poza program kursu)

SOLUTIO - I weryfikacja hipotezy zakładającej brak różnicy Częstość występowania otyłości nie różni się pomiędzy grupami o różnym stylu żywienia WYNIK WERYFIKACJI (TESTOWANIA) albo odrzucenie hipotezy albo brak podstaw do odrzucenia hipotezy

SOLUTIO - II Układ 2 hipotez H 0 (hipoteza zerowa) i H A (hipoteza alternatywna) H 0 brak różnicy, brak zależności, brak efektu H A obecna różnica, obecna zależność, obecny efekt STRATEGIA ALBO-ALBO odrzucenie H 0 powoduje aktualność H A nieodrzucenie H 0 powoduje nieaktualność H A TERTIUM NON DATUR

JAK POSTĘPOWA POWAĆ W CELU WERYFIKACJI HIPOTEZY? 1. Sformułuj H 0 / H A 2. Przeprowadź obserwację / eksperyment 3. Poddaj dane analizie statystycznej 4. Jeśli prawdopodobieństwo uzyskanego wyniku jest małe (p<α) przyjmij, że wyniki obserwacji nie są zgodne z treścią H 0 Odrzuć H 0 Akceptuj H A

SCIENTIA ET ARS H 0 & H A Brak dowodu na obecność efektu nie jest dowodem na brak obecności efektu DOWÓD STATYSTYCZNY PODLEGA INTERPRETACJI! Altman D.G., Bland J.M.: Absence of evidence is not evidence of absence. BMJ 1995;311:485

SPECYFICZNE BŁĘB ŁĘDY TOWARZYSZĄCE TESTOWANIU HIPOTEZ

Źle się dzieje, gdy prawdziwa H 0 jest odrzucona Błąd Typu I (błąd α) Prawdopodobieństwo błędu I istnieje zawsze na jakie się godzimy? JEST TO STATYSTYCZNA ZNAMIENNOŚĆ BADANIA

Źle się dzieje, gdy fałszywa H 0 nie jest odrzucona Błąd Typu II (błąd β) Założenie to wyznacza obszar braku błędu równy (1- β ) JEST TO MOC BADANIA (1-ß)

DECYZJA W SPRAWIE POZIOMU STATYSTYCZNEJ ZNAMIENNOŚCI I MOCY TESTU W wyniku testu dochodzi do: H 0 może być albo-albo: Prawdziwa Fałszywa Nieodrzucenia H 0 OK Błąd typu II Odrzucenia H 0 Błąd typu I OK. KONWENCJA BŁĄD TYPU I = α = 0,05 BŁĄD TYPU II = β = 0,20

DECYZJA W SPRAWIE POZIOMU STATYSTYCZNEJ ZNAMIENNOŚCI I MOCY TESTU W wyniku testu dochodzi do: H 0 może być albo-albo: Prawdziwa Fałszywa Nieodrzucenia H 0 OK. Błąd typu II Odrzucenia H 0 Błąd typu I OK KONWENCJA BŁĄD TYPU I = α = 0,05 BŁĄD TYPU II = β = 0,20

DECYZJA W SPRAWIE POZIOMU STATYSTYCZNEJ ZNAMIENNOŚCI I MOCY TESTU W wyniku testu dochodzi do: H 0 może być albo-albo: Prawdziwa Fałszywa Nieodrzucenia H 0 OK Błąd typu II Odrzucenia H 0 Błąd typu I OK. KONWENCJA BŁĄD TYPU I = α = 0,05 BŁĄD TYPU II = β = 0,20

DECYZJA W SPRAWIE POZIOMU STATYSTYCZNEJ ZNAMIENNOŚCI I MOCY TESTU W wyniku testu dochodzi do: H 0 może być albo-albo: Prawdziwa Fałszywa Nieodrzucenia H 0 OK Błąd typu II Odrzucenia H 0 Błąd typu I OK. KONWENCJA BŁĄD TYPU I = α = 0,05 BŁĄD TYPU II = β = 0,20

DECYZJA W SPRAWIE POZIOMU STATYSTYCZNEJ ZNAMIENNOŚCI I MOCY TESTU W wyniku testu dochodzi do: H 0 może być albo-albo: Prawdziwa Fałszywa Nieodrzucenia H 0 OK Błąd typu II Odrzucenia H 0 Błąd typu I OK KONWENCJA BŁĄD TYPU I = α = 0,05 BŁĄD TYPU II = β = 0,20

DECYZJA W SPRAWIE POZIOMU STATYSTYCZNEJ ZNAMIENNOŚCI I MOCY TESTU W wyniku testu dochodzi do: H 0 może być albo-albo: Prawdziwa Fałszywa Nieodrzucenia H 0 OK Błąd typu II Odrzucenia H 0 Błąd typu I OK KONWENCJA BŁĄD TYPU I = α = 0,05 BŁĄD TYPU II = β = 0,20

STATYSTYCZNA ZNAMIENNOŚĆ Uzasadnienie dla odrzucenia H 0 ma charakter probabilistyczny I jest wynikiem testu statystycznej znamienności KLUCZEM DO ZROZUMIENIA JEST PRAWDOPODOBIEŃSTWO WYSTĘPOWANIA RZADKICH ZJAWISK Zmniejszenie RR u chorych stosujących lek A może wystąpić całkiem przypadkowo, nawet gdy lek nie jest aktywny farmakologicznie. Nie zdarza się to często. Jaka częstość może być uznana za rzadkie zdarzenie?

CZĘSTA INTERPRETACJA RZADKICH ZDARZEŃ Specyfika rozkładu normalnego danej zmiennej wynika z faktu, że pod krzywą znajduje się 100% możliwych wartości zmiennej, ale ich gęstość nie jest jednorodna (wartości: częste, mniej częste, jeszcze mniej częste, rzadkie) 40 30 % 20 10 0 A X B 2.5% 95% 2.5% 0,025 0,95 0,025 rzadkie wartości rzadkie wartości X ± 1.96 SD definiuje obszar obejmujący 95% możliwych wartości, To co pozostaje poza to 5% obszar rzadkich wartości (0,05) CZĘSTOŚĆ RZADKICH WARTOŚCI = 2,5% + 2,5% = 5% CZĘSTOŚĆ RZADKICH WARTOŚCI = 0,025 + 0,025 = 0,05 Jeśli prawdopodobieństwo spontanicznego wystąpienia wyniku testu nie przekracza 5% (p<0,05) to wynik jest statystycznie znamienny

STATYSTYCZNA ZNAMIENNOŚĆ czyli STATYSTYCZNA ISTOTNOŚĆ

STATYSTYCZNA ZNAMIENNOŚĆ KLINICZNA ZNAMIENNOŚĆ *** KLINICZNA ZNAMIENNOŚĆ EFEKT RÓŻNY OD ZERA STATYSTYCZNA ZNAMIENNOŚĆ EFEKT RÓWNY ZERO *** Częstość bólów głowy u dzieci mieszkających w pobliżu składowiska odpadów wynosiła 15%, a u dzieci z terenu kontrolnego 13% i różnica ta była statystycznie znamienna na poziomie 0,05 Statystyczna znamienność, klinicznie trywialny wynik Czas przeżycia chorych leczonych preparatem A był o 2 lata dłuższy niż u chorych leczonych preparatem B, ale wynik nie był statystycznie znamienny na poziomie 0,05 Brak statystycznej znamienności, wynik istotny klinicznie

INTERPRETACJA p TYPOWE NIEPOROZUMIENIA Przekonanie, że im mniejsza wartość p tym silniejszy efekt Przekonanie, że każda wartość p<0,05 musi być skomentowana, nawet gdy efekt jest mały lub mało prawdopodobny Przekonanie, że brak statystycznej znamienności jest dowodem na słuszność hipotezy zerowej Rushton L.: Reporting of occupational and environmental research: use and misuse of statistical and epidemiological methods. Occup Environ Med 2000;57:1-9

wynik badania ma miejsce w rzeczywistości, W terminologii statystycznej słowo znamienność oznacza jedynie pewność, że obserwowany a statystyczna znamienność jest miarą wiarygodności wyniku badania, wyrażaną jako prawdopodobieństwo odrzucenia prawdziwej hipotezy zerowej Prawdopodobieństwo w/w błędu to poziom statystycznej znamienności α (a nie p ) * * - zwyczajowo α i p są stosowane zamiennie ( p jest nazywane poziomem znamienności statystycznej)

OBSZAR α OBSZAR p Prawdopodobieństwo odrzucenia prawdziwej hipotezy zerowej (błąd typu I) Znaczenie Prawdopodobieństwo zgodności pomiędzy wynikami badania i hipotezą testowaną przez to badanie Arbitralna decyzja Źródło Wynik obliczeń na podstawie danych pozyskanych w badaniu Jedna wartość z przedziału {0,1}, wybrana przez badacza, zwykle wynosząca 0,05 (5%) Dążenie do minimalizacji ryzyka popełnienia błędu typu I Wartość Jedna wartość z przedziału {0,1}, uzyskana w wyniku obliczeń statystycznych Czynniki Warunkujące Wartość Wielkość badanego efektu (zależności, różnicy), wielkość próby, błąd pomiaru Wynik porównania wartości p (obliczonej na podstawie danych uzyskanych w badaniu) z wartością α (ustaloną na zasadzie arbitralnej decyzji) jest podstawą do formułowania wniosku o statystycznej znamienności. Wniosek ten jest uzasadniony, gdy p < α, co przy konwencji przypisującej α wartość 0,05 prowadzi do znanego zapisu: p < 0,05.

TREŚĆ SEMINARIUM 2 Statystyka Analityczna Część IA - zarys metodologii badań naukowych - hipotezy badawcze - testowanie hipotez proste testy statystycznej znamienności różnic proste testy statystycznej znamienności zależności - minimalna niezbędna liczebność próby

CO TEST MIERZY? Test nie mierzy różnicy r pomiędzy średnią A i średnią B Test nie mierzy różnicy r pomiędzy często stością A i często stością B TEST MIERZY RÓŻNICĘ POMIĘDZY ROZKŁADAMI ZMIENNYCH

TESTY STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICE ZALEŻNOŚCI ZMIENNE ZMIENNE ZMIENNE ZMIENNE ILOŚCIOWE JAKOŚCIOWE ILOŚCIOWE JAKOŚCIOWE dodatkowo, w zależności od rozkładu, testy parametryczne lub nieparametryczne

TESTY STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICE ZALEŻNOŚCI dzisiaj ZMIENNE ILOŚCIOWE (czesc IA) ZMIENNE ZMIENNE ILOŚCIOWE JAKOŚCIOWE

OCENA STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICR! KLUCZOWE PYTANIA! Liczba porównywanych grup? Dwie grupy lub Więcej niż dwie grupy Rozkład zmiennych? Rozkład normalny lub Rozkład odbiegający od normalnego wg: Pereira-Maxwell F.: A-Z of Medical Statistics. A companion for critical appraisal. Arnold, London 1998

DANE NIESPAROWANE I DANE SPAROWANE (LICZBA LCD4 W GRUPACH NNO+ I NNO-) Dzisiaj Grupa NNO+ Porównanie LCD4 Grupa NNO- Porównanie LCD4 Jutro (np. po terapii sterydami) Grupa NNO+ POZIOMO: PIONOWO: TEST DLA DWÓCH ŚREDNICH, REPREZENTUJĄCYCH DWIE PORÓWNYWANE, RÓŻNE GRUPY TEST DLA DWÓCH ŚREDNICH, REPREZENTUJĄCYCH JEDNĄ GRUPĘ (DWA POMIARY W ODSTĘPIE CZASOWYM)

OCENA STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICR ZMIENNE ILOŚCIOWE Dane pochodzące z niezależnych pomiarów (dane niesparowane) Scenariusz: masa ciała chłopców (grupa A) i dziewcząt (grupa B) -Liczba grup 2: -Liczba grup 3 lub więcej: test t-studenta, gdy rozkład normalny test Mann-Whitney, gdy rozkład nie-normalny analiza wariancji ( anova ), gdy rozkład normalny test Kruskall-Wallis a, gdy rozkład nie-normalny Dane pochodzące z zależnych pomiarów (dane sparowane) Scenariusz: masa ciała dziewcząt przed (grupa A1) i po kuracji (grupa A2) odchudzającej -Liczba grup (punktów pomiaru) 2: test t-studenta dla par, gdy rozkład normalny test Wilcoxon a dla par, gdy rozkład nie-normalny - Liczba grup 3 lub więcej: brak standardowych metod

OCENA STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICR ZMIENNE ILOŚCIOWE Dane pochodzące z niezależnych pomiarów (dane niesparowane) Scenariusz: masa ciała chłopców (grupa A) i dziewcząt (grupa B) -Liczba grup 2: -Liczba grup 3 lub więcej: test t-studenta, gdy rozkład normalny test Mann-Whitney, gdy rozkład nie-normalny analiza wariancji ( anova ), gdy rozkład normalny test Kruskall-Wallis a, gdy rozkład nie-normalny Dane pochodzące z zależnych pomiarów (dane sparowane) Scenariusz: masa ciała dziewcząt przed (grupa A1) i po kuracji (grupa A2) odchudzającej -Liczba grup (punktów pomiaru) 2: test t-studenta dla par, gdy rozkład normalny test Wilcoxon a dla par, gdy rozkład nie-normalny - Liczba grup 3 lub więcej: brak standardowych metod

TEST T STUDENTA (DWIE GRUPY - H 0 : μ A = μ B ) ZAŁOŻENIA 1. Normalny rozkład zmiennej w każdej grupie 2. Podobieństwo wariancji w każdej grupie 3. Każda grupa spełnia kryteria niezależnej próby reprezentatywnej Ad 1: test Shapiro-Wilk a (każda grupa) Ad 2: test równych wariancji (wbudowany w program komputerowy) Ad 3: dana obserwacja znajduje się tylko w jednej grupie

PORÓWNANIA WIELOKROTNE PROBLEM PRZY STOSOWANIU TESTU T STUDENTA

p = 0,04 przestaje być wystarczające dla orzeczenia znamienności statystycznej KOREKTA PROBLEMU WIELOKROTNYCH PORÓWNA WNAŃ Zaostrzenie kryterium oceny znamienności statystycznej (α = 0,05 jest w tym przypadku zbyt liberalne) Korekta Metodą Bonferroni ego α Bonf = α / liczba porównań Gdy 3 porównania wówczas: α Bonf = 0,05 / 3 = 0,016

METODA BONFERRONI-HOLM HOLM a W KOREKCIE PORÓWNA WNAŃ WIELOKROTNYCH 1. Uporządkuj uzyskane p od najmniejszej do największej wartości (0,013; 0,032; 0,041) 2. Pomnóż najmniejszą wartość przez liczbę porównań (0,013 * 3 = 0,039); gdy mniejsze od 0,05 kontynuuj 3. Pomnóż drugą najmniejszą wartość przez n-1 (tu 2, a więc 0,032 * 2 = 0,063); gdy mniejsze od 0,05 kontynuuj 4. Powodzenia!

METODA BONFERRONI-HOLM HOLM a - OGRANICZENIA - Korekta satysfakcjonująca przy małej liczbie porównań dlatego Alternatywne metody (1) Tukey a lub (2) Scheffe go

OCENA STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICR ZMIENNE ILOŚCIOWE Dane pochodzące z niezależnych pomiarów (dane niesparowane) Scenariusz: masa ciała chłopców (grupa A) i dziewcząt (grupa B) -Liczba grup 2: -Liczba grup 3 lub więcej: test t-studenta, gdy rozkład normalny test Mann-Whitney, gdy rozkład nie-normalny analiza wariancji ( anova ), gdy rozkład normalny test Kruskall-Wallis a, gdy rozkład nie-normalny Dane pochodzące z zależnych pomiarów (dane sparowane) Scenariusz: masa ciała dziewcząt przed (grupa A1) i po kuracji (grupa A2) odchudzającej -Liczba grup (punktów pomiaru) 2: test t-studenta dla par, gdy rozkład normalny test Wilcoxon a dla par, gdy rozkład nie-normalny - Liczba grup 3 lub więcej: brak standardowych metod

ANALIZA WARIANCJI (ANOVA) W KLASYFIKACJI POJEDYNCZEJ (TRZY LUB WIĘCEJ GRUP - H 0 : μ A = μ B = μ C ) ZAŁOŻENIA (TAKIE SAME JAK DLA TESTU T) 1. Normalny rozkład zmiennej w każdej grupie 2. Podobieństwo wariancji w każdej grupie 3. Każda grupa spełnia kryteria niezależnej próby reprezentatywnej Test t-studenta jest redukcją ANOVY do dwóch grup ANOVA = Analysis of Variance

ANALIZA WARIANCJI W KLASYFIKACJI POJEDYNCZEJ Oglądanie wszystkich wartości (N) ujawnia zmienność pomiędzy nimi. Przy wyłonieniu badanych grup (pogrupowanie wszystkich wartości i obliczeniu średnich dla każdej z grup) ujawniają się dwa źródła zmienności: zmienność pomiędzy grupami i zmienność wewnątrz grup: Źródło Zmienności Suma kwadratów Liczba stopni swobody Uśredniona suma kwadratów* Pomiędzy SS B df B = k-1 S 2 B =SS B /df B Wewnątrz SS W df B = N-k S 2 W = SS W /df W Razem SS T = SS B + SS W df T = df B + df W * - popularna nazwa wariancji w żargonie Anowy ) STATYSTYKA F = S 2 B / S2 W Obliczoną wartość F porównuje się z krytyczną (np. dla 0,05) wartością F w tabeli rozkładu, dla dwóch stopni swobody df B i df W (komputer podaje gotową wartość p)

ANOVA FEV 1 JAKO FUNKCJA RTG The ANOVA Procedure Dependent Variable: FEV1P Source DF Anova SS Mean Square F Value Pr > F RTG 2 3602.457243 1801.228621 8.64 0.0002 Czy zachowana homogenność wariancji : (Test Levene a) Levene's Test for Homogeneity of FEV1P Variance ANOVA of Squared Deviations from Group Means Source DF Sum of squares Mean square F Value Pr > F RTG 2 92136.4 46068.2 0.55 0.5784 Error 516 43371047 84052.4

ANOVA KOREKTA ODSTĘPSTWA OD HOMOGENNOŚCI WARIANCJI TEST LEVENE s: p>0,05, ale gdyby p<0,05 to: PROCEDURA WELCH a Welch's ANOVA for FEV1P Source DF F Value Pr > F RTG 2.0000 8.77 0.0002 Error 194.8 wniosek taki sam jak w przypadku prostej Anovy

PODSTAWOWE ZAŁOŻENIA TEST T-STUDENTA I ANOVA rozkład analizowanej zmiennej spełnia kryterium rozkładu normalnego (weryfikacja np. testem Shapiro-Wilk a); duża liczba obserwacji w próbie; pomiary zmiennej odznaczają się dużą dokładnością (precyzja narzędzia pomiarowego); pomiary mają charakter ilościowy (zmienna ilościowa)

ROZKŁAD ZMIENNEJ ILOŚCIOWEJ ZNACZENIE WIELKOŚCI PRÓBY Im mniejsza próba tym większe ryzyko odstępstwa od rozkładu normalnego

KANON n 30 N Próba Komentarz < 30 mała Odstępstwo od rozkładu normalnego 30 100 średnia Konieczne testowanie normalności >100 duża Wskazane testowanie normalności Testowanie Normalnosci

TEST T STUDENTA I ANOVA TO TESTY PARAMETRYCZNE, OPRACOWANE DLA ANALIZ ZMIENNYCH O ROZKŁADZIE NORMALNYM gdy rozkład analizowanej zmiennej nie spełnia kryterium rozkładu normalnego (weryfikacja np. testem Shapiro-Wilk a); gdy mała liczba obserwacji w próbie; gdy pomiary zmiennej odznaczają się ograniczoną dokładnością (mała precyzja narzędzia pomiarowego) gdy pomiary mają charakter półilościowy (np. skala Apgar) lub ograniczoną dokładność TESTY NIEPARAMETRYCZNE

OCENA STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICR ZMIENNE ILOŚCIOWE Dane pochodzące z niezależnych pomiarów (dane niesparowane) Scenariusz: masa ciała chłopców (grupa A) i dziewcząt (grupa B) -Liczba grup 2: -Liczba grup 3 lub więcej: test t-studenta, gdy rozkład normalny test Mann-Whitney, gdy rozkład nie-normalny analiza wariancji ( anova ), gdy rozkład normalny test Kruskall-Wallis a, gdy rozkład nie-normalny Dane pochodzące z zależnych pomiarów (dane sparowane) Scenariusz: masa ciała dziewcząt przed (grupa A1) i po kuracji (grupa A2) odchudzającej -Liczba grup (punktów pomiaru) 2: test t-studenta dla par, gdy rozkład normalny test Wilcoxon a dla par, gdy rozkład nie-normalny - Liczba grup 3 lub więcej: brak standardowych metod

PODSTAWOWE TESTY NIEPARAMETRYCZNE DLA OCENY RÓŻNIC Test znaków (sign test) odwołuje się do wartości mediany i liczby wartości powyżej (+) i poniżej (-) mediany (test dla prób niezależnych lub sparowanych) małe zastosowanie 2 grupy, niesparowany: Test mediany i jego modyfikacja test Mann-Whitney; test Wilcoxon a dla dwóch grup (alternatywa dla testu t-studenta) 2 lub więcej grup, niesparowany: Test Kruskal-Wallis (alternatywa dla ANOVY) 2 grupy, sparowany: Test znaków Wilcoxon a dla danych sparowanych (ponadto stosowany tam, gdzie pomiar reprezentuje wartość uzyskaną jako wskaźnik, współczynnik, itp.)

TREŚĆ SEMINARIUM 2 Statystyka Analityczna Część IA - zarys metodologii badań naukowych - hipotezy badawcze - testowanie hipotez proste testy statystycznej znamienności różnic proste testy statystycznej znamienności zależności - minimalna niezbędna liczebność próby

PLANOWANIE BADANIA! Sformułowanie weryfikowalnej hipotezy Decyzja w sprawie mocy testu Decyzja w sprawie poziomu statystycznej znamienności Decyzja w sprawie zakładanego efektu (z określeniem poziomu zmienności)

PLANOWANIE BADANIA! Sformułowanie weryfikowalnej hipotezy Decyzja w sprawie mocy testu Decyzja w sprawie poziomu statystycznej znamienności Decyzja w sprawie zakładanego efektu (z określeniem poziomu zmienności)

SFORMUŁOWANIE WERYFIKOWALNEJ HIPOTEZY H 0 vs H A Wartośċ średnia A = Wartośċ średnia B Częstośċ A = Częstośċ B Czas przeżycia A = Czas przeżycia B Kąt nachyleniaa = Kąt nachyleniab itd.

MINIMALNA NIEZBĘDNA WIELKOŚĆ PRÓBY W CELU BADANIA: Wartości parametru populacyjnego; Różnicy dla zmiennych ilościowych; Różnicy dla zmiennych jakościowych; Prostej zależności (korelacji); Różnicy pomiędzy dwoma korelacjami; Różnicy pomiędzy dwoma profilami przebiegu czasowego; Itp.

PLANOWANIE BADANIA! Sformułowanie weryfikowalnej hipotezy Decyzja w sprawie mocy testu Decyzja w sprawie poziomu statystycznej znamienności Decyzja w sprawie zakładanego efektu (z określeniem poziomu zmienności)

DECYZJA W SPRAWIE POZIOMU STATYSTYCZNEJ ZNAMIENNOŚCI I MOCY TESTU W wyniku testu dochodzi do: H 0 może być albo-albo: Prawdziwa Fałszywa Nieodrzucenia H 0 OK Błąd typu II Odrzucenia H 0 Błąd typu I OK KONWENCJA BŁĄD TYPU I = α = 0,05 BŁĄD TYPU II = β = 0,20

MOC TESTU 1 β = 1-0,2 = 0,8 = 80% Moc testu jest jego zdolnością do wykrycia założonego efektu, o ile jest on obecny (przy założonym poziomie statystycznej znamienności)

STATYSTYCZNA ZNAMIENNOŚĆ α = 0,05 (lub 0,01, lub )

PLANOWANIE BADANIA! Sformułowanie weryfikowalnej hipotezy Decyzja w sprawie mocy testu Decyzja w sprawie poziomu statystycznej znamienności Decyzja w sprawie zakładanego efektu (z określeniem poziomu zmienności)

OBLICZENIE MINIMALNEJ NIEZBĘDNEJ LICZEBNOŚCI CI PRÓB B DLA TESTU T O ZAŁOŻONYCH ONYCH POZIOMACH α i β n = 2 * [ (z α + z β ) σ / (μ 1 - μ 2 ) ] 2 trzeba założyć wartości z (z α reprezentuje α - znamienność, z β reprezentuje β -moc), wielkość różnicy (μ 1 - μ 2 ) i znać odchylenie standardowe średniej σ UWAGA: Dla rutynowych α (0,05) i β (0,2; moc=80%) wartości z są usztywnione ZATEM PROSTA FORMUŁA: Minimalna liczebność dla każdej z grup wynosi n = 2* [(1,96+0,842) σ / (μ 1 - μ 2 )] 2 = 2* [2,8 σ / (μ 1 - μ 2 )] 2 Gdy chcemy udokumentować statystyczną znamienność różnicy wynoszącej 25j, przy odchyleniu standardowym 45 j, wówczas w każdej z grup potrzeba 50,8 badanych (t.j. 51 badanych + rozsądne extra) moc badania wyniesie 80%, znamienność 5%

! KALKULATORY!