PODSTAWY STATYSTYKI SEMINARIUM 2 ! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE
|
|
- Wojciech Wierzbicki
- 9 lat temu
- Przeglądów:
Transkrypt
1 STUDIUM DOKTORANCKIE KATOWICE, 2011/12 PODSTAWY STATYSTYKI SEMINARIUM 2! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE Jan E. Zejda Katedra Epidemiologii WLK, SUM
2 TREŚĆ SEMINARIUM 2 Statystyka Analityczna Część IA - zarys metodologii badań naukowych - hipotezy badawcze - testowanie hipotez proste testy statystycznej znamienności różnic proste testy statystycznej znamienności zależności - minimalna niezbędna liczebność próby
3 TREŚĆ SEMINARIUM 2 Statystyka Analityczna Część IA - zarys metodologii badań naukowych - hipotezy badawcze - testowanie hipotez proste testy statystycznej znamienności różnic proste testy statystycznej znamienności zależności - minimalna niezbędna liczebność próby
4 METODOLOGIA BADAŃ NAUKOWYCH Nauka zajmująca się tworzeniem i doskonaleniem metod badań naukowych w ramach różnych dziedzin, dla umożliwienia ciągłego ich rozwoju
5 PODSTAWOWE ZADANIE METODOLOGII BADAŃ NAUKOWYCH wypracowywanie optymalnych zasad poznania naukowego (poprzez prowadzenie badań) Badanie naukowe jest zorganizowaną, celową i systematyczną metodą postępowania mającego na celu poznanie rzeczywistości.
6 PODZIAŁ BADAŃ NAUKOWYCH Nauki Empiryczne systematyczna obserwacja, eksperyment Nauki Nieempiryczne dowodzenie twierdzeń bez wymogu obserwacji Nauki empiryczne odwołują się do kanonu doświadczenia, dostępnego dzięki procesom postrzegania w trakcie tzw. obserwacji lub tzw. eksperymentu. Nauki nieempiryczne charakteryzują się dowodzeniem twierdzeń bez wymogu gromadzenia informacji na drodze bezpośredniej obserwacji. NAUKI PRZYRODNICZE I SPOŁECZNE SĄ NAUKAMI EMPIRYCZNYMI
7 DWIE GŁÓWNE METODY POZNANIA NAUKOWEGO SCHEMAT DEDUKCJI Teoria Hipoteza Obserwacja Weryfikacja SCHEMAT INDUKCJI Obserwacja Prawidłowość Hipoteza Teoria
8 SYSTEM EPISTEMOLOGICZNY POPPER a -rozwój wiedzy jest możliwy przez żmudną procedurę obalania kolejnych (niesłusznych) teorii; -odrzucanie teorii jest możliwe pod warunkiem, że została ona wcześniej sformułowana; -sformułowanie problemu wymaga kreatywnego spojrzenia, często aktywizującego wyobraźnię badacza. Filozofia Poppera wprowadziła na dobre element niepewności w dociekaniach naukowych. Autor był bardziej radykalny w sądach wiedza jego zdaniem ma zawsze charakter tymczasowy, hipotetyczny, a to czego możemy od badań naukowych oczekiwać, to najwyżej eliminacja teorii, których fałszywość można udowodnić (
9 DWA PROSTE PRZESŁANIA KONCEPCJI FALSYFIKACJI żmudny proces falsyfikacji wiedzie do sytuacji, w której ostają się jedynie te teorie, które przeszły bardzo wyrafinowaną procedurę testowania; immanentną cechą działalności naukowej jest kreatywność, inwencja w proponowaniu wyjaśnień zjawisk, których natura nie jest jeszcze znana. Obie właściwości powinny także towarzyszyć praktycznym aspektom metodologii badań naukowych, muszą być brane pod uwagę w procesie poznania naukowego
10 PROCES POZNANIA NAUKOWEGO W PRAKTYCE Gruntowna wiedza Dobry warsztat ( dobra praktyka epidemiologiczna ) Twórcze wykorzystanie informacji (interpretacja) Inwencja, iluminacja, przypadek Umiejętne komunikowanie wyników
11 PROCES POZNANIA A PROTOKÓŁ BADAWCZY Typowy Proces Badania Naukowego Układ Protokołu Badawczego określenie problemu badawczego sformułowanie pytań badawczych/hipotez określenie sposobu uzyskania odpowiedzi wybór źródła danych pomiary analiza danych prezentacja wyników interpretacja wyników opracowanie raportu uzasadnienie podjęcia badania (wstęp) cel badania materiał i metoda wyniki badania omówienie (dyskusja) i wnioski
12 CEL - cel ukryty w tekście wprowadzenia - cel ogólnikowy - cel w formie pytania lub hipotezy? Dobrze Sformułowany Cel - konkretny i precyzyjny - oryginalny lub zapowiadający nowe spojrzenie - interesujący dla czytelnika Pożądany Model jedna praca = jeden główny cel (mogą mu towarzyszyć jeden, dwa cele poboczne) Częste Problemy
13 SENSOWNE PYTANIA BADAWCZE PRECYZYJNE, KLAROWNE, UMOŻLIWIJĄCE JEDNOZNACZNĄ ODPOWIEDŹ TRZY PODSTAWOWE TYPY PYTAŃ P. opisowe: jak jest?, jak dużo? P. odnośnie różnicy/zależności: korelacja?, różnica? P. odnośnie związku przyczynowo-skutkowego: czy powoduje? czy wynika z? Rozwiązanie problemu zależy od gradacji kolejnych pytań PERSPEKTYWA STATYSTYCZNA ZWIĄZEK P-S OPIS % sukcesu, masa itp. w grupie RDS+ % sukcesu, masa itp. w grupie RDS- (w. średnia, zakres, odchylenie standardowe, itp.) RÓŻNICA/ZALEŻNOŚĆ różnica pomiędzy % sukcesu w grupach RDS* i RDS+, różnice w zakresie innych cech, pomiar ryzyka I oczywiście to, co wcześniej po lewej stronie Kontrola czynników zakłócających (analiza stratyfikacyjna, analiza wielu zmiennych, itp.) I oczywiście to, co wcześniej po lewej stronie Niech wasza mowa będzie: tak, tak; nie, nie (Mt: 5, 37)
14 TREŚĆ SEMINARIUM 2 Statystyka Analityczna Część IA - zarys metodologii badań naukowych - hipotezy badawcze - testowanie hipotez proste testy statystycznej znamienności różnic proste testy statystycznej znamienności zależności - minimalna niezbędna liczebność próby
15 DWA OBSZARY STATYSTYKI Statystyka Opisowa Statystyka Analityczna (ile?, jak często?) ( charakterystyka ) Testowanie Hipotez Modelowanie Związków Przyczynowo-Skutkowych Ocena Wiarygodności Pomiaru itp.
16 WERYFIKUJ WERYFIKOWALNE! od hipotezy koncepcyjnej, poprzez hipotezę naukową, do hipotezy statystycznej
17 (sąd, HIPOTEZA d, testowalne stwierdzenie) Hipoteza: Częstość występowania otyłości zależy od tradycji żywieniowych Hipoteza musi podlegać weryfikacji albo się ostanie jako prawdziwa, albo zostanie uznana za fałszywą: jak weryfikować zależność od tradycji? Hipoteza: Częstość występowania otyłości jest większa wśród osób preferujących tradycyjny styl żywienia Skąd pewność, że częstość jest większa a nie mniejsza? Hipoteza: Częstość występowania otyłości różni się pomiędzy grupami o różnym stylu żywienia Problem: na gruncie metodologii badań naukowych nie jest możliwe weryfikowanie hipotezy zakładającej różnicę (dowód słuszności tego stwierdzenia wykracza poza program kursu)
18 SOLUTIO - I weryfikacja hipotezy zakładającej brak różnicy Częstość występowania otyłości nie różni się pomiędzy grupami o różnym stylu żywienia WYNIK WERYFIKACJI (TESTOWANIA) albo odrzucenie hipotezy albo brak podstaw do odrzucenia hipotezy
19 SOLUTIO - II Układ 2 hipotez H 0 (hipoteza zerowa) i H A (hipoteza alternatywna) H 0 brak różnicy, brak zależności, brak efektu H A obecna różnica, obecna zależność, obecny efekt STRATEGIA ALBO-ALBO odrzucenie H 0 powoduje aktualność H A nieodrzucenie H 0 powoduje nieaktualność H A TERTIUM NON DATUR
20 JAK POSTĘPOWA POWAĆ W CELU WERYFIKACJI HIPOTEZY? 1. Sformułuj H 0 / H A 2. Przeprowadź obserwację / eksperyment 3. Poddaj dane analizie statystycznej 4. Jeśli prawdopodobieństwo uzyskanego wyniku jest małe (p<α) przyjmij, że wyniki obserwacji nie są zgodne z treścią H 0 Odrzuć H 0 Akceptuj H A
21 SCIENTIA ET ARS H 0 & H A Brak dowodu na obecność efektu nie jest dowodem na brak obecności efektu DOWÓD STATYSTYCZNY PODLEGA INTERPRETACJI! Altman D.G., Bland J.M.: Absence of evidence is not evidence of absence. BMJ 1995;311:485
22 SPECYFICZNE BŁĘB ŁĘDY TOWARZYSZĄCE TESTOWANIU HIPOTEZ
23 Źle się dzieje, gdy prawdziwa H 0 jest odrzucona Błąd Typu I (błąd α) Prawdopodobieństwo błędu I istnieje zawsze na jakie się godzimy? JEST TO STATYSTYCZNA ZNAMIENNOŚĆ BADANIA
24 Źle się dzieje, gdy fałszywa H 0 nie jest odrzucona Błąd Typu II (błąd β) Założenie to wyznacza obszar braku błędu równy (1- β ) JEST TO MOC BADANIA (1-ß)
25 DECYZJA W SPRAWIE POZIOMU STATYSTYCZNEJ ZNAMIENNOŚCI I MOCY TESTU W wyniku testu dochodzi do: H 0 może być albo-albo: Prawdziwa Fałszywa Nieodrzucenia H 0 OK Błąd typu II Odrzucenia H 0 Błąd typu I OK. KONWENCJA BŁĄD TYPU I = α = 0,05 BŁĄD TYPU II = β = 0,20
26 DECYZJA W SPRAWIE POZIOMU STATYSTYCZNEJ ZNAMIENNOŚCI I MOCY TESTU W wyniku testu dochodzi do: H 0 może być albo-albo: Prawdziwa Fałszywa Nieodrzucenia H 0 OK. Błąd typu II Odrzucenia H 0 Błąd typu I OK KONWENCJA BŁĄD TYPU I = α = 0,05 BŁĄD TYPU II = β = 0,20
27 DECYZJA W SPRAWIE POZIOMU STATYSTYCZNEJ ZNAMIENNOŚCI I MOCY TESTU W wyniku testu dochodzi do: H 0 może być albo-albo: Prawdziwa Fałszywa Nieodrzucenia H 0 OK Błąd typu II Odrzucenia H 0 Błąd typu I OK. KONWENCJA BŁĄD TYPU I = α = 0,05 BŁĄD TYPU II = β = 0,20
28 DECYZJA W SPRAWIE POZIOMU STATYSTYCZNEJ ZNAMIENNOŚCI I MOCY TESTU W wyniku testu dochodzi do: H 0 może być albo-albo: Prawdziwa Fałszywa Nieodrzucenia H 0 OK Błąd typu II Odrzucenia H 0 Błąd typu I OK. KONWENCJA BŁĄD TYPU I = α = 0,05 BŁĄD TYPU II = β = 0,20
29 DECYZJA W SPRAWIE POZIOMU STATYSTYCZNEJ ZNAMIENNOŚCI I MOCY TESTU W wyniku testu dochodzi do: H 0 może być albo-albo: Prawdziwa Fałszywa Nieodrzucenia H 0 OK Błąd typu II Odrzucenia H 0 Błąd typu I OK KONWENCJA BŁĄD TYPU I = α = 0,05 BŁĄD TYPU II = β = 0,20
30 DECYZJA W SPRAWIE POZIOMU STATYSTYCZNEJ ZNAMIENNOŚCI I MOCY TESTU W wyniku testu dochodzi do: H 0 może być albo-albo: Prawdziwa Fałszywa Nieodrzucenia H 0 OK Błąd typu II Odrzucenia H 0 Błąd typu I OK KONWENCJA BŁĄD TYPU I = α = 0,05 BŁĄD TYPU II = β = 0,20
31 STATYSTYCZNA ZNAMIENNOŚĆ Uzasadnienie dla odrzucenia H 0 ma charakter probabilistyczny I jest wynikiem testu statystycznej znamienności KLUCZEM DO ZROZUMIENIA JEST PRAWDOPODOBIEŃSTWO WYSTĘPOWANIA RZADKICH ZJAWISK Zmniejszenie RR u chorych stosujących lek A może wystąpić całkiem przypadkowo, nawet gdy lek nie jest aktywny farmakologicznie. Nie zdarza się to często. Jaka częstość może być uznana za rzadkie zdarzenie?
32 CZĘSTA INTERPRETACJA RZADKICH ZDARZEŃ Specyfika rozkładu normalnego danej zmiennej wynika z faktu, że pod krzywą znajduje się 100% możliwych wartości zmiennej, ale ich gęstość nie jest jednorodna (wartości: częste, mniej częste, jeszcze mniej częste, rzadkie) % A X B 2.5% 95% 2.5% 0,025 0,95 0,025 rzadkie wartości rzadkie wartości X ± 1.96 SD definiuje obszar obejmujący 95% możliwych wartości, To co pozostaje poza to 5% obszar rzadkich wartości (0,05) CZĘSTOŚĆ RZADKICH WARTOŚCI = 2,5% + 2,5% = 5% CZĘSTOŚĆ RZADKICH WARTOŚCI = 0, ,025 = 0,05 Jeśli prawdopodobieństwo spontanicznego wystąpienia wyniku testu nie przekracza 5% (p<0,05) to wynik jest statystycznie znamienny
33 STATYSTYCZNA ZNAMIENNOŚĆ czyli STATYSTYCZNA ISTOTNOŚĆ
34 STATYSTYCZNA ZNAMIENNOŚĆ KLINICZNA ZNAMIENNOŚĆ *** KLINICZNA ZNAMIENNOŚĆ EFEKT RÓŻNY OD ZERA STATYSTYCZNA ZNAMIENNOŚĆ EFEKT RÓWNY ZERO *** Częstość bólów głowy u dzieci mieszkających w pobliżu składowiska odpadów wynosiła 15%, a u dzieci z terenu kontrolnego 13% i różnica ta była statystycznie znamienna na poziomie 0,05 Statystyczna znamienność, klinicznie trywialny wynik Czas przeżycia chorych leczonych preparatem A był o 2 lata dłuższy niż u chorych leczonych preparatem B, ale wynik nie był statystycznie znamienny na poziomie 0,05 Brak statystycznej znamienności, wynik istotny klinicznie
35 INTERPRETACJA p TYPOWE NIEPOROZUMIENIA Przekonanie, że im mniejsza wartość p tym silniejszy efekt Przekonanie, że każda wartość p<0,05 musi być skomentowana, nawet gdy efekt jest mały lub mało prawdopodobny Przekonanie, że brak statystycznej znamienności jest dowodem na słuszność hipotezy zerowej Rushton L.: Reporting of occupational and environmental research: use and misuse of statistical and epidemiological methods. Occup Environ Med 2000;57:1-9
36 wynik badania ma miejsce w rzeczywistości, W terminologii statystycznej słowo znamienność oznacza jedynie pewność, że obserwowany a statystyczna znamienność jest miarą wiarygodności wyniku badania, wyrażaną jako prawdopodobieństwo odrzucenia prawdziwej hipotezy zerowej Prawdopodobieństwo w/w błędu to poziom statystycznej znamienności α (a nie p ) * * - zwyczajowo α i p są stosowane zamiennie ( p jest nazywane poziomem znamienności statystycznej)
37 OBSZAR α OBSZAR p Prawdopodobieństwo odrzucenia prawdziwej hipotezy zerowej (błąd typu I) Znaczenie Prawdopodobieństwo zgodności pomiędzy wynikami badania i hipotezą testowaną przez to badanie Arbitralna decyzja Źródło Wynik obliczeń na podstawie danych pozyskanych w badaniu Jedna wartość z przedziału {0,1}, wybrana przez badacza, zwykle wynosząca 0,05 (5%) Dążenie do minimalizacji ryzyka popełnienia błędu typu I Wartość Jedna wartość z przedziału {0,1}, uzyskana w wyniku obliczeń statystycznych Czynniki Warunkujące Wartość Wielkość badanego efektu (zależności, różnicy), wielkość próby, błąd pomiaru Wynik porównania wartości p (obliczonej na podstawie danych uzyskanych w badaniu) z wartością α (ustaloną na zasadzie arbitralnej decyzji) jest podstawą do formułowania wniosku o statystycznej znamienności. Wniosek ten jest uzasadniony, gdy p < α, co przy konwencji przypisującej α wartość 0,05 prowadzi do znanego zapisu: p < 0,05.
38 TREŚĆ SEMINARIUM 2 Statystyka Analityczna Część IA - zarys metodologii badań naukowych - hipotezy badawcze - testowanie hipotez proste testy statystycznej znamienności różnic proste testy statystycznej znamienności zależności - minimalna niezbędna liczebność próby
39 CO TEST MIERZY? Test nie mierzy różnicy r pomiędzy średnią A i średnią B Test nie mierzy różnicy r pomiędzy często stością A i często stością B TEST MIERZY RÓŻNICĘ POMIĘDZY ROZKŁADAMI ZMIENNYCH
40 TESTY STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICE ZALEŻNOŚCI ZMIENNE ZMIENNE ZMIENNE ZMIENNE ILOŚCIOWE JAKOŚCIOWE ILOŚCIOWE JAKOŚCIOWE dodatkowo, w zależności od rozkładu, testy parametryczne lub nieparametryczne
41 TESTY STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICE ZALEŻNOŚCI dzisiaj ZMIENNE ILOŚCIOWE (czesc IA) ZMIENNE ZMIENNE ILOŚCIOWE JAKOŚCIOWE
42 OCENA STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICR! KLUCZOWE PYTANIA! Liczba porównywanych grup? Dwie grupy lub Więcej niż dwie grupy Rozkład zmiennych? Rozkład normalny lub Rozkład odbiegający od normalnego wg: Pereira-Maxwell F.: A-Z of Medical Statistics. A companion for critical appraisal. Arnold, London 1998
43 DANE NIESPAROWANE I DANE SPAROWANE (LICZBA LCD4 W GRUPACH NNO+ I NNO-) Dzisiaj Grupa NNO+ Porównanie LCD4 Grupa NNO- Porównanie LCD4 Jutro (np. po terapii sterydami) Grupa NNO+ POZIOMO: PIONOWO: TEST DLA DWÓCH ŚREDNICH, REPREZENTUJĄCYCH DWIE PORÓWNYWANE, RÓŻNE GRUPY TEST DLA DWÓCH ŚREDNICH, REPREZENTUJĄCYCH JEDNĄ GRUPĘ (DWA POMIARY W ODSTĘPIE CZASOWYM)
44 OCENA STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICR ZMIENNE ILOŚCIOWE Dane pochodzące z niezależnych pomiarów (dane niesparowane) Scenariusz: masa ciała chłopców (grupa A) i dziewcząt (grupa B) -Liczba grup 2: -Liczba grup 3 lub więcej: test t-studenta, gdy rozkład normalny test Mann-Whitney, gdy rozkład nie-normalny analiza wariancji ( anova ), gdy rozkład normalny test Kruskall-Wallis a, gdy rozkład nie-normalny Dane pochodzące z zależnych pomiarów (dane sparowane) Scenariusz: masa ciała dziewcząt przed (grupa A1) i po kuracji (grupa A2) odchudzającej -Liczba grup (punktów pomiaru) 2: test t-studenta dla par, gdy rozkład normalny test Wilcoxon a dla par, gdy rozkład nie-normalny - Liczba grup 3 lub więcej: brak standardowych metod
45 OCENA STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICR ZMIENNE ILOŚCIOWE Dane pochodzące z niezależnych pomiarów (dane niesparowane) Scenariusz: masa ciała chłopców (grupa A) i dziewcząt (grupa B) -Liczba grup 2: -Liczba grup 3 lub więcej: test t-studenta, gdy rozkład normalny test Mann-Whitney, gdy rozkład nie-normalny analiza wariancji ( anova ), gdy rozkład normalny test Kruskall-Wallis a, gdy rozkład nie-normalny Dane pochodzące z zależnych pomiarów (dane sparowane) Scenariusz: masa ciała dziewcząt przed (grupa A1) i po kuracji (grupa A2) odchudzającej -Liczba grup (punktów pomiaru) 2: test t-studenta dla par, gdy rozkład normalny test Wilcoxon a dla par, gdy rozkład nie-normalny - Liczba grup 3 lub więcej: brak standardowych metod
46 TEST T STUDENTA (DWIE GRUPY - H 0 : μ A = μ B ) ZAŁOŻENIA 1. Normalny rozkład zmiennej w każdej grupie 2. Podobieństwo wariancji w każdej grupie 3. Każda grupa spełnia kryteria niezależnej próby reprezentatywnej Ad 1: test Shapiro-Wilk a (każda grupa) Ad 2: test równych wariancji (wbudowany w program komputerowy) Ad 3: dana obserwacja znajduje się tylko w jednej grupie
47 PORÓWNANIA WIELOKROTNE PROBLEM PRZY STOSOWANIU TESTU T STUDENTA
48 p = 0,04 przestaje być wystarczające dla orzeczenia znamienności statystycznej KOREKTA PROBLEMU WIELOKROTNYCH PORÓWNA WNAŃ Zaostrzenie kryterium oceny znamienności statystycznej (α = 0,05 jest w tym przypadku zbyt liberalne) Korekta Metodą Bonferroni ego α Bonf = α / liczba porównań Gdy 3 porównania wówczas: α Bonf = 0,05 / 3 = 0,016
49 METODA BONFERRONI-HOLM HOLM a W KOREKCIE PORÓWNA WNAŃ WIELOKROTNYCH 1. Uporządkuj uzyskane p od najmniejszej do największej wartości (0,013; 0,032; 0,041) 2. Pomnóż najmniejszą wartość przez liczbę porównań (0,013 * 3 = 0,039); gdy mniejsze od 0,05 kontynuuj 3. Pomnóż drugą najmniejszą wartość przez n-1 (tu 2, a więc 0,032 * 2 = 0,063); gdy mniejsze od 0,05 kontynuuj 4. Powodzenia!
50 METODA BONFERRONI-HOLM HOLM a - OGRANICZENIA - Korekta satysfakcjonująca przy małej liczbie porównań dlatego Alternatywne metody (1) Tukey a lub (2) Scheffe go
51 OCENA STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICR ZMIENNE ILOŚCIOWE Dane pochodzące z niezależnych pomiarów (dane niesparowane) Scenariusz: masa ciała chłopców (grupa A) i dziewcząt (grupa B) -Liczba grup 2: -Liczba grup 3 lub więcej: test t-studenta, gdy rozkład normalny test Mann-Whitney, gdy rozkład nie-normalny analiza wariancji ( anova ), gdy rozkład normalny test Kruskall-Wallis a, gdy rozkład nie-normalny Dane pochodzące z zależnych pomiarów (dane sparowane) Scenariusz: masa ciała dziewcząt przed (grupa A1) i po kuracji (grupa A2) odchudzającej -Liczba grup (punktów pomiaru) 2: test t-studenta dla par, gdy rozkład normalny test Wilcoxon a dla par, gdy rozkład nie-normalny - Liczba grup 3 lub więcej: brak standardowych metod
52 ANALIZA WARIANCJI (ANOVA) W KLASYFIKACJI POJEDYNCZEJ (TRZY LUB WIĘCEJ GRUP - H 0 : μ A = μ B = μ C ) ZAŁOŻENIA (TAKIE SAME JAK DLA TESTU T) 1. Normalny rozkład zmiennej w każdej grupie 2. Podobieństwo wariancji w każdej grupie 3. Każda grupa spełnia kryteria niezależnej próby reprezentatywnej Test t-studenta jest redukcją ANOVY do dwóch grup ANOVA = Analysis of Variance
53 ANALIZA WARIANCJI W KLASYFIKACJI POJEDYNCZEJ Oglądanie wszystkich wartości (N) ujawnia zmienność pomiędzy nimi. Przy wyłonieniu badanych grup (pogrupowanie wszystkich wartości i obliczeniu średnich dla każdej z grup) ujawniają się dwa źródła zmienności: zmienność pomiędzy grupami i zmienność wewnątrz grup: Źródło Zmienności Suma kwadratów Liczba stopni swobody Uśredniona suma kwadratów* Pomiędzy SS B df B = k-1 S 2 B =SS B /df B Wewnątrz SS W df B = N-k S 2 W = SS W /df W Razem SS T = SS B + SS W df T = df B + df W * - popularna nazwa wariancji w żargonie Anowy ) STATYSTYKA F = S 2 B / S2 W Obliczoną wartość F porównuje się z krytyczną (np. dla 0,05) wartością F w tabeli rozkładu, dla dwóch stopni swobody df B i df W (komputer podaje gotową wartość p)
54 ANOVA FEV 1 JAKO FUNKCJA RTG The ANOVA Procedure Dependent Variable: FEV1P Source DF Anova SS Mean Square F Value Pr > F RTG Czy zachowana homogenność wariancji : (Test Levene a) Levene's Test for Homogeneity of FEV1P Variance ANOVA of Squared Deviations from Group Means Source DF Sum of squares Mean square F Value Pr > F RTG Error
55 ANOVA KOREKTA ODSTĘPSTWA OD HOMOGENNOŚCI WARIANCJI TEST LEVENE s: p>0,05, ale gdyby p<0,05 to: PROCEDURA WELCH a Welch's ANOVA for FEV1P Source DF F Value Pr > F RTG Error wniosek taki sam jak w przypadku prostej Anovy
56 PODSTAWOWE ZAŁOŻENIA TEST T-STUDENTA I ANOVA rozkład analizowanej zmiennej spełnia kryterium rozkładu normalnego (weryfikacja np. testem Shapiro-Wilk a); duża liczba obserwacji w próbie; pomiary zmiennej odznaczają się dużą dokładnością (precyzja narzędzia pomiarowego); pomiary mają charakter ilościowy (zmienna ilościowa)
57 ROZKŁAD ZMIENNEJ ILOŚCIOWEJ ZNACZENIE WIELKOŚCI PRÓBY Im mniejsza próba tym większe ryzyko odstępstwa od rozkładu normalnego
58 KANON n 30 N Próba Komentarz < 30 mała Odstępstwo od rozkładu normalnego średnia Konieczne testowanie normalności >100 duża Wskazane testowanie normalności Testowanie Normalnosci
59 TEST T STUDENTA I ANOVA TO TESTY PARAMETRYCZNE, OPRACOWANE DLA ANALIZ ZMIENNYCH O ROZKŁADZIE NORMALNYM gdy rozkład analizowanej zmiennej nie spełnia kryterium rozkładu normalnego (weryfikacja np. testem Shapiro-Wilk a); gdy mała liczba obserwacji w próbie; gdy pomiary zmiennej odznaczają się ograniczoną dokładnością (mała precyzja narzędzia pomiarowego) gdy pomiary mają charakter półilościowy (np. skala Apgar) lub ograniczoną dokładność TESTY NIEPARAMETRYCZNE
60 OCENA STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICR ZMIENNE ILOŚCIOWE Dane pochodzące z niezależnych pomiarów (dane niesparowane) Scenariusz: masa ciała chłopców (grupa A) i dziewcząt (grupa B) -Liczba grup 2: -Liczba grup 3 lub więcej: test t-studenta, gdy rozkład normalny test Mann-Whitney, gdy rozkład nie-normalny analiza wariancji ( anova ), gdy rozkład normalny test Kruskall-Wallis a, gdy rozkład nie-normalny Dane pochodzące z zależnych pomiarów (dane sparowane) Scenariusz: masa ciała dziewcząt przed (grupa A1) i po kuracji (grupa A2) odchudzającej -Liczba grup (punktów pomiaru) 2: test t-studenta dla par, gdy rozkład normalny test Wilcoxon a dla par, gdy rozkład nie-normalny - Liczba grup 3 lub więcej: brak standardowych metod
61 PODSTAWOWE TESTY NIEPARAMETRYCZNE DLA OCENY RÓŻNIC Test znaków (sign test) odwołuje się do wartości mediany i liczby wartości powyżej (+) i poniżej (-) mediany (test dla prób niezależnych lub sparowanych) małe zastosowanie 2 grupy, niesparowany: Test mediany i jego modyfikacja test Mann-Whitney; test Wilcoxon a dla dwóch grup (alternatywa dla testu t-studenta) 2 lub więcej grup, niesparowany: Test Kruskal-Wallis (alternatywa dla ANOVY) 2 grupy, sparowany: Test znaków Wilcoxon a dla danych sparowanych (ponadto stosowany tam, gdzie pomiar reprezentuje wartość uzyskaną jako wskaźnik, współczynnik, itp.)
62 TREŚĆ SEMINARIUM 2 Statystyka Analityczna Część IA - zarys metodologii badań naukowych - hipotezy badawcze - testowanie hipotez proste testy statystycznej znamienności różnic proste testy statystycznej znamienności zależności - minimalna niezbędna liczebność próby
63 PLANOWANIE BADANIA! Sformułowanie weryfikowalnej hipotezy Decyzja w sprawie mocy testu Decyzja w sprawie poziomu statystycznej znamienności Decyzja w sprawie zakładanego efektu (z określeniem poziomu zmienności)
64 PLANOWANIE BADANIA! Sformułowanie weryfikowalnej hipotezy Decyzja w sprawie mocy testu Decyzja w sprawie poziomu statystycznej znamienności Decyzja w sprawie zakładanego efektu (z określeniem poziomu zmienności)
65 SFORMUŁOWANIE WERYFIKOWALNEJ HIPOTEZY H 0 vs H A Wartośċ średnia A = Wartośċ średnia B Częstośċ A = Częstośċ B Czas przeżycia A = Czas przeżycia B Kąt nachyleniaa = Kąt nachyleniab itd.
66 MINIMALNA NIEZBĘDNA WIELKOŚĆ PRÓBY W CELU BADANIA: Wartości parametru populacyjnego; Różnicy dla zmiennych ilościowych; Różnicy dla zmiennych jakościowych; Prostej zależności (korelacji); Różnicy pomiędzy dwoma korelacjami; Różnicy pomiędzy dwoma profilami przebiegu czasowego; Itp.
67 PLANOWANIE BADANIA! Sformułowanie weryfikowalnej hipotezy Decyzja w sprawie mocy testu Decyzja w sprawie poziomu statystycznej znamienności Decyzja w sprawie zakładanego efektu (z określeniem poziomu zmienności)
68 DECYZJA W SPRAWIE POZIOMU STATYSTYCZNEJ ZNAMIENNOŚCI I MOCY TESTU W wyniku testu dochodzi do: H 0 może być albo-albo: Prawdziwa Fałszywa Nieodrzucenia H 0 OK Błąd typu II Odrzucenia H 0 Błąd typu I OK KONWENCJA BŁĄD TYPU I = α = 0,05 BŁĄD TYPU II = β = 0,20
69 MOC TESTU 1 β = 1-0,2 = 0,8 = 80% Moc testu jest jego zdolnością do wykrycia założonego efektu, o ile jest on obecny (przy założonym poziomie statystycznej znamienności)
70 STATYSTYCZNA ZNAMIENNOŚĆ α = 0,05 (lub 0,01, lub )
71 PLANOWANIE BADANIA! Sformułowanie weryfikowalnej hipotezy Decyzja w sprawie mocy testu Decyzja w sprawie poziomu statystycznej znamienności Decyzja w sprawie zakładanego efektu (z określeniem poziomu zmienności)
72 OBLICZENIE MINIMALNEJ NIEZBĘDNEJ LICZEBNOŚCI CI PRÓB B DLA TESTU T O ZAŁOŻONYCH ONYCH POZIOMACH α i β n = 2 * [ (z α + z β ) σ / (μ 1 - μ 2 ) ] 2 trzeba założyć wartości z (z α reprezentuje α - znamienność, z β reprezentuje β -moc), wielkość różnicy (μ 1 - μ 2 ) i znać odchylenie standardowe średniej σ UWAGA: Dla rutynowych α (0,05) i β (0,2; moc=80%) wartości z są usztywnione ZATEM PROSTA FORMUŁA: Minimalna liczebność dla każdej z grup wynosi n = 2* [(1,96+0,842) σ / (μ 1 - μ 2 )] 2 = 2* [2,8 σ / (μ 1 - μ 2 )] 2 Gdy chcemy udokumentować statystyczną znamienność różnicy wynoszącej 25j, przy odchyleniu standardowym 45 j, wówczas w każdej z grup potrzeba 50,8 badanych (t.j. 51 badanych + rozsądne extra) moc badania wyniesie 80%, znamienność 5%
73 ! KALKULATORY!
Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski
Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2
STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE
SUM - WLK 2011 WYKŁAD CZWARTY: BIOSTATYSTYKA Prof. dr hab. med. Jan E. Zejda! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE TREŚĆ WYKŁADU Podstawowe zadania statystyki Specyfika
WNIOSKOWANIE STATYSTYCZNE
STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących
Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka
Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną
SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY
SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Weryfikacja hipotez statystycznych Statystyka i demografia PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria Wykład 5 dr inż. Anna Skowrońska-Szmer zima 2017/2018 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Testy nieparametryczne
Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria Wykład 5 Anna Skowrońska-Szmer lato 2016/2017 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją jako prawdziwą
Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Jak sprawdzić normalność rozkładu w teście dla prób zależnych?
Jak sprawdzić normalność rozkładu w teście dla prób zależnych? W pliku zalezne_10.sta znajdują się dwie zmienne: czasu biegu przed rozpoczęciem cyklu treningowego (zmienna 1) oraz czasu biegu po zakończeniu
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,
Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (punktowa, przedziałowa) Weryfikacja
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
JEDNOCZYNNIKOWA ANOVA
Analizę ANOVA wykorzystujemy do wykrycia różnic pomiędzy średnimi w więcej niż dwóch grupach/więcej niż w dwóch pomiarach JEDNOCZYNNIKOWA ANOVA porównania jednej zmiennej pomiędzy więcej niż dwoma grupami
Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28
Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych
STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech
TATYTYKA wykład 8 Wnioskowanie Weryfikacja hipotez Wanda Olech Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych
Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej
P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?
2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali
Prawdopodobieństwo i rozkład normalny cd.
# # Prawdopodobieństwo i rozkład normalny cd. Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
Spis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu
STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.
STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Jednoczynnikowa analiza wariancji
Jednoczynnikowa analiza wariancji Zmienna zależna ilościowa, numeryczna Zmienna niezależna grupująca (dzieli próbę na więcej niż dwie grupy), nominalna zmienną wyrażoną tekstem należy w SPSS przerekodować
LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej
LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez statystycznych
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Rozkład Gaussa i test χ2
Rozkład Gaussa jest scharakteryzowany dwoma parametramiwartością oczekiwaną rozkładu μ oraz dyspersją σ: METODA 2 (dokładna) polega na zmianie zmiennych i na obliczeniu pk jako różnicy całek ze standaryzowanego
ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW
ODRZUCANIE WYNIKÓW OJEDYNCZYCH OMIARÓW W praktyce pomiarowej zdarzają się sytuacje gdy jeden z pomiarów odstaje od pozostałych. Jeżeli wykorzystamy fakt, że wyniki pomiarów są zmienną losową opisywaną
STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe
Zjazd 7. SGGW, dn. 28.11.10 r. Matematyka i statystyka matematyczna Tematy 1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe nna Rajfura 1 Zagadnienia Przykład porównania wielu obiektów w
Przykład 1. (A. Łomnicki)
Plan wykładu: 1. Wariancje wewnątrz grup i między grupami do czego prowadzi ich ocena 2. Rozkład F 3. Analiza wariancji jako metoda badań założenia, etapy postępowania 4. Dwie klasyfikacje a dwa modele
GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana
GRUPY NIEZALEŻNE Chi kwadrat Pearsona Testy stosujemy w sytuacji, kiedy zmienna zależna mierzona jest na skali nominalnej Liczba porównywanych grup (czyli liczba kategorii zmiennej niezależnej) nie ma
Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4
Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4 Konrad Miziński, nr albumu 233703 31 maja 2015 Zadanie 1 Wartości oczekiwane µ 1 i µ 2 oszacowano wg wzorów: { µ1 = 0.43925 µ = X
Testowanie hipotez statystycznych
Testowanie hipotez statystycznych Hipotezą statystyczną jest dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia
dr hab. Dariusz Piwczyński, prof. nadzw. UTP
dr hab. Dariusz Piwczyński, prof. nadzw. UTP NIEZBĘDNE DO ZROZUMIENIA WYKŁADU POJĘCIA Doświadczenie jednogrupowe (jednopróbkowe), dwugrupowe (dwupróbkowe) Doświadczenie niezależne i wiązane (zależne, sparowane)
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Testowanie hipotez statystycznych cd.
Temat Testowanie hipotez statystycznych cd. Kody znaków: żółte wyróżnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Przykłady testowania hipotez dotyczących:
TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.
TEST STATYSTYCZNY Testem statystycznym nazywamy regułę postępowania rozstrzygająca, przy jakich wynikach z próby hipotezę sprawdzaną H 0 należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.
Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,
Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (estymacja punktowa, przedziałowa)
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
PODSTAWY STATYSTYKI SEMINARIUM 3 ! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE
STUDIUM DOKTORANCKIE KATOWICE, 2011/12 PODSTAWY STATYSTYKI SEMINARIUM 3! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE Jan E. Zejda Katedra Epidemiologii WLK, SUM TREŚĆ SEMINARIUM
Analiza wariancji. dr Janusz Górczyński
Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Ćwiczenie: Analiza zmienności prosta Przykład w MS EXCEL Sprawdź czy genotyp jagniąt wpływa statystycznie na cechy użytkowości rzeźnej? Obliczenia wykonaj za pomocą modułu Analizy danych (jaganova.xls).
Zadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
Wydział Matematyki. Testy zgodności. Wykład 03
Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy
Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.
Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
WNIOSKOWANIE STATYSTYCZNE
STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących
Żródło:
Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Test
Zadania ze statystyki cz.8. Zadanie 1.
Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,
Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25
Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane
Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.
Teoria błędów Wskutek niedoskonałości przyrządów, jak również niedoskonałości organów zmysłów wszystkie pomiary są dokonywane z określonym stopniem dokładności. Nie otrzymujemy prawidłowych wartości mierzonej
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.
ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.
Opracowała: Joanna Kisielińska ZMIENNE LOSOWE Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R tzn. X: R. Realizacją zmiennej losowej
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Elementy statystyki STA - Wykład 5
STA - Wykład 5 Wydział Matematyki i Informatyki Uniwersytet im. Adama Mickiewicza 1 ANOVA 2 Model jednoczynnikowej analizy wariancji Na model jednoczynnikowej analizy wariancji możemy traktować jako uogólnienie
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,
Testowanie hipotez statystycznych
Temat Testowanie hipotez statystycznych Kody znaków: Ŝółte wyróŝnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Idea i pojęcia teorii testowania hipotez
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde
Statystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska Aktualizacja 2017 Plan wykładu 1. Metody wnioskowania statystycznego vs. metody opisu 2. Testowanie hipotez
Testowanie hipotez statystycznych
Testowanie hipotez statystycznych Przypuśdmy, że mamy do czynienia z następującą sytuacją: nieznany jest rozkład F rządzący pewnym zjawiskiem losowym. Dysponujemy konkretną próbą losową ( x1, x2,..., xn
Statystyka Matematyczna Anna Janicka
Statystyka Matematyczna Anna Janicka wykład IX, 25.04.2016 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Plan na dzisiaj 1. Hipoteza statystyczna 2. Test statystyczny 3. Błędy I-go i II-go rodzaju 4. Poziom istotności,
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Wnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Testowanie hipotez statystycznych
Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom
Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich
Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Nazwa
Testowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15
VII WYKŁAD STATYSTYKA 30/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 7 (c.d) WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności,
Metodologia badań psychologicznych. Wykład 12. Korelacje
Metodologia badań psychologicznych Lucyna Golińska SPOŁECZNA AKADEMIA NAUK Wykład 12. Korelacje Korelacja Korelacja występuje wtedy gdy dwie różne miary dotyczące tych samych osób, zdarzeń lub obiektów
12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez
Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie Wyznaczanie przedziału 95%CI oznaczającego, że dla 95% prób losowych następujące nierówności są prawdziwe: X t s 0.025 n < μ < X + t s
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne