PODSTAWY STATYSTYKI SEMINARIUM 3 ! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE

Wielkość: px
Rozpocząć pokaz od strony:

Download "PODSTAWY STATYSTYKI SEMINARIUM 3 ! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE"

Transkrypt

1 STUDIUM DOKTORANCKIE KATOWICE, 2011/12 PODSTAWY STATYSTYKI SEMINARIUM 3! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE Jan E. Zejda Katedra Epidemiologii WLK, SUM

2 TREŚĆ SEMINARIUM 2 i 3 Statystyka Analityczna - zarys metodologii badań naukowych - hipotezy badawcze POPRZEDNIO: CZĘŚĆ IA - testowanie hipotez proste testy statystycznej znamienności różnic - dla zmiennych ilościowych - dla zmiennych jakościowych proste testy statystycznej znamienności zależności - minimalna niezbędna wielkość próby - przedział ufności

3 TREŚĆ SEMINARIUM 3 Statystyka Analityczna Część IB - zarys metodologii badań naukowych - hipotezy badawcze - testowanie hipotez proste testy statystycznej znamienności różnic - dla zmiennych ilościowych - dla zmiennych jakościowych proste testy statystycznej znamienności zależności - minimalna niezbędna wielkość próby - przedział ufności

4 TESTY STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICE ZALEŻNOŚCI ZMIENNE ZMIENNE ZMIENNE ZMIENNE ILOŚCIOWE JAKOŚCIOWE ILOŚCIOWE JAKOŚCIOWE dodatkowo, w zależności od rozkładu, testy parametryczne lub nieparametryczne

5 TESTY STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICE ZALEŻNOŚCI ZMIENNE ZMIENNE ZMIENNE ZMIENNE ILOŚCIOWE JAKOŚCIOWE ILOŚCIOWE JAKOŚCIOWE dzisiaj

6 TESTY STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNIC (ROZKŁADÓW) < ZMIENNE JAKOŚCIOWE >

7 OCENA STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICR! KLUCZOWE PYTANIA! Oczekiwana częstość (bezwględna) wartości zmiennej jakościowej? <5 lub 5+ Liczba porównywanych grup? Dwie grupy lub Więcej niż dwie grupy Zależność obserwacji? Dane sparowane lub Dane niesparowane wg: Pereira-Maxwell F.: A-Z of Medical Statistics. A companion for critical appraisal. Arnold, London 1998

8 OCENA STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICR ZMIENNE JAKOŚCIOWE Dane pochodzące z niezależnych pomiarów (dane niesparowane) Scenariusz: otyłość (%) wśród chłopców (grupa A) i dziewcząt (grupa B) -Liczba grup 2: -Liczba grup 3 lub więcej: test chi2, test Fisher a (dla małej częstości) test chi2 Dane pochodzące z zależnych pomiarów (dane sparowane) Scenariusz: otyłość (%) wśród dziewcząt przed (grupa A1) i po kuracji (grupa A2) odchudzającej -Liczba grup (punktów pomiaru) 2: test McNemar a - Liczba grup 3 lub więcej: test Stuart-Maxwell a

9 TEST CHI-KWADRAT (Chi 2, χ 2 ) ( H 0 : π A = π B ) Podstawowa procedura dla porównania częstości Chi 2 = Σ [ (O E)2 / E] O częstości obserwowane; E częstości oczekiwane 15% i 30% 20% i 20% Wynikiem testu chi 2 jest statystyka chi 2, która posiada swój rozkład (dla konkretnej wartości istnieje konkretne prawdopodobieństwo p ) Gdy p<0,05 są podstawy do odrzucenia H 0 Uwaga: wypowiedź na temat różnic częstości w grupie A i B można też interpretować jako zależność częstości od grupy

10 TEST CHI-KWADRAT WYNIK: STATYSTYKA CHI 2 i JEJ WARTOŚĆ P JAKIE OGRANICZENIA? Test chi2 jest czuły wobec wielkości próby. Nie powinien być stosowany, gdy zachodzi jedna z dwóch okoliczności: n<20; 20<n<40 i oczekiwana częstość wynosi mniej niż 5, przynajmniej w jednym polu tabeli ROZWIĄZANIE PROBLEMU Poprawka Yates a (ze względu na fakt, że analizowane są dane jakościowe, a rozkład chi2 ma charakter ciągły) obecnie kwestionowana i nie jest rekomendowana Dokładny test Fisher a

11 TEST CHI-KWADRAT SCENARIUSZ Czy 11,9% różni się od 21,3 %? The FREQ Procedure Statistics for Table of FEV1 by RTG Statistic DF Value Prob Chi-Square Continuity Adj. Chi-Square Mantel-Haenszel Chi-Square Fisher's Exact Test Left-sided Pr <= F Right-sided Pr >= F Two-sided Pr <= P Test ma zastosowanie, gdy oczekiwane częstości są małe (np.<5 w jednej z klatek )

12 INTEPRETACJA! TEST CHI 2 INTEPRETACJA DLA ZMIENNEJ WIELOWARTOŚCIOWEJ (2 GRUPY) Test chi 2 ocenia różnicę pomiędzy rozkładami, a nie poszczególnymi wartościami porównywanych zmiennych Zmienna Ból Wartość Zmiennej Grupa A Grupa B Statystyka Chi 2 (p) Brak 10 6 Mały Średni Duży 6 12 Bardzo duży 6 9 5,23 (0,06) Wynik testu nie odpowiada bezpośrednio na pytanie, czy chorzy w grupie B bardziej cierpią z powodu obecności dużego lub bardzo dużego bólu niż chorzy w grupie A.

13 OCENA STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICR ZMIENNE JAKOŚCIOWE Dane pochodzące z niezależnych pomiarów (dane niesparowane) Scenariusz: otyłość (%) wśród chłopców (grupa A) i dziewcząt (grupa B) -Liczba grup 2: -Liczba grup 3 lub więcej: test chi2, test Fisher a (dla małej częstości) test chi2 Dane pochodzące z zależnych pomiarów (dane sparowane) Scenariusz: otyłość (%) wśród dziewcząt przed (grupa A1) i po kuracji (grupa A2) odchudzającej -Liczba grup (punktów pomiaru) 2: test McNemar a - Liczba grup 3 lub więcej: test Stuart-Maxwell a

14 TEST CHI-KWADRAT (TRZY GRUPY) SCENARIUSZ Czy 11,5%, 15,7%, 25,5% różnią się w sposób statystycznie znamienny? The FREQ Procedure Statistics for Table of FEV1 by RTG Statistic DF Value Prob Chi-Square Mantel-Haenszel Chi-Square Fisher's Exact Test Left-sided ODPOWIEDŹ Pr <= F Tak, albowiem Right-sided p=0,003 Pr (p<0,05), >= F co pozwala na Two-sided odrzucenie H 0 Pr o równości <= P częstości ODPOWIEDŹ Tak, albowiem MHChi 2 p=0,0009 (p<0,05), co uwzględnia charakter zmiennej porządkowej i pozwala na odrzucenie H 0

15 TEST CHI-KWADRAT (TRZY GRUPY) SCENARIUSZ Czy trend ma charakter statystycznie znamienny? The FREQ Procedure Statistics for Table of FEV1 by RTG COCHRAN-ARMITAGE TREND TEST Statistic (Z) One-sided Pr<Z Two-sided Pr<Z Fisher's Exact Test Left-sided Pr <= F Right-sided Pr >= F Two-sided Pr <= P ODPOWIEDŹ Tak, albowiem p<0,05), co pozwala na odrzucenie H 0 o nieznamienności statystycznej trendu

16 OCENA STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICR ZMIENNE JAKOŚCIOWE Dane pochodzące z niezależnych pomiarów (dane niesparowane) Scenariusz: otyłość (%) wśród chłopców (grupa A) i dziewcząt (grupa B) -Liczba grup 2: -Liczba grup 3 lub więcej: test chi2, test Fisher a (dla małej częstości) test chi2 Dane pochodzące z zależnych pomiarów (dane sparowane) Scenariusz: otyłość (%) wśród dziewcząt przed (grupa A1) i po kuracji (grupa A2) odchudzającej -Liczba grup (punktów pomiaru) 2: test McNemar a - Liczba grup 3 lub więcej: test Stuart-Maxwell a

17 TEST McNEMAR a Interpretacja przy zmiennych sparowanych analogiczna do interpretacji dla zmiennych niesparowanych SZCZEGÓLNE ZASTOSOWANIE wyniki sparowanego badania kliniczno-kontrolnego np. dla 60-letniego mężczyzny z Rtg+ dobieramy 60-letniego mężczyznę z Rtg-, dla 56-letniego mężczyzny z Rtg+ dobieramy 56-letniego mężczyznę z Rtg-, itd. aby sprawdzić, czy różnią się grupy Rtg+ i Rtg- w zakresie narażenia na dym tytoniowy Kontrola wieku (parowanie) uzasadniona zależnością czasu palenia od wieku

18 TREŚĆ SEMINARIUM 3 Statystyka Analityczna Część IB - zarys metodologii badań naukowych - hipotezy badawcze - testowanie hipotez proste testy statystycznej znamienności różnic - dla zmiennych ilościowych - dla zmiennych jakościowych proste testy statystycznej znamienności zależności - minimalna niezbędna wielkość próby - przedział ufności

19 (PROSTE) TESTY STATYSTYCZNEJ ZNAMIENNOŚCI ZALEŻNO NOŚCI ZMIENNA ZALEŻNA ZMIENNA NIEZALEŻNA NA.. Masa (kg) Dwie Zmienne Ilościowe Wzrost (cm).. Mutacja (tak/nie) Dwie Zmienne Jakościowe Narażenie na WWA (tak/nie).. Zmienna Ilościowa i Jakościowa FEV 1 (%w.n w.n.).) Zmiany rtg w płucach p (tak/nie).. Hiperglikemia (tak/nie) Zmienna Jakościowa i Ilościowa Podaż kalorii na dobę (kcal)

20 TESTY STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICE ZALEŻNOŚCI ZMIENNE ZMIENNE ZMIENNE ZMIENNE ILOŚCIOWE JAKOŚCIOWE ILOŚCIOWE JAKOŚCIOWE

21 (PROSTE) TESTY STATYSTYCZNEJ ZNAMIENNOŚCI ZALEŻNO NOŚCI ZMIENNA ZALEŻNA ZMIENNA NIEZALEŻNA NA.. Masa (kg) Dwie Zmienne Ilościowe Wzrost (cm).. Mutacja (tak/nie) Dwie Zmienne Jakościowe Narażenie rozkład na WWA normalny (tak/nie).. ANALIZA KORELACJI LINIOWEJ Zmienna Ilościowa i Jakościowa rozkład nie-normalny FEV 1 (%w.n w.n.).) Zmiany rtg w płucach p (tak/nie).. ANALIZA REGRESJI LINIOWEJ Zmienna Jakościowa i Ilościowa Hiperglikemia (tak/nie) Podaż kalorii na dobę (kcal)

22 100 KORELACJA LINIOWA H 0 : r = 0 80 IQ [j] Pb-B [ug/dl] r = 0,21 (p=0,6) (95%PU: -0,10-0,34) ergo r =0,21 nie różni r się w sposób b statystycznie znamienny od 0

23 ALTERNATYWA NIEPARAMETRYCZNA (r) Nazwa współczynnik korelacji liniowej mnemotechnicznie przywołuje wymóg analizy wartości zmiennych mierzonych według skali liniowej. Gdy pomiary pochodzą z innych skal (np. stopień duszności, poziom samopoczucia, średnica bąbla itp.) wówczas zasadne metody odwołujące się do rankingu wyników: ANALIZA KORELACJI METODĄ SPEARMANA (dla zmiennych o normalnym rozkładzie metoda Pearson a) NIEPOROZUMIENIA INTERPRETACYJNE r Interpretacja r jako miernika siły zależności pomiędzy przyczyną i skutkiem Wykorzystanie analizy korelacji do porównania wartości dwóch metod Przewidywanie wartości Y na podstawie wartości X Obecność korelacji liniowej nie jest automatycznym dowodem na obecność zależności biologicznej

24 ANALIZA REGRESJI LINIOWEJ

25 ANALIZA REGRESJI LINIOWEJ y = a + b x gdzie: a punkt odcięcia; b kąt nachylenia prostej (zmiana wartości y w odpowiedzi na jednostkową zmianę wartości x ) DEFINICJA ZMIENNEJ ZALEŻNEJ! Y jest funkcją X, Y zależy od X

26 PREZENTACJA GRAFICZNA Y b a X Y = b * X + 18

27 PREZENTACJA GRAFICZNA Y b=0 a X Y = b * X + 18 gdy b = 0, to Y = 0*X + 18, zatem Y = 18 (stale!)

28 Na gruncie statystycznym b=0, gdy w sposób statystycznie znamienny b nie różni się od 0 : b=1,39 (p=0,09) lub (95%PU dla b : -0,14-2,82) 100 PREZENTACJA GRAFICZNA H 0 : b = Y b=0 a X

29 PRAKTYCZNE ZNACZENIE ANALIZY REGRESJI LINIOWEJ DOKUMENTOWANIE (ILOŚCIOWE) ZALEŻNOŚCI POMIĘDZY Y I X PRZEWIDYWANIE WARTOŚCI Y DLA DANEJ WARTOŚCI X

30 ANALIZA REGRESJI LINIOWEJ SCENARIUSZ Czy FEV 1 (w %w.n.) zależy od stażu pracy? The Y REG = a Procedure + bx The SAS System Plot of FEV1P*STAZ. Model: MODEL1 Symbol used is '*'. Dependent Variable: FEV1P 150 * * * * * * * * * * * * * * * * * Parameter * * * * * Estimates * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * F 100 * * Parameter * * * * * * * * * * * Standard * * * * * * * * * * * * * * * * * * E * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * V * * * * * * * * * * * * * * * * * * * * * * * * * * * * 1 * * * * * * * * * * * * * * * * * P * * * * * * * * 50 * * * * * * * * Variable DF Estimate Error t Value Pr > t Intercept <.0001 STAZ Współczynnik regresji b różni się w sposób statystycznie znamienny od 0 Staż (lata) 95%PU dla B: (-0,43950) - (-0,11950)

31 ANALIZA REGRESJI LINIOWEJ - ZNACZENIE WSPÓŁCZYNNIKA DETERMINACJI R 2 - y = a + b x PRZYKŁAD Uwaga: zmienność w x objaśnia zmienność w y, w stopniu r 2 (zmienna objaśniana = zależna, zmienna objaśniająca = niezależna) FVC(l) = 2,5Wzrost(m) + 1,75 Współczynnik korelacji FVC ~ Wzrost : r = 0,6 a więc r 2 = 0,36 Model wyjaśnia zaledwie 36% okoliczności tłumaczących wartość FVC (tu uwzględniono wzrost) Inne czynniki? (dodanie wieku, nałogu palenia, narażenia na pył zwiększy wartość r 2 )

32 TESTY STATYSTYCZNEJ ZNAMIENNOŚCI RÓŻNICE ZALEŻNOŚCI ZMIENNE ZMIENNE ZMIENNE ZMIENNE ILOŚCIOWE JAKOŚCIOWE ILOŚCIOWE JAKOŚCIOWE

33 (PROSTE) TESTY STATYSTYCZNEJ ZNAMIENNOŚCI ZALEŻNO NOŚCI ZMIENNA ZALEŻNA ZMIENNA NIEZALEŻNA NA.. Masa (kg) Dwie Zmienne Ilościowe Wzrost (cm).. Mutacja (tak/nie) Dwie Zmienne Jakościowe Narażenie na WWA (tak/nie).. Zmienna Ilościowa i Jakościowa TEST CHI-KWADRAT FEV 1 (%w.n w.n.).) Zmiany rtg w płucach p (tak/nie) ANALIZA REGRESJI Zmienna LOGISTYCZNEJ Jakościowa i Ilościowa Hiperglikemia (tak/nie) Podaż kalorii na dobę (kcal)

34 TEST CHI-KWADRAT

35 ANALIZA REGRESJI LOGISTYCZNEJ

36 UNIWERSALNY MODEL REGRESJI Y ~ X Dla zmiennych ilościowych rozwiązanie jest intuicyjnie proste: gdy X wzrasta o daną wartość, to Y wzrasta o iloczyn danej wartości i współczynnika regresji b (Trójglicerydemia = b*dobowa podaż tłuszczu + a) ADAPTACJA MODELU DO JAKOŚCIOWEJ POSTACI ZMIENNEJ ZALEŻNEJ Hipertrójgicerydemia(tak/nie) ~ duża dobowa podaż tłuszczu JAK POŁĄCZYĆ OBIE STRONY RÓWNANIA?

37 MODEL REGRESJI Z JAKOŚCIOW CIOWĄ ZMIENNĄ ZALEŻNĄ Hipertrójgicerydemia ~ dobowa podaż tłuszczu SOLUTIO FUNKCJA ŁĄCZĄCA (FŁ) Hipertrójgicerydemia [FŁ] = dobowa podaż tłuszczu

38 FUNKCJA ŁĄCZĄCA W REGRESJI LOGISTYCZNEJ Hipertrójgicerydemia [FŁ] = dobowa podaż tłuszczu Przyjęcie przez y wartości 0 ( nie ) lub 1 ( tak ) jest mierzone prawdopodobieństwem p, powiązanym z 1-p, w układzie p/1-p ale prawdopodobieństwo jest zawsze dodatnie, co ogranicza obszar modelowania - brak kompatybilności z prawą stroną równania Transformacja logarytmiczna naturalny logarytm wyrażenia ( logit transformation ) usuwa tę niedogodność - ln[p/1-p] + teraz zatem bez przeszkód lewa strona prawa strona ln[p/1-p] = a+bx czyli model regresji logistycznej

39 ANALIZA REGRESJI LOGISTYCZNEJ y = a + b x (logit ukryty w procedurze) Analiza regresji logistycznej testuje konwencjonalny układ hipotez: H 0 : b = 0 H A : b 0 Gdy p dla b >0,05 wówczas y nie zależy od x w sposób statystycznie znamienny *** Analiza regresji logistycznej nie tylko informuje o obecności i sile związku, ale także umożliwia przewidywanie wartości zmiennej zależnej na podstawie wartości zmiennej niezależnej

40 ANALIZA REGRESJI LOGISTYCZNEJ SCENARIUSZ Pytanie: Czy obecność obniżonej wartości FEV 1 (norma/patologia) zależy od obecności zmian Rtg (-/+)? The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept <.0001 rtg Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits RTG 0 vs MODEL: FEV 1 (N/P) = 1,6539 0,3505 * Rtg

41 ANALIZA REGRESJI LOGISTYCZNEJ SCENARIUSZ Pytanie: Czy obecność obniżonej wartości FEV 1 (norma/patologia) zależy od obecności zmian Rtg (-/+/++)? Uwaga: regresja logistyczna analizuje zmienne o różnej liczbie wartości (nie tylko zmienne binarne) The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept <.0001 RTG RTG Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits RTG 0 vs RTG 1 vs

42 (PROSTE) TESTY STATYSTYCZNEJ ZNAMIENNOŚCI ZALEŻNO NOŚCI ZMIENNA ZALEŻNA ZMIENNA NIEZALEŻNA NA.. Dwie Zmienne Ilościowe analiza korelacji i analiza regresji liniowej.. Dwie Zmienne Jakościowe test chi-kwadrat i analiza regresji logistycznej.. Zmienna Ilościowa i Jakościowa analiza regresji liniowej.. Zmienna Jakościowa i Ilościowa analiza regresji logistycznej

43 OBLICZENIE MINIMALNEJ NIEZBĘDNEJ LICZEBNOŚCI CI PRÓB B DLA TESTU CHI-KWADRAT Obliczenia wykorzystują formułę wypracowaną dla proporcji Liczebność jednej (każdej) grupy wynosi: n = [ z α {2π(1-π)} + z β {π1(1- π 1 )+ π 2 (1- π 2 )}] 2 / [π 1 π 2 ] 2 gdzie: π 1 proporcja pierwsza; π 2 proporcja druga; π proporcja średnia (π 1 + π 2 / 2) Częstość LCD4 wynosi 15% u dzieci z NNO. Istnieją dane, że jest ona wyższa u dzieci bez NNO. Jak duże muszą być grupy, aby wykazać statystycznie znamienną różnicę? Niezbędne założenia 1. Wielkość różnicy: np. dwukrotna ma znaczenie kliniczne (a więc 15% i 30%) 2. Znamienność i moc: α = 0,05 (z=1,96); β = 0,2 (z=0,84) n = [ 1,96 {2* 0,225(1-0,225)} + 0,84 {0,15(1-0,15) + 0,30(1-0,30)}] 2 / [0,15-0,30] 2 n = [1,96 0,35 + 0,84 0,13 +0,21] 2 / 0,022 = [1,16+0,3+0,21] 2 / 0,022 = 123,5 Do każdej z grup należy wylosować 124 osoby

44 MINIMALNA NIEZBĘDNA LICZEBNOŚĆ PRÓBY - UZUPEŁNIENIA -

45 ALTERNATYWNY (POZORNIE) SPOSÓB SZACOWANIA N Chcę udowodnić, że wskutek różnego reżimu terapeutycznego średnia masa myszy w grupie T będzie wyższa o 10 g niż w grupie K (50 g vs 40 g). Zakładam (bo wiem lub przyjmuję), że współczynnik zmienności masy wynosi 20% (CV = SD/X). Pozwalam, aby przypadkowe (gdyby reżim T=K) wystąpienie różnicy jak wyżej nie było częstsze niż 5/100 (5% lub 0,05). Chcę, aby szansa wykrycia różnicy, gdy ma ona rzeczywiście miejsce, wynosiła co najmniej 80% (co to za badanie, które daje szansę 50:50 na zasadzie efekt albo jest albo go nie ma) PROSTA FORMUŁA: N = 25*V / (D*D) V zmienność (SD*X); D różnica do wykazania

46 ALTERNATYWNY (POZORNIE) SPOSÓB SZACOWANIA N D = 10g (50g 40g) N = 25*V / (D*D) Zgodnie z założeniami: SD = CV*X = 20% * 40g = 8g ponieważ CV = SD/X (uwaga mniejsza zmienność, gdy myszy są kopiami 1 egzemplarza) V = SD*SD = 8g * 8g = 64gg N = (25 * 64) / (10 * 10) N = 16 myszy w jednej grupie

47 ALTERNATYWNY (POZORNIE) SPOSÓB SZACOWANIA N ZAŁOŻENIA, W TYM absolutna różnica lub względna różnica: PROCENTOWA (%) WARTOŚĆ LICZBA ZNAMIENNOŚĆ RÓŻNICA T-K CV ZWIERZĄT NA POZIOMIE 0, NIE TAK TAK PRAWIE TAK TAK TAK

48 PUNKT CIĘŻKOŚCI: ZMIENNA DECYDUJĄCA W randomizowanym badaniu nad skutecznością treningu fizycznego w leczeniu POCHP po 2 miesiącach oceni się: 1) Kliniczny stopień duszności; 2) Wartość FEV 1 ; 3) Wartość PEFR; 4) Wartość MMEF ; 5) Objętość plwociny dobowej; 6) Częstość napadów duszności; 7) Itd KTÓRA ZMIENNA MA DECYDOWAĆ O SZACOWANIU N?

SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE

SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE SUM - WLK 2011 WYKŁAD CZWARTY: BIOSTATYSTYKA Prof. dr hab. med. Jan E. Zejda! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE TREŚĆ WYKŁADU Podstawowe zadania statystyki Specyfika

Bardziej szczegółowo

PAKIETY STATYSTYCZNE

PAKIETY STATYSTYCZNE . Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej

Bardziej szczegółowo

PODSTAWY STATYSTYKI SEMINARIUM 2 ! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE

PODSTAWY STATYSTYKI SEMINARIUM 2 ! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE STUDIUM DOKTORANCKIE KATOWICE, 2011/12 PODSTAWY STATYSTYKI SEMINARIUM 2! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE Jan E. Zejda Katedra Epidemiologii WLK, SUM TREŚĆ SEMINARIUM

Bardziej szczegółowo

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

dr hab. Dariusz Piwczyński, prof. nadzw. UTP dr hab. Dariusz Piwczyński, prof. nadzw. UTP Cechy jakościowe są to cechy, których jednoznaczne i oczywiste scharakteryzowanie za pomocą liczb jest niemożliwe lub bardzo utrudnione. nominalna porządek

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności

Bardziej szczegółowo

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE

SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE SUM - WLK 2011 WYKŁAD PIĄTY: BIOSTATYSTYKA C.D. Prof. dr hab. med. Jan E. Zejda! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE TREŚĆ WYKŁADU Dokumentowanie efektu (analiza danych

Bardziej szczegółowo

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności: Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane

Bardziej szczegółowo

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska Anna Stankiewicz Izabela Słomska Wstęp- statystyka w politologii Rzadkie stosowanie narzędzi statystycznych Pisma Karla Poppera

Bardziej szczegółowo

S t a t y s t y k a, część 3. Michał Żmihorski

S t a t y s t y k a, część 3. Michał Żmihorski S t a t y s t y k a, część 3 Michał Żmihorski Porównanie średnich -test T Założenia: Zmienne ciągłe (masa, temperatura) Dwie grupy (populacje) Rozkład normalny* Równe wariancje (homoscedasticity) w grupach

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Wykład 8 Dane kategoryczne

Wykład 8 Dane kategoryczne Wykład 8 Dane kategoryczne Wrocław, 19.04.2017r Zmienne kategoryczne 1 Przykłady zmiennych kategorycznych 2 Zmienne nominalne, zmienne ordynalne (porządkowe) 3 Zmienne dychotomiczne kodowanie zmiennych

Bardziej szczegółowo

GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana

GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana GRUPY NIEZALEŻNE Chi kwadrat Pearsona Testy stosujemy w sytuacji, kiedy zmienna zależna mierzona jest na skali nominalnej Liczba porównywanych grup (czyli liczba kategorii zmiennej niezależnej) nie ma

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

Rozkłady statystyk z próby

Rozkłady statystyk z próby Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny

Bardziej szczegółowo

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe? 2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali

Bardziej szczegółowo

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

TESTOWANIE HIPOTEZ STATYSTYCZNYCH TETOWANIE HIPOTEZ TATYTYCZNYCH HIPOTEZA TATYTYCZNA przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę) PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

1 Estymacja przedziałowa

1 Estymacja przedziałowa 1 Estymacja przedziałowa 1. PRZEDZIAŁY UFNOŚCI DLA ŚREDNIEJ (a) MODEL I Badana cecha ma rozkład normalny N(µ, σ) o nieznanym parametrze µ i znanym σ. Przedział ufności: [ ( µ x u 1 α ) ( σn ; x + u 1 α

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.

Bardziej szczegółowo

Przykład 1. (A. Łomnicki)

Przykład 1. (A. Łomnicki) Plan wykładu: 1. Wariancje wewnątrz grup i między grupami do czego prowadzi ich ocena 2. Rozkład F 3. Analiza wariancji jako metoda badań założenia, etapy postępowania 4. Dwie klasyfikacje a dwa modele

Bardziej szczegółowo

Projektowanie badań i interpretacja wyników okiem biostatystyka. Warszawa, 15 marca 2016, Anna Marcisz

Projektowanie badań i interpretacja wyników okiem biostatystyka. Warszawa, 15 marca 2016, Anna Marcisz Projektowanie badań i interpretacja wyników okiem biostatystyka Warszawa, 15 marca 2016, Anna Marcisz Agenda Część I Cel badań - hipotezy badawcze/statystyczne Wielkość próby potrzebna do badania Jak odczytywać

Bardziej szczegółowo

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI Korelacja 1. Współczynnik korelacji 2. Współczynnik korelacji liniowej definicja 3. Estymacja współczynnika korelacji 4. Testy istotności współczynnika korelacji

Bardziej szczegółowo

Prawdopodobieństwo i rozkład normalny cd.

Prawdopodobieństwo i rozkład normalny cd. # # Prawdopodobieństwo i rozkład normalny cd. Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl

Bardziej szczegółowo

Wnioskowanie statystyczne. Statystyka w 5

Wnioskowanie statystyczne. Statystyka w 5 Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających

Bardziej szczegółowo

Regresja logistyczna (LOGISTIC)

Regresja logistyczna (LOGISTIC) Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji

Bardziej szczegółowo

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4 Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4 Konrad Miziński, nr albumu 233703 31 maja 2015 Zadanie 1 Wartości oczekiwane µ 1 i µ 2 oszacowano wg wzorów: { µ1 = 0.43925 µ = X

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22 Spis treści Przedmowa do wydania pierwszego.... 11 Przedmowa do wydania drugiego.... 15 Wykaz symboli.... 17 Litery alfabetu greckiego wykorzystywane w podręczniku.... 17 Symbole wykorzystywane w zagadnieniach

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Przedziały ufności i testy parametrów. Przedziały ufności dla średniej odpowiedzi. Interwały prognoz (dla przyszłych obserwacji)

Przedziały ufności i testy parametrów. Przedziały ufności dla średniej odpowiedzi. Interwały prognoz (dla przyszłych obserwacji) Wkład 1: Prosta regresja liniowa Statstczn model regresji liniowej Dane dla prostej regresji liniowej Przedział ufności i test parametrów Przedział ufności dla średniej odpowiedzi Interwał prognoz (dla

Bardziej szczegółowo

Zadania ze statystyki cz.8. Zadanie 1.

Zadania ze statystyki cz.8. Zadanie 1. Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 Inne układy doświadczalne 1) Układ losowanych bloków Stosujemy, gdy podejrzewamy, że może występować systematyczna zmienność między powtórzeniami np. - zmienność

Bardziej szczegółowo

Uogólniony model liniowy

Uogólniony model liniowy Uogólniony model liniowy Ogólny model liniowy y = Xb + e Każda obserwacja ma rozkład normalny Każda obserwacja ma tą samą wariancję Dane nienormalne Rozkład binomialny np. liczba chorych krów w stadzie

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Czy miejsce zamieszkania różnicuje uprawianie sportu? Mieszkańcy

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test

Bardziej szczegółowo

Rozdział 8. Regresja. Definiowanie modelu

Rozdział 8. Regresja. Definiowanie modelu Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność

Bardziej szczegółowo

Metodologia badań psychologicznych. Wykład 12. Korelacje

Metodologia badań psychologicznych. Wykład 12. Korelacje Metodologia badań psychologicznych Lucyna Golińska SPOŁECZNA AKADEMIA NAUK Wykład 12. Korelacje Korelacja Korelacja występuje wtedy gdy dwie różne miary dotyczące tych samych osób, zdarzeń lub obiektów

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1. Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w

Bardziej szczegółowo

Wydział Matematyki. Testy zgodności. Wykład 03

Wydział Matematyki. Testy zgodności. Wykład 03 Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy

Bardziej szczegółowo

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 23 maja 2018 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem

Bardziej szczegółowo

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna

Bardziej szczegółowo

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI ANALIZA KORELACJI Korelacja 1. Współczynnik korelacji 2. Współczynnik korelacji liniowej definicja 3. Estymacja współczynnika korelacji 4. Testy istotności

Bardziej szczegółowo

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 24 maja 2017 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników

Bardziej szczegółowo

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA Opis zakładanych efektów kształcenia na studiach podyplomowych Nazwa studiów: BIOSTATYSTYKA PRAKTYCZNE ASPEKTY STATYSTYKI W BADANIACH MEDYCZNYCH Typ studiów: doskonalące Symbol Efekty kształcenia dla studiów

Bardziej szczegółowo

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu

Bardziej szczegółowo

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1 Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, że 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 Regresja wielokrotna Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X 1, X 2, X 3,...) na zmienną zależną (Y).

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom

Bardziej szczegółowo

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Statystyka matematyczna. Wykład V. Parametryczne testy istotności Statystyka matematyczna. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Weryfikacja hipotezy o równości wartości średnich w dwóch populacjach 2 3 Weryfikacja hipotezy o równości wartości średnich

Bardziej szczegółowo

Rozkłady statystyk z próby. Statystyka

Rozkłady statystyk z próby. Statystyka Rozkłady statystyk z próby tatystyka Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających ten

Bardziej szczegółowo

WYKŁAD 8 ANALIZA REGRESJI

WYKŁAD 8 ANALIZA REGRESJI WYKŁAD 8 ANALIZA REGRESJI Regresja 1. Metoda najmniejszych kwadratów-regresja prostoliniowa 2. Regresja krzywoliniowa 3. Estymacja liniowej funkcji regresji 4. Testy istotności współczynnika regresji liniowej

Bardziej szczegółowo

STUDIUM DOKTORANCKIE KATOWICE, 2011/12 PODSTAWY STATYSTYKI SEMINARIUM 4. Jan E. Zejda Katedra Epidemiologii WLK, SUM

STUDIUM DOKTORANCKIE KATOWICE, 2011/12 PODSTAWY STATYSTYKI SEMINARIUM 4. Jan E. Zejda Katedra Epidemiologii WLK, SUM STUDIUM DOKTORANCKIE KATOWICE, 2011/12 PODSTAWY STATYSTYKI SEMINARIUM 4 Jan E. Zejda Katedra Epidemiologii WLK, SUM TREŚĆ SEMINARIUM 4 Statystyka Analityczna Część II - czynniki zakłócające - analiza stratyfikacyjna

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.

Bardziej szczegółowo

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Analiza zależności cech ilościowych regresja liniowa (Wykład 13) Analiza zależności cech ilościowych regresja liniowa (Wykład 13) dr Mariusz Grządziel semestr letni 2012 Przykład wprowadzajacy W zbiorze danych homedata (z pakietu R-owskiego UsingR) można znaleźć ceny

Bardziej szczegółowo

Założenia: wyniki są binarne próby są niezależne liczba prób n ustalona przed pomiarem to samo prawdopodobieństwo sukcesu we wszystkich próbach

Założenia: wyniki są binarne próby są niezależne liczba prób n ustalona przed pomiarem to samo prawdopodobieństwo sukcesu we wszystkich próbach Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie Test dwumianowy χ 2 test dobroci dopasowania Analiza tabeli kontygencji ( tabeli krzyżywej) P k sukcesów = n k pk (1 p) n k Założenia:

Bardziej szczegółowo

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Przykład 2 Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Sondaż sieciowy analiza wyników badania sondażowego dotyczącego motywacji w drodze do sukcesu Cel badania: uzyskanie

Bardziej szczegółowo

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy Załącznik nr 7 do Zarządzenia Rektora nr../12 z dnia.... 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2017/2018 STATYSTYKA

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

Eksploracja Danych. Testowanie Hipotez. (c) Marcin Sydow

Eksploracja Danych. Testowanie Hipotez. (c) Marcin Sydow Testowanie Hipotez Wprowadzenie Testy statystyczne: pocz. XVII wieku (prace J.Arbuthnotta, liczba urodzeń noworodków obu płci w Londynie) Testowanie hipotez: Karl Pearson (pocz. XX w., testowanie zgodności,

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy

Bardziej szczegółowo

Katedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Katedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy Temat: Weryfikacja hipotez statystycznych dla jednej i dwóch średnich. MS EXCEL Do weryfikacji różnic między dwiema grupami jednostek doświadczalnych w MS Excelu wykorzystujemy funkcję o nazwie T.TEST.

Bardziej szczegółowo

Badanie normalności rozkładu

Badanie normalności rozkładu Temat: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności. Badanie normalności rozkładu Shapiro-Wilka: jest on najbardziej zalecanym testem normalności rozkładu. Jednak wskazane jest, aby liczebność

Bardziej szczegółowo

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie...

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie... Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów Wstęp... 13 1. Wprowadzenie... 19 1.1. Statystyka opisowa.................................. 21 1.2. Wnioskowanie

Bardziej szczegółowo

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Regresja liniowa Korelacja Modelowanie Analiza modelu Wnioskowanie Korelacja 3 Korelacja R: charakteryzuje

Bardziej szczegółowo

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

dr hab. Dariusz Piwczyński, prof. nadzw. UTP dr hab. Dariusz Piwczyński, prof. nadzw. UTP NIEZBĘDNE DO ZROZUMIENIA WYKŁADU POJĘCIA Doświadczenie jednogrupowe (jednopróbkowe), dwugrupowe (dwupróbkowe) Doświadczenie niezależne i wiązane (zależne, sparowane)

Bardziej szczegółowo

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012

Bardziej szczegółowo

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę

Bardziej szczegółowo