STUDIUM DOKTORANCKIE KATOWICE, 2011/12 PODSTAWY STATYSTYKI SEMINARIUM 4. Jan E. Zejda Katedra Epidemiologii WLK, SUM
|
|
- Małgorzata Dobrowolska
- 7 lat temu
- Przeglądów:
Transkrypt
1 STUDIUM DOKTORANCKIE KATOWICE, 2011/12 PODSTAWY STATYSTYKI SEMINARIUM 4 Jan E. Zejda Katedra Epidemiologii WLK, SUM
2 TREŚĆ SEMINARIUM 4 Statystyka Analityczna Część II - czynniki zakłócające - analiza stratyfikacyjna - analiza wielu zmiennych model regresji liniowej model regresji logistycznej model regresji proporcjonalnego ryzyka model regresji Poisson a - specyficzne zastosowania analizy wielu zmiennych
3 TREŚĆ SEMINARIUM 3 Statystyka Analityczna Część II - czynniki zakłócające - analiza stratyfikacyjna - analiza wielu zmiennych model regresji liniowej model regresji logistycznej model regresji proporcjonalnego ryzyka model regresji Poisson a) - specyficzne zastosowania analizy wielu zmiennych
4 CZYNNIK RYZYKA Indywidualna cecha związana ze stylem życia lub narażeniem środowiskowym, lub cecha wrodzona albo odziedziczona, która - w świetle dowodów epidemiologicznych - jest związana ze stanem zdrowotnym uzasadniającym postępowanie zapobiegawcze palenie tytoniu przebycie wirusowego zapalenia wątroby typu C otyłość atopia polimorfizm genu X dodatni wywiad rodzinny w kierunku raka sutka hipercholesterolemia małą masa urodzeniowa stres
5 CZYNNIK ZAKŁÓCAJ CAJĄCYCY Czynnik związany zarówno z badanym narażeniem jak i badanym efektem zdrowotnym, którego obecność zniekształca wynik analizy przyczynowo-skutkowej (badany efekt ~ badane narażenie). Zatem: Cz. Zakłócający jest związany z narażeniem Cz. Zakłócający jest niezależnym czynnikiem ryzyka? Więź nie musi mieć charakteru biologicznego. Może się zdarzyć przypadkowo (np. palenie tytoniu i narażenie na azbest a rak płuc; płeć i nadużywanie fenacetyny a nefropatia). Wpływ na wynik analizy przyczynowo-skutkowej taki sam.
6 CZYNNIK ZAKŁÓCAJ CAJĄCYCY Czynnik związany zarówno z badanym narażeniem jak i badanym efektem zdrowotnym, którego obecność zniekształca wynik analizy przyczynowo-skutkowej (badany efekt ~ badane narażenie). Zatem: Cz. Zakłócający jest związany z narażeniem Cz. Zakłócający jest niezależnym czynnikiem ryzyka? Więź nie musi mieć charakteru biologicznego. Może się zdarzyć przypadkowo (np. palenie tytoniu i narażenie na azbest a rak płuc; płeć i nadużywanie fenacetyny a nefropatia). Wpływ na wynik analizy przyczynowo-skutkowej taki sam.
7 METODY ELIMINACJI LUB KONTROLI WPŁYWU CZYNNIKÓW W ZAKŁÓCAJ CAJĄCYCHCYCH Randomizacja (tylko badania eksperymentalne) Restrykcja (np. ocena pulmotoksyczności pyłu tylko u niepalaczy, kryteria włączenia ) Parowanie obserwacji (np. zapadalność na raka sutka u mężatek i panien w tym samym wieku) Stratyfikacja (procedura Mantel-Haenszel) Statystyczna analiza wielu zmiennych (analiza regresji) Etap planowania badania Etap analizy danych
8 TREŚĆ SEMINARIUM 3 Statystyka Analityczna Część II - czynniki zakłócające - analiza stratyfikacyjna - analiza wielu zmiennych model regresji liniowej model regresji logistycznej model regresji proporcjonalnego ryzyka) model regresji Poisson a - specyficzne zastosowania analizy wielu zmiennych
9 WPŁYW CZYNNIKA ZAKŁÓCAJ CAJĄCEGO CEGO PZO a narażenie na pył w warstwach* palacze i niepalacze PZO+ PZO- %PZO+ N % N % PZO+ PZO- %PZO+ N % N % PZO+ PZO- %PZO+ N % N % Wszyscy Badani Warstwa Niepalacze Warstwa Palacze * - warstwa = stratum
10 PROCEDURA MANTEL HAENSZEL Σ IS MH (OR MH ) = Σ A i D i. N i. B 1 C i N 1 A, B, C i D to dane z i tabel czteropolowych WAŻONY ILORAZ SZANS M-H Iloraz Szans wg Mantel-Haenszel to pojedyncza statystyka, odzwierciedlająca zależność pomiędzy chorobą i narażeniem, po uwzględnieniu jednego lub więcej czynników zakłócających. Choroba = narażenie + czynnik zakłócający Jest to średnia ważona ilorazów szans dla każdej z warstw
11 SUROWY A WAŻONY ILORAZ SZANS SUROWY ILORAZ SZANS (PZO a NARAŻENIE NA PYŁ) IS S = 1,03 (95%PU: 0,85 1,25) WAŻONY ILORAZ SZANS M-H (PZO a NARAŻENIE NA PYŁ, Z UWZGLĘDNIENIEM NAŁOGU PALENIA) IS M-H = 1,34 (95%PU: 1,09 2,33) Narażenie na pył organiczny zwiększa ryzyko występowania przewlekłego zapalenia oskrzeli o 34%, po uwzględnieniu wpływu nałogu palenia tytoniu
12 ANALIZA STRATYFIKACYJNA W IDENTYFIKACJI INTERAKCJI interakcja statystyczna interakcja biologiczna Interakcja statystyczna ma miejsce, gdy testowany model zależności Y od narażenia nie jest właściwy dla opisu zależności Y od dwóch lub więcej narażeń tak RYZYKO RAKA PŁUC nie narażenie na azbest NIEPALACZE PALACZE
13 ANALIZA STRATYFIKACYJNA W IDENTYFIKACJI INTERAKCJI (czy fiasko ncpap zależy od masy ciała noworodka?) Summary Statistics for fiasko by masa Controlling for poród Cochran-Mantel-Haenszel Statistics (Based on Table Scores) Statistic Alternative Hypothesis DF Value Prob ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 1 Nonzero Correlation Row Mean Scores Differ General Association Breslow-Day Test for Homogeneity of the Odds Ratios ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Chi-Square DF 1 Pr > ChiSq H 0 : zależności są homogenne (takie same w każdej warstwie) brak interakcji
14 TREŚĆ SEMINARIUM 3 Statystyka Analityczna Część II - czynniki zakłócające - analiza stratyfikacyjna - analiza wielu zmiennych analiza regresji liniowej analiza regresji logistycznej model regresji proporcjonalnego ryzyka model regresji Poisson a - specyficzne zastosowania analizy wielu zmiennych
15 ANALIZY EKSPLORATYWNE I KONFORMACYJNE
16 ANALIZA DANYCH A. EKSPLORATYWNA A. KONFIRMATYWNA Hipoteza może być formułowana na podstawie wyników pierwszych analiz; dopuszczalne są otwarte pytania Konkretna hipoteza, sformułowana przed rozpoczęciem badania, testowana zgodnie z protokołem Jakie są czynniki ryzyka zakażeń szpitalnych u noworodków? Częstość zakażeń szpitalnych jest podobna u noworodków płci męskiej i żeńskiej
17 A.E. ~ GENERATOR PRZYPADKOWYCH ZNAMIENNOŚCI Nawet, gdy analizy są wykonane zgodnie z wymogami metodologii (właściwy test, kontrola czynników zakłócających) przypadkowe uzyskanie statystycznie znamiennego wyniku jest prawdopodobne
18 PODSTAWY ANALIZY WIELU ZMIENNYCH
19 CZTERY POZIOMY ANALIZY DANYCH - KONWENCJONALNA STRATEGIA - Analiza Opisowa Prosta Analiza Różnic/Zależności Stratyfikacyjna Analiza Różnic/Zależności Złożona Analiza Wielu Zmiennych Przykład: wskazanie a sukces ncpap (realne dane)
20 PORÓWNANIE % SUKCESÓW W 2 GRUPACH O RÓŻNYCH WSKAZANIACH (ncpap) Wskazanie RDS + Wskazanie RDS - Wiek > 30 HBD Wiek < 31 HBD Wiek > 30 HBD Wiek < 30 HBD Apgar Apgar Apgar Apgar Apgar Apgar Apgar Apgar SN CC SN CC SN CC SN CC SN CC SN CC SN CC SN CC % % % % % % % % % % % % % % % % i.t.d. brak danych do porównań szum informacyjny
21 to b nie rożni się w sposób statystycznie znamienny od 0, a więc ANALIZA WIELU ZMIENNYCH Y = b 0 + b 1 X 1 + b 2 X b k X k KLUCZ INTEPRETACYJNY H 0 : b = 0 vs H A b 0 b = 0 gdy p>0,05 gdy b = 0 wówczas bx = 0*X = 0 (to X znika!) np. FVC = 1,67 + 2,34*Wzrost 0,92*Papierosy b 1 = 2,34 b 2 = 0,92 p = 0,01 p = 0,08
22 ANALIZA WIELU ZMIENNYCH Y = b 0 + b 1 X 1 + b 2 X b k X k UWAGA Metoda szacowania b i to metoda najmniejszych kwadratów (znalezienie takich b i, które zapewniają najmniejszą sumę kwadratów odległości wszystkich punktów definiowanych przez X i Y od prostej regresji) Porównywanie bezwzględnych wartości b i nie ma sensu bez uwzględnienia jednostek pomiaru odpowiednich X i. Na przykład, nie można stwierdzić, że wzrost posiada trzy razy większe znaczenie wyjaśniające FVC niż papierosy [2,34:0,92]: FVC = 1,67 + 2,34*Wzrost 0,92*Papierosy + 1,67 Model zakłada liniową zależność (np. zmiana obciążenia paleniem z 1 do 5 pap/dzień jest tożsama ze zmianą z 20 do 25 pap/dzień. Analiza podlega założeniom (dyskutowanym w związku z diagnostyką modelu ) Model analizuje ilościowe lub jakościowe X i!!!
23 ANALIZA WIELU ZMIENNYCH Y = b 0 + b 1 X 1 + b 2 X b k X k ZASTOSOWANIA 1. badanie zależności Y od X i, po uwzględnieniu wpływu pozostałych X na Y; 2. przewidywanie wartości Y na podstawie wartości wszystkich X
24 ANALIZA WIELU ZMIENNYCH CZTERY PODSTAWOWE TECHNIKI 1. model regresji liniowej (Y jest zmienną ilościową) 2. model regresji logistycznej (Y jest zmienną jakościową) 3. model regresji proporcjonalnego ryzyka (analiza przeżywalności) 4. model regresji Poisson a (analiza zapadalności)
25 ANALIZA WIELU ZMIENNYCH CZTERY PODSTAWOWE TECHNIKI 1. model regresji liniowej (Y jest zmienną ilościową) 2. model regresji logistycznej (Y jest zmienną jakościową) 3. model regresji proporcjonalnego ryzyka (analiza przeżywalności) 4. model regresji Poisson a (analiza zapadalności)
26 MODEL REGRESJI LINIOWEJ Y = b 0 + b 1 X 1 + b 2 X b k X k PYTANIA 1. Jakie zmienne niezależne X? 2. Ile zmiennych niezależnych X?
27 MODEL REGRESJI LINIOWEJ Y = b 0 + b 1 X 1 + b 2 X b k X k PYTANIA 1. Jakie zmienne niezależne X? Koncepcja, model biologiczny (konfirmacja) Dążenie do ustalenia jakichkolwiek zależności, nawet przy mglistej koncepcji po coś te badania wykonano (eksploracja)
28 MODEL REGRESJI LINIOWEJ Y = b 0 + b 1 X 1 + b 2 X b k X k PYTANIA 1. Jakie zmienne niezależne X? 2. Ile zmiennych niezależnych X? Prosta reguła: liczba X < liczba obserwacji / 10
29 MODEL REGRESJI LINIOWEJ KONSTRUKCJA MODELU MODEL KOMPLETNY DNICPAP1 = LPOPO2 + WIEKPL1 + APGAR + CRIB + MASA + DWCPAP1 MODEL p R 2 DNICPAP1 = LPOPO2 + WIEKPL1 + APGAR + CRIB + MASA + DWCPAP1 0,9 0,0001 DNICPAP1 = LPOPO2 + WIEKPL1 + APGAR + CRIB + MASA + DWCPAP1 0,3 0,03 DNICPAP1 = LPOPO2 + WIEKPL1 + APGAR + CRIB + MASA + DWCPAP1 0,2 0,06 DNICPAP1 = LPOPO2 + WIEKPL1 + APGAR + CRIB + MASA + DWCPAP1 0,3 0,08 DNICPAP1 = LPOPO2 + WIEKPL1 + APGAR + CRIB + MASA + DWCPAP1 0,03 0,20 DNICPAP1 = LPOPO2 + WIEKPL1 + APGAR + CRIB + MASA + DWCPAP1 <0,0001 0,56 Im więcej zmiennych niezależnych w modelu tym większe R 2
30 MODEL REGRESJI LINIOWEJ KOMPLETNY MODEL The REG Procedure - Dependent Variable: DNICPAP1 Number of Observations Read 64 Number of Observations Used 58 Number of Observations with Missing Values 6 Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model <.0001 Error Corrected Total Root MSE R-Square !!! Dependent Mean Adj R-Sq Coeff Var Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > t Intercept LPOPO WIEKPL APGAR CRIB MASA DWCPAP <.0001
31 MODEL REGRESJI LINIOWEJ KOMPLETNY MODEL The REG Procedure - Dependent Variable: DNICPAP1 Number of Observations Read 64 Number of Observations Used 58 Number of Observations with Missing Values 6 Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model <.0001 Error Corrected Total Root MSE R-Square !!! Dependent Mean Adj R-Sq Coeff Var Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > t Intercept LPOPO WIEKPL APGAR CRIB MASA DWCPAP <.0001 UWAGA Wynik dla poszczególnych b nie zależy od kolejności zmiennych (typ III sumy kwadratów) Intercept WIEKPL APGAR CRIB DWCPAP1 <.0001 MASA LPOPO
32 MODEL REGRESJI LINIOWEJ KOMPLETNY MODEL CZAS CPAP = LPOPO2 0,11WIEKPL1+0,13APGAR1 0,19CRIB 0,008MASA+14,56DWCPAP1 ale ze względu na szereg startystycznie nieznamiennych b ostateczny model to CZAS CPAP = MASA + DWCPAP1 Uwaga: konieczna ponowna parametryzacja
33 MODEL REGRESJI LINIOWEJ OSTATECZNY MODEL (REZULTAT SELEKCJI WSTECZNEJ) Parameter Standard Variable Estimate Error Type II SS F Value Pr > F Intercept <.0001 DWCPAP <.0001 MASA CZASCPAP = 14,306*DWCPAP1 0,007*MASA + 11,314
34 MODEL REGRESJI LINIOWEJ DIAGNOSTYKA MODELU - WSPÓŁLINIOWOŚĆ Y ~ X 1, X 2, ale co gdy X 1 ~ X 2? ZJAWISKO WSPÓŁLINIOWOŚCI Zniekształcenie wyników analizy wielu zmiennych, polegające na uzyskaniu niewłaściwych lub nawet fałszywych (dodatnich/ujemnych) współczynników regresji, związane z korelacją dwóch lub więcej zmiennych niezależnych IDENTYFIKACJA WSPÓŁLINIOWOŚCI 1) analiza korelacji liniowej pomiędzy wszystkimi X i 2) analiza tolerancji
35 X MODEL REGRESJI LINIOWEJ DIAGNOSTYKA ZAŁOŻEŃ Model jest trafny (intepretowalny), gdy spełnione są następujące założenia/warunki: 1. Brak odległych obserwacji ( outliers ); 2. Niezależność obserwacji 3. Normalny rozkład wartości resztowych (średnia = 0; stała wariancja) Wartość resztowa to odległość pomiędzy wartością obserwowaną (Y i ) i wartością Y i wynikającą z równania regresji: Y
36 MODEL REGRESJI LINIOWEJ TERMINOLOGIA CzasCPAP = 16,02DobaWłącz 0,004Masa + 7,23 Zmienna Zależna Zmienne Niezależne Pytanie: Od czego zależy CzasCPAP? Zmienna Zależna Zmienne Objaśniające Pytanie: Jaki jest przewidywany CzasCPAP u noworodka o masie X 1, podłączonego w dobie X 2 Zmienna Zależna Predyktory
37 ANALIZA WIELU ZMIENNYCH CZTERY PODSTAWOWE TECHNIKI 1. model regresji liniowej (Y jest zmienną ilościową) 2. model regresji logistycznej (Y jest zmienną jakościową) 3. model regresji proporcjonalnego ryzyka (analiza przeżywalności) 4. model regresji Poisson a (analiza zapadalności)
38 MODEL REGRESJI LOGISTYCZNEJ LOGIT FUNKCJA ŁĄCZĄCA W CELU WYKONANIA ANALIZY LINIOWEJ P LOGIT P X X PRAWDOPODOBIEŃSTWO WYSTĄPIENIA Y W ODPOWIEDZI NA ZMIANĘ X uliniowienie zależności biologicznej
39 MODEL REGRESJI LOGISTYCZNEJ ZMIENNA ZALEŻNA = ZMIENNA JAKOŚCIOWA ZMIENNE NIEZALEŻNE = ZMIENNE JAKOŚCIOWE/ILOŚCIOWE PARAMETRYZACJA MODELU REGRESJI LOGISTYCZNEJ ANALOGICZNA DO PARAMETRYZACJI MODELU REGRESJI LINIOWEJ POPULARNOŚĆ REGRESJI LOGISTYCZNEJ W BADANIACH MEDYCZNYCH 1. Odwzorowanie zjawisk (zgon/wyzdrowienie; poprawa/brak poprawy, objaw/brak objawu itd..) 2. Bezpośrednie obliczenie ilorazu szans (logistycznego ilorazu szans: logis lub logor) WARTOŚCI ZMIENNYCH ORYGINALNE LUB W WYNIKU TRANSFORMACJI
40 MODEL REGRESJI LOGISTYCZNEJ KONSTRUKCJA MODELU - stopniowe ( ręczne ) dodawanie zmiennych - sformułowanie kompletnego modelu - metody automatyczne (eliminacja wsteczna, wstępująca, krokowa na przykład w oparciu o kryterium p<0,05) Y = b 0 + b 1 X 1 + b 2 X b k-1 X k-1 + b k X k
41 MODEL REGRESJI LOGISTYCZNEJ WYNIK ANALIZY Logistyczny Iloraz Szans (logis = logor) iloraz szans dla danej zależności Y ~ X, po uwzględnieniu wpływu pozostałych X na Y Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits masac wiekc apgarc cribc dwcpapc po2c UWAGA zmieność zmiennej binarnej to nie to samo co zmienność zmiennej ilościowej
42 MODEL REGRESJI LOGISTYCZNEJ WYNIK ANALIZY Logistyczny Iloraz Szans (logis = logor) iloraz szans dla danej zależności Y ~ X, po uwzględnieniu wpływu pozostałych X na Y SUROWY vs LOGISTYCZNY Odds Ratio Estimates ILORAZ Point SZANS 95% Wald Effect Estimate Confidence Limits masac wiekc apgarc cribc dwcpapc po2c UWAGA zmieność zmiennej binarnej to nie to samo co zmienność zmiennej ilościowej
43 MODEL REGRESJI LOGISTYCZNEJ DOBÓR MODELU 1. Definicja zmiennych (znaczenie kliniczne lub statystyczne) 2. Testowanie interakcji 3. Automatyczna selekcja zmiennych statystycznie znamiennych 4. Diagnostyka trafności modelu 5. Diagnostyka założeń modelu INNE MODELE Generalny Model Liniowy (uniwersalny dla zmiennych ilościowych i jakościowych)
44 ANALIZA WIELU ZMIENNYCH CZTERY PODSTAWOWE TECHNIKI 1. model regresji liniowej (Y jest zmienną ilościową) 2. model regresji logistycznej (Y jest zmienną jakościową) 3. model regresji proporcjonalnego ryzyka (analiza przeżywalności) 4. model regresji Poisson a (analiza zapadalności)
45 ANALIZA PRZEŻYWALNO YWALNOŚCI (SURVIVAL ANALYSIS)
46 ANALIZA PRZEŻYWALNO YWALNOŚCI OBSZARY ZASTOSOWAŃ historia naturalna chorób ( tym identyfikacja czynników ryzyka); ocena skuteczności nowych metod terapeutycznych; ocena skuteczności profilaktyki. MEDYCYNA KLINICZNA A EPIDEMIOLOGIA Skutki Terapii X Obserwacja Kliniczna Pacjent A + Pacjent A + Pacjent A - Pacjent A + Pacjent A - Itd... Obserwacja Epidemiologiczna Odsetek + Odsetek - Obserwacja grupy umożliwia kontrolowanie zakłócającego wpływu zjawiska zmienności międzyosobniczej, ale utrudnia uwzględnienie indywidualnie istotnych okoliczności zdarzeń. Zgon jako przykład zdarzenia kończącego okres obserwacji (inne zdarzenia to np. pierwsza remisja, normalizacja biochemiczna itp.)
47 PORÓWNANIA UMIERALNOŚCI - (DWIE KOHORTY) KOHORTA - A 100 CHORYCH CZAS OBSERWACJI = 3 LATA KOHORTA - B 100 CHORYCH 50 zmarło 45 zmarło GRUPA A 100 CHORYCH Ale GRUPA B 100 CHORYCH Zgon w 1 roku: 15 Zgon w 1 roku: 5 Zgon w 2 roku: 20 Zgon w 1 roku: 15 Zgon w 3 roku: 15 Zgon w 3 roku: 25 Ale w obu grupach wystąpiły także zgony z innych powodów niż choroba stanowiąca przedmiot obserwacji Ale w obu grupach utracono z obserwacji część chorych (np. dobrowolna rezygnacja z udziału w badaniu, zmiana miejsca pobytu) ilu utraconych zmarło z powodu choroby X w grupie A, ilu w grupie B? Ale chorzy objęci kompletną obserwacją trzyletnią żyją także (różnie długo) po zakończeniu obserwacji
48 PORÓWNANIE PROFILU PRZEŻYWALNO YWALNOŚCI Dwie Grupy Terapia A i Terapia B RADIOTERAPIA- SCHEMAT A Tablica przeżywalności kohorty RADIOTERAPIA- SCHEMAT B Tablica przeżywalności kohorty (1) (2) (3) (4) (5) (6) (7) (8) 1 X X X X X X X 2 X X X X X X X 3 X X X X X X X... N X X X X X X X (1) (2) (3) (4) (5) (6) (7) (8) 1 X X X X X X X 2 X X X X X X X 3 X X X X X X X... N X X X X X X X Wykres przeżywalności kohorty Wykres przeżywalności kohorty 1 1 0,8 0,8 0,6 0,6 0,4 0,4 0,2 0, Oczekiwany czas przeżycia kohorty Oczekiwany czas przeżycia kohorty T = 6,1 miesięcy T = 4,6 miesięcy
49 MODEL PROPORCJONALNYCH RYZYK (proportional hazards model) CZYM dla testów parametrycznych jest założenie liniowości TYM dla testów różnic w zakresie przeżywalności jest założenie proporcjonalnych ryzyk (UPROSZCZONA) KONWENCJA STATYSTYCZNA Przebieg ryzyka, jego natężenie i zmiany w czasie obserwacji [t] dają się opisać matematycznie funkcją ryzyka (t) Gdy porównuje się ryzyko zgonu w dwóch grupach ( Terapia i Kontrola ) wówczas dla grupy kontrolnej (punkt odniesienia) ryzyko opisuje funkcja [ K (t)], a dla grupy terapeutycznej funkcja uwzględniająca badany efekt terapeutyczny [ ], zatem [ * T (t)]. Celem badania jest porównanie ryzyk, co opisuje model proporcjonalnych ryzyk : K (t) = * T (t) gdy efekt terapeutyczny jest żaden (=1) wówczas = 1, i K (t) = T (t) HIPOTEZĘ O RÓWNOŚCI RYZYK W PORÓWNYWANYCH GRUPACH K i T TESTUJE SIĘ PRZY UŻYCIU: TESTU RANG (LOGRANK) proste sytuacje ANALIZY REGRESJI COX A złożone sytuacje
50 TEST RANG STRATEGIA (B) Podstawowe Dane rzeczywista, obserwowana liczbie zgonów w obu grupach (OT i OK); oczekiwana liczba zgonów w obu grupach (ET i EK). Podstawowy Wynik Testu Rang - Statystyka χ2 χ2 = [(OT ET)2 / ET] + [(OK EK)2 / EK], a po podstawieniu danych z omawianego scenariusza: χ2 = [(5-5,39)2/5,39] + [(8-7,57)2/7,57] = 0, ,024 = 0,052 Uzyskany wynik w konfrontacji z rozkładem statystyki χ2 dla jednego stopnia swobody (liczba grup 1) nie upoważnia do stwierdzenia, że różnica pomiędzy przeżywalnością w grupie T i K jest statystycznie znamienna. Tym samym można przyjąć, że testowana metoda terapeutyczna nie jest skuteczna, pod warunkiem, że inne przyczyny nie wpłynęły na wyniki badania. PROBLEMY Wniosek, że różnice w przeżywalności nie zależą od terapii jest zasadny, gdy w każdym innym aspekcie istotnym dla przeżywalności porównywane grupy są podobne: Wiek; Płeć; Stadium choroby; Wcześniejsze leczenie; Choroby współistniejące; Itd! kryteria doboru badanych i randomizacja
51 ANALIZA REGRESJI COX A - I (Cox D.R.: Regression models and life tables. Journal of the Royal Statistical Society 1972;34: ) MODEL COX a = PROCEDURA STATYSTYCZNA UMOŻLIWIAJĄCA ZBADANIE ZALEŻNOŚCI CZASU PRZEŻYCIA OD CZYNNIKÓW PODEJRZEWANYCH O WPŁYW NA CZAS PRZEŻYCIA, Z UWZGLĘDNIENIEM OBSERWACJI NIEPEŁNYCH Dane toksykologiczne wykazują, że czas przeżycia dobrze charakteryzuje funkcja wykładnicza: Y = a x przekształcenie modelu proporcjonalnych ryzyk [ K (t) = * T (t)] w model proporcjonalnych przeżyć [S K (t) = S T (t) ] badany efekt (np. skutek terapii) reprezentuje wówczas funkcja wykładnicza a dla wielu zmiennych: Y = a (b 1 *X 1 + b 2 *X b k-1 *X k-1 + b k *X k ) Porównanie dwóch grup (np. terapia A i B) jest porównaniem dwóch profili przeżycia, co umożliwia obliczenie ilorazu ryzyk (RR=risk ratio) RR = ryzyko A / ryzyko B Jest to możliwe ze względu na założenie, że ryzyko wystąpienia zgonu rozkłada się proporcjonalnie w trakcie obserwacji stąd pochodzi ogólna nazwa procedury: model proporcjonalnego ryzyka (proportional-hazards model w terminologii anglosaskiej).
52 ANALIZA REGRESJI COX A A (MODEL COX a) III Gdy model Cox a dotyczy prostej analizy (tylko jeden czynnik X terapia) wyniki będą tożsame z wynikiem testu rang. Pełne wykorzystanie analizy Cox a i jej zalety są widoczne wówczas, gdy w analizie przeżywalności stosuje się jednoczasowo wiele zmiennych, np.: b 1 *PŁEĆ + b 2 *WIEK + b 3 *STAN + b 4 *TERAPIA Analizy tego typu są możliwe przy użyciu procedur dostępnych w programach komputerowych, np. PROC PHREG w programie SAS. Inne procedury dostarczają szerokiego spektrum testów stosowanych w analizie przeżywalności (PROC LIFETEST, PROC LIFEREG w programie SAS).
53 ANALIZA PRZEŻYWALNO YWALNOŚCI PODSUMOWANIE I CHARAKTERYSTYKA PROFILU PRZEŻYWALNOŚCI Metoda Kaplan-Meier a Cel: opis profilu * * * PORÓWANIA PROFILI PRZEŻYWALNOŚCI Test rang (logrank test) Cel: ocena różnic pomiędzy profilami * * * IDENTYFIKACJA CZYNNIKÓW WPŁYWAJĄCYCH NA PRZEŻYWALNOŚĆ Analiza Cox a Cel: analiza czynników determinujących profil lub odpowiedzialnych za różnice pomiędzy porównywanymi profilami
54 ANALIZA WIELU ZMIENNYCH CZTERY PODSTAWOWE TECHNIKI 1. model regresji liniowej (Y jest zmienną ilościową) 2. model regresji logistycznej (Y jest zmienną jakościową) 3. model regresji proporcjonalnego ryzyka (analiza przeżywalności) 4. model regresji Poisson a (analiza zapadalności)
55 MODEL REGRESJI POISSON A WSPÓŁCZYNNIK REGRESJI POISSON A : b gdy narażenie = tak (X 1 =1) log(wsp. E+ ) = b 0 + b 1 *1 + + b k X k gdy narażenie = nie (X=0) log (wsp. E-) = b 0 + b 1 * b k X k a po rozwiązaniu układu równań b 1 = log(wsp. E+ ) log(wsp. E- ) b 1 = log(wsp. E+ / wsp. E- ) Współczynnik regresji b jest logarytmem ilorazu współczynników, a zatem antylogarytm b, czyli e b1 to iloraz współczynnika u narażonych i nienarażonych!!! (wartość sprawcza danego narażenia po uwzględnieniu innych zmiennych w modelu)
56 TREŚĆ SEMINARIUM 3 Statystyka Analityczna Część II - czynniki zakłócające - analiza stratyfikacyjna - analiza wielu zmiennych model regresji liniowej model regresji logistycznej model regresja proporcjonalnego ryzyka model regresji Poisson a - specyficzne zastosowania analizy wielu zmiennych
57 MODEL REGRESJI WIELU ZMIENNYCH 1. Analiza dyskryminacyjna (SAS-DISCRIM) 2. Analiza wyników powtarzanych pomiarów (SAS-GLM/REPEATED) 3. Analiza skupień (SAS-CLUSTER) 4. Analiza ścieżek (SAS-CALIS) 5. - tematyka wykracza poza zakres kursu -
SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE
SUM - WLK 2011 WYKŁAD PIĄTY: BIOSTATYSTYKA C.D. Prof. dr hab. med. Jan E. Zejda! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE TREŚĆ WYKŁADU Dokumentowanie efektu (analiza danych
PAKIETY STATYSTYCZNE
. Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa
PODSTAWY STATYSTYKI SEMINARIUM 3 ! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE
STUDIUM DOKTORANCKIE KATOWICE, 2011/12 PODSTAWY STATYSTYKI SEMINARIUM 3! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE Jan E. Zejda Katedra Epidemiologii WLK, SUM TREŚĆ SEMINARIUM
PRAKTYCZNE METODY STATYSTYCZNE W BADANIACH NAUKOWYCH
Katedra i Zakład Epidemiologii Wydział Lekarski w Katowicach Tel./Fax: (32) 2523734 Ul. Medyków 18, 40-752 Katowice Śląski Uniwersytet Medyczny E-mail: epikat@sum.edu.pl PRAKTYCZNE METODY STATYSTYCZNE
Rozdział 8. Regresja. Definiowanie modelu
Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność
Uogólniony model liniowy
Uogólniony model liniowy Ogólny model liniowy y = Xb + e Każda obserwacja ma rozkład normalny Każda obserwacja ma tą samą wariancję Dane nienormalne Rozkład binomialny np. liczba chorych krów w stadzie
WYKŁAD DRUGI: TYPY BADAŃ EPIDEMIOLOGICZNYCH
SUM - WLK 2011 WYKŁAD DRUGI: TYPY BADAŃ EPIDEMIOLOGICZNYCH Prof. dr hab. med. Jan E. Zejda! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE TREŚĆ WYKŁADU Badania epidemiologiczne
Przedziały ufności i testy parametrów. Przedziały ufności dla średniej odpowiedzi. Interwały prognoz (dla przyszłych obserwacji)
Wkład 1: Prosta regresja liniowa Statstczn model regresji liniowej Dane dla prostej regresji liniowej Przedział ufności i test parametrów Przedział ufności dla średniej odpowiedzi Interwał prognoz (dla
Statystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki
WYKŁAD TRZECI: OCENA ZWIĄZK PRZYCZYNOWO-SKUTKOWYCH W EPIDEMIOLOGII
SUM - WLK 2011 WYKŁAD TRZECI: OCENA ZWIĄZK ZKÓW PRZYCZYNOWO-SKUTKOWYCH W EPIDEMIOLOGII Prof. dr hab. med. Jan E. Zejda! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE TREŚĆ WYKŁADU
(LMP-Liniowy model prawdopodobieństwa)
OGÓLNY MODEL REGRESJI BINARNEJ (LMP-Liniowy model prawdopodobieństwa) Dla k3 y α α α α + x + x + x 2 2 3 3 + α x x α x x + α x x + α x x + ε + x 4 2 5 3 6 2 3 7 2 3 Zał.: Wszystkie zmienne interakcyjne
Przykład 1. (A. Łomnicki)
Plan wykładu: 1. Wariancje wewnątrz grup i między grupami do czego prowadzi ich ocena 2. Rozkład F 3. Analiza wariancji jako metoda badań założenia, etapy postępowania 4. Dwie klasyfikacje a dwa modele
Stanisław Cichocki. Natalia Nehrebecka. Wykład 9
Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności
Analiza danych ilościowych i jakościowych
Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego 8 kwietnia 2010 Plan prezentacji 1 Zbiory danych do analiz 2 3 4 5 6 Implementacja w R Badanie depresji Depression trial data Porównanie
WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno
WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:
Stanisław Cichocki. Natalia Nehrebecka. Wykład 4
Stanisław Cichocki Natalia Nehrebecka Wykład 4 1 1. Własności hiperpłaszczyzny regresji 2. Dobroć dopasowania równania regresji. Współczynnik determinacji R 2 Dekompozycja wariancji zmiennej zależnej Współczynnik
Ekonometria dla IiE i MSEMat Z7
Ekonometria dla IiE i MSEMat Z7 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 21-11-2016 Na podstawie zbioru danych cps_small.dat z książki Principles of Econometrics oszacowany
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test
Rozkłady statystyk z próby
Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny
KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona
KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y 2. Współczynnik korelacji Pearsona 3. Siła i kierunek związku między zmiennymi 4. Korelacja ma sens, tylko wtedy, gdy związek między zmiennymi
statystyka badania epidemiologiczne
statystyka badania epidemiologiczne Epidemiologia Epi = wśród Demos = lud Logos = nauka Epidemiologia to nauka zajmująca się badaniem rozprzestrzenienia i uwarunkowań chorób u ludzi, wykorzystująca tą
Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna
Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA
Opis zakładanych efektów kształcenia na studiach podyplomowych Nazwa studiów: BIOSTATYSTYKA PRAKTYCZNE ASPEKTY STATYSTYKI W BADANIACH MEDYCZNYCH Typ studiów: doskonalące Symbol Efekty kształcenia dla studiów
Założenia: wyniki są binarne próby są niezależne liczba prób n ustalona przed pomiarem to samo prawdopodobieństwo sukcesu we wszystkich próbach
Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie Test dwumianowy χ 2 test dobroci dopasowania Analiza tabeli kontygencji ( tabeli krzyżywej) P k sukcesów = n k pk (1 p) n k Założenia:
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Regresja logistyczna (LOGISTIC)
Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim
Stanisław Cichocki. Natalia Nehrebecka. Wykład 14
Stanisław Cichocki Natalia Nehrebecka Wykład 14 1 1.Problemy z danymi Współliniowość 2. Heteroskedastyczność i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji Metody radzenia sobie z heteroskedastycznością
S t a t y s t y k a, część 3. Michał Żmihorski
S t a t y s t y k a, część 3 Michał Żmihorski Porównanie średnich -test T Założenia: Zmienne ciągłe (masa, temperatura) Dwie grupy (populacje) Rozkład normalny* Równe wariancje (homoscedasticity) w grupach
Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii
SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane
Stanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników
Spis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska
Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska Anna Stankiewicz Izabela Słomska Wstęp- statystyka w politologii Rzadkie stosowanie narzędzi statystycznych Pisma Karla Poppera
1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe
Zjazd 7. SGGW, dn. 28.11.10 r. Matematyka i statystyka matematyczna Tematy 1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe nna Rajfura 1 Zagadnienia Przykład porównania wielu obiektów w
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności
Regresja logistyczna. Regresja logistyczna. Przykłady DV. Wymagania
Regresja logistyczna analiza relacji między zbiorem zmiennych niezależnych (ilościowych i dychotomicznych) a dychotomiczną zmienną zależną wyniki wyrażone są w prawdopodobieństwie przynależności do danej
WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno
WERYFIKACJA MODELI MODELE LINIOWE Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno ANALIZA KORELACJI LINIOWEJ to NIE JEST badanie związku przyczynowo-skutkowego, Badanie współwystępowania cech (czy istnieje
Regresja logistyczna. Regresja logistyczna. Wymagania. Przykłady DV
Regresja logistyczna analiza relacji między zbiorem zmiennych niezależnych (ilościowych i dychotomicznych) a dychotomiczną zmienną zależną wyniki wyrażone są w prawdopodobieństwie przynależności do danej
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna
Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować
Analiza regresji - weryfikacja założeń
Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.
Stanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
BADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ
WYKŁAD 3 BADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ Było: Przykład. Z dziesięciu poletek doświadczalnych zerano plony ulw ziemniaczanych (cecha X) i oznaczono w nich procentową zawartość
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Stanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników
MODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
ANALIZA REGRESJI SPSS
NLIZ REGRESJI SPSS Metody badań geografii społeczno-ekonomicznej KORELCJ REGRESJ O ile celem korelacji jest zmierzenie siły związku liniowego między (najczęściej dwoma) zmiennymi, o tyle w regresji związek
Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22
Spis treści Przedmowa do wydania pierwszego.... 11 Przedmowa do wydania drugiego.... 15 Wykaz symboli.... 17 Litery alfabetu greckiego wykorzystywane w podręczniku.... 17 Symbole wykorzystywane w zagadnieniach
Autor: Dariusz Piwczyński 1 Ćwiczenie. Analiza zmienności złożona. Testy wielokrotnych porównań
Autor: Dariusz Piwczyński 1 Ćwiczenie. Analiza zmienności złożona. Testy wielokrotnych porównań Analizę wariancji możemy wykonać w SAS za pomocą procedury ANOVA oraz GLM. ANOVA Analysis of variance (Analiza
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 Inne układy doświadczalne 1) Układ losowanych bloków Stosujemy, gdy podejrzewamy, że może występować systematyczna zmienność między powtórzeniami np. - zmienność
Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.
Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)
Statystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -
Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu
Część 2 Test Durbina-Watsona Test Durbina-Watsona Weryfikowana hipoteza H 0 : cov(ε t, ε t 1 ) = 0 H 1 : cov(ε t, ε t 1 ) 0 Test Durbina-Watsona Weryfikowana hipoteza H 0 : cov(ε t, ε t 1 ) = 0 H 1 : cov(ε
Ekonometria egzamin 07/03/2018
imię, nazwisko, nr indeksu: Ekonometria egzamin 07/03/2018 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 Regresja wielokrotna Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X 1, X 2, X 3,...) na zmienną zależną (Y).
1 Analizy zmiennych jakościowych
1 Analizy zmiennych jakościowych Przedmiotem analizy są zmienne jakościowe. Dokładniej wyniki pomiarów jakościowych. Pomiary tego typu spotykamy w praktyce badawczej znacznie częściej niż pomiary typu
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Statystyka matematyczna Test χ 2. Wrocław, 18.03.2016r
Statystyka matematyczna Test χ 2 Wrocław, 18.03.2016r Zakres stosowalności Testowanie zgodności Testowanie niezależności Test McNemara Test ilorazu szans Copyright 2014, Joanna Szyda ZAKRES STOSOWALNOŚCI
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM
Wykład 4 Związki i zależności
Wykład 4 Związki i zależności Rozważmy: Dane z dwiema lub więcej zmiennymi Zagadnienia do omówienia: Zmienne objaśniające i zmienne odpowiedzi Wykres punktowy Korelacja Prosta regresji Słownictwo: Zmienna
Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008
Redaktor: Alicja Zagrodzka Korekta: Krystyna Chludzińska Projekt okładki: Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008 ISBN 978-83-7383-296-1 Wydawnictwo Naukowe Scholar
Analiza wariancji. dr Janusz Górczyński
Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik
Badania obserwacyjne 1
Badania obserwacyjne 1 Chorobowość Chorobowość (ang. prevalence rate) liczba chorych w danej chwili na konkretną chorobę w określonej grupie mieszkańców (np. na 100 tys. mieszkańców). Współczynnik ten
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss
Modele warunkowej heteroscedastyczności
Teoria Przykład - zwroty z WIG Niskie koszty transakcyjne Teoria Przykład - zwroty z WIG Niskie koszty transakcyjne Racjonalne oczekiwania inwestorów P t = E(P t+1 I t ) 1 + R (1) Teoria Przykład - zwroty
Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści
Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, 2018 Spis treści Przedmowa 13 O Autorach 15 Przedmowa od Tłumacza 17 1. Wprowadzenie i statystyka opisowa 19 1.1.
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Wykład 8 Dane kategoryczne
Wykład 8 Dane kategoryczne Wrocław, 19.04.2017r Zmienne kategoryczne 1 Przykłady zmiennych kategorycznych 2 Zmienne nominalne, zmienne ordynalne (porządkowe) 3 Zmienne dychotomiczne kodowanie zmiennych
Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 4 Prognozowanie, stabilność 1 / 17 Agenda
WYKŁAD PIERWSZY: PODSTAWY EPIDEMIOLOGII (A)
SUM - WLK 2013 WYKŁAD PIERWSZY: PODSTAWY EPIDEMIOLOGII (A) Prof. dr hab. med. Jan E. Zejda POLSKI STANDARD KSZTAŁCENIA HIGIENA I EPIDEMIOLOGIA Uwarunkowania stanu zdrowia. Znaczenie chorobotwórcze czynników
KORELACJE I REGRESJA LINIOWA
KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 3 1 / 8 ZADANIE z rachunku
Jednoczynnikowa analiza wariancji. Wnioskowanie dla jednoczynnikowej ANOV-y. Porównywanie poszczególnych średnich
(Wykład 13) Jednoczynnikowa analiza wariancji Wnioskowanie dla jednoczynnikowej ANOV-y Format danych Hipotezy i model ANOVA Tabela ANOVA i test F Porównywanie poszczególnych średnich Jednoczynnikowa ANOVA
Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku
Przykład 2 Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Sondaż sieciowy analiza wyników badania sondażowego dotyczącego motywacji w drodze do sukcesu Cel badania: uzyskanie
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady
Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń 1. Problem ozwaŝamy zjawisko (model): Y = β 1 X 1 X +...+ β k X k +Z Ηβ = w r Hipoteza alternatywna: Ηβ w r
Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną
Wydział: Zarządzanie i Finanse Nazwa kierunku kształcenia: Finanse i Rachunkowość Rodzaj przedmiotu: podstawowy Opiekun: prof. nadzw. dr hab. Tomasz Kuszewski Poziom studiów (I lub II stopnia): II stopnia
Rak płuca wyzwania. Witold Zatoński Centrum Onkologii Instytut im. Marii Skłodowskiej-Curie w Warszawie
Rak płuca wyzwania Witold Zatoński Centrum Onkologii Instytut im. Marii Skłodowskiej-Curie w Warszawie Innowacje w leczeniu RAKA PŁUC ocena dostępności w Polsce Warszawa, 1 marca 14 Nowotwory główna przyczyna
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, że 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.
Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat
Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat Anna Rajfura 1 Przykład W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zależy
Analiza autokorelacji
Analiza autokorelacji Oblicza się wartości współczynników korelacji między y t oraz y t-i (dla i=1,2,...,k), czyli współczynniki autokorelacji różnych rzędów. Bada się statystyczną istotność tych współczynników.
Testowanie hipotez statystycznych
Część 2 Hipoteza złożona Testowanie hipotez łącznych Zapis matematyczny Rozkład statystyki testowej Hipoteza łączna H 0 : Rβ = q Hipoteza złożona Testowanie hipotez łącznych Zapis matematyczny Rozkład
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.
Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu
Część 1 Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy małej próby Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy małej próby Testy
Podstawy epidemiologii
Podstawy epidemiologii Epidemiologia - Epi = na Demos = lud Logos = nauka Epidemiologia to nauka zajmująca się badaniem rozprzestrzeniania i uwarunkowań chorób u ludzi, wykorzystująca tę wiedzę do ograniczenia
KARTA KURSU. Kod Punktacja ECTS* 1
KARTA KURSU Nazwa Nazwa w j. ang. Wprowadzenie do statystyki Introduction to statistics Kod Punktacja ECTS* 1 Koordynator Prof. dr hab. Jerzy Wołek Zespół dydaktyczny Prof. dr hab. Jerzy Wołek doktoranci
Zastosowanie uogólnionych modeli liniowych i uogólnionych mieszanych modeli liniowych do analizy danych dotyczacych występowania zębiniaków
Zastosowanie uogólnionych modeli liniowych i uogólnionych mieszanych modeli liniowych do analizy danych dotyczacych występowania zębiniaków Wojciech Niemiro, Jacek Tomczyk i Marta Zalewska Uniwersytet
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. opulacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Statystyczna analiza danych (molekularnych) analiza wariancji ANOVA
Statystyczna analiza danych (molekularnych) analiza wariancji ANOVA Anna Gambin 19 maja 2013 Spis treści 1 Przykład: Model liniowy dla ekspresji genów 1 2 Jednoczynnikowa analiza wariancji 3 2.1 Testy
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Stanisław Cichocki. Natalia Nehrebecka. Wykład 13
Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Autokorelacja Konsekwencje Testowanie autokorelacji 2. Metody radzenia sobie z heteroskedastycznością i autokorelacją Uogólniona Metoda Najmniejszych
Analiza przeżycia. Czym zajmuje się analiza przeżycia?
ANALIZA PRZEŻYCIA Analiza przeżycia Czym zajmuje się analiza przeżycia? http://www.analyticsvidhya.com/blog/2014/04/survival-analysis-model-you/ Analiza przeżycia Jest to inaczej analiza czasu trwania
Stanisław Cichocki. Natalia Nehrebecka. Wykład 12
Stanisław Cichocki Natalia Nehrebecka Wykład 12 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne 2. Autokorelacja o Testowanie autokorelacji 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne
Analiza przeżycia. Czym zajmuje się analiza przeżycia? Jest to analiza czasu trwania, zaprojektowana do analizy tzw.
ANALIZA PRZEŻYCIA Analiza przeżycia Czym zajmuje się analiza przeżycia? Jest to analiza czasu trwania, zaprojektowana do analizy tzw. danych uciętych Obserwacja jest nazywana uciętą jeżeli zdarzenie jeszcze
Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.
imię, nazwisko, nr indeksu: Ekonometria egzamin 0/0/0. Egzamin trwa 90 minut.. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu. Złamanie
Natalia Nehrebecka Stanisław Cichocki. Wykład 13
Natalia Nehrebecka Stanisław Cichocki Wykład 13 1 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość 2 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje
Diagnostyka w Pakiecie Stata
Karol Kuhl Zgodnie z twierdzeniem Gaussa-Markowa, estymator MNK w KMRL jest liniowym estymatorem efektywnym i nieobciążonym, co po angielsku opisuje się za pomocą wyrażenia BLUE Best Linear Unbiased Estimator.
STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych
STATYSTYKA MATEMATYCZNA WYKŁAD 3 Populacje i próby danych POPULACJA I PRÓBA DANYCH POPULACJA population Obserwacje dla wszystkich osobników danego gatunku / rasy PRÓBA DANYCH sample Obserwacje dotyczące