STUDIUM DOKTORANCKIE KATOWICE, 2011/12 PODSTAWY STATYSTYKI SEMINARIUM 4. Jan E. Zejda Katedra Epidemiologii WLK, SUM

Wielkość: px
Rozpocząć pokaz od strony:

Download "STUDIUM DOKTORANCKIE KATOWICE, 2011/12 PODSTAWY STATYSTYKI SEMINARIUM 4. Jan E. Zejda Katedra Epidemiologii WLK, SUM"

Transkrypt

1 STUDIUM DOKTORANCKIE KATOWICE, 2011/12 PODSTAWY STATYSTYKI SEMINARIUM 4 Jan E. Zejda Katedra Epidemiologii WLK, SUM

2 TREŚĆ SEMINARIUM 4 Statystyka Analityczna Część II - czynniki zakłócające - analiza stratyfikacyjna - analiza wielu zmiennych model regresji liniowej model regresji logistycznej model regresji proporcjonalnego ryzyka model regresji Poisson a - specyficzne zastosowania analizy wielu zmiennych

3 TREŚĆ SEMINARIUM 3 Statystyka Analityczna Część II - czynniki zakłócające - analiza stratyfikacyjna - analiza wielu zmiennych model regresji liniowej model regresji logistycznej model regresji proporcjonalnego ryzyka model regresji Poisson a) - specyficzne zastosowania analizy wielu zmiennych

4 CZYNNIK RYZYKA Indywidualna cecha związana ze stylem życia lub narażeniem środowiskowym, lub cecha wrodzona albo odziedziczona, która - w świetle dowodów epidemiologicznych - jest związana ze stanem zdrowotnym uzasadniającym postępowanie zapobiegawcze palenie tytoniu przebycie wirusowego zapalenia wątroby typu C otyłość atopia polimorfizm genu X dodatni wywiad rodzinny w kierunku raka sutka hipercholesterolemia małą masa urodzeniowa stres

5 CZYNNIK ZAKŁÓCAJ CAJĄCYCY Czynnik związany zarówno z badanym narażeniem jak i badanym efektem zdrowotnym, którego obecność zniekształca wynik analizy przyczynowo-skutkowej (badany efekt ~ badane narażenie). Zatem: Cz. Zakłócający jest związany z narażeniem Cz. Zakłócający jest niezależnym czynnikiem ryzyka? Więź nie musi mieć charakteru biologicznego. Może się zdarzyć przypadkowo (np. palenie tytoniu i narażenie na azbest a rak płuc; płeć i nadużywanie fenacetyny a nefropatia). Wpływ na wynik analizy przyczynowo-skutkowej taki sam.

6 CZYNNIK ZAKŁÓCAJ CAJĄCYCY Czynnik związany zarówno z badanym narażeniem jak i badanym efektem zdrowotnym, którego obecność zniekształca wynik analizy przyczynowo-skutkowej (badany efekt ~ badane narażenie). Zatem: Cz. Zakłócający jest związany z narażeniem Cz. Zakłócający jest niezależnym czynnikiem ryzyka? Więź nie musi mieć charakteru biologicznego. Może się zdarzyć przypadkowo (np. palenie tytoniu i narażenie na azbest a rak płuc; płeć i nadużywanie fenacetyny a nefropatia). Wpływ na wynik analizy przyczynowo-skutkowej taki sam.

7 METODY ELIMINACJI LUB KONTROLI WPŁYWU CZYNNIKÓW W ZAKŁÓCAJ CAJĄCYCHCYCH Randomizacja (tylko badania eksperymentalne) Restrykcja (np. ocena pulmotoksyczności pyłu tylko u niepalaczy, kryteria włączenia ) Parowanie obserwacji (np. zapadalność na raka sutka u mężatek i panien w tym samym wieku) Stratyfikacja (procedura Mantel-Haenszel) Statystyczna analiza wielu zmiennych (analiza regresji) Etap planowania badania Etap analizy danych

8 TREŚĆ SEMINARIUM 3 Statystyka Analityczna Część II - czynniki zakłócające - analiza stratyfikacyjna - analiza wielu zmiennych model regresji liniowej model regresji logistycznej model regresji proporcjonalnego ryzyka) model regresji Poisson a - specyficzne zastosowania analizy wielu zmiennych

9 WPŁYW CZYNNIKA ZAKŁÓCAJ CAJĄCEGO CEGO PZO a narażenie na pył w warstwach* palacze i niepalacze PZO+ PZO- %PZO+ N % N % PZO+ PZO- %PZO+ N % N % PZO+ PZO- %PZO+ N % N % Wszyscy Badani Warstwa Niepalacze Warstwa Palacze * - warstwa = stratum

10 PROCEDURA MANTEL HAENSZEL Σ IS MH (OR MH ) = Σ A i D i. N i. B 1 C i N 1 A, B, C i D to dane z i tabel czteropolowych WAŻONY ILORAZ SZANS M-H Iloraz Szans wg Mantel-Haenszel to pojedyncza statystyka, odzwierciedlająca zależność pomiędzy chorobą i narażeniem, po uwzględnieniu jednego lub więcej czynników zakłócających. Choroba = narażenie + czynnik zakłócający Jest to średnia ważona ilorazów szans dla każdej z warstw

11 SUROWY A WAŻONY ILORAZ SZANS SUROWY ILORAZ SZANS (PZO a NARAŻENIE NA PYŁ) IS S = 1,03 (95%PU: 0,85 1,25) WAŻONY ILORAZ SZANS M-H (PZO a NARAŻENIE NA PYŁ, Z UWZGLĘDNIENIEM NAŁOGU PALENIA) IS M-H = 1,34 (95%PU: 1,09 2,33) Narażenie na pył organiczny zwiększa ryzyko występowania przewlekłego zapalenia oskrzeli o 34%, po uwzględnieniu wpływu nałogu palenia tytoniu

12 ANALIZA STRATYFIKACYJNA W IDENTYFIKACJI INTERAKCJI interakcja statystyczna interakcja biologiczna Interakcja statystyczna ma miejsce, gdy testowany model zależności Y od narażenia nie jest właściwy dla opisu zależności Y od dwóch lub więcej narażeń tak RYZYKO RAKA PŁUC nie narażenie na azbest NIEPALACZE PALACZE

13 ANALIZA STRATYFIKACYJNA W IDENTYFIKACJI INTERAKCJI (czy fiasko ncpap zależy od masy ciała noworodka?) Summary Statistics for fiasko by masa Controlling for poród Cochran-Mantel-Haenszel Statistics (Based on Table Scores) Statistic Alternative Hypothesis DF Value Prob ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 1 Nonzero Correlation Row Mean Scores Differ General Association Breslow-Day Test for Homogeneity of the Odds Ratios ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Chi-Square DF 1 Pr > ChiSq H 0 : zależności są homogenne (takie same w każdej warstwie) brak interakcji

14 TREŚĆ SEMINARIUM 3 Statystyka Analityczna Część II - czynniki zakłócające - analiza stratyfikacyjna - analiza wielu zmiennych analiza regresji liniowej analiza regresji logistycznej model regresji proporcjonalnego ryzyka model regresji Poisson a - specyficzne zastosowania analizy wielu zmiennych

15 ANALIZY EKSPLORATYWNE I KONFORMACYJNE

16 ANALIZA DANYCH A. EKSPLORATYWNA A. KONFIRMATYWNA Hipoteza może być formułowana na podstawie wyników pierwszych analiz; dopuszczalne są otwarte pytania Konkretna hipoteza, sformułowana przed rozpoczęciem badania, testowana zgodnie z protokołem Jakie są czynniki ryzyka zakażeń szpitalnych u noworodków? Częstość zakażeń szpitalnych jest podobna u noworodków płci męskiej i żeńskiej

17 A.E. ~ GENERATOR PRZYPADKOWYCH ZNAMIENNOŚCI Nawet, gdy analizy są wykonane zgodnie z wymogami metodologii (właściwy test, kontrola czynników zakłócających) przypadkowe uzyskanie statystycznie znamiennego wyniku jest prawdopodobne

18 PODSTAWY ANALIZY WIELU ZMIENNYCH

19 CZTERY POZIOMY ANALIZY DANYCH - KONWENCJONALNA STRATEGIA - Analiza Opisowa Prosta Analiza Różnic/Zależności Stratyfikacyjna Analiza Różnic/Zależności Złożona Analiza Wielu Zmiennych Przykład: wskazanie a sukces ncpap (realne dane)

20 PORÓWNANIE % SUKCESÓW W 2 GRUPACH O RÓŻNYCH WSKAZANIACH (ncpap) Wskazanie RDS + Wskazanie RDS - Wiek > 30 HBD Wiek < 31 HBD Wiek > 30 HBD Wiek < 30 HBD Apgar Apgar Apgar Apgar Apgar Apgar Apgar Apgar SN CC SN CC SN CC SN CC SN CC SN CC SN CC SN CC % % % % % % % % % % % % % % % % i.t.d. brak danych do porównań szum informacyjny

21 to b nie rożni się w sposób statystycznie znamienny od 0, a więc ANALIZA WIELU ZMIENNYCH Y = b 0 + b 1 X 1 + b 2 X b k X k KLUCZ INTEPRETACYJNY H 0 : b = 0 vs H A b 0 b = 0 gdy p>0,05 gdy b = 0 wówczas bx = 0*X = 0 (to X znika!) np. FVC = 1,67 + 2,34*Wzrost 0,92*Papierosy b 1 = 2,34 b 2 = 0,92 p = 0,01 p = 0,08

22 ANALIZA WIELU ZMIENNYCH Y = b 0 + b 1 X 1 + b 2 X b k X k UWAGA Metoda szacowania b i to metoda najmniejszych kwadratów (znalezienie takich b i, które zapewniają najmniejszą sumę kwadratów odległości wszystkich punktów definiowanych przez X i Y od prostej regresji) Porównywanie bezwzględnych wartości b i nie ma sensu bez uwzględnienia jednostek pomiaru odpowiednich X i. Na przykład, nie można stwierdzić, że wzrost posiada trzy razy większe znaczenie wyjaśniające FVC niż papierosy [2,34:0,92]: FVC = 1,67 + 2,34*Wzrost 0,92*Papierosy + 1,67 Model zakłada liniową zależność (np. zmiana obciążenia paleniem z 1 do 5 pap/dzień jest tożsama ze zmianą z 20 do 25 pap/dzień. Analiza podlega założeniom (dyskutowanym w związku z diagnostyką modelu ) Model analizuje ilościowe lub jakościowe X i!!!

23 ANALIZA WIELU ZMIENNYCH Y = b 0 + b 1 X 1 + b 2 X b k X k ZASTOSOWANIA 1. badanie zależności Y od X i, po uwzględnieniu wpływu pozostałych X na Y; 2. przewidywanie wartości Y na podstawie wartości wszystkich X

24 ANALIZA WIELU ZMIENNYCH CZTERY PODSTAWOWE TECHNIKI 1. model regresji liniowej (Y jest zmienną ilościową) 2. model regresji logistycznej (Y jest zmienną jakościową) 3. model regresji proporcjonalnego ryzyka (analiza przeżywalności) 4. model regresji Poisson a (analiza zapadalności)

25 ANALIZA WIELU ZMIENNYCH CZTERY PODSTAWOWE TECHNIKI 1. model regresji liniowej (Y jest zmienną ilościową) 2. model regresji logistycznej (Y jest zmienną jakościową) 3. model regresji proporcjonalnego ryzyka (analiza przeżywalności) 4. model regresji Poisson a (analiza zapadalności)

26 MODEL REGRESJI LINIOWEJ Y = b 0 + b 1 X 1 + b 2 X b k X k PYTANIA 1. Jakie zmienne niezależne X? 2. Ile zmiennych niezależnych X?

27 MODEL REGRESJI LINIOWEJ Y = b 0 + b 1 X 1 + b 2 X b k X k PYTANIA 1. Jakie zmienne niezależne X? Koncepcja, model biologiczny (konfirmacja) Dążenie do ustalenia jakichkolwiek zależności, nawet przy mglistej koncepcji po coś te badania wykonano (eksploracja)

28 MODEL REGRESJI LINIOWEJ Y = b 0 + b 1 X 1 + b 2 X b k X k PYTANIA 1. Jakie zmienne niezależne X? 2. Ile zmiennych niezależnych X? Prosta reguła: liczba X < liczba obserwacji / 10

29 MODEL REGRESJI LINIOWEJ KONSTRUKCJA MODELU MODEL KOMPLETNY DNICPAP1 = LPOPO2 + WIEKPL1 + APGAR + CRIB + MASA + DWCPAP1 MODEL p R 2 DNICPAP1 = LPOPO2 + WIEKPL1 + APGAR + CRIB + MASA + DWCPAP1 0,9 0,0001 DNICPAP1 = LPOPO2 + WIEKPL1 + APGAR + CRIB + MASA + DWCPAP1 0,3 0,03 DNICPAP1 = LPOPO2 + WIEKPL1 + APGAR + CRIB + MASA + DWCPAP1 0,2 0,06 DNICPAP1 = LPOPO2 + WIEKPL1 + APGAR + CRIB + MASA + DWCPAP1 0,3 0,08 DNICPAP1 = LPOPO2 + WIEKPL1 + APGAR + CRIB + MASA + DWCPAP1 0,03 0,20 DNICPAP1 = LPOPO2 + WIEKPL1 + APGAR + CRIB + MASA + DWCPAP1 <0,0001 0,56 Im więcej zmiennych niezależnych w modelu tym większe R 2

30 MODEL REGRESJI LINIOWEJ KOMPLETNY MODEL The REG Procedure - Dependent Variable: DNICPAP1 Number of Observations Read 64 Number of Observations Used 58 Number of Observations with Missing Values 6 Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model <.0001 Error Corrected Total Root MSE R-Square !!! Dependent Mean Adj R-Sq Coeff Var Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > t Intercept LPOPO WIEKPL APGAR CRIB MASA DWCPAP <.0001

31 MODEL REGRESJI LINIOWEJ KOMPLETNY MODEL The REG Procedure - Dependent Variable: DNICPAP1 Number of Observations Read 64 Number of Observations Used 58 Number of Observations with Missing Values 6 Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model <.0001 Error Corrected Total Root MSE R-Square !!! Dependent Mean Adj R-Sq Coeff Var Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > t Intercept LPOPO WIEKPL APGAR CRIB MASA DWCPAP <.0001 UWAGA Wynik dla poszczególnych b nie zależy od kolejności zmiennych (typ III sumy kwadratów) Intercept WIEKPL APGAR CRIB DWCPAP1 <.0001 MASA LPOPO

32 MODEL REGRESJI LINIOWEJ KOMPLETNY MODEL CZAS CPAP = LPOPO2 0,11WIEKPL1+0,13APGAR1 0,19CRIB 0,008MASA+14,56DWCPAP1 ale ze względu na szereg startystycznie nieznamiennych b ostateczny model to CZAS CPAP = MASA + DWCPAP1 Uwaga: konieczna ponowna parametryzacja

33 MODEL REGRESJI LINIOWEJ OSTATECZNY MODEL (REZULTAT SELEKCJI WSTECZNEJ) Parameter Standard Variable Estimate Error Type II SS F Value Pr > F Intercept <.0001 DWCPAP <.0001 MASA CZASCPAP = 14,306*DWCPAP1 0,007*MASA + 11,314

34 MODEL REGRESJI LINIOWEJ DIAGNOSTYKA MODELU - WSPÓŁLINIOWOŚĆ Y ~ X 1, X 2, ale co gdy X 1 ~ X 2? ZJAWISKO WSPÓŁLINIOWOŚCI Zniekształcenie wyników analizy wielu zmiennych, polegające na uzyskaniu niewłaściwych lub nawet fałszywych (dodatnich/ujemnych) współczynników regresji, związane z korelacją dwóch lub więcej zmiennych niezależnych IDENTYFIKACJA WSPÓŁLINIOWOŚCI 1) analiza korelacji liniowej pomiędzy wszystkimi X i 2) analiza tolerancji

35 X MODEL REGRESJI LINIOWEJ DIAGNOSTYKA ZAŁOŻEŃ Model jest trafny (intepretowalny), gdy spełnione są następujące założenia/warunki: 1. Brak odległych obserwacji ( outliers ); 2. Niezależność obserwacji 3. Normalny rozkład wartości resztowych (średnia = 0; stała wariancja) Wartość resztowa to odległość pomiędzy wartością obserwowaną (Y i ) i wartością Y i wynikającą z równania regresji: Y

36 MODEL REGRESJI LINIOWEJ TERMINOLOGIA CzasCPAP = 16,02DobaWłącz 0,004Masa + 7,23 Zmienna Zależna Zmienne Niezależne Pytanie: Od czego zależy CzasCPAP? Zmienna Zależna Zmienne Objaśniające Pytanie: Jaki jest przewidywany CzasCPAP u noworodka o masie X 1, podłączonego w dobie X 2 Zmienna Zależna Predyktory

37 ANALIZA WIELU ZMIENNYCH CZTERY PODSTAWOWE TECHNIKI 1. model regresji liniowej (Y jest zmienną ilościową) 2. model regresji logistycznej (Y jest zmienną jakościową) 3. model regresji proporcjonalnego ryzyka (analiza przeżywalności) 4. model regresji Poisson a (analiza zapadalności)

38 MODEL REGRESJI LOGISTYCZNEJ LOGIT FUNKCJA ŁĄCZĄCA W CELU WYKONANIA ANALIZY LINIOWEJ P LOGIT P X X PRAWDOPODOBIEŃSTWO WYSTĄPIENIA Y W ODPOWIEDZI NA ZMIANĘ X uliniowienie zależności biologicznej

39 MODEL REGRESJI LOGISTYCZNEJ ZMIENNA ZALEŻNA = ZMIENNA JAKOŚCIOWA ZMIENNE NIEZALEŻNE = ZMIENNE JAKOŚCIOWE/ILOŚCIOWE PARAMETRYZACJA MODELU REGRESJI LOGISTYCZNEJ ANALOGICZNA DO PARAMETRYZACJI MODELU REGRESJI LINIOWEJ POPULARNOŚĆ REGRESJI LOGISTYCZNEJ W BADANIACH MEDYCZNYCH 1. Odwzorowanie zjawisk (zgon/wyzdrowienie; poprawa/brak poprawy, objaw/brak objawu itd..) 2. Bezpośrednie obliczenie ilorazu szans (logistycznego ilorazu szans: logis lub logor) WARTOŚCI ZMIENNYCH ORYGINALNE LUB W WYNIKU TRANSFORMACJI

40 MODEL REGRESJI LOGISTYCZNEJ KONSTRUKCJA MODELU - stopniowe ( ręczne ) dodawanie zmiennych - sformułowanie kompletnego modelu - metody automatyczne (eliminacja wsteczna, wstępująca, krokowa na przykład w oparciu o kryterium p<0,05) Y = b 0 + b 1 X 1 + b 2 X b k-1 X k-1 + b k X k

41 MODEL REGRESJI LOGISTYCZNEJ WYNIK ANALIZY Logistyczny Iloraz Szans (logis = logor) iloraz szans dla danej zależności Y ~ X, po uwzględnieniu wpływu pozostałych X na Y Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits masac wiekc apgarc cribc dwcpapc po2c UWAGA zmieność zmiennej binarnej to nie to samo co zmienność zmiennej ilościowej

42 MODEL REGRESJI LOGISTYCZNEJ WYNIK ANALIZY Logistyczny Iloraz Szans (logis = logor) iloraz szans dla danej zależności Y ~ X, po uwzględnieniu wpływu pozostałych X na Y SUROWY vs LOGISTYCZNY Odds Ratio Estimates ILORAZ Point SZANS 95% Wald Effect Estimate Confidence Limits masac wiekc apgarc cribc dwcpapc po2c UWAGA zmieność zmiennej binarnej to nie to samo co zmienność zmiennej ilościowej

43 MODEL REGRESJI LOGISTYCZNEJ DOBÓR MODELU 1. Definicja zmiennych (znaczenie kliniczne lub statystyczne) 2. Testowanie interakcji 3. Automatyczna selekcja zmiennych statystycznie znamiennych 4. Diagnostyka trafności modelu 5. Diagnostyka założeń modelu INNE MODELE Generalny Model Liniowy (uniwersalny dla zmiennych ilościowych i jakościowych)

44 ANALIZA WIELU ZMIENNYCH CZTERY PODSTAWOWE TECHNIKI 1. model regresji liniowej (Y jest zmienną ilościową) 2. model regresji logistycznej (Y jest zmienną jakościową) 3. model regresji proporcjonalnego ryzyka (analiza przeżywalności) 4. model regresji Poisson a (analiza zapadalności)

45 ANALIZA PRZEŻYWALNO YWALNOŚCI (SURVIVAL ANALYSIS)

46 ANALIZA PRZEŻYWALNO YWALNOŚCI OBSZARY ZASTOSOWAŃ historia naturalna chorób ( tym identyfikacja czynników ryzyka); ocena skuteczności nowych metod terapeutycznych; ocena skuteczności profilaktyki. MEDYCYNA KLINICZNA A EPIDEMIOLOGIA Skutki Terapii X Obserwacja Kliniczna Pacjent A + Pacjent A + Pacjent A - Pacjent A + Pacjent A - Itd... Obserwacja Epidemiologiczna Odsetek + Odsetek - Obserwacja grupy umożliwia kontrolowanie zakłócającego wpływu zjawiska zmienności międzyosobniczej, ale utrudnia uwzględnienie indywidualnie istotnych okoliczności zdarzeń. Zgon jako przykład zdarzenia kończącego okres obserwacji (inne zdarzenia to np. pierwsza remisja, normalizacja biochemiczna itp.)

47 PORÓWNANIA UMIERALNOŚCI - (DWIE KOHORTY) KOHORTA - A 100 CHORYCH CZAS OBSERWACJI = 3 LATA KOHORTA - B 100 CHORYCH 50 zmarło 45 zmarło GRUPA A 100 CHORYCH Ale GRUPA B 100 CHORYCH Zgon w 1 roku: 15 Zgon w 1 roku: 5 Zgon w 2 roku: 20 Zgon w 1 roku: 15 Zgon w 3 roku: 15 Zgon w 3 roku: 25 Ale w obu grupach wystąpiły także zgony z innych powodów niż choroba stanowiąca przedmiot obserwacji Ale w obu grupach utracono z obserwacji część chorych (np. dobrowolna rezygnacja z udziału w badaniu, zmiana miejsca pobytu) ilu utraconych zmarło z powodu choroby X w grupie A, ilu w grupie B? Ale chorzy objęci kompletną obserwacją trzyletnią żyją także (różnie długo) po zakończeniu obserwacji

48 PORÓWNANIE PROFILU PRZEŻYWALNO YWALNOŚCI Dwie Grupy Terapia A i Terapia B RADIOTERAPIA- SCHEMAT A Tablica przeżywalności kohorty RADIOTERAPIA- SCHEMAT B Tablica przeżywalności kohorty (1) (2) (3) (4) (5) (6) (7) (8) 1 X X X X X X X 2 X X X X X X X 3 X X X X X X X... N X X X X X X X (1) (2) (3) (4) (5) (6) (7) (8) 1 X X X X X X X 2 X X X X X X X 3 X X X X X X X... N X X X X X X X Wykres przeżywalności kohorty Wykres przeżywalności kohorty 1 1 0,8 0,8 0,6 0,6 0,4 0,4 0,2 0, Oczekiwany czas przeżycia kohorty Oczekiwany czas przeżycia kohorty T = 6,1 miesięcy T = 4,6 miesięcy

49 MODEL PROPORCJONALNYCH RYZYK (proportional hazards model) CZYM dla testów parametrycznych jest założenie liniowości TYM dla testów różnic w zakresie przeżywalności jest założenie proporcjonalnych ryzyk (UPROSZCZONA) KONWENCJA STATYSTYCZNA Przebieg ryzyka, jego natężenie i zmiany w czasie obserwacji [t] dają się opisać matematycznie funkcją ryzyka (t) Gdy porównuje się ryzyko zgonu w dwóch grupach ( Terapia i Kontrola ) wówczas dla grupy kontrolnej (punkt odniesienia) ryzyko opisuje funkcja [ K (t)], a dla grupy terapeutycznej funkcja uwzględniająca badany efekt terapeutyczny [ ], zatem [ * T (t)]. Celem badania jest porównanie ryzyk, co opisuje model proporcjonalnych ryzyk : K (t) = * T (t) gdy efekt terapeutyczny jest żaden (=1) wówczas = 1, i K (t) = T (t) HIPOTEZĘ O RÓWNOŚCI RYZYK W PORÓWNYWANYCH GRUPACH K i T TESTUJE SIĘ PRZY UŻYCIU: TESTU RANG (LOGRANK) proste sytuacje ANALIZY REGRESJI COX A złożone sytuacje

50 TEST RANG STRATEGIA (B) Podstawowe Dane rzeczywista, obserwowana liczbie zgonów w obu grupach (OT i OK); oczekiwana liczba zgonów w obu grupach (ET i EK). Podstawowy Wynik Testu Rang - Statystyka χ2 χ2 = [(OT ET)2 / ET] + [(OK EK)2 / EK], a po podstawieniu danych z omawianego scenariusza: χ2 = [(5-5,39)2/5,39] + [(8-7,57)2/7,57] = 0, ,024 = 0,052 Uzyskany wynik w konfrontacji z rozkładem statystyki χ2 dla jednego stopnia swobody (liczba grup 1) nie upoważnia do stwierdzenia, że różnica pomiędzy przeżywalnością w grupie T i K jest statystycznie znamienna. Tym samym można przyjąć, że testowana metoda terapeutyczna nie jest skuteczna, pod warunkiem, że inne przyczyny nie wpłynęły na wyniki badania. PROBLEMY Wniosek, że różnice w przeżywalności nie zależą od terapii jest zasadny, gdy w każdym innym aspekcie istotnym dla przeżywalności porównywane grupy są podobne: Wiek; Płeć; Stadium choroby; Wcześniejsze leczenie; Choroby współistniejące; Itd! kryteria doboru badanych i randomizacja

51 ANALIZA REGRESJI COX A - I (Cox D.R.: Regression models and life tables. Journal of the Royal Statistical Society 1972;34: ) MODEL COX a = PROCEDURA STATYSTYCZNA UMOŻLIWIAJĄCA ZBADANIE ZALEŻNOŚCI CZASU PRZEŻYCIA OD CZYNNIKÓW PODEJRZEWANYCH O WPŁYW NA CZAS PRZEŻYCIA, Z UWZGLĘDNIENIEM OBSERWACJI NIEPEŁNYCH Dane toksykologiczne wykazują, że czas przeżycia dobrze charakteryzuje funkcja wykładnicza: Y = a x przekształcenie modelu proporcjonalnych ryzyk [ K (t) = * T (t)] w model proporcjonalnych przeżyć [S K (t) = S T (t) ] badany efekt (np. skutek terapii) reprezentuje wówczas funkcja wykładnicza a dla wielu zmiennych: Y = a (b 1 *X 1 + b 2 *X b k-1 *X k-1 + b k *X k ) Porównanie dwóch grup (np. terapia A i B) jest porównaniem dwóch profili przeżycia, co umożliwia obliczenie ilorazu ryzyk (RR=risk ratio) RR = ryzyko A / ryzyko B Jest to możliwe ze względu na założenie, że ryzyko wystąpienia zgonu rozkłada się proporcjonalnie w trakcie obserwacji stąd pochodzi ogólna nazwa procedury: model proporcjonalnego ryzyka (proportional-hazards model w terminologii anglosaskiej).

52 ANALIZA REGRESJI COX A A (MODEL COX a) III Gdy model Cox a dotyczy prostej analizy (tylko jeden czynnik X terapia) wyniki będą tożsame z wynikiem testu rang. Pełne wykorzystanie analizy Cox a i jej zalety są widoczne wówczas, gdy w analizie przeżywalności stosuje się jednoczasowo wiele zmiennych, np.: b 1 *PŁEĆ + b 2 *WIEK + b 3 *STAN + b 4 *TERAPIA Analizy tego typu są możliwe przy użyciu procedur dostępnych w programach komputerowych, np. PROC PHREG w programie SAS. Inne procedury dostarczają szerokiego spektrum testów stosowanych w analizie przeżywalności (PROC LIFETEST, PROC LIFEREG w programie SAS).

53 ANALIZA PRZEŻYWALNO YWALNOŚCI PODSUMOWANIE I CHARAKTERYSTYKA PROFILU PRZEŻYWALNOŚCI Metoda Kaplan-Meier a Cel: opis profilu * * * PORÓWANIA PROFILI PRZEŻYWALNOŚCI Test rang (logrank test) Cel: ocena różnic pomiędzy profilami * * * IDENTYFIKACJA CZYNNIKÓW WPŁYWAJĄCYCH NA PRZEŻYWALNOŚĆ Analiza Cox a Cel: analiza czynników determinujących profil lub odpowiedzialnych za różnice pomiędzy porównywanymi profilami

54 ANALIZA WIELU ZMIENNYCH CZTERY PODSTAWOWE TECHNIKI 1. model regresji liniowej (Y jest zmienną ilościową) 2. model regresji logistycznej (Y jest zmienną jakościową) 3. model regresji proporcjonalnego ryzyka (analiza przeżywalności) 4. model regresji Poisson a (analiza zapadalności)

55 MODEL REGRESJI POISSON A WSPÓŁCZYNNIK REGRESJI POISSON A : b gdy narażenie = tak (X 1 =1) log(wsp. E+ ) = b 0 + b 1 *1 + + b k X k gdy narażenie = nie (X=0) log (wsp. E-) = b 0 + b 1 * b k X k a po rozwiązaniu układu równań b 1 = log(wsp. E+ ) log(wsp. E- ) b 1 = log(wsp. E+ / wsp. E- ) Współczynnik regresji b jest logarytmem ilorazu współczynników, a zatem antylogarytm b, czyli e b1 to iloraz współczynnika u narażonych i nienarażonych!!! (wartość sprawcza danego narażenia po uwzględnieniu innych zmiennych w modelu)

56 TREŚĆ SEMINARIUM 3 Statystyka Analityczna Część II - czynniki zakłócające - analiza stratyfikacyjna - analiza wielu zmiennych model regresji liniowej model regresji logistycznej model regresja proporcjonalnego ryzyka model regresji Poisson a - specyficzne zastosowania analizy wielu zmiennych

57 MODEL REGRESJI WIELU ZMIENNYCH 1. Analiza dyskryminacyjna (SAS-DISCRIM) 2. Analiza wyników powtarzanych pomiarów (SAS-GLM/REPEATED) 3. Analiza skupień (SAS-CLUSTER) 4. Analiza ścieżek (SAS-CALIS) 5. - tematyka wykracza poza zakres kursu -

SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE

SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE SUM - WLK 2011 WYKŁAD PIĄTY: BIOSTATYSTYKA C.D. Prof. dr hab. med. Jan E. Zejda! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE TREŚĆ WYKŁADU Dokumentowanie efektu (analiza danych

Bardziej szczegółowo

PAKIETY STATYSTYCZNE

PAKIETY STATYSTYCZNE . Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa

Bardziej szczegółowo

PODSTAWY STATYSTYKI SEMINARIUM 3 ! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE

PODSTAWY STATYSTYKI SEMINARIUM 3 ! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE STUDIUM DOKTORANCKIE KATOWICE, 2011/12 PODSTAWY STATYSTYKI SEMINARIUM 3! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE Jan E. Zejda Katedra Epidemiologii WLK, SUM TREŚĆ SEMINARIUM

Bardziej szczegółowo

PRAKTYCZNE METODY STATYSTYCZNE W BADANIACH NAUKOWYCH

PRAKTYCZNE METODY STATYSTYCZNE W BADANIACH NAUKOWYCH Katedra i Zakład Epidemiologii Wydział Lekarski w Katowicach Tel./Fax: (32) 2523734 Ul. Medyków 18, 40-752 Katowice Śląski Uniwersytet Medyczny E-mail: epikat@sum.edu.pl PRAKTYCZNE METODY STATYSTYCZNE

Bardziej szczegółowo

Rozdział 8. Regresja. Definiowanie modelu

Rozdział 8. Regresja. Definiowanie modelu Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność

Bardziej szczegółowo

Uogólniony model liniowy

Uogólniony model liniowy Uogólniony model liniowy Ogólny model liniowy y = Xb + e Każda obserwacja ma rozkład normalny Każda obserwacja ma tą samą wariancję Dane nienormalne Rozkład binomialny np. liczba chorych krów w stadzie

Bardziej szczegółowo

WYKŁAD DRUGI: TYPY BADAŃ EPIDEMIOLOGICZNYCH

WYKŁAD DRUGI: TYPY BADAŃ EPIDEMIOLOGICZNYCH SUM - WLK 2011 WYKŁAD DRUGI: TYPY BADAŃ EPIDEMIOLOGICZNYCH Prof. dr hab. med. Jan E. Zejda! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE TREŚĆ WYKŁADU Badania epidemiologiczne

Bardziej szczegółowo

Przedziały ufności i testy parametrów. Przedziały ufności dla średniej odpowiedzi. Interwały prognoz (dla przyszłych obserwacji)

Przedziały ufności i testy parametrów. Przedziały ufności dla średniej odpowiedzi. Interwały prognoz (dla przyszłych obserwacji) Wkład 1: Prosta regresja liniowa Statstczn model regresji liniowej Dane dla prostej regresji liniowej Przedział ufności i test parametrów Przedział ufności dla średniej odpowiedzi Interwał prognoz (dla

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki

Bardziej szczegółowo

WYKŁAD TRZECI: OCENA ZWIĄZK PRZYCZYNOWO-SKUTKOWYCH W EPIDEMIOLOGII

WYKŁAD TRZECI: OCENA ZWIĄZK PRZYCZYNOWO-SKUTKOWYCH W EPIDEMIOLOGII SUM - WLK 2011 WYKŁAD TRZECI: OCENA ZWIĄZK ZKÓW PRZYCZYNOWO-SKUTKOWYCH W EPIDEMIOLOGII Prof. dr hab. med. Jan E. Zejda! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE TREŚĆ WYKŁADU

Bardziej szczegółowo

(LMP-Liniowy model prawdopodobieństwa)

(LMP-Liniowy model prawdopodobieństwa) OGÓLNY MODEL REGRESJI BINARNEJ (LMP-Liniowy model prawdopodobieństwa) Dla k3 y α α α α + x + x + x 2 2 3 3 + α x x α x x + α x x + α x x + ε + x 4 2 5 3 6 2 3 7 2 3 Zał.: Wszystkie zmienne interakcyjne

Bardziej szczegółowo

Przykład 1. (A. Łomnicki)

Przykład 1. (A. Łomnicki) Plan wykładu: 1. Wariancje wewnątrz grup i między grupami do czego prowadzi ich ocena 2. Rozkład F 3. Analiza wariancji jako metoda badań założenia, etapy postępowania 4. Dwie klasyfikacje a dwa modele

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9 Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności

Bardziej szczegółowo

Analiza danych ilościowych i jakościowych

Analiza danych ilościowych i jakościowych Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego 8 kwietnia 2010 Plan prezentacji 1 Zbiory danych do analiz 2 3 4 5 6 Implementacja w R Badanie depresji Depression trial data Porównanie

Bardziej szczegółowo

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4 Stanisław Cichocki Natalia Nehrebecka Wykład 4 1 1. Własności hiperpłaszczyzny regresji 2. Dobroć dopasowania równania regresji. Współczynnik determinacji R 2 Dekompozycja wariancji zmiennej zależnej Współczynnik

Bardziej szczegółowo

Ekonometria dla IiE i MSEMat Z7

Ekonometria dla IiE i MSEMat Z7 Ekonometria dla IiE i MSEMat Z7 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 21-11-2016 Na podstawie zbioru danych cps_small.dat z książki Principles of Econometrics oszacowany

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test

Bardziej szczegółowo

Rozkłady statystyk z próby

Rozkłady statystyk z próby Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny

Bardziej szczegółowo

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y 2. Współczynnik korelacji Pearsona 3. Siła i kierunek związku między zmiennymi 4. Korelacja ma sens, tylko wtedy, gdy związek między zmiennymi

Bardziej szczegółowo

statystyka badania epidemiologiczne

statystyka badania epidemiologiczne statystyka badania epidemiologiczne Epidemiologia Epi = wśród Demos = lud Logos = nauka Epidemiologia to nauka zajmująca się badaniem rozprzestrzenienia i uwarunkowań chorób u ludzi, wykorzystująca tą

Bardziej szczegółowo

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna

Bardziej szczegółowo

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA Opis zakładanych efektów kształcenia na studiach podyplomowych Nazwa studiów: BIOSTATYSTYKA PRAKTYCZNE ASPEKTY STATYSTYKI W BADANIACH MEDYCZNYCH Typ studiów: doskonalące Symbol Efekty kształcenia dla studiów

Bardziej szczegółowo

Założenia: wyniki są binarne próby są niezależne liczba prób n ustalona przed pomiarem to samo prawdopodobieństwo sukcesu we wszystkich próbach

Założenia: wyniki są binarne próby są niezależne liczba prób n ustalona przed pomiarem to samo prawdopodobieństwo sukcesu we wszystkich próbach Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie Test dwumianowy χ 2 test dobroci dopasowania Analiza tabeli kontygencji ( tabeli krzyżywej) P k sukcesów = n k pk (1 p) n k Założenia:

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Regresja logistyczna (LOGISTIC)

Regresja logistyczna (LOGISTIC) Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14 Stanisław Cichocki Natalia Nehrebecka Wykład 14 1 1.Problemy z danymi Współliniowość 2. Heteroskedastyczność i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji Metody radzenia sobie z heteroskedastycznością

Bardziej szczegółowo

S t a t y s t y k a, część 3. Michał Żmihorski

S t a t y s t y k a, część 3. Michał Żmihorski S t a t y s t y k a, część 3 Michał Żmihorski Porównanie średnich -test T Założenia: Zmienne ciągłe (masa, temperatura) Dwie grupy (populacje) Rozkład normalny* Równe wariancje (homoscedasticity) w grupach

Bardziej szczegółowo

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników

Bardziej szczegółowo

Spis treści 3 SPIS TREŚCI

Spis treści 3 SPIS TREŚCI Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe

Bardziej szczegółowo

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska Anna Stankiewicz Izabela Słomska Wstęp- statystyka w politologii Rzadkie stosowanie narzędzi statystycznych Pisma Karla Poppera

Bardziej szczegółowo

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe Zjazd 7. SGGW, dn. 28.11.10 r. Matematyka i statystyka matematyczna Tematy 1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe nna Rajfura 1 Zagadnienia Przykład porównania wielu obiektów w

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności

Bardziej szczegółowo

Regresja logistyczna. Regresja logistyczna. Przykłady DV. Wymagania

Regresja logistyczna. Regresja logistyczna. Przykłady DV. Wymagania Regresja logistyczna analiza relacji między zbiorem zmiennych niezależnych (ilościowych i dychotomicznych) a dychotomiczną zmienną zależną wyniki wyrażone są w prawdopodobieństwie przynależności do danej

Bardziej szczegółowo

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno WERYFIKACJA MODELI MODELE LINIOWE Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno ANALIZA KORELACJI LINIOWEJ to NIE JEST badanie związku przyczynowo-skutkowego, Badanie współwystępowania cech (czy istnieje

Bardziej szczegółowo

Regresja logistyczna. Regresja logistyczna. Wymagania. Przykłady DV

Regresja logistyczna. Regresja logistyczna. Wymagania. Przykłady DV Regresja logistyczna analiza relacji między zbiorem zmiennych niezależnych (ilościowych i dychotomicznych) a dychotomiczną zmienną zależną wyniki wyrażone są w prawdopodobieństwie przynależności do danej

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować

Bardziej szczegółowo

Analiza regresji - weryfikacja założeń

Analiza regresji - weryfikacja założeń Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

BADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ

BADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ WYKŁAD 3 BADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ Było: Przykład. Z dziesięciu poletek doświadczalnych zerano plony ulw ziemniaczanych (cecha X) i oznaczono w nich procentową zawartość

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

ANALIZA REGRESJI SPSS

ANALIZA REGRESJI SPSS NLIZ REGRESJI SPSS Metody badań geografii społeczno-ekonomicznej KORELCJ REGRESJ O ile celem korelacji jest zmierzenie siły związku liniowego między (najczęściej dwoma) zmiennymi, o tyle w regresji związek

Bardziej szczegółowo

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22 Spis treści Przedmowa do wydania pierwszego.... 11 Przedmowa do wydania drugiego.... 15 Wykaz symboli.... 17 Litery alfabetu greckiego wykorzystywane w podręczniku.... 17 Symbole wykorzystywane w zagadnieniach

Bardziej szczegółowo

Autor: Dariusz Piwczyński 1 Ćwiczenie. Analiza zmienności złożona. Testy wielokrotnych porównań

Autor: Dariusz Piwczyński 1 Ćwiczenie. Analiza zmienności złożona. Testy wielokrotnych porównań Autor: Dariusz Piwczyński 1 Ćwiczenie. Analiza zmienności złożona. Testy wielokrotnych porównań Analizę wariancji możemy wykonać w SAS za pomocą procedury ANOVA oraz GLM. ANOVA Analysis of variance (Analiza

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 Inne układy doświadczalne 1) Układ losowanych bloków Stosujemy, gdy podejrzewamy, że może występować systematyczna zmienność między powtórzeniami np. - zmienność

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -

Bardziej szczegółowo

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu Część 2 Test Durbina-Watsona Test Durbina-Watsona Weryfikowana hipoteza H 0 : cov(ε t, ε t 1 ) = 0 H 1 : cov(ε t, ε t 1 ) 0 Test Durbina-Watsona Weryfikowana hipoteza H 0 : cov(ε t, ε t 1 ) = 0 H 1 : cov(ε

Bardziej szczegółowo

Ekonometria egzamin 07/03/2018

Ekonometria egzamin 07/03/2018 imię, nazwisko, nr indeksu: Ekonometria egzamin 07/03/2018 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 Regresja wielokrotna Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X 1, X 2, X 3,...) na zmienną zależną (Y).

Bardziej szczegółowo

1 Analizy zmiennych jakościowych

1 Analizy zmiennych jakościowych 1 Analizy zmiennych jakościowych Przedmiotem analizy są zmienne jakościowe. Dokładniej wyniki pomiarów jakościowych. Pomiary tego typu spotykamy w praktyce badawczej znacznie częściej niż pomiary typu

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.

Bardziej szczegółowo

Statystyka matematyczna Test χ 2. Wrocław, 18.03.2016r

Statystyka matematyczna Test χ 2. Wrocław, 18.03.2016r Statystyka matematyczna Test χ 2 Wrocław, 18.03.2016r Zakres stosowalności Testowanie zgodności Testowanie niezależności Test McNemara Test ilorazu szans Copyright 2014, Joanna Szyda ZAKRES STOSOWALNOŚCI

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM

Bardziej szczegółowo

Wykład 4 Związki i zależności

Wykład 4 Związki i zależności Wykład 4 Związki i zależności Rozważmy: Dane z dwiema lub więcej zmiennymi Zagadnienia do omówienia: Zmienne objaśniające i zmienne odpowiedzi Wykres punktowy Korelacja Prosta regresji Słownictwo: Zmienna

Bardziej szczegółowo

Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008

Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008 Redaktor: Alicja Zagrodzka Korekta: Krystyna Chludzińska Projekt okładki: Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008 ISBN 978-83-7383-296-1 Wydawnictwo Naukowe Scholar

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

Badania obserwacyjne 1

Badania obserwacyjne 1 Badania obserwacyjne 1 Chorobowość Chorobowość (ang. prevalence rate) liczba chorych w danej chwili na konkretną chorobę w określonej grupie mieszkańców (np. na 100 tys. mieszkańców). Współczynnik ten

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

Modele warunkowej heteroscedastyczności

Modele warunkowej heteroscedastyczności Teoria Przykład - zwroty z WIG Niskie koszty transakcyjne Teoria Przykład - zwroty z WIG Niskie koszty transakcyjne Racjonalne oczekiwania inwestorów P t = E(P t+1 I t ) 1 + R (1) Teoria Przykład - zwroty

Bardziej szczegółowo

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, 2018 Spis treści Przedmowa 13 O Autorach 15 Przedmowa od Tłumacza 17 1. Wprowadzenie i statystyka opisowa 19 1.1.

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

Wykład 8 Dane kategoryczne

Wykład 8 Dane kategoryczne Wykład 8 Dane kategoryczne Wrocław, 19.04.2017r Zmienne kategoryczne 1 Przykłady zmiennych kategorycznych 2 Zmienne nominalne, zmienne ordynalne (porządkowe) 3 Zmienne dychotomiczne kodowanie zmiennych

Bardziej szczegółowo

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej Ekonometria Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 4 Prognozowanie, stabilność 1 / 17 Agenda

Bardziej szczegółowo

WYKŁAD PIERWSZY: PODSTAWY EPIDEMIOLOGII (A)

WYKŁAD PIERWSZY: PODSTAWY EPIDEMIOLOGII (A) SUM - WLK 2013 WYKŁAD PIERWSZY: PODSTAWY EPIDEMIOLOGII (A) Prof. dr hab. med. Jan E. Zejda POLSKI STANDARD KSZTAŁCENIA HIGIENA I EPIDEMIOLOGIA Uwarunkowania stanu zdrowia. Znaczenie chorobotwórcze czynników

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 3 1 / 8 ZADANIE z rachunku

Bardziej szczegółowo

Jednoczynnikowa analiza wariancji. Wnioskowanie dla jednoczynnikowej ANOV-y. Porównywanie poszczególnych średnich

Jednoczynnikowa analiza wariancji. Wnioskowanie dla jednoczynnikowej ANOV-y. Porównywanie poszczególnych średnich (Wykład 13) Jednoczynnikowa analiza wariancji Wnioskowanie dla jednoczynnikowej ANOV-y Format danych Hipotezy i model ANOVA Tabela ANOVA i test F Porównywanie poszczególnych średnich Jednoczynnikowa ANOVA

Bardziej szczegółowo

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Przykład 2 Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Sondaż sieciowy analiza wyników badania sondażowego dotyczącego motywacji w drodze do sukcesu Cel badania: uzyskanie

Bardziej szczegółowo

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)

Bardziej szczegółowo

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń 1. Problem ozwaŝamy zjawisko (model): Y = β 1 X 1 X +...+ β k X k +Z Ηβ = w r Hipoteza alternatywna: Ηβ w r

Bardziej szczegółowo

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną Wydział: Zarządzanie i Finanse Nazwa kierunku kształcenia: Finanse i Rachunkowość Rodzaj przedmiotu: podstawowy Opiekun: prof. nadzw. dr hab. Tomasz Kuszewski Poziom studiów (I lub II stopnia): II stopnia

Bardziej szczegółowo

Rak płuca wyzwania. Witold Zatoński Centrum Onkologii Instytut im. Marii Skłodowskiej-Curie w Warszawie

Rak płuca wyzwania. Witold Zatoński Centrum Onkologii Instytut im. Marii Skłodowskiej-Curie w Warszawie Rak płuca wyzwania Witold Zatoński Centrum Onkologii Instytut im. Marii Skłodowskiej-Curie w Warszawie Innowacje w leczeniu RAKA PŁUC ocena dostępności w Polsce Warszawa, 1 marca 14 Nowotwory główna przyczyna

Bardziej szczegółowo

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1 Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, że 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.

Bardziej szczegółowo

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat Anna Rajfura 1 Przykład W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zależy

Bardziej szczegółowo

Analiza autokorelacji

Analiza autokorelacji Analiza autokorelacji Oblicza się wartości współczynników korelacji między y t oraz y t-i (dla i=1,2,...,k), czyli współczynniki autokorelacji różnych rzędów. Bada się statystyczną istotność tych współczynników.

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Część 2 Hipoteza złożona Testowanie hipotez łącznych Zapis matematyczny Rozkład statystyki testowej Hipoteza łączna H 0 : Rβ = q Hipoteza złożona Testowanie hipotez łącznych Zapis matematyczny Rozkład

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.

Bardziej szczegółowo

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu Część 1 Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy małej próby Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy małej próby Testy

Bardziej szczegółowo

Podstawy epidemiologii

Podstawy epidemiologii Podstawy epidemiologii Epidemiologia - Epi = na Demos = lud Logos = nauka Epidemiologia to nauka zajmująca się badaniem rozprzestrzeniania i uwarunkowań chorób u ludzi, wykorzystująca tę wiedzę do ograniczenia

Bardziej szczegółowo

KARTA KURSU. Kod Punktacja ECTS* 1

KARTA KURSU. Kod Punktacja ECTS* 1 KARTA KURSU Nazwa Nazwa w j. ang. Wprowadzenie do statystyki Introduction to statistics Kod Punktacja ECTS* 1 Koordynator Prof. dr hab. Jerzy Wołek Zespół dydaktyczny Prof. dr hab. Jerzy Wołek doktoranci

Bardziej szczegółowo

Zastosowanie uogólnionych modeli liniowych i uogólnionych mieszanych modeli liniowych do analizy danych dotyczacych występowania zębiniaków

Zastosowanie uogólnionych modeli liniowych i uogólnionych mieszanych modeli liniowych do analizy danych dotyczacych występowania zębiniaków Zastosowanie uogólnionych modeli liniowych i uogólnionych mieszanych modeli liniowych do analizy danych dotyczacych występowania zębiniaków Wojciech Niemiro, Jacek Tomczyk i Marta Zalewska Uniwersytet

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. opulacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.

Bardziej szczegółowo

Statystyczna analiza danych (molekularnych) analiza wariancji ANOVA

Statystyczna analiza danych (molekularnych) analiza wariancji ANOVA Statystyczna analiza danych (molekularnych) analiza wariancji ANOVA Anna Gambin 19 maja 2013 Spis treści 1 Przykład: Model liniowy dla ekspresji genów 1 2 Jednoczynnikowa analiza wariancji 3 2.1 Testy

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13 Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Autokorelacja Konsekwencje Testowanie autokorelacji 2. Metody radzenia sobie z heteroskedastycznością i autokorelacją Uogólniona Metoda Najmniejszych

Bardziej szczegółowo

Analiza przeżycia. Czym zajmuje się analiza przeżycia?

Analiza przeżycia. Czym zajmuje się analiza przeżycia? ANALIZA PRZEŻYCIA Analiza przeżycia Czym zajmuje się analiza przeżycia? http://www.analyticsvidhya.com/blog/2014/04/survival-analysis-model-you/ Analiza przeżycia Jest to inaczej analiza czasu trwania

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12 Stanisław Cichocki Natalia Nehrebecka Wykład 12 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne 2. Autokorelacja o Testowanie autokorelacji 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne

Bardziej szczegółowo

Analiza przeżycia. Czym zajmuje się analiza przeżycia? Jest to analiza czasu trwania, zaprojektowana do analizy tzw.

Analiza przeżycia. Czym zajmuje się analiza przeżycia? Jest to analiza czasu trwania, zaprojektowana do analizy tzw. ANALIZA PRZEŻYCIA Analiza przeżycia Czym zajmuje się analiza przeżycia? Jest to analiza czasu trwania, zaprojektowana do analizy tzw. danych uciętych Obserwacja jest nazywana uciętą jeżeli zdarzenie jeszcze

Bardziej szczegółowo

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 0/0/0. Egzamin trwa 90 minut.. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu. Złamanie

Bardziej szczegółowo

Natalia Nehrebecka Stanisław Cichocki. Wykład 13

Natalia Nehrebecka Stanisław Cichocki. Wykład 13 Natalia Nehrebecka Stanisław Cichocki Wykład 13 1 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość 2 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje

Bardziej szczegółowo

Diagnostyka w Pakiecie Stata

Diagnostyka w Pakiecie Stata Karol Kuhl Zgodnie z twierdzeniem Gaussa-Markowa, estymator MNK w KMRL jest liniowym estymatorem efektywnym i nieobciążonym, co po angielsku opisuje się za pomocą wyrażenia BLUE Best Linear Unbiased Estimator.

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych STATYSTYKA MATEMATYCZNA WYKŁAD 3 Populacje i próby danych POPULACJA I PRÓBA DANYCH POPULACJA population Obserwacje dla wszystkich osobników danego gatunku / rasy PRÓBA DANYCH sample Obserwacje dotyczące

Bardziej szczegółowo