Statystyka medyczna II. 7. Wstęp do regresji logistycznej. Regresja logistyczna prosta, porównanie z miarami ryzyka.

Wielkość: px
Rozpocząć pokaz od strony:

Download "Statystyka medyczna II. 7. Wstęp do regresji logistycznej. Regresja logistyczna prosta, porównanie z miarami ryzyka."

Transkrypt

1 Statystyka medyczna II. 7. Wstęp do regresji logistycznej. Regresja logistyczna prosta, porównanie z miarami ryzyka. Dane The Western Collaborative Group Study (WCGS) badanie epidemiologiczne zaprojektowane, by sprawdzić powiązanie pomiędzy osobowością typu A (Type A behavior pattern, TABP) a chorobą niedokrwienną serca (CHD). id age arcus behpat height weight chd69 chol dbp sbp smoke ncigs agec dibpat bmi wghtcat typchd A No Yes Type A B No Yes Type B A No No Type A <NA> A Yes No Type A A No No Type A A Yes No Type A Opis zmiennych id id pacjenta age wiek (w latach) arcus arcus senilis, obwódka rogówki (0/1) behpat behavior pattern, typ osobowości (A1/A2/B3/B4) height wzrost (w calach) weight waga (w funtach) chd69 choroba niedokrwienna serca (różnego rodzaju) (0/1) chol poziom cholesterolu dbp ciśnienie rozkurczowe (mmhg) sbp ciśnienie skurczowe (mmhg) smoke self-reported smoking (Tak/Nie) ncigs liczba wypalanych papierosów zmienne pochodne agec wiek w kategoriach 35 40, 41 45, 46 50, 51 55, dibpat typ osobowości A/B bmi wskaźnik bmi (weight/height 2 703) wghtcat waga w kategoriach < 140, , , > 200 typchd69 typ choroby niedokrwiennej serca (0/1/2/3)

2 Miary ryzyka Badaliśmy zależność występowania chorób serca (CHD) od wieku. W tym celu zbadaliśmy obserwowane proporcje (P ) osób w kolejnych przedziałach wiekowych (agec) i wyznaczyliśmy podstawowe miary ryzyka: RR iloraz ryzyk, OR iloraz szans. Najmłodsza grupa wiekowa została uznana za referencyjną. Wyniki zebrane w poniższych tabelach. > cs(chd69,agec,decimal = 3) agec chd No Yes Absolute risk Risk ratio lower 95% CI upper 95% CI Chi-squared = , 4 d.f., P value = 0 > cc(chd69,agec,decimal = 3) agec chd No Yes Odds ratio lower 95% CI upper 95% CI Chi-squared = , 4 d.f., P value = 0 Grupa wiekowa P 1 P RR OR

3 Model regresji liniowej i logistycznej W modelu regresji liniowej (prostej) opisujemy średnią zmiennej zależnej (wyniku) y jako funkcję liniową pojedynczej ciągłej zmiennej niezależnej (predyktora) x: E(y x) = β 0 + β 1 x. Przyjmując taką konwencję zmienną binarną y możemy potraktować jako przyjmującą wartość 1 dla osób z chorobą oraz wartość 0 dla osób zdrowych. Obserwowana proporcja chorych wśród pacjentów o danej wartości zmiennej niezależnej x jest po prostu średnią y w tej grupie. Stąd liniowy model dla zmiennej binarnej y można zapisać w postaci P (x) = E(y x) = β 0 + β 1 x, tzn. wartość oczekiwana wyniku (zmiennej y) jest funkcją liniową predyktora (x). Zauważmy, że jeżeli również x jest zmienną binarną o wartościach 0 lub 1, wtedy zwiększenie x o 1 skutkuje zmianą prawdopodobieństwa / wartości oczekiwanej Modele o takiej własności określa się jako addytywne modele ryzyka. P (1) P (0) = β 1. Oczywiście takie sformułowanie zagadnienia regresji dla binarnych wyników ma swoje ograniczenia: y nie ma rozkładu normalnego (nawet w przybliżeniu!), wynik y reprezentuje prawdopodobieństwo, zatem wartości poza przedziałem [0, 1] nie mają sensu, zazwyczaj nie ma podstaw do przyjęcia założeń, że ryzyko opisane przez y zmienia się w sposób liniowy na przedziale zmienności predyktora x.

4 Poniżej przedstawiono przykładowe modele łączące prawdopodobieństwo P (x) binarnego wyniku z ciągłym predyktorem x. linear exponential P(x) P(x) x x step function logistic P(x) P(x) x x W modelu wykładniczym logarytm ryzyka opisanego przez y zmienia się liniowo od wartości x, jednak nie jest ograniczony dla dużych wartości β 0 + β 1 x. W modelu dla funkcji prostej mamy dobrą własność ograniczenia wartości funkcji do przedziału [0, 1]. Ponadto modyfikując wartości skoków funkcji możemy modyfikować wpływ zmian wartości x na ryzyko P (x). Problem może stanowić brak gładkości czy chociażby ciągłości funkcji. Odpowiedzią na ten problem jest funkcja logistyczna postaci f(x) = exp( x) = exp(x) 1 + exp(x).

5 Model logistyczny opisujący zależność zmiennej binarnej y od zmiennej ciągłej x przedstawiamy w postaci P (x) = exp(β 0 + β 1 x) 1 + exp(β 0 + β 1 x). Interesująca dla nas będzie również odwrotna funkcja funkcja logit. W języku szans (odds) zmiennej y model można przedstawić również w postaci P (x) 1 P (x) = exp(β 0 + β 1 x). Jeżeli przypomnimy sytuację, w której x przyjmował wartości 0 lub 1, widzimy, że iloraz szans (odds ratio) związany z tymi wartościami wynosi P (1)/(1 P (1)) P (0)/(1 P (0)) = exp(β 1). Widzimy, że szansa y = 1 dla x = 1 wynika z mnożenia szansy dla x = 0 przez czynnik exp(β 1 ). Z tej własności wynika określenie modelu logistycznego jako multiplikatywnego modelu ryzyka. Ostatnią i w statystyce najbardziej użyteczną postacią modelu regresji logistycznej jest ( ) P (x) log = β 0 + β 1 x, 1 P (x) gdzie widzimy, że logarytm szans związany z binarnym wynikiem y (logit P (x)) jest opisany funkcją liniową ciągłego predyktora x (model logistyczny jest addytywnym modelem na skali logarytmu szans). Założenia regresji logistycznej: y ma rozkład dwupunktowy, E(y x) = P (x) jest dane funkcją logistyczną, wartości (y i ) są niezależne (próbka losowa prosta). Ponadto wśród istotnych różnic z modelem regresji liniowej: założenie o homoskedastyczności nie jest konieczne, losowa część modelu nie jest wyrażeniem addytywnym w równaniu regresji.

6 Badamy zależność wystąpienia choroby y = CHD od wieku x = age dla danych WCGS. Poniżej przedstawiono wykres rozrzutu dla 100 obserwacji. Wykorzystujemy funkcję glm() (generalized linear model). Model zadajemy tak jak model liniowy. Różnica polega na wskazaniu parametru family określającego rodzinę rozkładów zmiennej y oraz argumentu link określającego funkcję wiążącą (link function). W przypadku regresji liniowej parametr family= gaussian ; dla regresji logistycznej mamy family= binomial oraz funkcję wiążącą link= logit : wcgs.glm <- glm(chd69~age,data=wcgs,family=binomial()) summary(wcgs.glm) Wynikiem funkcji glm() jest obiekt klasy glm opisujący dopasowany (fitted) model: Call: --- glm(formula = chd69 ~ age, family = binomial(), data = wcgs) Signif. codes: Deviance Residuals: 0 *** ** 0.01 * Min 1Q Median 3Q Max (Dispersion parameter for binomial family taken to be 1) Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) < 2e-16 *** age e-11 *** Null deviance: on 3153 degrees of freedom Residual deviance: on 3152 degrees of freedom AIC: Number of Fisher Scoring iterations: 5

7 Interpretacja współczynników regresji W analizie otrzymujemy ˆβ 0 = 5.940, ˆβ 1 = Zatem ˆβ 1 = wyraża zmianę w log odds ratio CHD69 związaną ze wzrostem zmiennej age o 1 jednostkę (o 1 rok): ( ) ( ) P (56) P (55) log log = ( ) ( ) = P (56) 1 P (55) Odpowiednie odds ratio związane ze wzrostem wieku o 1 rok wynosi exp(0.074) = 1.077, zatem mamy mały, ale istotny, 8% wzrost ryzyka CHD z każdym kolejnym rokiem. Z punktu widzenia badania klinicznego bardziej istotną może być OR związane z 10-letnim wzrostem wieku, odpowiednio exp( ) = Współczynników możemy również użyć do wyznaczenia ryzyka P (x), tj. oceny prawdopodobieństwa CHD dla osoby w wieku x, np. dla osoby w wieku 55 lat P (55) = exp( ) 1 + exp( ) = > wcgs.glm.fit <- fitted(wcsg.glm) > pred.df <- data.frame(age=c(55)) > predict(wcgs.glm,pred.df,type="response",se=true) $fit $se.fit Estimated probability $residual.scale [1] Age (years)

8 > wcgs.glm <- glm(chd69~age,data=wcgs,family=binomial()) > summary(wcgs.glm) Call: glm(formula = chd69 ~ age, family = binomial(), data = wcgs) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) < 2e-16 *** age e-11 *** --- Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for binomial family taken to be 1) Null deviance: on 3153 degrees of freedom Residual deviance: on 3152 degrees of freedom AIC: Number of Fisher Scoring iterations: 5 W odpowiedzi widzimy błąd standardowy, możemy otrzymać przedziały ufności: > confint(wcgs.glm) # 95% CI using profiled likelihood Waiting for profiling to be done % 97.5 % (Intercept) age > confint.default(wcgs.glm) # 95% CI based assuming asymptotic normality 2.5 % 97.5 % (Intercept) age

9 Jeżeli przedział ufności nie zawiera 0, to oznacza to statystycznie istotną różnicę wartości współczynnika od wartości 0. z value jest ilorazem wartości estymatora i jego błędu standardowego wartością statystyki Walda. Mamy również p-value testu współczynnika (H 0 : współczynnik =0). Logarytm wiarogodności dla uzyskanego modelu uzyskujemy poleceniem >loglik(wcgs.glm) log Lik (df=2) Następnie możemy wyznaczyć wartość statystyki LR (likelihood ratio) i odpowiednie p-value > anova(wcgs.glm,test="chisq") Analysis of Deviance Table Model: binomial, link: logit Response: chd69 Terms added sequentially (first to last) Df Deviance Resid. Df Resid. Dev Pr(>Chi) NULL age e-11 *** --- Signif. codes: 0 *** ** 0.01 * Statystyka LR porównuje wiarogodność dopasowanego modelu z modelem zerowym, bez zmiennej age, badając hipotezę, że nie ma liniowej zależności pomiędzy wiekiem a ryzykiem (log odds) CHD. Wkład pary (x i, y i ) do funkcji wiarogodności dany jest poprzez P (x i ) y i [1 P (x i )] 1 y i, zatem zakładając, że obserwacje są niezależne, funkcję wiarogodności otrzymujemy jako iloczyn n L(β) = P (x i ) y i [1 P (x i )] 1 y i. Współczynniki ˆβ = ( ˆβ 0, ˆβ 1 ) maksymalizują funkcję wiarogodności L(β). Równoważnie maksymalizują funkcję logarytmu wiarogodności n log L(β) = y i P (x i ) + (1 y i ) [1 P (x i )]. i=1 i=1

10 Statystykę LR definiujemy następująco: LR = 2 log Przy założeniu hipotezy zerowej (H 0 : β 1 = 0) statystyka LR ma rozkład χ 2 (1). > wcgs0.glm <- glm(chd69~1,data=wcgs,family=binomial()) >2*(logLik(wcgs.glm)-logLik(wcgs0.glm)) log Lik (df=2) wiarogodność modelu bez zmiennej niezależnej wiarogodność modelu ze zmienną niezależną.

11 Regresja logistyczna dla kategorialnego predyktora Model regresji logistycznej jest również poprawny dla kategorialnej zmiennej niezależnej. Rozważmy nam znane już badanie ryzyka CHD od arcus senilis. Wyniki regresji logistycznej porównamy z OR dla macierzy kontyngencji. Zmienna arcus kodowana jest 0/1 i jest włączana do modelu logistycznego tak, jakby była zmienną ciągłą. Otrzymujemy poprawny wynik: współczynnik wyraża logarytm ilorazu szans związany ze wzrostem predyktora o wartość 1 (tylko wzrost o 1 jest możliwy!). Jeżeli zmienna dychotomiczna jest kodowana w inny sposób, należy zwrócić na to uwagę, by model potraktował odpowiednie wartości jak kategorie, a nie wartości zmiennej ciągłej. W drugim przykładzie rozważymy zmienną kategorialną agec o wartościach w 5 elementowym zbiorze 35 40, 41 45, 46 50, 51 55, OR dla czterech starszych grup wyznaczamy w stosunku do najmłodszej grupy referencyjnej. Otrzymamy wyniki takie jak dla tablic kontyngencji ponieważ predyktor jest kategorialny, nie dotyczą go założenia nakładane na zmienną ciągłą.

12 > table(wcgs$chd69,wcgs$arcus) Unexposed Exposed No Yes > exp(confint.default(wcgs.glm2) ) # a.norm 2.5 % 97.5 % (Intercept) arcusexposed > wcgs.glm2 <- glm(chd69~arcus,data=wcgs,family=binomial()) > summary(wcgs.glm2) Call: glm(formula = chd69 ~ arcus, family = binomial(), data = wcgs) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) < 2e-16 *** arcusexposed *** --- $measure Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for binomial family taken to be 1) Null deviance: on 3151 degrees of freedom Residual deviance: on 3150 degrees of freedom (2 observations deleted due to missingness) AIC: Number of Fisher Scoring iterations: 5 > exp(wcgs.glm2$coeff) (Intercept) arcusexposed > oddsratio(table(wcgs$chd69,wcgs$arcus),method="wald") $data Unexposed Exposed Total No Yes Total odds ratio with 95% C.I. estimate lower upper No NA NA Yes $p.value two-sided midp.exact fisher.exact chi.square No NA NA NA Yes > exp(confint(wcgs.glm2)) # p.lhood Waiting for profiling to be done % 97.5 % (Intercept) arcusexposed $correction [1] FALSE attr(,"method") [1] "Unconditional MLE & normal approximation (Wald) CI"

13 > wcgs.glm3 <- glm(chd69~as.factor(agec),data=wcgs,family=binomial()) > summary(wcgs.glm3) Call: glm(formula = chd69 ~ as.factor(agec), family = binomial(), data = wcgs) Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) < 2e-16 *** as.factor(agec) as.factor(agec) * as.factor(agec) *** as.factor(agec) e-05 *** > oddsratio(t(table(wcgs$chd69,wcgs$agec)),method="wald") > wcgs.glm3.or <- as.numeric(exp(coef(wcgs.glm3)[2:5])) $data > res <- matrix(na,nr=4,nc=3) > for (i in 2:5) { + test <- oddsratio(table(wcgs$chd69, + wcgs$agec)[,c(1,i)],method="wald") + res[i-1,] <- test$measure[2,] + } > colnames(res) <- c("or","lb-ci","ub-ci") > rownames(res) <- paste("agec",1:4,sep="_") > print(res,digits=4) OR LB-CI UB-CI agec_ agec_ agec_ agec_ No Yes Total Total $measure odds ratio with 95% C.I. estimate lower upper NA NA $p.value two-sided midp.exact fisher.exact chi.square NA NA NA e e e e e e e e e e e e-05

Regresja logistyczna. Regresja logistyczna. Przykłady DV. Wymagania

Regresja logistyczna. Regresja logistyczna. Przykłady DV. Wymagania Regresja logistyczna analiza relacji między zbiorem zmiennych niezależnych (ilościowych i dychotomicznych) a dychotomiczną zmienną zależną wyniki wyrażone są w prawdopodobieństwie przynależności do danej

Bardziej szczegółowo

Regresja liniowa wprowadzenie

Regresja liniowa wprowadzenie Regresja liniowa wprowadzenie a) Model regresji liniowej ma postać: gdzie jest zmienną objaśnianą (zależną); są zmiennymi objaśniającymi (niezależnymi); natomiast są parametrami modelu. jest składnikiem

Bardziej szczegółowo

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:

Bardziej szczegółowo

Regresja logistyczna

Regresja logistyczna Regresja logistyczna Zacznijmy od danych dotyczących tego czy studenci zostali przyjęci na studia. admissions

Bardziej szczegółowo

Założenia: wyniki są binarne próby są niezależne liczba prób n ustalona przed pomiarem to samo prawdopodobieństwo sukcesu we wszystkich próbach

Założenia: wyniki są binarne próby są niezależne liczba prób n ustalona przed pomiarem to samo prawdopodobieństwo sukcesu we wszystkich próbach Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie Test dwumianowy χ 2 test dobroci dopasowania Analiza tabeli kontygencji ( tabeli krzyżywej) P k sukcesów = n k pk (1 p) n k Założenia:

Bardziej szczegółowo

Regresja logistyczna. Regresja logistyczna. Wymagania. Przykłady DV

Regresja logistyczna. Regresja logistyczna. Wymagania. Przykłady DV Regresja logistyczna analiza relacji między zbiorem zmiennych niezależnych (ilościowych i dychotomicznych) a dychotomiczną zmienną zależną wyniki wyrażone są w prawdopodobieństwie przynależności do danej

Bardziej szczegółowo

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y 2. Współczynnik korelacji Pearsona 3. Siła i kierunek związku między zmiennymi 4. Korelacja ma sens, tylko wtedy, gdy związek między zmiennymi

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników

Bardziej szczegółowo

Regresja liniowa w R Piotr J. Sobczyk

Regresja liniowa w R Piotr J. Sobczyk Regresja liniowa w R Piotr J. Sobczyk Uwaga Poniższe notatki mają charakter roboczy. Mogą zawierać błędy. Za przesłanie mi informacji zwrotnej o zauważonych usterkach serdecznie dziękuję. Weźmy dane dotyczące

Bardziej szczegółowo

Zastosowanie uogólnionych modeli liniowych i uogólnionych mieszanych modeli liniowych do analizy danych dotyczacych występowania zębiniaków

Zastosowanie uogólnionych modeli liniowych i uogólnionych mieszanych modeli liniowych do analizy danych dotyczacych występowania zębiniaków Zastosowanie uogólnionych modeli liniowych i uogólnionych mieszanych modeli liniowych do analizy danych dotyczacych występowania zębiniaków Wojciech Niemiro, Jacek Tomczyk i Marta Zalewska Uniwersytet

Bardziej szczegółowo

Regresja logistyczna (LOGISTIC)

Regresja logistyczna (LOGISTIC) Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników

Bardziej szczegółowo

Własności statystyczne regresji liniowej. Wykład 4

Własności statystyczne regresji liniowej. Wykład 4 Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności

Bardziej szczegółowo

PAKIETY STATYSTYCZNE

PAKIETY STATYSTYCZNE . Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa

Bardziej szczegółowo

Model regresji wielokrotnej Wykład 14 ( ) Przykład ceny domów w Chicago

Model regresji wielokrotnej Wykład 14 ( ) Przykład ceny domów w Chicago Model regresji wielokrotnej Wykład 14 (4.06.2007) Przykład ceny domów w Chicago Poniżej są przedstawione dane dotyczące cen domów w Chicago (źródło: Sen, A., Srivastava, M., Regression Analysis, Springer,

Bardziej szczegółowo

Uogólniony model liniowy

Uogólniony model liniowy Uogólniony model liniowy Ogólny model liniowy y = Xb + e Każda obserwacja ma rozkład normalny Każda obserwacja ma tą samą wariancję Dane nienormalne Rozkład binomialny np. liczba chorych krów w stadzie

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9 Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności

Bardziej szczegółowo

(LMP-Liniowy model prawdopodobieństwa)

(LMP-Liniowy model prawdopodobieństwa) OGÓLNY MODEL REGRESJI BINARNEJ (LMP-Liniowy model prawdopodobieństwa) Dla k3 y α α α α + x + x + x 2 2 3 3 + α x x α x x + α x x + α x x + ε + x 4 2 5 3 6 2 3 7 2 3 Zał.: Wszystkie zmienne interakcyjne

Bardziej szczegółowo

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Analiza zależności cech ilościowych regresja liniowa (Wykład 13) Analiza zależności cech ilościowych regresja liniowa (Wykład 13) dr Mariusz Grządziel semestr letni 2012 Przykład wprowadzajacy W zbiorze danych homedata (z pakietu R-owskiego UsingR) można znaleźć ceny

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników

Bardziej szczegółowo

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2. Zadanie 1 Niech y t ma rozkład logarytmiczno normalny o funkcji gęstości postaci [ ] 1 f (y t ) = y exp (ln y t β ln x t ) 2 t 2πσ 2 2σ 2 Zakładamy, że x t jest nielosowe a y t są nieskorelowane w czasie.

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników

Bardziej szczegółowo

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego Łukasz Kończyk WMS AGH Plan prezentacji Model regresji liniowej Uogólniony model liniowy (GLM) Ryzyko ubezpieczeniowe Przykład

Bardziej szczegółowo

Permutacyjna metoda oceny istotności regresji

Permutacyjna metoda oceny istotności regresji Permutacyjna metoda oceny istotności regresji (bez założenia normalności) f

Bardziej szczegółowo

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska Anna Stankiewicz Izabela Słomska Wstęp- statystyka w politologii Rzadkie stosowanie narzędzi statystycznych Pisma Karla Poppera

Bardziej szczegółowo

KREATOR REGRESJI LOGISTYCZNEJ

KREATOR REGRESJI LOGISTYCZNEJ KREATOR REGRESJI LOGISTYCZNEJ Grzegorz Migut, StatSoft Polska Sp. z o.o. W niniejszym opracowaniu zaprezentowany zostanie przykład budowy modelu regresji logistycznej za pomocą Kreatora Regresji Logistycznej.

Bardziej szczegółowo

Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy

Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy Dane: Eksploracja (mining) Problemy: Jedna zmienna 2000 najwi ększych

Bardziej szczegółowo

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,

Bardziej szczegółowo

Ekonometria dla IiE i MSEMat Z12

Ekonometria dla IiE i MSEMat Z12 Ekonometria dla IiE i MSEMat Z12 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 09-01-2017 Test RESET Ramsey a W pierwszym etapie estymujemy współczynniki regresji w modelu:

Bardziej szczegółowo

NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR

NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR M Zalewska Zakład Profilaktyki ZagrożeńŚrodowiskowych i Alergologii Analiza niezależności zmiennych jakościowych (test niezależności Chi-kwadrat)

Bardziej szczegółowo

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,

Bardziej szczegółowo

Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej Ekonometria Modelowanie zmiennej jakościowej Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 1 / 25 Zmienna jakościowa Zmienna ilościowa może zostać zmierzona

Bardziej szczegółowo

Analiza danych ilościowych i jakościowych

Analiza danych ilościowych i jakościowych Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego 8 kwietnia 2010 Plan prezentacji 1 Zbiory danych do analiz 2 3 4 5 6 Implementacja w R Badanie depresji Depression trial data Porównanie

Bardziej szczegółowo

Ekonometria dla IiE i MSEMat Z7

Ekonometria dla IiE i MSEMat Z7 Ekonometria dla IiE i MSEMat Z7 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 21-11-2016 Na podstawie zbioru danych cps_small.dat z książki Principles of Econometrics oszacowany

Bardziej szczegółowo

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje

Bardziej szczegółowo

WYKŁAD II: Klasyfikacja logistyczna. MiNI PW

WYKŁAD II: Klasyfikacja logistyczna. MiNI PW WYKŁAD II: Klasyfikacja logistyczna MiNI PW Rozpatrywane dotąd metody klasyfikacji: LDA Fishera (liniowa reguła klasyfikacyjna); Reguła Bayesowska (jej wersja empiryczna dla rozkładów normalnych ze wspólną

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu 23 kwietnia 2014 Korelacja - wspó lczynnik korelacji 1 Gdy badamy różnego rodzaju rodzaju zjawiska (np. przyrodnicze) możemy stwierdzić, że na każde z nich ma wp lyw dzia lanie innych czynników; Korelacja

Bardziej szczegółowo

Wykład 8 Dane kategoryczne

Wykład 8 Dane kategoryczne Wykład 8 Dane kategoryczne Wrocław, 19.04.2017r Zmienne kategoryczne 1 Przykłady zmiennych kategorycznych 2 Zmienne nominalne, zmienne ordynalne (porządkowe) 3 Zmienne dychotomiczne kodowanie zmiennych

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Część 2 Hipoteza złożona Testowanie hipotez łącznych Zapis matematyczny Rozkład statystyki testowej Hipoteza łączna H 0 : Rβ = q Hipoteza złożona Testowanie hipotez łącznych Zapis matematyczny Rozkład

Bardziej szczegółowo

Quick Launch Manual:

Quick Launch Manual: egresja Odds atio Quick Launch Manual: regresja logistyczna i odds ratio Uniwesytet Warszawski, Matematyka 28.10.2009 Plan prezentacji egresja Odds atio 1 2 egresja egresja logistyczna 3 Odds atio 4 5

Bardziej szczegółowo

Rozdział 8. Regresja. Definiowanie modelu

Rozdział 8. Regresja. Definiowanie modelu Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność

Bardziej szczegółowo

Wstęp. Regresja logistyczna. Spis treści. Hipoteza. powrót

Wstęp. Regresja logistyczna. Spis treści. Hipoteza. powrót powrót Spis treści 1 Wstęp 2 Regresja logistyczna 2.1 Hipoteza 2.2 Estymacja parametrów 2.2.1 Funkcja wiarygodności 3 Uogólnione modele liniowe 3.1 Rodzina wykładnicza 3.1.1 Rozkład Bernouliego 3.1.2 Rozkład

Bardziej szczegółowo

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

Prawdopodobieństwo i statystyka r.

Prawdopodobieństwo i statystyka r. Prawdopodobieństwo i statystyka 9.06.999 r. Zadanie. Rzucamy pięcioma kośćmi do gry. Następnie rzucamy ponownie tymi kośćmi, na których nie wypadły szóstki. W trzeciej rundzie rzucamy tymi kośćmi, na których

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

Badania obserwacyjne 1

Badania obserwacyjne 1 Badania obserwacyjne 1 Chorobowość Chorobowość (ang. prevalence rate) liczba chorych w danej chwili na konkretną chorobę w określonej grupie mieszkańców (np. na 100 tys. mieszkańców). Współczynnik ten

Bardziej szczegółowo

Statystyka Matematyczna Anna Janicka

Statystyka Matematyczna Anna Janicka Statystyka Matematyczna Anna Janicka wykład X, 9.05.206 TESTOWANIE HIPOTEZ STATYSTYCZNYCH II: PORÓWNYWANIE TESTÓW Plan na dzisiaj 0. Przypomnienie potrzebnych definicji. Porównywanie testów 2. Test jednostajnie

Bardziej szczegółowo

Uogolnione modele liniowe

Uogolnione modele liniowe Uogolnione modele liniowe Jerzy Mycielski Uniwersytet Warszawski grudzien 2013 Jerzy Mycielski (Uniwersytet Warszawski) Uogolnione modele liniowe grudzien 2013 1 / 17 (generalized linear model - glm) Zakładamy,

Bardziej szczegółowo

Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017

Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017 Testowanie hipotez dla frakcji Wrocław, 29 marca 2017 Powtórzenie z rachunku prawdopodobieństwa Centralne Twierdzenie Graniczne Niech X = (X 1, X 2,..., X n ) oznacza próbę z rozkładu o średniej µ i skończonej

Bardziej szczegółowo

Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015

Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015 Testowanie hipotez dla proporcji Wrocław, 13 kwietnia 2015 Powtórka z rachunku prawdopodobieństwa Centralne Twierdzenie Graniczne Niech X = (X 1, X 2,..., X n ) oznacza próbę z rozkładu o średniej µ i

Bardziej szczegółowo

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 0/0/0. Egzamin trwa 90 minut.. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu. Złamanie

Bardziej szczegółowo

Analiza przeżycia. Czym zajmuje się analiza przeżycia? Jest to analiza czasu trwania, zaprojektowana do analizy tzw.

Analiza przeżycia. Czym zajmuje się analiza przeżycia? Jest to analiza czasu trwania, zaprojektowana do analizy tzw. ANALIZA PRZEŻYCIA Analiza przeżycia Czym zajmuje się analiza przeżycia? Jest to analiza czasu trwania, zaprojektowana do analizy tzw. danych uciętych Obserwacja jest nazywana uciętą jeżeli zdarzenie jeszcze

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie

Bardziej szczegółowo

Statystyka I. Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy)

Statystyka I. Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy) Statystyka I Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy) 1 Zmienne jakościowe qzmienne jakościowe niemierzalne kategorie: np. pracujący / bezrobotny qzmienna binarna Y=0,1 qczasami

Bardziej szczegółowo

Egzamin z ekonometrii wersja IiE, MSEMAT

Egzamin z ekonometrii wersja IiE, MSEMAT Egzamin z ekonometrii wersja IiE, MSEMAT 04-02-2016 Pytania teoretyczne 1. Za pomocą jakiego testu weryfikowana jest normalność składnika losowego? Jakiemu założeniu KMRL odpowiada w tym teście? Jakie

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re Wykład 4 Wybór najlepszej procedury. Estymacja parametrów regresji z wykorzystaniem metody bootstrap. Wrocław, 22.03.2017r Wybór najlepszej procedury - podsumowanie Co nas interesuje przed przeprowadzeniem

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Stanisław Cichocki Natalia Nehrebecka. Wykład 7 Stanisław Cichocki Natalia Nehrebecka Wykład 7 1 1. Metoda Największej Wiarygodności MNW 2. Założenia MNW 3. Własności estymatorów MNW 4. Testowanie hipotez w MNW 2 1. Metoda Największej Wiarygodności

Bardziej szczegółowo

18. Obliczyć. 9. Obliczyć iloczyn macierzy i. 10. Transponować macierz. 11. Transponować macierz. A następnie podać wymiar powstałej macierzy.

18. Obliczyć. 9. Obliczyć iloczyn macierzy i. 10. Transponować macierz. 11. Transponować macierz. A następnie podać wymiar powstałej macierzy. 1 Czy iloczyn macierzy, które nie są kwadratowe może być macierzą kwadratową? Podaj przykład 2 Czy każde dwie macierze jednostkowe są równe? Podaj przykład 3 Czy mnożenie macierzy przez macierz jednostkową

Bardziej szczegółowo

Metoda największej wiarogodności

Metoda największej wiarogodności Wprowadzenie Założenia Logarytm funkcji wiarogodności Metoda Największej Wiarogodności (MNW) jest bardziej uniwersalną niż MNK metodą szacowania wartości nieznanych parametrów Wprowadzenie Założenia Logarytm

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12 Stanisław Cichocki Natalia Nehrebecka Wykład 1 1 1. Testy diagnostyczne Testowanie stabilności parametrów modelu: test Chowa. Heteroskedastyczność Konsekwencje Testowanie heteroskedastyczności 1. Testy

Bardziej szczegółowo

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej

Bardziej szczegółowo

Rachunek Prawdopodobieństwa Anna Janicka

Rachunek Prawdopodobieństwa Anna Janicka Rachunek Prawdopodobieństwa Anna Janicka wykład XIV, 24.01.2017 ŁAŃCUCHYMARKOWA CD. KRÓTKIE INFO O RÓŻNYCH WAŻNYCH ROZKŁADACH Plan na dzisiaj Łańcuchy Markowa cd. Różne ważne rozkłady prawdopodobieństwa,

Bardziej szczegółowo

W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji.

W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji. 5 Collocations Związek frazeologiczny (kolokacja), to często używane zestawienie słów. Przykłady: strong tea, weapons of mass destruction, make up. Znaczenie całości wyrażenia, nie zawsze wynika ze znaczeń

Bardziej szczegółowo

Regresja - zadania i przykłady.

Regresja - zadania i przykłady. Regresja - zadania i przykłady. W5 e0 Zadanie 1. Poniżej zamieszczono fragmenty wydruków dotyczących dopasowania modelu regresji do zmiennej ozone w oparciu o promieniowanie (radiation), oraz w oparciu

Bardziej szczegółowo

Ekonometria Ćwiczenia 19/01/05

Ekonometria Ćwiczenia 19/01/05 Oszacowano regresję stopy bezrobocia (unemp) na wzroście realnego PKB (pkb) i stopie inflacji (cpi) oraz na zmiennych zero-jedynkowych związanymi z kwartałami (season). Regresję przeprowadzono na danych

Bardziej szczegółowo

Model Cox a. Testowanie założeń o proporcjonalnym hazardzie.

Model Cox a. Testowanie założeń o proporcjonalnym hazardzie. Model Cox a. Testowanie założeń o proporcjonalnym hazardzie. Seminarium - Statystyka w medycynie Model Cox a.. Plan 1 Wstęp Model Cox a - przypomnienie 2 Założenie proporcjonalnego hazardu 3 Metoda wizualna

Bardziej szczegółowo

Temat zajęć: ANALIZA DANYCH ZBIORU EKSPORT. Część I: analiza regresji

Temat zajęć: ANALIZA DANYCH ZBIORU EKSPORT. Część I: analiza regresji Temat zajęć: ANALIZA DANYCH ZBIORU EKSPORT Część I: analiza regresji Krok 1. Pod adresem http://zsi.tech.us.edu.pl/~nowak/adb/eksport.txt znajdziesz zbiór danych do analizy. Zapisz plik na dysku w dowolnej

Bardziej szczegółowo

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15 VII WYKŁAD STATYSTYKA 30/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 7 (c.d) WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności,

Bardziej szczegółowo

Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy

Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy Dane: 2000 największych spółek światowych z 2004 (Forbes Magazine)

Bardziej szczegółowo

Stosowana Analiza Regresji

Stosowana Analiza Regresji prostej Stosowana Wykład I 5 Października 2011 1 / 29 prostej Przykład Dane trees - wyniki pomiarów objętości (Volume), średnicy (Girth) i wysokości (Height) pni drzew. Interesuje nas zależność (o ile

Bardziej szczegółowo

Prawdopodobieństwo i statystyka r.

Prawdopodobieństwo i statystyka r. Zadanie. Niech (X, Y) ) będzie dwuwymiarową zmienną losową, o wartości oczekiwanej (μ, μ, wariancji każdej ze współrzędnych równej σ oraz kowariancji równej X Y ρσ. Staramy się obserwować niezależne realizacje

Bardziej szczegółowo

Rozkłady statystyk z próby

Rozkłady statystyk z próby Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10 Stanisław Cichocki Natalia Nehrebecka Wykład 10 1 1. Testy diagnostyczne Testowanie prawidłowości formy funkcyjnej: test RESET Testowanie normalności składników losowych: test Jarque-Berra Testowanie stabilności

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Niezawodność diagnostyka systemów laboratorium. Ćwiczenie 2

Niezawodność diagnostyka systemów laboratorium. Ćwiczenie 2 dr inż. Jacek Jarnicki doc. PWr Niezawodność diagnostyka systemów laboratorium Ćwiczenie 2 1. Treść ćwiczenia Generowanie realizacji zmiennych losowych i prezentacja graficzna wyników losowania. Symulacja

Bardziej szczegółowo

Model 1: Estymacja KMNK z wykorzystaniem 4877 obserwacji Zmienna zależna: y

Model 1: Estymacja KMNK z wykorzystaniem 4877 obserwacji Zmienna zależna: y Zadanie 1 Rozpatrujemy próbę 4877 pracowników fizycznych, którzy stracili prace w USA miedzy rokiem 1982 i 1991. Nie wszyscy bezrobotni, którym przysługuje świadczenie z tytułu ubezpieczenia od utraty

Bardziej szczegółowo

Szkice rozwiązań z R:

Szkice rozwiązań z R: Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami

Bardziej szczegółowo

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie Wyznaczanie przedziału 95%CI oznaczającego, że dla 95% prób losowych następujące nierówności są prawdziwe: X t s 0.025 n < μ < X + t s

Bardziej szczegółowo

Regresja - zadania i przykłady.

Regresja - zadania i przykłady. Regresja - zadania i przykłady. W5 e0 Zadanie 1. Poniżej zamieszczono fragmenty wydruków dotyczących dopasowania modelu regresji do zmiennej ozone w oparciu o promieniowanie (radiation), oraz w oparciu

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych 9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :

Bardziej szczegółowo

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład II 2017/2018

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład II 2017/2018 Systemy pomiarowo-diagnostyczne Metody uczenia maszynowego wykład II bogumil.konopka@pwr.edu.pl 2017/2018 Określenie rzeczywistej dokładności modelu Zbiór treningowym vs zbiór testowy Zbiór treningowy

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Natalia Nehrebecka Stanisław Cichocki. Wykład 10 Natalia Nehrebecka Stanisław Cichocki Wykład 10 1 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów

Bardziej szczegółowo

Diagnostyka w Pakiecie Stata

Diagnostyka w Pakiecie Stata Karol Kuhl Zgodnie z twierdzeniem Gaussa-Markowa, estymator MNK w KMRL jest liniowym estymatorem efektywnym i nieobciążonym, co po angielsku opisuje się za pomocą wyrażenia BLUE Best Linear Unbiased Estimator.

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8 Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów

Bardziej szczegółowo

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych STATYSTYKA MATEMATYCZNA WYKŁAD 3 Populacje i próby danych POPULACJA I PRÓBA DANYCH POPULACJA population Obserwacje dla wszystkich osobników danego gatunku / rasy PRÓBA DANYCH sample Obserwacje dotyczące

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH

PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH Wykład 1 Prosta regresja liniowa - model i estymacja parametrów. Regresja z wieloma zmiennymi - analiza, diagnostyka i interpretacja wyników. Literatura pomocnicza J. Koronacki i J. Ćwik Statystyczne systemy

Bardziej szczegółowo

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl

Bardziej szczegółowo