Estymacja i prognozowanie

Wielkość: px
Rozpocząć pokaz od strony:

Download "Estymacja i prognozowanie"

Transkrypt

1 Estymacja i prognozowanie Maciej Kostrzewski AGH Kraków 1 luty Regresja Wieloraka Motywacja: ceny mieszkań, a...? Rozwiazanie: Opis zwiazku miedzy Y a X 1 ; :::; X k. Tablica danych. y 1 x 11 : : : x 1k... y n x n1 : : : x nk Poszukujemy hiperp aszczyzny najlepiej dopasowanej do tego zbioru. Model regresji z k zmiennymi objaśniajacymi: gdzie x i0 1. y i = 0 x i0 + 1 x i1 + ::: + k x ik + " i, i = 1; :::; n Uwaga 1 0 jest odpowiednikiem wyrazu wolnego w regresji liniowej Postać macierzowa: y 1 x 10 x 11 : : : x 1k 6 4. y n 7 5 = x n0 x n1 : : : x nk k " 1. " n Y = X + " y - wektor obserwacji zmiennej objaśniajacej (nx1) (realizacja zmiennej Y ) X - macierz obserwacji zmiennych objaśniajacych (nx (1 + k)) - wektor wspó czynników ((1 + k) x1) " -wektor reszt (nx1). Dodatkowe za o zenia 2 3 x 10 : : : x 1k 6 7 X = x n0 : : : x nk 1

2 ma ustalone elementy (brak losowości) E" = 0 E"" T = 2 I rz (X) = 1 + k n Obserwacja 1 : 1. rz (X) = 1 + k 2. E" 2 i = 2 3. E" i " j = 0 dla i 6= j. 4. X jest deterministyczna ) X? " Estymacja: by = X b + e Metoda najmniejszych kwadratów: SSE = e T e = Ró zniczkujemy y minsse @ b X b T y = miny T y b = 2X T y + 2X T X b = 0 X b = y T y 2 T X T y + b T X T X b 2 b T X T y + b T X T X b X T X b = X T y (uk ad równań normalnych b = X T X 1 X T y Gdyby rzx < 1+k wówczas estymator nie jest określony jednoznacznie. Wartości teoretyczne: by = X b e = b" = y Lemat 1 Niech b = X T X 1 X T y wówczas 1. E b = 2. P b b = 2 X T X 1 by 2

3 De nicja 1 Estymator b jest najlepszym nieobcia zonym estymatorem wektora (inaczej najefektywniejszym), gdy b jest estymatorem nieobcia zonym oraz macierz T T E e e E b b jest nieujemnie okre slona, gdzie e jest dowolnym innym nieobcia zonym estymatorem. Twierdzenie 1 (Gaussa i Markowa) W modelu regresji wielorakiej najlepszym nieobcia zonym estymatorem liniowym wektora jest wektor wyznaczony metoda najmniejszych kwadratów Twierdzenie 2 Nieobcia zonym estymatorem wariancji 2 sk adnika losowego jest 1 b 2 = SSE n k 1 gdzie SSE = e T e = P n i=1 e2 i = P n i=1 (y i by i ) 2. De nicja 2 Klasyczny model normalnej regresji wielorakiej to model regresji wielorakiej z dodatkowym za o zeniem " N 0; 2 I tzn. E" = 0 oraz E"" T = 2 I Obserwacja 2 Z braku korelacji mi edzy " i i " j wynika, ze " i dla i = 1; :::; n sa niezale znymi ziennymi losowymi o rozk adach normalnych t. ze E" i = 0 oraz V ar (" i ) = 2. Wniosek 1 Niech i 2 f0; :::; kg H0 : i = c i t statystyka = b i c i t n k 1 SE bi r gdzie SE bi = 2 (X T X) 1. Jest to test dwustronny. ii Wniosek 2 W praktyce interesuje nas wp yw zmiennych niezale znych (bez wyrazu wolnego) na Y. H0 : 1 = 0; :::; k = 0 H1 : 9i 2 f0; :::; kg : i 6= 0 F statystyka = MSR MSE F k;n k 1 gdzie MSR = SSR k (k bo tyle zmiennych niezaleznych X), MSE = SSE n k 1 (bo n punktów ale k + 1 parametrów do oszacowania), SSR = P n i=1 (by i y) 2. Jest to test prawostronny. 1 Pierwiastek z niego nie jest estymatorem nieobcia zonym odchylenia. 3

4 Uwaga 2 Je sli nie mo zna odrzucíc hipotezy H0, to analiza regresji si e kończy. W przeciwnym wypadku wiemy, ze sa statystyczne podstawy, by przypuszczać, ze zachodzi zwiazek liniowy pomi edzy zmienna obja sniana i co najmniej jedna zmienna niezale zna. Uwaga 3 W praktyce przeprowadzamy najpierw test F, a dopiero potem testy t. Przedzia y ufności: Idea: estymatorwartość krytyczna*odchylenie standardowe (estymatora) Twierdzenie 3 (1 ) 100% przedzia ufno sci dla parametru i jest postaci: b i t n k 1;=2 SE bi Ćwiczenie 1 Wykonać analiz e regresji wielorakiej dla danych SMSA. Przyjać, ze zmienna Crime jest zmienna obja sniana. Rozwi zanie 1 1. Dokonać wyboru zmiennych kierujac si e intuicja 2. Zaznacz obszar 5x(1+k), nacísnij F2 wpisz =REGLINP(Zakres_Y;Zakres_X;1;1) ; CTRL+SHIFT+ENTER: b b k k b 1 k 2 ::: 0 b SE bk SE bk SE bk ::: SE b0 1 2 r 2 b ::: F df ::: SSR SSE ::: 3. Interpretacja wspó czynników 4. Wykonaj analiz e regresji korzystajac z Narz edzia>analiza Danych>Regresja (zaznaczyć tytu y) 5. Porównaj wyniki uzyskane w punktach 2 i 4: 6. Wyja snij co oznacza "Istotno sć F ". Czy "Istotno sć F "to p-value?[tak] Rozk ad.f(x)=???, a co pisza w Pomocy? 7. Dokonaj analizy istotno sci wp ywu poszczególnych zmiennych obja sniaja- cych, korzystajac z testu t, na zmienna obja sniana Y. 8. Stworzyć macierz korelacji: Narz edzia>analiza Danych>Korelacja. Przeprowadzíc dyskusj e nad doborem zmiennych obja sniajacych. Wspó liniowość: Ćwiczenie 2 Wykonać prób e analizy regresji dla dowolnych zmiennych: Y, X 1, X 2, X 3, gdzie X 3 = 0; 2X 1 0; 4X 2. 4

5 Za ó zmy, ze zmienna X k+1 wywo uje wspó liniowość po do aczeniu do modelu w którym znajduja sie X 1 ; :::; X k. Niech ta wspó liniowość wynika ze wspó zalezności tej zmiennej ze zbiorem zmiennych niezale znych. Podstawowym skutkiem wspó liniowości jest zbyt wysoka wariancja estymatorów wspó czynników regresji. Aby zmierzyć ten skutek wspó linowości oblicza si e VIF De nicja 3 Wska znik nadmiaru wariancji VIF (variance in ation factor) zwiazany ze zmienna X k+1 : 1 V IF (X k+1 ) = 1 Rk+1 2 gdzie Rk+1 2 jest warto sci a wspó czynnika R2 dla regresji gdzie zmienna zale zna jest X k+1 a zbiorem zmiennych niezale znych jest X 1 ; :::; X k. Uwaga 4 Mo zna wykazać, ze V IF jest ilorazem wariancji estymatora k+1 do wariancji tego wspó czynnika, gdyby zmienna X k+1 by a nieskorelowana z pozosta ymi, stad nazwa miary jako wska znik nadmiaru wariancji estymatora. Uwaga 5 VIF jest kolejnym wska znikiem, obok macierzy korelacji, na istnienie wspó liniowo sci. Ćwiczenie 3 Zastosować VIF jako miar e wspó liniowo sci dla danych SMSA Dobór zmiennych 1. Dobór zmiennych do modelu na podstawie zmian wspó czyn- Ćwiczenie 4 nika Rp: 2 2. Przeprowadzíc dobór zmiennych dla SMSA (ograniczyć zbiór zmiennych obja sniajacych do silnie sokrelowanych z CRIME - powy zej 0,9) metoda w przód. Cz eściowy test F Wychodzimy od modelu w którym znajduje si e ju z k l zmiennych. Chcemy sprawdzić istotność zwiazku Y oraz pewnego l elementowego podzbioru zmiennych objaśniajacych, przy za o zeniu, ze w modelu znajduje sie ju z k l zmiennych -jest to tzw. wzgl edna istotność, bo wzgl edem k l zmiennych. Model Y = X 1 + ::: + k X k + " nazywamy modelem pe nym. Model zredukowany to model zawierajacy k Statystyka: F l;n (1+k) = (SSE R SSE F ) =l MSE F l zmiennych. gdzie SSE R to SSE dla modelu zredukowanego, SSE F i MSE F = odpowiednio SSE i M SE obie obliczone dla pe nego modelu. SSE F n (1+k) to 5

6 Dobór w przód Punktem wyjścia jest model bez zmiennych. W kolejnych krokach do acza sie zmienna wg. kryterium: najwy zsza wartość testu F (równowa znemu t) przy za o zeniu, ze F jest powy zej z góry ustalonego (przez u zytkownika lub program) progu. Dobór drugiej i ewentualnie kolejnych odbywa si e za pomoca testu cześciowego F. Procedura kończy sie, gdy nie ma ju z zmiennej dla której wartość statystyki (cz esciowego F ) spe nia aby kryterium progu. Algorithm 1 1. Do modelu do aczamy zmienna X j, gdy j : F j = max ff i : i = 1; :::; kg, jt j j = max fjt i j : i = 1; :::; kg oraz p in p value (j) 2. W modelu znajduje si e wektor zmiennych,gdzie J f1; :::; kg to ich zbiór indeksów. Do acza si e do modelu X j, gdy j : F j = max ff i : i = f1; :::; kg njg gdzie F to cz e sciowy test F oraz p in p value (j) Uwaga 6 Która ze zmiennych wspó liniowych usunać z modelu? Wy aczamy t e zmienna, której usuni ecie najmniej zmniejszy R 2 Regresja krokowa Algorithm 2 1. Do modelu do aczamy zmienna X j, gdy j : F j = max ff i : i = 1; :::; kg, jt j j = max fjt i j : i = 1; :::; kg oraz p in p value (j) 2. Je sli p value (j) > p out to do aczona zmienna wykluczamy - zap etlenie algorytmu; zwrócíc uwag e na ustalenie relacji mi edzy p in a p out 3. W modelu znajduje si e wektor zmiennych,gdzie J f1; :::; kg to ich zbiór indeksów. Do acza si e do modelu X j, gdy j : F j = max ff i : i = f1; :::; kg njg gdzie F to cz e sciowy test F oraz p in p value (j) Z modelu wykluczamy X l, gdy l : F l = min ff i : i 2 Jg gdzie F to cz e sciowy test F oraz p out p value (j) 6

7 Koniec algorytmu, gdy nie ma zmiennych spe niajacych kryteria do aczenia i nie ma zmiennych spe niajacych zpe niaj acych warunki wykluczenia. Uwaga 7 1. Zwykle p in = 0; 05 i p out = 0; Gdyby p in > p out to procedura mo ze okazać sie rozbie zna, tj. w kolejnych krokach zmienna b edzie do aczana, po to by w kolejnym zostać wykluczona. Regresja jakościowa: dane Zarobki 1. Statystyki opsiowe dla zarobków m e zczyzn oraz zarobków kobiet; analiza 2. Korelacja mi edzy wykszta ceniem, a zarobkami 3. Przeprowadzić analize regresji wielorakiej - Y =zarobki, X 1 =wykszta cenie, X 2 =p eć 4. Czy na podstawie analizy regresji mo zna wyciagn ać wniosek o dyskryminacji kobiet? 5. Czy uzyskane dwie linie regresji sa do siebie równoleg e? Przyk ad 1 dane PasyBezpieczeństwa. Regresja nieliniowa: De nicja 4 Model regresji gdzie F jest dowolna funkcja. Modele regresji dzielimy na: 1. modele liniowe (by o) Y = F (X 1 ; :::; X k ), 2. modele nieliniowe linearyzowane (takie, które mo zemy sprowadzić do modeli liniowych) 3. modele nieliniowe nielinearyzowalne Modele linearyzowalne Uwaga 8 Transformacj e mo zemy odgadnać obserwujac wykresy rozrzutu zmiennej zale znej i zmiennych niezale znych. 7

8 Model Transformacja Model po transformacji Y = ax p " (f.potegowa) ln(y ) ln(y ) = ln (a) + p ln(x) + ln (") Y > Y = ab X " (f.wyk adnicza) ln (Y ) ln (Y ) = ln (a) + ln (b) X + ln (") a > Y = a 0 + a 1 X + ::: + a p X p + " X 1 = X; X 2 = X 2 ; :::; X p = X p Y = a 0 + a 1 X 1 + ::: + a p X p + " Y = a + b 1 X + " (f. hiperboliczna) X 1 = 1 X Y = a + bx 1 + " a Z = 1+be X +" (f. logistyczna) Y = 1 Z, X 1 = e X Y = 1 a + b a X a " Uwaga 9 Cz esto rezygnujemy z lepszego dopasowania na rzecz gorszego, je sli to drugie ma dobre (lepsze) merytoryczne uzasadnienie (interpretacj e) Modele nieliniowe nielinearyzowalne Modele które nie da sie przekszta cić do modeli liniowych np: Y = ab X + " Przyk ad 2 plik kombajn Regresja pozorna (ang. spurious regression) Regresja pozorna ma miejsce, gdy trend zmiennej objaśniajacej i trend zmiennej objaśnianej sa podobne. Wspó czynniki regresji przy zmiennych objaśniajacych moga być statystycznie istotnie ró zne od zera, wartość wspó czynnika deterinacji R 2 mo ze być wysoka, jednak ze zale zność ma charakter z udny, przypadkowy, pozorny - nie ma bowiem rozsadnego uzasadnienia zwiazku mi edzy zmiennymi! Przyk ad 3 Produkcja czekolady i produkcja energii - plik Komajn Przyk ad 4 Inne... Przyk ad 5 Interpretacja w modelu regresji w oparciu o Rosen (1982) "The Impact of Proposition 13 on Housing Prices in Northern California: A Test of the Interjurisdictional Capitalization Hypothesis": Problem za o zeń modelu regresji Heteroskedastyczność Wst epne badanie przeprowadzamy analizujac wykresy: (by i ; e i ), by i ; e 2 i, (numer obserwacji,ei ). Jeśli reszty rosna lub maleja wraz ze wzrostem wartości teoretycznych y to mamy przes annke za heteroskedastycznościa. Przy heteroskedastyczności estymatory MNK moga nie być efektywne. Heteroskedastyczności mo zna spróbować pozbyć si e stosujac transformacje Boxa i Coxa: y 6= 0 ln jyj = 0 1. = 1, to 1 Y 8

9 2. = 0, to ln (Y ) (stosujemy, gdy e 2 i rośnie) 3. = 1 2, to p Y 4. = 2, to Y 2 Przyk ad 6 Plik Farmakologia. Normalność. Normalność nie jest wymagana na etapie estymacji, ale jest potrzebna do wery kacji istotności parametrów. Testy t i F sa odporne na niewielkieódchylenia od normalności. Rola za o zenia o normalności zmniejsza si e przy wzrastajacej próbie. Uwaga 10 W praktyce je sli n < 15(1 + k) to przyjmuje si e, ze zbiór danych jest ma y. Wówczas wa zne jest testowanie za o zenia normalno sci. Niezale zność " i : De nicja 5 Autokorelacja zaburzenia losowego z opó znieniem rz edu l to korelacja mi edzy " i i " i l ; oznaczenie l. Uwaga 11 W praktyce najcz e sciej wyst epuje autokorelacja pierwszego rz edu Mowa tu o korelacji mi edzy sk adnikami losowymi, pojawiajaca sie w szeregach czasowych. Korelacja ta wynika z wzajemnego skorelowania pomini etych zmiennych objasniajacych, które sa reprezentowane przez sk adniki losowe (b edy). Twierdzenie 4 Test Durbina-Watsona: Za o zenia: 1. Modelu musi uwzgl edniać wyraz wolny 2. Sk adniki resztowe maja rozk ad normalny 3. W modelu nie wyst epuje zmienna opóźniona (np. nie mo zna stosować testu dla X n = 0 + X n 1 + " n ) d = P n i=2 (e i e i 1 ) 2 P n i=1 e2 i H0 : 1 = 0 H1 : 1 6= 0 brak autokorelacji H1 : 1 > 0 dodatnia autokorelacja, gdy d < 2 H1 : 1 < 0 ujemna autokorelacja, gdy d > 2 9

10 Dla H1 : 1 6= 0 oraz poziomu istotności 2 : d < d L d L d d U d U < d < 4 d U 4 d U d 4 d L 4 d L < d H1 Test nie roztrzyga H0 Test nie roztrzyga H1 Dla H1 : 1 > 0 oraz poziomu istotności : d < d L d L d d U d U < d < 4 d U 4 d U d 4 d L 4 d L < d H1 Test nie roztrzyga H0 Dla H1 : 1 < 0 oraz poziomu istotności : d < d L d L d d U d U < d < 4 d U 4 d U d 4 d L 4 d L < d H0 Test nie roztrzyga H1 Uwaga 12 Mankamentem testu jest, ze nie dla ka zdej warto sci statystyki test wskazuje na hipotez e Uwaga 13 W przypadku statystycznego udowodnienia istnienia autokorelacji wówczas wyniki analizy regresji sa niewiarygodne, rozwiazaniem jest zastosowanie uogólnionej metody najmniejszych kwadratów. Przyk ad 7 plik TestDW Przyk ad 8 Plik outliers Obserwacje nietypowe Obserwacje nietypowe inaczej obserwacje skrajne (outliers) to obserwacje istotnie ró zniace si e od pozosta ych. Dla regresji prostej wykrycie obserwacji odstajacych umo zliwia analiza wykresu. W przypadku regresji wielorakiej czasami analiza reszt oszacowanego modelu umo zliwia wykrycie obserwacji nietypowych. Uwaga 14 Idealny model nie dopuszcza do obserwacji odstajacych. W idealnym modelu ka zda z obserwacji jest typowa. Uwaga 15 Przyczyny wyst epowania danych nietypowych 1. b edy w trakcie zapisu danych 2. s aby model, który nie uwzgl ednia istotnej zmiennej obja sniajacej - mówimy o danych nietypowych dla modelu. 3. Nietypowe zjawisko/warunki w okresie badanym np. okres trwania wojny Uwaga 16 Jedna z konsekwencji wyst epowania nietypowych danych jest zmiana warto sci estymatorów. Uwaga 17 W sród danych nietypowych wyró zniamy wp ywowe i te nie majace wp ywu na estymacj e parametrów. Pierwsze z nich moga być gro zne. Algorithm 3 1. Identy kacja obserwacji odstajacych. 2. Wyznaczenie wp ywu obserwacji odstajacych na analiz e regresji. 10

11 3. Decyzja o wykluczeniu lub pozostawieniu w bazie danych przypadków odstajacych i wp ywowych. Uwaga 18 Najprostrze jest usuni ecie zmiennej odstajacej i ponowne wykonanie analizy regresji. Takie dzia anie mo ze prowadzíc do b edów. Uwaga 19 Dane nietypowe moga przyciagać p aszczyzn e regresji do siebie, a wówczas, gdy wyst epuja np. 2 nietypowe obserwacje obok siebie to ich identy- kacja jest trudna - obserwacje te nawzajem tuszuja si e. Uwaga 20 Post epowanie 1. Analiza najmniejszych i najwi ekszych warto sci ka zdej ze zmiennych obja sniajacych i obja snianej. 2. Obserwacja reszt - du ze reszty moga wskazywać na obserwacje odstajace. 3. Wewn etrznie studentyzowane reszty: e st i = e i q [1 h ii ] 1 n 1 k P n i=1 e2 i = e i p MSE [1 hii ], gdzie k to liczba zmiennych niezale znych. przyjrzeć danemu przypadkowi. Je sli je st i j > 3 to nale zy si e 4. b Y = X b = HY, H = X X T X 1 X T, e = (I H) Y, macierz kowariancji P e ie j = 2 (I H), V ar (e i ) = 2 (1 h ii ), gdzie h ii to element z diagonalii H: Mo zna pokazać, ze h ii jest odleg o scia i tego przypadku od srodka ci e zko sci danych"( sredniego przypadku)x. Im wi eksze jest h ii tym mniejsza jest wariancja b edu, gdy z V ar (e i ) = 2 (1 h ii ). W przypadku h ii = 1, to V ar (e i ) = 0, co oznacza, ze warto sć teoretyczna pokrywa si e z prawdziwa. Przypadki z du z a wielko scia h ii maja ma a wariancj e reszt, zatem ich wykrycie na podstawie wy acznie analizy du zych warto sci reszt jest niemo zliwe - jakim s rozwiazaniem jest analiza przypadków o ma ych i du zych warto sciach reszt. h ii to wska znik czy dany przypadek jest odstajacy od pozosta ych (w kontek scie zmiennych obja sniajacyh) oraz czy jest wp ywowy (na model tj.y). h ii nazywany jest d zwignia. Im wi eksza jest warto sć h ii tym jest jego wp yw na analiz e regresji jest wi ekszy, gdy z by i jest liniowa kombinacja Y z waga h ii ( Y b = HY ). Im wi eksza jest warto sć h ii tym bardziej odstajacy jest i ty przypadek, a jednocze snie wi ekszy jest jego wp yw na analiz e regresji. Wskazówka praktyczna: obserwacje uznaje si e za odstajace, gdy h ii > 2(1+k) n. Gdy h ii 0; 5 to mówimy, ze przypadek ma bardzo du z a d zwigni e (wp yw). Gdy 0; 2 < h ii < 0; 5 to mówimy o srednim wp ywie czy sredniej wielko sci d zwignii. 11

12 5. d i = y i by i(i) e i d i = 1 h ii Zauwa zmy, ze, gdy h ii ro snie to d i ro snie. 6. Studentized deleted Residuals. d i = d p i V ar (di ) = d p i MSE(i) (1 h ii ) d i = e i s n p 1 SSE (1 h ii ) e 2 i Du ze warto sci d i przemawiaj a za tym, ze i-ta obserwacja jest odstaj aca. 7. Identy kacja przypadków wp ywowych - miary DFFITS, DFBETAS i odleg o sć Cook a. DF=ró znica (di erence); FIT=dopasowanie; S=studentyzowalne (DF F IT S) i = by i by i(i) p MSE(i) h ii Miara okre sla wp yw i-tego przypadku na teoretyczna warto sć by i (tj. w sytuacji, gdy ka zdy z przypadków jest brany pod uwag e w analizie). r DF F IT S i = d i hii 1 h ii gdy h ii rosnie to jdf F IT S i j te z ro snie. Wskazówki praktyczne: dla ma ej próby lu z srednio licznej próby je sli jdf F IT S i j > 1 to mówimy, ze przypadek jest wp ywowy; dla licznej to mówimy, ze przypadek jest wp y- q próby je si jdf F IT S i j > 2 wowy Odleg o sć Cooka 1+k n b b (i) T X T X b b (i) D i = (1 + k) MSE F (1 + k; n 1 k) b (i) jest wektorem parametrów wyestymowanych bez uwzgl ednienia i- tego przypadku. Miar e t e mo zna obliczyć dla pe nego modelu, gdy z " # e 2 i h ii D i = (1 + k) MSE (1 h ii ) 2 12

13 Wraz ze wzrostem e i lub h ii ro snie D i. Wskazówka praktyczna : P (F < D i ) = p, gdzie F F (1+k; n 1 k) to je sli p < 0; 2 to i-ty przypadek ma ma y wp yw na model, je sli p > 0; 5 to i-ty przypadek ma du zy wp yw na model. Uwaga 21 Jesli obserwacja jest nietypowa i nie ma uzasadnienia, ze jest wynikiem b edu gromadzenia danych oraz nie ma sensownej interpretacji jej wystepowania. Wówczas o wiele lepszym posunieciem ni z jej eliminacja jest zmniejszenie jej wp ywu. Je sli obserw. odst. dotyczy jednej ze zmiennych niezale nych wówczas nale zy zastosowac transformacje zmiennych tj logarytm, pierw. kwadratowy i inne. Oczywiscie to mam sens jesli transformacja nie zrodzi innych problemów. Uwaga 22 Excel w kolumnie Std. sk adniki resztowe"podaje: q e i 1 n 1 P n i=1 e2 i 13

1 Regresja liniowa cz. I

1 Regresja liniowa cz. I Regresja liniowa cz. I. Model statystyczny Model statystyczny to zbiór za o zeń. Wprowadzamy model, który mo zliwie najlepiej opisuje ineresujacy ¾ nas fragment rzeczywistość. B ¾edy modelu wynikaja¾ z

Bardziej szczegółowo

Wyk ad II. Stacjonarne szeregi czasowe.

Wyk ad II. Stacjonarne szeregi czasowe. Wyk ad II. Stacjonarne szeregi czasowe. W wi ekszości przypadków poszukiwanie modelu, który dok adnie by opisywa zachowanie sk adnika losowego " t, polega na analizie pewnej klasy losowych ciagów czasowych

Bardziej szczegółowo

1 Rozk ad normalny. Szczególnym przypadkiem jest standardowy rozk ad normalny N (0; 1), wartości

1 Rozk ad normalny. Szczególnym przypadkiem jest standardowy rozk ad normalny N (0; 1), wartości Studia podyplomowe w zakresie technik internetowych i komputerowej analizy danych Podstawy statystyki matematycznej Adam Kiersztyn 2 godziny lekcyjne 2011-10-23 8.20-9.50 1 Rozk ad normalny Jednym z najwa

Bardziej szczegółowo

1 Praktyczne metody wyznaczania podstawowych miar bez zastosowania komputerów

1 Praktyczne metody wyznaczania podstawowych miar bez zastosowania komputerów Kurs w zakresie zaawansowanych metod komputerowej analizy danych Podstawy statystycznej analizy danych 8.03.014 - godziny ćwiczeń autor: Adam Kiersztyn 1 Praktyczne metody wyznaczania podstawowych miar

Bardziej szczegółowo

Funkcje dwóch zmiennych

Funkcje dwóch zmiennych Funkcje dwóch zmiennych Je zeli ka zdemu punktowi P o wspó rzednych x; y) z pewnego obszaru D na p aszczyźnie R 2 przyporzadkujemy w sposób jednoznaczny liczb e rzeczywista z, to przyporzadkowanie to nazywamy

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych round Testowanie hipotez statystycznych Wyk lad 9 Natalia Nehrebecka Stanis law Cichocki 13 grudnia 2014 Plan zajeć 1 Rozk lad estymatora b Rozk lad sumy kwadratów reszt 2 Hipotezy proste - test t Badanie

Bardziej szczegółowo

1 Miary asymetrii i koncentracji

1 Miary asymetrii i koncentracji Studia podyplomowe w zakresie technik internetowych i komputerowej analizy danych Podstawy statystyki opisowej Adam Kiersztyn 3 godziny lekcyjne 2011-10-22 10.10-12.30 1 Miary asymetrii i koncentracji

Bardziej szczegółowo

Rozdział 8. Regresja. Definiowanie modelu

Rozdział 8. Regresja. Definiowanie modelu Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność

Bardziej szczegółowo

Pochodne cz ¾astkowe i ich zastosowanie.

Pochodne cz ¾astkowe i ich zastosowanie. Pochodne cz ¾astkowe i ich zastosowanie. Adam Kiersztyn Lublin 2013 Adam Kiersztyn () Pochodne cz ¾astkowe i ich zastosowanie. maj 2013 1 / 18 Zanim przejdziemy do omawiania pochodnych funkcji wielu zmiennych

Bardziej szczegółowo

1 Wieloczynnikowa analiza wariancji

1 Wieloczynnikowa analiza wariancji Studia podyplomowe w zakresie technik internetowych i komputerowej analizy danych Statystyczna analiza danych Adam Kiersztyn 5 godzin lekcyjnych 2012-02-04 13.00-17.00 1 Wieloczynnikowa analiza wariancji

Bardziej szczegółowo

Równania ró znicowe wg A. Ostoja - Ostaszewski "Matematyka w ekonomii. Modele i metody".

Równania ró znicowe wg A. Ostoja - Ostaszewski Matematyka w ekonomii. Modele i metody. Równania ró znicowe wg A. Ostoja - Ostaszewski "Matematyka w ekonomii. Modele i metody". Przyk ad. Za ó zmy, ze w chwili t = 0 populacja liczy P 0 osób. Roczny wskaźnik urodzeń wynosi b = 00, a roczna

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Testowanie hipotez statystycznych Wyk lad 8 Natalia Nehrebecka Stanis law Cichocki 29 listopada 2015 Plan zajeć 1 Rozk lad estymatora b Rozk lad sumy kwadratów reszt 2 Hipotezy proste - test t Badanie

Bardziej szczegółowo

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować

Bardziej szczegółowo

O zgodności procedur jednoczesnego testowania zastosowanych do problemu selekcji zmiennych w modelu liniowym

O zgodności procedur jednoczesnego testowania zastosowanych do problemu selekcji zmiennych w modelu liniowym O zgodności procedur jednoczesnego testowania zastosowanych do problemu selekcji zmiennych w modelu liniowym Konrad Furmańczyk Katedra Zastosowań Matematyki SGGW Wis a 2010 Plan referatu 1. Modele liniowe

Bardziej szczegółowo

Rozdzia 5. Uog lniona metoda najmniejszych kwadrat w : ::::::::::::: Podstawy uog lnionej metody najmniejszych kwadrat w :::::: Zastos

Rozdzia 5. Uog lniona metoda najmniejszych kwadrat w : ::::::::::::: Podstawy uog lnionej metody najmniejszych kwadrat w :::::: Zastos Spis tre ci PRZEDMOWA :::::::::::::::::::::::::::::::::::::::::::::::::::::::: 11 CZ I. Wprowadzenie do modelowania ekonometrycznego ::::::::::: 13 Rozdzia 1. Modelowanie ekonometryczne ::::::::::::::::::::::::::::::

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Testowanie hipotez statystycznych Wyk lad 9 Natalia Nehrebecka Stanis law Cichocki 28 listopada 2018 Plan zaj eć 1 Rozk lad estymatora b 2 3 dla parametrów 4 Hipotezy l aczne - test F 5 Dodatkowe za lożenie

Bardziej szczegółowo

1 Analiza wariancji H 1 : 1 6= 2 _ 1 6= 3 _ 1 6= 4 _ 2 6= 3 _ 2 6= 4 _ 3 6= 4

1 Analiza wariancji H 1 : 1 6= 2 _ 1 6= 3 _ 1 6= 4 _ 2 6= 3 _ 2 6= 4 _ 3 6= 4 Studia podyplomowe w zakresie technik internetowych i komputerowej analizy danych Statystyczna analiza danych Adam Kiersztyn 5 godzin lekcyjnych 2012-02-04 13.00-17.00 1 Analiza wariancji Na wst¾epie zapoznamy

Bardziej szczegółowo

1 Poj ¾ecie szeregu czasowego

1 Poj ¾ecie szeregu czasowego Studia podyplomowe w zakresie przetwarzania, zarz¾adzania i statystycznej analizy danych Analiza szeregów czasowych 24.11.2013-2 godziny konwersatorium autor: Adam Kiersztyn 1 Poj ¾ecie szeregu czasowego

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA. Dariusz Gozdowski. Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW

Statystyczna analiza danych w programie STATISTICA. Dariusz Gozdowski. Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Statystyczna analiza danych w programie STATISTICA ( 4 (wykład Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Regresja prosta liniowa Regresja prosta jest

Bardziej szczegółowo

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ Dana jest populacja generalna, w której dwuwymiarowa cecha (zmienna losowa) (X, Y ) ma pewien dwuwymiarowy rozk lad. Miara korelacji liniowej dla zmiennych (X, Y

Bardziej szczegółowo

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y). Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych

Bardziej szczegółowo

Własności statystyczne regresji liniowej. Wykład 4

Własności statystyczne regresji liniowej. Wykład 4 Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Wyznaczniki, macierz odwrotna, równania macierzowe

Wyznaczniki, macierz odwrotna, równania macierzowe Wyznaczniki, macierz odwrotna, równania macierzowe Adam Kiersztyn Katolicki Uniwersytet Lubelski Jana Paw a II Lublin 013 Adam Kiersztyn (KUL) Wyznaczniki, macierz odwrotna, równania macierzowe marzec

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

1 Praktyczne metody wyznaczania podstawowych miar przy zastosowaniu programu EXCEL

1 Praktyczne metody wyznaczania podstawowych miar przy zastosowaniu programu EXCEL Kurs w zakresie zaawansowanych metod komputerowej analizy danych Podstawy statystycznej analizy danych 9.03.2014-3 godziny ćwiczeń autor: Adam Kiersztyn 1 Praktyczne metody wyznaczania podstawowych miar

Bardziej szczegółowo

Ocena ryzyka kredytowego

Ocena ryzyka kredytowego Marcin Studniarski http://math.uni.lodz.pl/marstud/ marstud@math.uni.lodz.pl Ocena ryzyka kredytowego (semestr letni 2013/14) 1 Informacje wst epne Celem tego rozdzia u jest powtórzenie pewnych wiadomości

Bardziej szczegółowo

1 Testy statystyczne. 2 Rodzaje testów

1 Testy statystyczne. 2 Rodzaje testów 1 Testy statystyczne Podczas sprawdzania hipotez statystycznych moga¾ wystapić ¾ dwa rodzaje b ¾edów. Prawdopodobieństwo b ¾edu polegajacego ¾ na odrzuceniu hipotezy zerowej (H 0 ), gdy jest ona prawdziwa,

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu 23 kwietnia 2014 Korelacja - wspó lczynnik korelacji 1 Gdy badamy różnego rodzaju rodzaju zjawiska (np. przyrodnicze) możemy stwierdzić, że na każde z nich ma wp lyw dzia lanie innych czynników; Korelacja

Bardziej szczegółowo

Ekstrema funkcji wielu zmiennych.

Ekstrema funkcji wielu zmiennych. Ekstrema funkcji wielu zmiennych. Adam Kiersztyn Lublin 2013 Adam Kiersztyn () Ekstrema funkcji wielu zmiennych. kwiecień 2013 1 / 13 Niech dana b ¾edzie funkcja f (x, y) określona w pewnym otoczeniu punktu

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu 31 marca 2014 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś

Bardziej szczegółowo

Powtórzenie wiadomości z rachunku prawdopodobieństwa i statystyki.

Powtórzenie wiadomości z rachunku prawdopodobieństwa i statystyki. Powtórzenie wiadomości z rachunku prawdopodobieństwa i statystyki. Zaj ecia 5 Natalia Nehrebeceka 04 maja, 2010 Plan zaj eć 1 Rachunek prawdopodobieństwa Wektor losowy Wartość oczekiwana Wariancja Odchylenie

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji

Bardziej szczegółowo

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres

Bardziej szczegółowo

1 Próba a populacja. Nasze rozwa zania zaczniemy od przedyskutowania podstawowych poj ¾eć statystycznych,

1 Próba a populacja. Nasze rozwa zania zaczniemy od przedyskutowania podstawowych poj ¾eć statystycznych, Kurs w zakresie zaawansowanych metod komputerowej analizy danych Podstawy statystycznej analizy danych 9.03.04 - godziny konwersatorium autor Adam Kiersztyn Próba a populacja Nasze rozwa zania zaczniemy

Bardziej szczegółowo

Analiza regresji - weryfikacja założeń

Analiza regresji - weryfikacja założeń Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu 29 marca 2011 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów 5. Testowanie

Bardziej szczegółowo

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13 Stanisław Cichocki Natalia Neherbecka Zajęcia 13 1 1. Kryteria informacyjne 2. Testowanie autokorelacji 3. Modele dynamiczne: modele o rozłożonych opóźnieniach (DL) modele autoregresyjne o rozłożonych

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

(wymiar macierzy trójk¹tnej jest równy liczbie elementów na g³ównej przek¹tnej). Z twierdzen 1 > 0. Zatem dla zale noœci

(wymiar macierzy trójk¹tnej jest równy liczbie elementów na g³ównej przek¹tnej). Z twierdzen 1 > 0. Zatem dla zale noœci 56 Za³ó my, e twierdzenie jest prawdziwe dla macierzy dodatnio okreœlonej stopnia n 1. Macierz A dodatnio okreœlon¹ stopnia n mo na zapisaæ w postaci n 1 gdzie A n 1 oznacza macierz dodatnio okreœlon¹

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8 Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów

Bardziej szczegółowo

1 Wieloczynnikowa analiza wariancji ciag ¾ dalszy

1 Wieloczynnikowa analiza wariancji ciag ¾ dalszy Studia podyplomowe w zakresie technik internetowych i komputerowej analizy danych Wielowymiarowa analiza danych Adam Kiersztyn 5 godzin lekcyjnych 2012-03-18 08.20-12.30 1 Wieloczynnikowa analiza wariancji

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Ze względu na jakość uzyskiwanych ocen parametrów strukturalnych modelu oraz weryfikację modelu, metoda najmniejszych

Bardziej szczegółowo

Egzamin z ekonometrii wersja IiE, MSEMAT

Egzamin z ekonometrii wersja IiE, MSEMAT Egzamin z ekonometrii wersja IiE, MSEMAT 04-02-2016 Pytania teoretyczne 1. Za pomocą jakiego testu weryfikowana jest normalność składnika losowego? Jakiemu założeniu KMRL odpowiada w tym teście? Jakie

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Ćwiczenia IV

Ćwiczenia IV Ćwiczenia IV - 17.10.2007 1. Spośród podanych macierzy X wskaż te, których nie można wykorzystać do estymacji MNK parametrów modelu ekonometrycznego postaci y = β 0 + β 1 x 1 + β 2 x 2 + ε 2. Na podstawie

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna Badanie współzależności zmiennych Uwzględniając ilość zmiennych otrzymamy 4 odmiany zależności: Zmienna zależna jednowymiarowa oraz jedna

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13 Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Autokorelacja Konsekwencje Testowanie autokorelacji 2. Metody radzenia sobie z heteroskedastycznością i autokorelacją Uogólniona Metoda Najmniejszych

Bardziej szczegółowo

E k o n o m e t r i a S t r o n a 1

E k o n o m e t r i a S t r o n a 1 E k o n o m e t r i a S t r o n a Liniowy model ekonometryczny Jednorównaniowy liniowy model ekonometryczny (model regresji wielorakiej) można zapisać w postaci: y = α + α x + α x +... + α x + ε, t =,,...,

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12 Stanisław Cichocki Natalia Nehrebecka Wykład 12 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne 2. Autokorelacja o Testowanie autokorelacji 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne

Bardziej szczegółowo

Zmienne zależne i niezależne

Zmienne zależne i niezależne Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,

Bardziej szczegółowo

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej Ekonometria Ćwiczenia nr 3 Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Ćwiczenia 3 Własności składnika losowego 1 / 18 Agenda KMNK przypomnienie 1 KMNK przypomnienie 2 3 4 Jakub Mućk

Bardziej szczegółowo

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej Ekonometria Wprowadzenie do modelowania ekonometrycznego Estymator Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 1 Estymator 1 / 16 Agenda 1 Literatura Zaliczenie przedmiotu 2 Model

Bardziej szczegółowo

Prognozowanie na podstawie modelu ekonometrycznego

Prognozowanie na podstawie modelu ekonometrycznego Prognozowanie na podstawie modelu ekonometrycznego Przykład. Firma usługowa świadcząca usługi doradcze w ostatnich kwartałach (t) odnotowała wynik finansowy (yt - tys. zł), obsługując liczbę klientów (x1t)

Bardziej szczegółowo

1 Rekodowanie w podgrupach i obliczanie wartości w podgrupach

1 Rekodowanie w podgrupach i obliczanie wartości w podgrupach 1 Rekodowanie w podgrupach i obliczanie wartości w podgrupach Czasami chcemy rekodować jedynie cz ¾eść danych zawartych w pewnym zbiorze. W takim przypadku stosujemy rekodowanie z zastosowaniem warunku

Bardziej szczegółowo

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota Ekonometria ćwiczenia 3 Prowadzący: Sebastian Czarnota Strona - niezbędnik http://sebastianczarnota.com/sgh/ Normalność rozkładu składnika losowego Brak normalności rozkładu nie odbija się na jakości otrzymywanych

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu 22 marca 2011 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś

Bardziej szczegółowo

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne Egzamin z ekonometrii wersja ogólna 31-01-2014 Pytania teoretyczne 1. Podać postać przekształcenia Boxa-Coxa i wyjaśnić, do czego jest stosowane w ekonometrii. 2. Porównaj zastosowania znanych ci kontrastów

Bardziej szczegółowo

Ekonometria. Zajęcia

Ekonometria. Zajęcia Ekonometria Zajęcia 16.05.2018 Wstęp hipoteza itp. Model gęstości zaludnienia ( model gradientu gęstości ) zakłada, że gęstość zaludnienia zależy od odległości od okręgu centralnego: y t = Ae βx t (1)

Bardziej szczegółowo

Metody Ilościowe w Socjologii

Metody Ilościowe w Socjologii Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona Sprawdzanie założeń przyjętych o modelu (etap IIIC przyjętego schematu modelowania regresyjnego) 1. Szum 2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9 Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności

Bardziej szczegółowo

Analiza autokorelacji

Analiza autokorelacji Analiza autokorelacji Oblicza się wartości współczynników korelacji między y t oraz y t-i (dla i=1,2,...,k), czyli współczynniki autokorelacji różnych rzędów. Bada się statystyczną istotność tych współczynników.

Bardziej szczegółowo

Niestacjonarne zmienne czasowe własności i testowanie

Niestacjonarne zmienne czasowe własności i testowanie Materiał dla studentów Niestacjonarne zmienne czasowe własności i testowanie (studium przypadku) Część 3: Przykłady testowania niestacjonarności Nazwa przedmiotu: ekonometria finansowa I (22204), analiza

Bardziej szczegółowo

Przykład 2. Stopa bezrobocia

Przykład 2. Stopa bezrobocia Przykład 2 Stopa bezrobocia Stopa bezrobocia. Komentarz: model ekonometryczny stopy bezrobocia w Polsce jest modelem nieliniowym autoregresyjnym. Podobnie jak model podaŝy pieniądza zbudowany został w

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

3. Modele tendencji czasowej w prognozowaniu

3. Modele tendencji czasowej w prognozowaniu II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

Podstawowe pojęcia: Populacja. Populacja skończona zawiera skończoną liczbę jednostek statystycznych

Podstawowe pojęcia: Populacja. Populacja skończona zawiera skończoną liczbę jednostek statystycznych Podstawowe pojęcia: Badanie statystyczne - zespół czynności zmierzających do uzyskania za pomocą metod statystycznych informacji charakteryzujących interesującą nas zbiorowość (populację generalną) Populacja

Bardziej szczegółowo

Wprowadzenie do równań ró znicowych i ró zniczkowych.

Wprowadzenie do równań ró znicowych i ró zniczkowych. Wprowadzenie do równań ró znicowych i ró zniczkowych. Adam Kiersztyn Lublin 2013 Adam Kiersztyn () Wprowadzenie do równań ró znicowych i ró zniczkowych. maj 2013 1 / 11 Przyjmijmy nast ¾epuj ¾ace oznaczenia:

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, 2018 Spis treści Przedmowa 13 O Autorach 15 Przedmowa od Tłumacza 17 1. Wprowadzenie i statystyka opisowa 19 1.1.

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14 Stanisław Cichocki Natalia Nehrebecka Wykład 14 1 1.Problemy z danymi Współliniowość 2. Heteroskedastyczność i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji Metody radzenia sobie z heteroskedastycznością

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno WERYFIKACJA MODELI MODELE LINIOWE Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno ANALIZA KORELACJI LINIOWEJ to NIE JEST badanie związku przyczynowo-skutkowego, Badanie współwystępowania cech (czy istnieje

Bardziej szczegółowo

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31 Statystyka Wykład 8 Magdalena Alama-Bućko 10 kwietnia 2017 Magdalena Alama-Bućko Statystyka 10 kwietnia 2017 1 / 31 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13 Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Testowanie autokorelacji 2. Heteroskedastyczność i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji 3.Problemy z danymi Zmienne pominięte

Bardziej szczegółowo

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE ZADANIE 1 Oszacowano zależność między luką popytowa a stopą inflacji dla gospodarki niemieckiej. Wyniki estymacji są następujące: Estymacja KMNK,

Bardziej szczegółowo

Normy wektorów i macierzy

Normy wektorów i macierzy Rozdzia l 3 Normy wektorów i macierzy W tym rozdziale zak ladamy, że K C. 3.1 Ogólna definicja normy Niech ψ : K m,n [0, + ) b edzie przekszta lceniem spe lniaj acym warunki: (i) A K m,n ψ(a) = 0 A = 0,

Bardziej szczegółowo

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35 Statystyka Wykład 7 Magdalena Alama-Bućko 16 kwietnia 2017 Magdalena Alama-Bućko Statystyka 16 kwietnia 2017 1 / 35 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

Wyk lad 7 Metoda eliminacji Gaussa. Wzory Cramera

Wyk lad 7 Metoda eliminacji Gaussa. Wzory Cramera Wyk lad 7 Metoda eliminacji Gaussa Wzory Cramera Metoda eliminacji Gaussa Metoda eliminacji Gaussa polega na znalezieniu dla danego uk ladu a x + a 2 x 2 + + a n x n = b a 2 x + a 22 x 2 + + a 2n x n =

Bardziej szczegółowo

1 Modele ADL - interpretacja współczynników

1 Modele ADL - interpretacja współczynników 1 Modele ADL - interpretacja współczynników ZADANIE 1.1 Dany jest proces DL następującej postaci: y t = µ + β 0 x t + β 1 x t 1 + ε t. 1. Wyjaśnić, jaka jest intepretacja współczynników β 0 i β 1. 2. Pokazać

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu lista nr 7

Statystyka w analizie i planowaniu eksperymentu lista nr 7 Statystyka w analizie i planowaniu eksperymentu lista nr 7 1 B l edy pomiaru Wskutek niedoskona lości przyrzadów jak również niedoskona lości naszych zmys lów - wszystkie pomiary sa dokonywane z określonym

Bardziej szczegółowo

Stanisław Cihcocki. Natalia Nehrebecka

Stanisław Cihcocki. Natalia Nehrebecka Stanisław Cihcocki Natalia Nehrebecka 1 1. Kryteria informacyjne 2. Testowanie autokorelacji w modelu 3. Modele dynamiczne: modele o rozłożonych opóźnieniach (DL) modele autoregresyjne o rozłożonych opóźnieniach

Bardziej szczegółowo

IV. UK ADY RÓWNAÑ LINIOWYCH

IV. UK ADY RÓWNAÑ LINIOWYCH IV. UK ADY RÓWNAÑ LINIOWYCH 4.1. Wprowadzenie Uk³ad równañ liniowych gdzie A oznacza dan¹ macierz o wymiarze n n, a b dany n-elementowy wektor, mo e byæ rozwi¹zany w skoñczonej liczbie kroków za pomoc¹

Bardziej szczegółowo

ANALIZA REGRESJI WIELOKROTNEJ. Zastosowanie statystyki w bioinżynierii Ćwiczenia 8

ANALIZA REGRESJI WIELOKROTNEJ. Zastosowanie statystyki w bioinżynierii Ćwiczenia 8 ANALIZA REGRESJI WIELOKROTNEJ Zastosowanie statystyki w bioinżynierii Ćwiczenia 8 ZADANIE 1A 1. Irysy: Sprawdź zależność długości płatków korony od ich szerokości Utwórz wykres punktowy Wyznacz współczynnik

Bardziej szczegółowo

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący

Bardziej szczegółowo

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007 Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja

Bardziej szczegółowo

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Analiza zależności cech ilościowych regresja liniowa (Wykład 13) Analiza zależności cech ilościowych regresja liniowa (Wykład 13) dr Mariusz Grządziel semestr letni 2012 Przykład wprowadzajacy W zbiorze danych homedata (z pakietu R-owskiego UsingR) można znaleźć ceny

Bardziej szczegółowo

4. Średnia i autoregresja zmiennej prognozowanej

4. Średnia i autoregresja zmiennej prognozowanej 4. Średnia i autoregresja zmiennej prognozowanej 1. Średnia w próbie uczącej Własności: y = y = 1 N y = y t = 1, 2, T s = s = 1 N 1 y y R = 0 v = s 1 +, 2. Przykład. Miesięczna sprzedaż żelazek (szt.)

Bardziej szczegółowo

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych 3.1. Estymacja parametrów i ocena dopasowania modeli z jedną zmienną 23. Właściciel komisu w celu zbadania

Bardziej szczegółowo