Przyjazdy turystów zagranicznych do Polski miesięcznie od 2005 roku do 2009 roku modelowanie ekonometryczne

Wielkość: px
Rozpocząć pokaz od strony:

Download "Przyjazdy turystów zagranicznych do Polski miesięcznie od 2005 roku do 2009 roku modelowanie ekonometryczne"

Transkrypt

1 Dawid Twardowski Wrocław, dnia 6 czerwca 2010 Przyjazdy turystów zagranicznych do Polski miesięcznie od 2005 roku do 2009 roku modelowanie ekonometryczne Spis treści Spis treści... 1 Struktura projektu... 2 Zmienne zastosowane w modelu... 4 Dobór zmiennych objaśniających do modelu po przez eliminację nieistotnych zmiennych Metoda analizy współczynników korelacji...10 Weryfikacja najlepszego modelu strukturalnego...18 Modyfikacje modelu strukturalnego...22 Model na zmiennych opóźnionych na Y rząd opóźnieo Model strukturalny z czasem...34 Dodawanie zmiennej czas do wszystkich zmiennych objaśniających...34 Dodawanie zmiennej czas do ostatecznego modelu strukturalnego...36 Model czystej tendencji rozwojowej...36 Model oparty na funkcji kwadratowej wielomianowej...40 Modyfikacja nieliniowego modelu trendu...45 Model nieliniowego trendu ze zmiennymi sztucznymi...49 Model na przyrostach Test pierwiastka jednostkowego...55 Model ARIMA (model losowy)...56 Kointegracja...57

2 Struktura projektu W poniższym projekcie szacowanie modeli odbyło się za pomocą pakietu statystycznego GRETL. Najpierw został utworzony model strukturalny, a następnie jego modyfikacje, model z czasem, model trendu, nieliniowy model trendu i model na przyrostach. W każdym przypadku sprawdzam stosowalnośd założeo KMNK estymatora, opierającego się na założeniach: - średnia wartośd zakłóceo wynosi 0, Do weryfikacji testu o wartości oczekiwanej reszt = 0 przyjąłem następujące hipotezy: H₀ : μ = 0 H₁ : μ 0 Ponieważ H₁ : μ 0, występuje dwustronny obszar krytyczny obszar odrzucenia. Hipotezę zerową odrzuca się, gdy z z - składnik losowy jest homoscedastyczny, Hipotezą, którą również należy zweryfikowad jest homoscedastycznośd składnika losowego. W tym celu wykorzystywany jest test White a. Niska wartośd p wyliczona z tego testu oznacza, że są podstawy do odrzucenia H 0, czyli składnik losowy jest heteroscedastyczny, natomiast wysoka wartośd oznacza, że nie ma podstaw do odrzucenia H 0, a więc składnik losowy nie jest heteroscedastyczny. Kolejnym testem weryfikującym czy zachodzi homoscedastycznośd jest test Goldfielda Quandtta o hipotezach: 2 2 H 0 : ; ( ). H 1 : Jeżeli F F * nie ma podstaw do odrzucenia hipotezy H 0, wariancja odchyleo losowych jest stała; jeżeli F F * odrzucamy H 0 na rzecz hipotezy alternatywnej, wariancja odchyleo losowych zmienia się w czasie. Zatem F e <F*, co oznacza, że nie ma podstaw do odrzucenia hipotezy zerowej, czyli składnik losowy jest homoscedastyczny. Podobnie zachodzi dla pozostałych podziałów. Ostatnim wykorzystywanym testem do zweryfikowania homoscedastyczności jest test Breuscha- Pagan a. - nie występuje autokorelacja składnika losowego, Hipotezę o występowaniu autokorelacji składnika losowego pozwala zweryfikowad test Durbina-Watsona: α 2 Statystyka testowa D-W postaci: D W H 0 : p( H 1 : p( n 1 i 1, ) 0 i i j, ) 0 e i 1. j e i 2 n i 1 e 2 i 1 - składnik losowy ma rozkład normalny, Aby ocenid czy składnik losowy ma rozkład normalny przyjąłem hipotezy: H 0 : e N H 1 : e N Test normalności reszt oparty jest na statystyce testowej postaci: S W n 2 i 1 a n 2 2 n i 1 ( e( n i 1) e( i) ) ( ei e) i 1 1 2

3 Niska wartośd p oznacza, że są podstawy do odrzucenia H 0, czyli składnik losowy nie ma rozkładu normalnego, natomiast wartośd przekraczająca zakładany poziom krytyczny, oznacza że nie ma podstaw do odrzucenia H 0, a wtedy składnik losowy ma rozklad normalny. - zmienne objaśniające nie są losowe lub są nieskorelowane z zakłóceniami Na podstawie oceny wzrokowej wykresów rozrzutu X-Y podejmuję decyzję o istnieniu, bądź nie korelacji pomiędzy zakłóceniami a zmiennymi objaśniającymi pochodzącymi z modelu. - reszty modelu są losowe Do sprawdzenia czy składnik losowy jest losowy posługuję się testem serii (dla dodatnich i ujemnych serii). Hipotezą zerowa jest losowośd reszt, a hipotezą alternatywną jest brak tej losowości. 3

4 Wyk_ob_cudz Wyk_ob Przyjazd_cudz Zmienne zastosowane w modelu Za zmienną objaśnianą przyjąłem: Przyjazd_cudz Miesięczne przyjazdy turystów *podane w milionach+ w latach Przyjazdy turystów do Polski w badanym okresie charakteryzują się sezonowością. Najwięcej przyjazdów notuje się w okresie letnim (czerwiec wrzesieo). Największa liczba przyjazdów wyniosła w sierpniu 2005 roku cudzoziemców. Średnio w całym okresie przyjechało turystów zagranicy. Za zmienne objaśniające zjawisko przyjąłem: Wyk_ob Wykorzystanie turystycznych obiektów zbiorowego zakwaterowania 2.4e e+006 2e e+006 Średnie wykorzystanie w całym okresie wyniosło Charakteryzuje się sezonowością. Tutaj również największe wykorzystanie przypada na letnie miesiące. Największe wykorzystanie obiektów przypadło na sierpieo 2008 roku e e e+006 1e Wyk_ob_cudz Turyści zagraniczni korzystający z turystycznych obiektów zbiorowego zakwaterowania Wartości charakteryzują się sezonowością. Największa ilośd turystów zagranicznych korzystający z obiektów zakwaterowania wyniosła w sierpniu 2005 roku Średnia ilośd wyniosła

5 Przewozy_og r_opad r_temp Lud_Pol Lud_Pol Liczba ludności zamieszkałej w Polsce *podana w tysiącach Średnia liczba ludności Polski w badanym okresie wynosiła Drastyczny spadek zanotowano w maju 2007 roku ( ) r_temp Średnia temperatura powietrza *podana w o C] średnia z głównych ośrodków meteorologicznych w Polsce Średnia temperatura powietrza w Polsce największe wartości przybiera w okresach letnich, natomiast w okresach zimowych najniższe. Najwyżej odnotowana średnia temperatura miała miejsce w lipcu 2006, najniższa natomiast w styczniu 2006 roku r_opad Średnia ilośd opadów atmosferycznych *podana w mm Największa średnia ilośd opadów atmosferycznych przypada na sierpieo Przewozy_og 0 Ilośd przewozów pasażerów w Polsce dowolnym środkiem komunikacji zbiorowej *podana w tysiącach Ilośd przewozów pasażerskich w Polsce dowolnymi środkami komunikacji zbiorowej charakteryzuje się sezonowością. Najmniej przejazdów przypada w każdym roku na lipiec, sierpieo, co może mied związek z okresem letnim i tym, że komunikacja zbiorowa miejska traci znaczenie na rzecz komunikacji długodystansowej. Średnie wykorzystanie komunikacji zbiorowej dla badanego okresu wynosi

6 r_kurs_euro r_kurs_usd Il_podr_kraj_Po Il_podr_zagr_Po Il_podr_zagr_Po Ilośd podróży zagranicznych Polaków *podana w milionach Najwięcej podróży Polaków zagranicę notuje się w okresach letnich (najwięcej w sierpniu 2007 około 1,10 miliona podróży). Średnia liczba wyjazdów wyniosła 0,53 mln Il_podr_kraj_Po Ilośd podróży krajowych Polaków *podana w milionach Największa ilośd podróży krajowych Polaków przypada na miesiące wakacyjne. Najwyższy punkt wartości przyjęły w lipcu 2006 roku - 6,55 mln. Średnio Polacy odbywając 2,92 milionów podróży po swoim kraju r_kurs_usd Średni kurs $ *podany w PLN Kurs dolara stopniowo ciągle spadał aż do lipca 2007 roku. W tym czasie za jednego dolara można było zapłacid 2,07 PLN. Od tego momentu ciągle rósł, aby w lutym 2009 przybrad najwyższą wartośd w badanym okresie (za 1 dolara trzeba było zapłacid 3,63 PLN) r_kurs_euro Średni kurs *podany w PLN Kurs euro najniższą wartośd osiągnął w lipcu 2007 (za 1 euro trzeba było zapłacid 3,26 PLN), a najwyższy w lutym 2009 (za 1 euro trzeba było zapłacid 4,64 PLN)

7 Sp_us_zakw_gast Kon_zakw_gastr UNESCO Pom_hist Pom_hist Ilośd ustanowionych Pomników Historii w Polsce Pomniki Historii są szczególną formą ochrony najcenniejszych zabytków w Polsce. W badanym okresie zostało ustanowionych 13 pomników historii UNESCO 24 Ilośd ustanowionych obiektów światowego dziedzictwa UNESCO w Polsce Lista Światowego Dziedzictwa Kulturowego i Przyrodniczego Ludzkości - lista obiektów objętych szczególną ochroną międzynarodowej organizacji UNESCO, filii ONZ, ze względu na ich unikatową wartośd kulturową bądź przyrodniczą dla ludzkości. W badanym okresie na listę został wpisany jeden obiekt Hala Ludowa we Wrocławiu Kon_zakw_gastr Wskaźnik ogólnego klimatu koniunktury dla działalności związanej z zakwaterowaniem i usługami gastronomicznymi Wskaźniki ogólnego klimatu koniunktury powstały na podstawie sformułowanych przez dyrektorów przedsiębiorstw usługowych związanych z zakwaterowaniem i usługami gastronomicznymi opinii i oczekiwao co do ich ogólnej sytuacji gospodarczej Sp_us_zakw_gast Wskaźnik sprzedaży usług dla działalności związanej z zakwaterowaniem i usługami gastronomicznymi Analiza sprzedaży zawiera wiele przydatnych informacji dotyczących sprzedaży produktów wytwarzanych przez daną firmy związaną z zakwaterowaniem i usługami gastronomicznymi

8 Og_syt_zakw_gas Og_syt_zakw_gas Wskaźnik ogólnej sytuacji dla działalności związanej z zakwaterowaniem i usługami gastronomicznymi Rosnąca wartośd wskaźnika jest świadectwem poprawiającej się sytuacji w firmie Dobór zmiennych objaśniających do modelu po przez eliminację nieistotnych zmiennych. W tym celu przeprowadzamy estymację KMNK dla wszystkich zmiennych objaśniających. Jak widad z poniżej zamieszczonego zrzutu z programu statystycznego Gretl, zmienna UNESCO przyjmuje największą wartośd p. Z tego też powodu eliminujemy ją ze zbioru i powtarzamy kroki do uzyskania najwiarygodniejszej postaci modelu. Model 1: Estymacja KMNK, wykorzystane obserwacje 2005: :12 (N = 60) Zmienna zależna: Przyjazd_cudz Współczynnik Błąd stand. t-studenta wartość p const 4, , ,6816 0,49909 Wyk_ob -4,54885e-07 4,69524e-07-0,9688 0,33793 Wyk_ob_cudz 3,91224e-06 1,53388e-06 2,5506 0,01431 ** Lud_Pol -5,67538e-05 0, ,3685 0,71429 r_temp 0, , ,0785 0,28669 r_opad 0, , ,7852 0,43654 Przewozy_og 1,91386e-05 1,05429e-05 1,8153 0,07630 * Il_podr_zagr_Po 0, , ,5534 0,58278 Il_podr_kraj_Po 0, , ,9383 0,05902 * r_kurs_usd 0, , ,5061 0,13920 r_kurs_euro -0, , ,0422 0,30301 Pom_hist -0, , ,3565 0,72315 UNESCO 0, , ,0853 0,93239 Kon_zakw_gastr -0, , ,5215 0,60460 Sp_us_zakw_gast 0, , ,7039 0,48523 Og_syt_zakw_gas 0, , ,0520 0,04615 ** Średn.aryt.zm.zależnej 5, Odch.stand.zm.zależnej 0, Suma kwadratów reszt 3, Błąd standardowy reszt 0, Wsp. determ. R-kwadrat 0, Skorygowany R-kwadrat 0, F(15, 44) 26,87578 Wartość p dla testu F 2,87e-17 Logarytm wiarygodności -0, Kryt. inform. Akaike'a 32,25625 Kryt. bayes. Schwarza 65,76576 Kryt. Hannana-Quinna 45,36366 Autokorel.reszt - rho1 0, Stat. Durbina-Watsona 1, W toku dalszego postępowania z modelu odrzuciłem zmienne: UNESCO, Pom_hist, Lud_Pol, Kon_zakw_gastr, Sp_us_zakw_gast, Il_podr_zagr_Po, r_opad, Wyk_ob, r_kurs_euro, r_temp, const 8

9 Przyjazd_cudz Model 1: Estymacja KMNK, wykorzystane obserwacje 2005: :12 (N = 60) Zmienna zależna: Przyjazd_cudz Współczynnik Błąd stand. t-studenta wartość p Wyk_ob_cudz 3,88476e-06 3,88722e-07 9,9937 <0,00001 *** Przewozy_og 2,68565e-05 2,72491e-06 9,8559 <0,00001 *** Il_podr_kraj_Po 0, , ,6018 <0,00001 *** r_kurs_usd 0, , ,8760 0,00572 *** Og_syt_zakw_gas 0, , ,9476 <0,00001 *** Średn.aryt.zm.zależnej 5, Odch.stand.zm.zależnej 0, Suma kwadratów reszt 3, Błąd standardowy reszt 0, Wsp. determ. R-kwadrat 0, Skorygowany R-kwadrat 0, F(5, 55) 4647,509 Wartość p dla testu F 6,67e-71 Logarytm wiarygodności -2, Kryt. inform. Akaike'a 15,63556 Kryt. bayes. Schwarza 26,10728 Kryt. Hannana-Quinna 19,73162 Autokorel.reszt - rho1 0, Stat. Durbina-Watsona 1, W tym przypadku postad oszacowanego modelu wygląda następująco: Ӯ = 3,88476e-06 x 1 + 2,68565e-05 x 2 + 0, x 3 + 0, x 4 + 0, x 5 + e Ӯ = 0, x 1 + 0, x 2 + 0, x 3 + 0, x 4 + 0, x 5 + e Wynika, że wzrost wykorzystania obiektów zakwaterowania przez cudzoziemców o jedną jednostkę, wpłynie na wzrost przyjazdów turystów zagranicznych do Polski o 3,88. Wzrost ilości przewozów środkami transportu zbiorowego w Polsce o 1000 będzie skutkowało wzrostem liczby przyjazdów cudzoziemców do Polski o 26,7. Jeżeli liczba podróży krajowych po Polsce wzrośnie o milion, to spowoduje to wzrost przyjazdów zagranicznych o Dodatnia zmiana średniego kursu USD o 1 PLN wpłynie na przyjazdy cudzoziemców do Polski wzrostem o A zwiększenie się wskaźnika ogólnej sytuacji jednostek gospodarczych związanych z zakwaterowaniem i gastronomią spowoduje wzrost przyjazdów o Współczynnik determinacji R 2 wyniósł 0, co oznacza, że oszacowany model w 99,76 % opisuje zmiennośd przyjazdów turystów zagranicznych do Polski. Wykres dopasowania wygląda następująco: Empiryczne i wyrównane warto ci zmiennej: Przyjazd_cudz 7 wyrównane empiryczne

10 Metoda analizy współczynników korelacji Na początku szukam zmiennych o współczynniku zmienności mniejszym od wartości progowej 10% (quasi-stałe). Współczynnik Wartośd Zmienna zmienności procentowa x 1 Wyk_ob 0, ,63% x 2 Wyk_ob_cudz 0, ,11% x 3 Lud_Pol 0, ,69% x 4 r_temp 0, ,08% x 5 r_opad 1, ,14% x 6 Przewozy_og 0, ,09% x 7 Il_podr_zagr_Po 0, ,07% x 8 Il_podr_kraj_Po 0, ,05% x 9 r_kurs_usd 0, ,54% x 10 r_kurs_euro 0, ,77% x 11 Pom_hist 0, ,69% x 12 UNESCO 0, ,64% x 13 Kon_zakw_gastr 1, ,86% x 14 Sp_us_zakw_gast 8, ,47% x 15 Og_syt_zakw_gas 1, ,07% Z powyżej zamieszczonej tabelki, zawierającej obliczony współczynnik zmienności wychodzi na to, że zmienne Lud_Pol, r_kurs_euro, Pom_hist, UNESCO przyjmują wartości mniejsze niż 10%. Z tego powodu też odrzucamy te zmienne z modelu. Kolejnym krokiem jest stworzenie macierzy korelacji: 10

11 y x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 x 10 x 11 x 12 x 13 x 14 x 15 y 1 0,7939 0,8368-0,1275 0,7708 0,3774-0,2447 0,6779 0,6608-0,0601-0,266-0,1817-0,0495 0,6833 0,7809 0,6551 x 1 0, ,9356-0,1261 0,9152 0,3971-0,4997 0,7603 0,6815-0,3196-0,3354 0,1445 0,1789 0,6315 0,7761 0,5164 x 2 0,8368 0, ,0875 0,942 0,4186-0,5047 0,7556 0,6835-0,0811-0,0965 0,0438 0,0363 0,6036 0,6998 0,4249 x 3-0,1275-0,1261-0, ,1053 0,0014-0,0895-0,0428 0,0195 0,0865 0,0985-0,0568-0,1243-0,2468-0,1988-0,1597 x 4 0,7708 0,9152 0,942-0, ,3746-0,5402 0,7439 0,6373-0,1312-0,0809 0,1542 0,1579 0,5773 0,6981 0,4138 x 5 0,3774 0,3971 0,4186 0,0014 0, ,4901 0,5157 0,5459 0,021 0,0737 0,0812 0,1353 0,2397 0,287 0,1607 x 6-0,2447-0,4997-0,5047-0,0895-0,5402-0, ,6852-0,7383 0,0141-0,2286-0,4165-0,3066-0,0546-0,1928 0,0093 x 7 0,6779 0,7603 0,7556-0,0428 0,7439 0,5157-0, ,8357-0,1709-0,151 0,1575 0,2019 0,3664 0,5423 0,3935 x 8 0,6608 0,6815 0,6835 0,0195 0,6373 0,5459-0,7383 0, ,0923-0,144-0,0081 0,0677 0,3764 0,5112 0,341 x 9-0,0601-0,3196-0,0811 0,0865-0,1312 0,021 0,0141-0,1709-0, ,8261-0,366-0,5097-0,2466-0,3842-0,3438 x 10-0,266-0,3354-0,0965 0,0985-0,0809 0,0737-0,2286-0,151-0,144 0, ,0152-0,1503-0,401-0,4962-0,5103 x 11-0,1817 0,1445 0,0438-0,0568 0,1542 0,0812-0,4165 0,1575-0,0081-0,366 0, ,7271-0,2121-0,0056 0,0454 x 12-0,0495 0,1789 0,0363-0,1243 0,1579 0,1353-0,3066 0,2019 0,0677-0,5097-0,1503 0, ,0213 0,2142 0,3233 x 13 0,6833 0,6315 0,6036-0,2468 0,5773 0,2397-0,0546 0,3664 0,3764-0,2466-0,401-0,2121 0, ,8142 0,6797 x 14 0,7809 0,7761 0,6998-0,1988 0,6981 0,287-0,1928 0,5423 0,5112-0,3842-0,4962-0,0056 0,2142 0, ,8026 x 15 0,6551 0,5164 0,4249-0,1597 0,4138 0,1607 0,0093 0,3935 0,341-0,3438-0,5103 0,0454 0,3233 0,6797 0,

12 Przyjazd_cudz Przyjazd_cudz Przyjazd_cudz Przyjazd_cudz Przyjazd_cudz Przyjazd_cudz Przyjazd_cudz Przyjazd_cudz Następnie przyporządkowuje wyliczony współczynnik korelacji między zmienną objaśnianą, a zmiennymi po wcześniejszej weryfikacji. Zmienna Współczynnik korelacji x 1 Wyk_ob 0,7939 x 2 Wyk_ob_cudz 0,8368 x 4 r_temp 0,7708 x 5 r_opad 0,3774 x 6 Przewozy_og -0,2447 x 7 Il_podr_zagr_Po 0,6779 x 8 Il_podr_kraj_Po 0,6608 x 9 r_kurs_usd -0,0601 x 13 Kon_zakw_gastr 0,6833 x 14 Sp_us_zakw_gast 0,7809 x 15 Og_syt_zakw_gas 0,6551 Ustalam wartośd krytyczną r* na podstawie wzoru: r* = t α 2 t α 2 + N 2 Gdzie: n= 60, α=0,05, Do oszacowania wartosci t α posłużono się pakietem statystycznym Gretl t(58) prawostronne prawdopodobieństwo = 0,025 prawdopodobieństwo dopełnienia = 0,975 dwustronny obszar krytyczny = 0,05 Krytyczna wart. = 2,00172 t α = 2,00172 r*= 0,254 Wyk_ob Wyk_ob_cudz r_opad Przewozy_og Lud_Pol r_temp Il_podr_zagr_Po Il_podr_kraj_Po 12

13 Przyjazd_cudz Przyjazd_cudz Przyjazd_cudz Przyjazd_cudz Przyjazd_cudz Przyjazd_cudz Przyjazd_cudz r_kurs_usd r_kurs_euro Kon_zakw_gastr Sp_us_zakw_gast Pom_hist UNESCO Wykonujemy badanie istotności współczynnika korelacji dla zmiennych. Og_syt_zakw_gas t(58) prawostronne prawdopodobieństwo = 0,025 prawdopodobieństwo dopełnienia = 0,975 dwustronny obszar krytyczny = 0,05 Krytyczna wart. = 2,00172 Zmienna objaśniana Y, czyli przyjazdy cudzoziemców do Polski z następującymi zmiennymi objaśniającymi: Wyk_ob corr(przyjazd_cudz, Wyk_ob) = 0, Hipoteza zerowa: R = 0, brak korelacji: t(58) = 9,94523, przy dwustronym obszarze krytycznym p = 0,0000 t= 9, t>tα - otrzymujemy, że nasze t jest większe od tα, w związku z tym istnieją podstawy do odrzucenia hipotezy zerowej o braku korelacji. Wychodzi, że istnieje korelacja między zmienną Y, a zmienną Wyk_ob. Wyk_ob_cudz corr(przyjazd_cudz, Wyk_ob_cudz) = 0, Hipoteza zerowa: R = 0, brak korelacji: t(58) = 11,6408, przy dwustronym obszarze krytycznym p = 0,0000 t= 11,43833 t>tα - otrzymujemy, że nasze t jest większe od tα, w związku z tym istnieją podstawy do odrzucenia hipotezy zerowej o braku korelacji. Wychodzi, że istnieje korelacja między zmienną Y, a zmienną Wyk_ob_cudz. Lud_pol corr(przyjazd_cudz, Lud_Pol) = -0, Hipoteza zerowa: R = 0, brak korelacji: t(58) = -0,978952, przy dwustronym obszarze krytycznym p = 0,3317 t= -0,96193 t<tα - otrzymujemy, że nasze t jest mniejsze od tα, w związku z tym nie ma podstaw do odrzucenia hipotezy zerowej. Wychodzi, że nie istnieje korelacja między zmienną Y, a zmienną Lud_pol. r_temp corr(przyjazd_cudz, r_temp) = 0, Hipoteza zerowa: R = 0, brak korelacji: t(58) = 9,21335, przy dwustronym obszarze krytycznym p = 0,0000 t=9, t>tα - otrzymujemy, że nasze t jest większe od tα, w związku z tym istnieją podstawy do odrzucenia hipotezy zerowej o braku korelacji. Wychodzi, że istnieje korelacja między zmienną Y, a zmienną r_temp. 13

14 r_opad corr(przyjazd_cudz, r_opad) = 0, Hipoteza zerowa: R = 0, brak korelacji: t(58) = 3,10328, przy dwustronym obszarze krytycznym p = 0,0030 t=3, t>tα - otrzymujemy, że nasze t jest większe od tα, w związku z tym istnieją podstawy do odrzucenia hipotezy zerowej o braku korelacji. Wychodzi, że istnieje korelacja między zmienną Y, a zmienną r_opad. Przewozy_og corr(przyjazd_cudz, Przewozy_og) = -0, Hipoteza zerowa: R = 0, brak korelacji: t(58) = -1,92218, przy dwustronym obszarze krytycznym p = 0,0595 t=-1,88875 t<tα - otrzymujemy, że nasze t jest mniejsze od tα, w związku z tym nie ma podstaw do odrzucenia hipotezy zerowej. Wychodzi, że nie istnieje korelacja między zmienną Y, a zmienną Przeowzy_og. Il_podr_zagr_Po corr(przyjazd_cudz, Il_podr_zagr_Po) = 0, Hipoteza zerowa: R = 0, brak korelacji: t(58) = 7,0226, przy dwustronym obszarze krytycznym p = 0,0000 t=6, t>tα- otrzymujemy, że nasze t jest większe od tα, w związku z tym istnieją podstawy do odrzucenia hipotezy zerowej o braku korelacji. Wychodzi, że istnieje korelacja między zmienną Y, a zmienną Il_podr_zagr_Po. Il_podr_kraj_Po corr(przyjazd_cudz, Il_podr_kraj_Po) = 0, Hipoteza zerowa: R = 0, brak korelacji: t(58) = 6,70418, przy dwustronym obszarze krytycznym p = 0,0000 t=6, t>tα - otrzymujemy, że nasze t jest większe od tα, w związku z tym istnieją podstawy do odrzucenia hipotezy zerowej o braku korelacji. Wychodzi, że istnieje korelacja między zmienną Y, a zmienną Il_podr_kraj_Po. r_kurs_usd corr(przyjazd_cudz, r_kurs_usd) = -0, Hipoteza zerowa: R = 0, brak korelacji: t(58) = -0,458378, przy dwustronym obszarze krytycznym p = 0,6484 t=-0,45041 t<tα - otrzymujemy, że nasze t jest mniejsze od tα, w związku z tym nie ma podstaw do odrzucenia hipotezy zerowej. Wychodzi, że nie istnieje korelacja między zmienną Y, a zmienną r_kurs_usd. r_kurs_euro corr(przyjazd_cudz, r_kurs_euro) = -0, Hipoteza zerowa: R = 0, brak korelacji: t(58) = -2,10164, przy dwustronym obszarze krytycznym p = 0,0399 t=-2,06509 t>tα - otrzymujemy, że nasze t jest większe od tα, w związku z tym istnieją podstawy do odrzucenia hipotezy zerowej o braku korelacji. Wychodzi, że istnieje korelacja między zmienną Y, a zmienną r_kurs_euro. Pom_hist corr(przyjazd_cudz, Pom_hist) = -0, Hipoteza zerowa: R = 0, brak korelacji: t(58) = -1,40733, przy dwustronym obszarze krytycznym p = 0,1647 t=-1,38286 t<tα - otrzymujemy, że nasze t jest mniejsze od tα, w związku z tym nie ma podstaw do odrzucenia hipotezy zerowej. Wychodzi, że nie istnieje korelacja między zmienną Y, a zmienną Pom_hist. 14

15 UNESCO corr(przyjazd_cudz, UNESCO) = -0, Hipoteza zerowa: R = 0, brak korelacji: t(58) = -0,377593, przy dwustronym obszarze krytycznym p = 0,7071 t=-0,37103 t<tα - otrzymujemy, że nasze t jest mniejsze od tα, w związku z tym nie ma podstaw do odrzucenia hipotezy zerowej. Wychodzi, że nie istnieje korelacja między zmienną Y, a zmienną UNESCO. Kon_zakw_gastr corr(przyjazd_cudz, Kon_zakw_gastr) = 0, Hipoteza zerowa: R = 0, brak korelacji: t(58) = 7,12692, przy dwustronym obszarze krytycznym p = 0,0000 t=7, t>tα - otrzymujemy, że nasze t jest większe od tα, w związku z tym istnieją podstawy do odrzucenia hipotezy zerowej o braku korelacji. Wychodzi, że istnieje korelacja między zmienną Y, a zmienną Kon_zakw_gastr. Sp_us_zakw_gast corr(przyjazd_cudz, Sp_us_zakw_gast) = 0, Hipoteza zerowa: R = 0, brak korelacji: t(58) = 9,51916, przy dwustronym obszarze krytycznym p = 0,0000 t=9, t>tα - otrzymujemy, że nasze t jest większe od tα, w związku z tym istnieją podstawy do odrzucenia hipotezy zerowej o braku korelacji. Wychodzi, że istnieje korelacja między zmienną Y, a zmienną Sp_us_zakw_gastr. Og_syt_zakw_gas corr(przyjazd_cudz, Og_syt_zakw_gas) = 0, Hipoteza zerowa: R = 0, brak korelacji: t(58) = 6,6037, przy dwustronym obszarze krytycznym p = 0,0000 t=6, t>tα - otrzymujemy, że nasze t jest większe od tα, w związku z tym istnieją podstawy do odrzucenia hipotezy zerowej o braku korelacji. Wychodzi, że istnieje korelacja między zmienną Y, a zmienną Og_syt_zakw_gastr. Korelacja ze zmienną objaśnianą Przyjazd_cudz występuje tylko z następującymi zmiennymi objaśniającymi: wyk_ob, wyk_ob_cudz, r_temp, r_opad, przewozy_og, il_podr_zagr_po, il_podr_kraj_po, r_euro, kon_zakw_gast, sp_us_zakw_gast, og_syt_zakw_gast. Następnie buduje macierz korelacji dla powyższych zmiennych, które nie zostały odrzucone. x 1 x 2 x 4 x 5 x 7 x 8 x 13 x 14 x 15 x 1 1 0,9356 0,9152 0,3971 0,7603 0,6815 0,6315 0,7761 0,5164 x 2 0, ,942 0,4186 0,7556 0,6835 0,6036 0,6998 0,4249 x 4 0,9152 0, ,3746 0,7439 0,6373 0,5773 0,6981 0,4138 x 5 0,3971 0,4186 0, ,5157 0,5459 0,2397 0,287 0,1607 x 7 0,7603 0,7556 0,7439 0, ,8357 0,3664 0,5423 0,3935 x 8 0,6815 0,6835 0,6373 0,5459 0, ,3764 0,5112 0,341 x 13 0,6315 0,6036 0,5773 0,2397 0,3664 0, ,8142 0,6797 x 14 0,7761 0,6998 0,6981 0,287 0,5423 0,5112 0, ,8026 x 15 0,5164 0,4249 0,4138 0,1607 0,3935 0,341 0,6797 0, W dalszym toku postępowania usuwam zmienne objaśniające, które są za słabo skorelowane ze zmienną objaśnianą. 15

16 Zmienna Współczynnik korelacji x 1 Wyk_ob 0,7939 x 2 Wyk_ob_cudz 0,8368 x 4 r_temp 0,7708 x 5 r_opad 0,3774 x 6 Przewozy_og -0,2447 x 7 Il_podr_zagr_Po 0,6779 x 8 Il_podr_kraj_Po 0,6608 x 9 r_kurs_usd -0,0601 x 13 Kon_zakw_gastr 0,6833 x 14 Sp_us_zakw_gast 0,7809 x 15 Og_syt_zakw_gas 0,6551 Na podstawie wartości krytycznej odrzucam zmienne, które są słabo skorelowane ze zmienną Y, czyli posiadają mniejsze wartości od wartości r*. W takim wypadku odrzucam zmienne: Przewozy_og i r_kurs_usd. Następnie dokonuje wyboru zmiennej objaśniającej najsilniej skorelowanej ze zmienną objaśnianą Y. Zmienna Współczynnik korelacji x 1 Wyk_ob 0,7939 x 2 Wyk_ob_cudz 0,8368 x 4 r_temp 0,7708 x 5 r_opad 0,3774 x 7 Il_podr_zagr_Po 0,6779 x 8 Il_podr_kraj_Po 0,6608 x 13 Kon_zakw_gastr 0,6833 x 14 Sp_us_zakw_gast 0,7809 x 15 Og_syt_zakw_gas 0,6551 Najlepiej skorelowaną zmienną objaśniającą ze zmienną objaśnianą jest: x 2 Wyk_ob_cudz 0,8368 Po poprzednim kroku usuwamy te zmienne, które powielają informacje. Współczynnik Zmienna korelacji x 1 Wyk_ob 0,9356 x 4 r_temp 0,9420 x 5 r_opad 0,4186 x 7 Il_podr_zagr_Po 0,7556 x 8 Il_podr_kraj_Po 0,6835 x 13 Kon_zakw_gastr 0,6036 x 14 Sp_us_zakw_gast 0,6998 x 15 Og_syt_zakw_gas 0,4249 Ponieważ wartości zmiennych są wyższe od przyjętej wartości krytycznej r*, wychodzi, że odrzucam wszystkie zmienne, czyli: x 1, x 4,x 7,x 8,x 13,x 14,x 15. Do modelu wchodzi zatem tylko zmienna x 2 Wyk_ob_cud. 16

17 Przyjazd_cudz Postad modelu w oparciu o metodę KMNK wygląda następująco: Model 2: Estymacja KMNK, wykorzystane obserwacje 2005: :12 (N = 60) Zmienna zależna: Przyjazd_cudz Współczynnik Błąd stand. t-studenta wartość p const 3, , ,3519 <0,00001 *** Wyk_ob_cudz 5,18145e-06 4,45111e-07 11,6408 <0,00001 *** Średn.aryt.zm.zależnej 5, Odch.stand.zm.zależnej 0, Suma kwadratów reszt 10,74604 Błąd standardowy reszt 0, Wsp. determ. R-kwadrat 0, Skorygowany R-kwadrat 0, F(1, 58) 135,5080 Wartość p dla testu F 8,28e-17 Logarytm wiarygodności -33,54208 Kryt. inform. Akaike'a 71,08417 Kryt. bayes. Schwarza 75,27286 Kryt. Hannana-Quinna 72,72260 Autokorel.reszt - rho1 0, Stat. Durbina-Watsona 0, Ӯ = 3,35 + 0, x 2 +e Z tego modelu wynika, że jeżeli: ogólne wykorzystanie obiektów zakwaterowania przez cudzoziemców, będzie wynosid 0, to spowoduje to wzrost przyjazdów turystów zagranicznych o 3, Natomiast wzrost wykorzystania obiektów przez cudzoziemców o jedną jednostkę wpłynie na wzrost przyjazdów turystów zagranicznych o 0, Współczynnik determinacji R 2 wyniósł 0,70 co oznacza, że oszacowany model w 70 % opisuje zjawisko zmienności przyjazdów turystów zagranicznych do Polski. Empiryczne i wyrównane warto ci zmiennej: Przyjazd_cudz 7 wyrównane empiryczne Do wyboru liniowego modelu strukturalnego w oparciu o przyjazdy turystów zagranicznych do Polski wybieram model pierwszy, w którym zmienne objaśniające zostały wybrane po przez eliminację zmiennych nieistotnych, ponieważ porównując z modelem 2, model 1 charakteryzuje się niższą wartością kryterium informacyjnym Akaike a i wyższym dopasowaniem do danych empirycznych. 17

18 Weryfikacja najlepszego modelu strukturalnego Model 1: Estymacja KMNK, wykorzystane obserwacje 2005: :12 (N = 60) Zmienna zależna: Przyjazd_cudz Współczynnik Błąd stand. t-studenta wartość p Wyk_ob_cudz 3,88476e-06 3,88722e-07 9,9937 <0,00001 *** Przewozy_og 2,68565e-05 2,72491e-06 9,8559 <0,00001 *** Il_podr_kraj_Po 0, , ,6018 <0,00001 *** r_kurs_usd 0, , ,8760 0,00572 *** Og_syt_zakw_gas 0, , ,9476 <0,00001 *** Średn.aryt.zm.zależnej 5, Odch.stand.zm.zależnej 0, Suma kwadratów reszt 3, Błąd standardowy reszt 0, Wsp. determ. R-kwadrat 0, Skorygowany R-kwadrat 0, F(5, 55) 4647,509 Wartość p dla testu F 6,67e-71 Logarytm wiarygodności -2, Kryt. inform. Akaike'a 15,63556 Kryt. bayes. Schwarza 26,10728 Kryt. Hannana-Quinna 19,73162 Autokorel.reszt - rho1 0, Stat. Durbina-Watsona 1, a) Badam dokładnośd szacunku w oparciu: - o test F. Snedecora Wartość p dla testu F 6,98e-25 Wartośd p dla testu F jest mniejsza od przyjętego poziomu istotności (α = 0,05), co oznacza, że odrzucamy Ho, a przyjmujemy H 1. Przynajmniej jeden z parametrów modelu jest istotny. - test t-studenta Przy wszystkich parametrach modelu oprócz zmiennej const wartośd p jest mniejsza od przyjętego poziomu istotności α = 0,05. Oznacza to, że wszystkie parametry modelu, oprócz właśnie const, są istotne. b) Błędy standardowe szacunku 3,88722e-07/3,88476e-061,00E-01=0,1 Dla α 1 obliczona wartośd z testu t-studenta wyniosła 0,1. Oznacza to, że wartośd względna błędu szacunku oznacza, że wartośd parametru α 1 różni się od jego oszacowania średnio o 10%. 2,68565e-05/2,72491e-06= 1,01E-01 = 0,101 Dla α 2 obliczona wartośd z testu t-studenta wyniosła 0,101. Oznacza to, że wartośd względna błędu szacunku oznacza, że wartośd parametru α 2 różni się od jego oszacowania średnio o 10%. 0, / 0,253412= 1,51E-01= 0,151 Dla α 3 obliczona wartośd z testu t-studenta wyniosła 0,151. Oznacza to, że wartośd względna błędu szacunku oznacza, że wartośd parametru α 3 różni się od jego oszacowania średnio o 15%. 0, / 0,258934= 3,48E-01= 0,348 Dla α 4 obliczona wartośd z testu t-studenta wyniosła 0,348. Oznacza to, że wartośd względna błędu szacunku oznacza, że wartośd parametru α 4 różni się od jego oszacowania średnio o 35%. 0, / 0,024884= 2,02E-01= 0,202 Dla α 5 obliczona wartośd z testu t-studenta wyniosła 0,202. Oznacza to, że wartośd względna błędu szacunku oznacza, że wartośd parametru α 5 różni się od jego oszacowania średnio o 20%. Najwyższy błąd wyszedł przy oszacowaniu parametru α 3 18

19 uhat1 uhat1 uhat1 uhat1 uhat1 Przyjazd_cudz Wartośd błędu standardowego reszt S e = 0, mówi, że oszacowana ilośd przyjazdów turystów zagranicznych różni się średnio od jej rzeczywistej wartości, właśnie o 0, c) Ocena dopasowania modelu do danych: Współczynnik determinacji R 2 wynosi: 0, Oszacowany model w 99,8 % opisuje zjawisko przyjazdów cudzoziemców do Polski. Empiryczne i wyrównane warto ci zmiennej: Przyjazd_cudz 7 wyrównane empiryczne d) Weryfikacja założeo KMNK - estymatora Hipoteza zerowa: średnia z populacji = 0 Liczebność próby: n = 60 Średnia z próby = 7,53151e-005, odchylenie std. = 0, Statystyka testowa: t(59) = (7,53151e-005-0)/0, = 0, Dwustronny obszar krytyczny p = 0,9982 (jednostronny obszar krytyczny = 0,4991) T= 0, , < 1,96, wartośd T jest mniejsza od wartości krytycznej, dlatego też nie ma podstaw do odrzucenia Ho. Średnia wartośd oczekiwana reszt wynosi 0. Założenie dotyczące korelacji reszt z innymi zmiennymi. Na podstawie wykresów rozrzutu pomiędzy resztami a poszczególnymi zmiennymi objaśniającymi przyjętymi do modelu rozpatruję występowanie korelacji pomiędzy nimi. Wyk_ob_cudz Il_podr_kraj_Po r_kurs_usd Z wykresów wynika, że nie ma korelacji reszt ze zmiennymi objaśniającymi pochodzącymi z modelu. 19 Og_syt_zakw_gas Przewozy_og

20 uhat1 Przeprowadziłem analizę reszt modelu, które dla modelu liniowego z trzema zmiennymi objaśniającymi przedstawia poniższy rysunek Losowośd składnika losowego Na podstawie rysunku reszt modelu przeprowadziłem weryfikację losowości składnika losowego. losowości dodatkowo wykonałem test serii. W celu zbadania Test serii Liczba serii (R) dla zmiennej 'uhat1' = 28 Test niezależności oparty na liczbie dodatnich i ujemnych serii. Hipoteza zerowa: próba jest losowa, dla R odpowiednio N(31, 3,84057), test z-score = -0,781133, przy dwustronnym obszarze krytycznym p = 0, Otrzymana wartośd p-value = 0,43 przekracza przyjęty poziom istotności α= 0,05. Oznacza to, że składnik losowy jest losowy. Normalnośd rozkładu Kolejny przeprowadzony test to test normalności rozkładu - Test Shapiro-Wilka. Rozkład częstości dla uhat1, obserwacje 1-60 liczba przedziałów = 7, średnia = -4,58892e-016, odch.std. = 0,26732 Przedziały średnia liczba częstość skumlowana < -0, , ,67% 11,67% **** -0, , , ,67% 33,33% ******* -0, , , ,67% 65,00% *********** 0, , , ,33% 88,33% ******** 0, , , ,00% 93,33% * 0, , , ,00% 98,33% * >= 0, , ,67% 100,00% Hipoteza zerowa: dystrybuanta empiryczna posiada rozkład normalny. Test Doornika-Hansena (1994)- transformowana skośnośd i kurtoza: Chi-kwadrat(2) = 2,346 z wartością p 0,

21 Gêsto æ Test na normalno æ rozk³adu: Chi-kwadrat(2) = 2,346, warto æ p = 0,30948 uhat1 N(-4,5889e-016 0,26732) uhat1 Otrzymana wartośd p równa 0,30948 przekracza przyjęty poziom istotności α = 0,05, co oznacza, że reszty modelu mają rozkład normalny. Homoscedastycznośd składnika losowego Następnym z kolei testem jest test White a na homoscedastycznośd składnika losowego. Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej) Estymacja KMNK, wykorzystane obserwacje 2005: :12 (N = 60) Zmienna zależna: uhat^2 współczynnik błąd standardowy t-studenta wartość p const 6, , ,412 0,1660 Wyk_ob_cudz -2,38429e-06 2,88417e-06-0,8267 0,4134 Przewozy_og -0, ,86547e-05-1,682 0,1005 Il_podr_kraj_Po -0, , ,8181 0,4183 r_kurs_usd -0, , ,1561 0,8767 Og_syt_zakw_gas 0, , ,6036 0,5496 sq_wyk_ob_cud -2,03350e-012 2,68284e-012-0,7580 0,4530 X2_X3 1,53347e-011 2,68186e-011 0,5718 0,5707 X2_X4 4,12038e-07 3,64338e-07 1,131 0,2650 X2_X5 4,01982e-07 6,36096e-07 0,6320 0,5311 X2_X6 8,00467e-09 2,73593e-08 0,2926 0,7714 sq_przewozy_o 4,32872e-010 3,07604e-010 1,407 0,1673 X3_X4 4,27082e-06 5,43403e-06 0,7859 0,4367 X3_X5 9,52455e-06 7,54274e-06 1,263 0,2142 X3_X6-1,05605e-07 3,71533e-07-0,2842 0,7777 sq_il_podr_kr -0, , ,7848 0,4373 X4_X5 0, , ,5525 0,5838 X4_X6 0, , ,2244 0,8236 sq_r_kurs_usd -0, , ,165 0,2512 X5_X6-0, , ,5378 0,5938 sq_og_syt_zak -0, , ,8881 0,3799 Uwaga: macierz danych jest osobliwa! Wsp. determ. R-kwadrat = 0, Statystyka testu: TR^2 = 11,467042, z wartością p = P(Chi-kwadrat(20) > 11,467042) = 0, Obliczona wartośd p równa oznacza, że nie ma podstaw do odrzucenia H 0, czyli składnik losowy jest homoscedastyczny. 21

22 Przyjazd_cudz Test Breuscha Pagana Kolejnym testem jest test Breuscha-Pagana na heteroskedastycznośd składnika losowego Test Breuscha-Pagana na heteroskedastyczność Estymacja KMNK, wykorzystane obserwacje 2005: :12 (N = 60) Zmienna zależna: parametr skali uhat^2 współczynnik błąd standardowy t-studenta wartość p Wyk_ob_cudz -1,04619e-06 2,14017e-06-0,4888 0,6269 Przewozy_og 1,71697e-06 1,50024e-05 0,1144 0,9093 Il_podr_kraj_Po 0, , ,5283 0,5994 r_kurs_usd 0, , ,5862 0,5602 Og_syt_zakw_gas 0, , ,3111 0,7569 Wyjaśniona suma kwadr. = 1,23029 Statystyka testu: LM = 0,615143, z wartością p = P(Chi-kwadrat(4) > 0,615143) = 0, Wartośd p jest większa od przyjętego poziomu istotności alfa=0,05, zatem nie ma podstaw do odrzucenia H0 czyli składnik losowy jest homoscedastyczny. Test Durbina-Watsona Test ten pozwala sprawdzid czy występuje autokorelacja składnika losowego. Statystyka Durbina-Watsona wynosi: 1, Wartości krytyczne dla =0,05 i k= 5, które wynoszą odpowiednio dl=1,41 oraz du= 1,76. Wartośd empiryczna znajduje się w przedziale: [1,41; 1,76]. Jest to tzw. obszar niekonkluzywności. Oznacza to, że nie można jednoznacznie stwierdzid istnienia lub nieistenienia autokorelacji. Otrzymany liniowy model strukturalny postaci: Ӯ = 0, x 1 + 0, x 2 + 0, x 3 + 0, x 4 + 0, x 5 + e Podsumowując otrzymany model nie spełnia następujących założeo stosowalności KMNK estymatora: - nie jest spełnione założenie, dotyczące autokorelacji składnika losowego Modyfikacje modelu strukturalnego Wykres szeregu czasowego dla zmiennej objaśnianej Przyjazdy cudzoziemców:

23 Wykres zmiennej objaśnianej w czasie wskazuje na możliwośd wprowadzenia do modelu zmiennych sztucznych 0-1 sezonowych, ponieważ badane zjawisko w czasie odznacza się sezonowością. Model 1: Estymacja KMNK, wykorzystane obserwacje 2005: :12 (N = 60) Zmienna zależna: Przyjazd_cudz Współczynnik Błąd stand. t-studenta wartość p Wyk_ob_cudz 5,24029e-06 1,20803e-06 4,3379 0,00008 *** Przewozy_og 2,41861e-05 5,68939e-06 4,2511 0,00011 *** Il_podr_kraj_Po 0, , ,1604 0,03623 ** r_kurs_usd 0, , ,2579 0,02896 ** Og_syt_zakw_gas 0, , ,6922 0,00003 *** q1-0, , ,3856 0,70161 q2 0, , ,5238 0,60307 q3 0, , ,5159 0,60852 q4 0, , ,2948 0,20213 q5-0, , ,6942 0,00995 *** q6-0, , ,4134 0,68134 q7-0, , ,4540 0,65206 q8-0, , ,5069 0,61475 q9-0, , ,5721 0,12310 q10 0, , ,4485 0,15458 q11 0, , ,7102 0,48135 Średn.aryt.zm.zależnej 5, Odch.stand.zm.zależnej 0, Suma kwadratów reszt 2, Błąd standardowy reszt 0, Wsp. determ. R-kwadrat 0, Skorygowany R-kwadrat 0, F(16, 44) 2047,030 Wartość p dla testu F 9,94e-58 Logarytm wiarygodności 14,14215 Kryt. inform. Akaike'a 3, Kryt. bayes. Schwarza 37,22520 Kryt. Hannana-Quinna 16,82310 Autokorel.reszt - rho1 0, Stat. Durbina-Watsona 1, Po eliminacji zmiennych z wartością p większą od przyjętego poziomu istotności α = 0,05 otrzymujemy następujący model: Model 10: Estymacja KMNK, wykorzystane obserwacje 2005: :12 (N = 60) Zmienna zależna: Przyjazd_cudz Współczynnik Błąd stand. t-studenta wartość p Wyk_ob_cudz 5,27324e-06 4,42887e-07 11,9065 <0,00001 *** Przewozy_og 2,67826e-05 2,32694e-06 11,5098 <0,00001 *** Il_podr_kraj_Po 0, , ,1647 0,00012 *** r_kurs_usd 0, , ,5033 0,01542 ** Og_syt_zakw_gas 0, , ,9000 <0,00001 *** q5-0, , ,4148 0,00123 *** q9-0, , ,3675 0,02159 ** Średn.aryt.zm.zależnej 5, Odch.stand.zm.zależnej 0, Suma kwadratów reszt 2, Błąd standardowy reszt 0, Wsp. determ. R-kwadrat 0, Skorygowany R-kwadrat 0, F(7, 53) 4624,064 Wartość p dla testu F 1,82e-71 Logarytm wiarygodności 8, Kryt. inform. Akaike'a -2, Kryt. bayes. Schwarza 12,23229 Kryt. Hannana-Quinna 3, Autokorel.reszt - rho1 0, Stat. Durbina-Watsona 1,

24 W tym przypadku postad oszacowanego modelu wygląda następująco: Ӯ = 5,27324e-06 x 1 + 2,67826e-05 x 2 + 0, x 3 + 0, x 4 + 0, x 5-0,301038d 1-0,226523d 2 + e Współczynnik determinacji R 2 wyniósł 0, co oznacza, że oszacowany model w 99,84 % opisuje zmiennośd przyjazdów turystów zagranicznych do Polski. Wykres dopasowania: Empiryczne i wyrównane warto ci zmiennej: Przyjazd_cudz 7 wyrównane empiryczne Weryfikacja modelu a) Badam dokładnośd szacunku w oparciu: - o test F. Snedecora Wartość p dla testu F 1,82e-71 Wartośd p dla testu F jest mniejsza od przyjętego poziomu istotności (α = 0,05), co oznacza, że odrzucamy Ho, a przyjmujemy H 1. Przynajmniej jeden z parametrów modelu jest istotny. - test t-studenta Przy wszystkich parametrach modelu, wartośd p jest mniejsza od przyjętego poziomu istotności α = 0,05. Oznacza to, że parametry są istotne. b) Błędy standardowe szacunku 4,42887e-07 : 5,27324e-06 = 0,08399 Dla α 1 obliczona wartośd z testu t-studenta wyniosła 0, Oznacza to, że wartośd względna błędu szacunku oznacza, że wartośd parametru α 1 różni się od jego oszacowania średnio o 8%. 2,32694e-06 : 2,67826e-05 = 0, Dla α 2 obliczona wartośd z testu t-studenta wyniosła 0, Oznacza to, że wartośd względna błędu szacunku oznacza, że wartośd parametru α 2 różni się od jego oszacowania średnio o 9%. 0,03879 : 0, = 0,24011 Dla α 3 obliczona wartośd z testu t-studenta wyniosła 0, Oznacza to, że wartośd względna błędu szacunku oznacza, że wartośd parametru α 3 różni się od jego oszacowania średnio o 24%. 0,07773 : 0, = 0,39947 Dla α 4 obliczona wartośd z testu t-studenta wyniosła 0, Oznacza to, że wartośd względna błędu szacunku oznacza, że wartośd parametru α 4 różni się od jego oszacowania średnio o 40%. 24

25 uhat10 uhat10 uhat10 uhat10 uhat10 uhat10-1 q , : 0, = 0,20408 Dla α 5 obliczona wartośd z testu t-studenta wyniosła 0, Oznacza to, że wartośd względna błędu szacunku oznacza, że wartośd parametru α 5 różni się od jego oszacowania średnio o 20%. 0, : -0, = -0,2928 Dla α 6 obliczona wartośd z testu t-studenta wyniosła 0,2928. Oznacza to, że wartośd względna błędu szacunku oznacza, że wartośd parametru α 6 różni się od jego oszacowania średnio o 29%. 0, : -0, = -0,4224 Dla α 7 obliczona wartośd z testu t-studenta wyniosła 0,4224. Oznacza to, że wartośd względna błędu szacunku oznacza, że wartośd parametru α 7 różni się od jego oszacowania średnio o 42%. Najwyższy błąd wyszedł przy oszacowaniu parametru α 7 i α 4 Wartośd błędu standardowego reszt S e = 0, mówi, że oszacowana ilośd przyjazdów turystów zagranicznych różni się średnio od jej rzeczywistej wartości, właśnie o 0, c) Ocena dopasowania modelu do danych: Współczynnik determinacji R 2 wynosi: 0, Oszacowany model w 99,8 % opisuje zjawisko przyjazdów cudzoziemców do Polski. d) Weryfikacja założeo KMNK - estymatora Hipoteza zerowa: średnia z populacji = 0 Liczebność próby: n = 60 Średnia z próby = -0, , odchylenie std. = 0, Statystyka testowa: t(59) = (-0, )/0, = -0, Dwustronny obszar krytyczny p = 0,9434 (jednostronny obszar krytyczny = 0,4717) T= 0, , < 1,96, wartośd T jest mniejsza od wartości krytycznej, dlatego też nie ma podstaw do odrzucenia Ho. Średnia wartośd oczekiwana reszt wynosi 0. Założenie dotyczące korelacji reszt z innymi zmiennymi. Na podstawie wykresów rozrzutu pomiędzy resztami a poszczególnymi zmiennymi objaśniającymi przyjętymi do modelu rozpatruję występowanie korelacji pomiędzy nimi uhat10 Wyk_ob_cudz Przewozy_og Il_podr_kraj_Po Z wykresów wynika, że nie ma korelacji reszt ze zmiennymi objaśniającymi pochodzącymi z modelu. r_kurs_usd Og_syt_zakw_gas q5 25

26 uhat10 Przeprowadziłem analizę reszt modelu, które dla modelu liniowego z trzema zmiennymi objaśniającymi przedstawia poniższy rysunek Losowośd składnika losowego Na podstawie rysunku reszt modelu przeprowadziłem weryfikację losowości składnika losowego. losowości dodatkowo wykonałem test serii. W celu zbadania Test serii Liczba serii (R) dla zmiennej 'uhat10' = 23 Test niezależności oparty na liczbie dodatnich i ujemnych serii. Hipoteza zerowa: próba jest losowa, dla R odpowiednio N(31, 3,84057), test z-score = -2,08302, przy dwustronym obszarze krytycznym p = 0, Otrzymana wartośd p-value = 0, jest mniejsza od przyjętego poziom istotności α= 0,05. Oznacza to, że składnik losowy nie jest losowy. Normalnośd rozkładu Kolejny przeprowadzony test to test normalności rozkładu - Test Shapiro-Wilka. Rozkład częstości dla uhat11, obserwacje 1-60 liczba przedziałów = 7, średnia = -0, , odch.std. = 0, Przedziały średnia liczba częstość skumlowana < -0, , ,00% 5,00% * -0, , , ,33% 33,33% ********** -0, , , ,00% 63,33% ********** 0, , , ,00% 88,33% ******** 0, , , ,33% 96,67% *** 0, , , ,67% 98,33% >= 0, , ,67% 100,00% Hipoteza zerowa: dystrybuanta empiryczna posiada rozkład normalny. Test Doornika-Hansena (1994)- transformowana skośność i kurtoza: Chi-kwadrat(2) = 4,926 z wartością p 0,

27 Gêsto æ Test na normalno æ rozk³adu: Chi-kwadrat(2) = 4,926, warto æ p = 0,08518 uhat11 N(-0, ,22451) uhat11 Otrzymana wartośd p równa 0,08518 przekracza przyjęty poziom istotności α = 0,05, co oznacza, że reszty modelu mają rozkład normalny. Homoscedastycznośd składnika losowego Następnym z kolei testem jest test White a na homoscedastycznośd składnika losowego. Test White'a na heteroskedastycznośd reszt (zmiennośd wariancji resztowej) - Hipoteza zerowa: heteroskedastycznośd reszt nie występuje Statystyka testu: LM = 25,3475 z wartością p = P(Chi-Square(26) > 35,3759) = 0,34723 Obliczona wartośd p value jest większa od przyjętego poziomu istotności. Nie ma podstaw do odrzucenia hipotezy zerowej, zatem składnik losowy jest homoscedastyczny. Test Breuscha Pagana Kolejnym testem jest test Breuscha-Pagana na heteroskedastycznośd składnika losowego Test Breuscha-Pagana na heteroskedastyczność Estymacja KMNK, wykorzystane obserwacje 2005: :12 (N = 60) Zmienna zależna: parametr skali uhat^2 współczynnik błąd standardowy t-studenta wartość p Wyk_ob_cudz 2,44886e-06 3,51400e-06 0,6969 0,4889 Przewozy_og -9,42984e-06 1,84627e-05-0,5108 0,6116 Il_podr_kraj_Po -0, , ,6599 0,5121 r_kurs_usd 0, , ,7660 0,4471 Og_syt_zakw_gas 0, , ,6603 0,5119 a5-0, , , ,9589 a9-0, , ,7293 0,4690 Wyjaśniona suma kwadr. = 6,97625 Statystyka testu: LM = 3,488124, z wartością p = P(Chi-kwadrat(6) > 3,488124) = 0, Wartośd p jest większa od przyjętego poziomu istotności alfa=0,05, zatem nie ma podstaw do odrzucenia H0 czyli składnik losowy jest homoscedastyczny. 27

28 Test Durbina-Watsona Test ten pozwala sprawdzid czy występuje autokorelacja składnika losowego. Statystyka D-W wynosi: 1, Statystyka testu Durbina-Watsona dla 5% poziomu istotności, n = 60, k = 7 Wartości krytyczne dla =0,05 i k= 5, które wynoszą odpowiednio dl=1,3349 oraz du= 1,8505. Wartośd empiryczna nie znajduje się w przedziale: [1,3349; 1,8505]. Oznacza to, że istnieje dodatnia autokorelacja reszt. Model jest bardzo dobrze dopasowany do danych empirycznych, ale nie są spełnione założenia stosowalności estymatora MNK dotyczące losowości reszt, a tym samym braku autokorelacji. Kolejną zaproponowaną modyfikacją modelu strukturalnego jest dołączenie zmiennych opóźnionych dla zmiennej objaśnianej. Dorzucenie zmiennych opóźnionych pozwoli nam na pozbycie się autokorelacji z modelu. Przed wprowadzeniem zmiennych opóźnionych należy określid rząd opóźnieo dla zmiennej objaśnianej. W tym celu wykorzystam korelogram. ACF dla zmiennej Przyjazd_cudz ,96/T^0, opó¼nienia PACF dla zmiennej Przyjazd_cudz ,96/T^0, opó¼nienia 28

29 Funkcja autokorelacji (ACF) i autokorelacji cząstkowej (PACF), test autokorelacji Ljunga-Boxa (Q) dla procesu: Przyjazd_cudz Opóźnienia ACF PACF Ljung-Box Q [wartość p] 1 0,7739 *** 0,7739 *** 37,7655 [0,000] 2 0,5194 *** -0, ,0699 [0,000] 3 0,1967-0,3415 *** 57,5945 [0,000] 4-0,1027-0, ,2950 [0,000] 5-0,3168 ** -0, ,0838 [0,000] 6-0,4556 *** -0, ,3844 [0,000] 7-0,2901 ** 0,5625 *** 85,2918 [0,000] 8-0,0920 0, ,8969 [0,000] 9 0,1567 0, ,6885 [0,000] 10 0,3822 *** 0, ,5559 [0,000] 11 0,5141 *** -0, ,6243 [0,000] 12 0,6033 *** 0, ,8338 [0,000] 13 0,4154 *** -0,2416 * 160,4918 [0,000] 14 0,2088-0, ,0167 [0,000] 15-0,0326 0, ,1045 [0,000] 16-0,2320 * 0, ,6567 [0,000] 17-0,3679 *** -0, ,3632 [0,000] 18-0,4659 *** -0, ,5858 [0,000] 19-0,3511 *** -0, ,7691 [0,000] 20-0,1867 0, ,0120 [0,000] 21 0,0009-0, ,0120 [0,000] 22 0,1663-0, ,7201 [0,000] 23 0,2540 ** -0, ,2048 [0,000] 24 0,2938 ** -0, ,1261 [0,000] 25 0,1450-0, ,3619 [0,000] 26-0,0331-0, ,4815 [0,000] 27-0,2074 0, ,3286 [0,000] 28-0,3410 *** 0, ,8428 [0,000] 29-0,4065 *** -0, ,6756 [0,000] 30-0,4233 *** -0, ,8975 [0,000] 31-0,3274 ** -0, ,6500 [0,000] 32-0,1828-0, ,0899 [0,000] 33-0,0369 0, ,2775 [0,000] 34 0,0863 0, ,3440 [0,000] 35 0,1361-0, ,1005 [0,000] 36 0,1508-0, ,6275 [0,000] 37 0,0875 0, ,8668 [0,000] 38-0,0131 0, ,8958 [0,000] 39-0,1075 0, ,9430 [0,000] 40-0,1944-0, ,9736 [0,000] 41-0,2355 * -0, ,8293 [0,000] 42-0,2282 * 0, ,5945 [0,000] 43-0,1735 0, ,1786 [0,000] 44-0,0753-0, ,4953 [0,000] 45 0,0116-0, ,5285 [0,000] 46 0,0769-0, ,0993 [0,000] 47 0,0891-0, ,3733 [0,000] 48 0,0638 0, ,6346 [0,000] 49 0,0226-0, ,8077 [0,000] 50-0,0302 0, ,1466 [0,000] 51-0,0422 0, ,8832 [0,000] 52-0,0635-0, ,7575 [0,000] 53-0,0416 0, ,6763 [0,000] 54-0,0021-0, ,6790 [0,000] 55 0,0222-0, ,0442 [0,000] 56 0,0464 0, ,0425 [0,000] 57 0,0549 0, ,7820 [0,000] 58 0,0551-0, ,4359 [0,000] 59 0,0247-0, ,7025 [0,000] Analizując funkcję PACF można stwierdzid, że rząd opóźnieo wynosi 7. Wysoki rząd opóźnienia wskazuje, ze w badanym zjawisku istnieje sezonowośd. 29

30 Model na zmiennych opóźnionych na Y rząd opóźnień 7 Model 15: Estymacja KMNK, wykorzystane obserwacje 2005: :12 (N = 58) Zmienna zależna: Przyjazd_cudz współczynnik błąd standardowy t-studenta wartość p Wyk_ob_cudz 3,84028e-06 3,91082e-07 9,820 1,94e-013 *** Przewozy_og 2,21076e-05 3,61845e-06 6,110 1,29e-07 *** Il_podr_kraj_Po 0, , ,128 4,40e-06 *** r_kurs_usd 0, , ,434 0,0184 ** Og_syt_zakw_gas 0, , ,319 0,0017 *** Przyjazd_cu_2 0, , ,045 0,0460 ** Średn.aryt.zm.zależnej 5, Odch.stand.zm.zależnej 0, Suma kwadratów reszt 3, Błąd standardowy reszt 0, Wsp. determ. R-kwadrat 0, Skorygowany R-kwadrat 0, F(6, 52) 3877,465 Wartość p dla testu F 4,29e-67 Logarytm wiarygodności -1, Kryt. inform. Akaike'a 14,90744 Kryt. bayes. Schwarza 27,27010 Kryt. Hannana-Quinna 19,72294 Autokorel.reszt - rho1 0, Stat. Durbina-Watsona 1, Weryfikacja modelu a) Badam dokładnośd szacunku w oparciu: - o test F. Snedecora Wartość p dla testu F 4,29e-67 Wartośd p dla testu F jest mniejsza od przyjętego poziomu istotności (α = 0,05), co oznacza, że odrzucamy Ho, a przyjmujemy H 1. Przynajmniej jeden z parametrów modelu jest istotny. - test t-studenta Przy wszystkich parametrach modelu, wartośd p jest mniejsza od przyjętego poziomu istotności α = 0,05. Oznacza to, że parametry są istotne. b) Błędy standardowe szacunku 3,91082e-07/3,84028e-06 = 0,10 Dla α 1 obliczona wartośd z testu t-studenta wyniosła 0,10. Oznacza to, że wartośd względna błędu szacunku oznacza, że wartośd parametru α 1 różni się od jego oszacowania średnio o 10%. 3,61845e-06/2,21076e-05 = 0,164 Dla α 2 obliczona wartośd z testu t-studenta wyniosła 0,164. Oznacza to, że wartośd względna błędu szacunku oznacza, że wartośd parametru α 2 różni się od jego oszacowania średnio o 16%. 0, /0, = 0,1818 Dla α 3 obliczona wartośd z testu t-studenta wyniosła 0,1818. Oznacza to, że wartośd względna błędu szacunku oznacza, że wartośd parametru α 3 różni się od jego oszacowania średnio o 18%. 0, /0, = 0,263 Dla α 4 obliczona wartośd z testu t-studenta wyniosła 0,263. Oznacza to, że wartośd względna błędu szacunku oznacza, że wartośd parametru α 4 różni się od jego oszacowania średnio o 26%. 0, /0, = 0,5 Dla β 1 obliczona wartośd z testu t-studenta wyniosła 0,5. Oznacza to, że wartośd względna błędu szacunku oznacza, że wartośd parametru α 5 różni się od jego oszacowania średnio o 50%. Wartośd błędu standardowego reszt S e = 0, mówi, że oszacowana ilośd przyjazdów turystów zagranicznych różni się średnio od jej rzeczywistej wartości, właśnie o 0,

e) Oszacuj parametry modelu za pomocą MNK. Zapisz postać modelu po oszacowaniu wraz z błędami szacunku.

e) Oszacuj parametry modelu za pomocą MNK. Zapisz postać modelu po oszacowaniu wraz z błędami szacunku. Zajęcia 4. Estymacja i weryfikacja modelu model potęgowy Wersja rozszerzona W pliku Funkcja produkcji.xls zostały przygotowane przykładowe dane o produkcji, kapitale i zatrudnieniu dla 27 przedsiębiorstw

Bardziej szczegółowo

4. Średnia i autoregresja zmiennej prognozowanej

4. Średnia i autoregresja zmiennej prognozowanej 4. Średnia i autoregresja zmiennej prognozowanej 1. Średnia w próbie uczącej Własności: y = y = 1 N y = y t = 1, 2, T s = s = 1 N 1 y y R = 0 v = s 1 +, 2. Przykład. Miesięczna sprzedaż żelazek (szt.)

Bardziej szczegółowo

Proces modelowania zjawiska handlu zagranicznego towarami

Proces modelowania zjawiska handlu zagranicznego towarami Załącznik nr 1 do raportu końcowego z wykonania pracy badawczej pt. Handel zagraniczny w województwach (NTS2) realizowanej przez Centrum Badań i Edukacji Statystycznej z siedzibą w Jachrance na podstawie

Bardziej szczegółowo

Outsourcing a produktywność pracy w polskich przedsiębiorstwach. Anna Grześ Zakład Zarządzania Uniwersytet w Białymstoku

Outsourcing a produktywność pracy w polskich przedsiębiorstwach. Anna Grześ Zakład Zarządzania Uniwersytet w Białymstoku Outsourcing a produktywność pracy w polskich przedsiębiorstwach Anna Grześ Zakład Zarządzania Uniwersytet w Białymstoku Cele : pomiar produktywności pracy w polskich przedsiębiorstwach na poziomie sekcji

Bardziej szczegółowo

Niestacjonarne zmienne czasowe własności i testowanie

Niestacjonarne zmienne czasowe własności i testowanie Materiał dla studentów Niestacjonarne zmienne czasowe własności i testowanie (studium przypadku) Część 3: Przykłady testowania niestacjonarności Nazwa przedmiotu: ekonometria finansowa I (22204), analiza

Bardziej szczegółowo

Zadanie 1 1. Czy wykresy zmiennych sugerują, że zmienne są stacjonarne. Czy występuje sezonowość?

Zadanie 1 1. Czy wykresy zmiennych sugerują, że zmienne są stacjonarne. Czy występuje sezonowość? Zadanie 1 1. Czy wykresy zmiennych sugerują, że zmienne są stacjonarne. Czy występuje sezonowość? Wykres stopy bezrobocia rejestrowanego w okresie 01.1998 12.2008, dane Polskie 22 20 18 16 stopa 14 12

Bardziej szczegółowo

Szymon Bargłowski, sb39345 MODEL. 1. Równania rozpatrywanego modelu: 1 PKB t = a 1 a 2 E t a 3 Invest t 1

Szymon Bargłowski, sb39345 MODEL. 1. Równania rozpatrywanego modelu: 1 PKB t = a 1 a 2 E t a 3 Invest t 1 Szymon Bargłowski, sb39345 MODEL 1. Równania rozpatrywanego modelu: 1 PKB t = a 1 a 2 E t a 3 Invest t 1 2 C t = b 1 b 2 PKB t b 3 Invest t 1 b 4 G t 2 3 Invest t = d 1 d 2 C t d 3 R t 3 gdzie: G - wydatki

Bardziej szczegółowo

5. Model sezonowości i autoregresji zmiennej prognozowanej

5. Model sezonowości i autoregresji zmiennej prognozowanej 5. Model sezonowości i autoregresji zmiennej prognozowanej 1. Model Sezonowości kwartalnej i autoregresji zmiennej prognozowanej (rząd istotnej autokorelacji K = 1) Szacowana postać: y = c Q + ρ y, t =

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16 Stanisław Cichocki Natalia Nehrebecka Zajęcia 15-16 1 1. Sezonowość 2. Zmienne stacjonarne 3. Zmienne zintegrowane 4. Test Dickey-Fullera 5. Rozszerzony test Dickey-Fullera 6. Test KPSS 7. Regresja pozorna

Bardziej szczegółowo

Ekonometria. Zajęcia

Ekonometria. Zajęcia Ekonometria Zajęcia 16.05.2018 Wstęp hipoteza itp. Model gęstości zaludnienia ( model gradientu gęstości ) zakłada, że gęstość zaludnienia zależy od odległości od okręgu centralnego: y t = Ae βx t (1)

Bardziej szczegółowo

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 Zadanie 1 a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 b) W naszym przypadku populacja są inżynierowie w Tajlandii. Czy można jednak przypuszczać, że na zarobki kobiet-inżynierów

Bardziej szczegółowo

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE ZADANIE 1 Oszacowano zależność między luką popytowa a stopą inflacji dla gospodarki niemieckiej. Wyniki estymacji są następujące: Estymacja KMNK,

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Model 1: Estymacja KMNK z wykorzystaniem 4877 obserwacji Zmienna zależna: y

Model 1: Estymacja KMNK z wykorzystaniem 4877 obserwacji Zmienna zależna: y Zadanie 1 Rozpatrujemy próbę 4877 pracowników fizycznych, którzy stracili prace w USA miedzy rokiem 1982 i 1991. Nie wszyscy bezrobotni, którym przysługuje świadczenie z tytułu ubezpieczenia od utraty

Bardziej szczegółowo

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015 Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015 Nr indeksu... Imię i Nazwisko... Nr grupy ćwiczeniowej... Imię i Nazwisko prowadzącego... 1. Specyfikacja modelu

Bardziej szczegółowo

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp. Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.

Bardziej szczegółowo

STUDIA I STOPNIA EGZAMIN Z EKONOMETRII

STUDIA I STOPNIA EGZAMIN Z EKONOMETRII NAZWISKO IMIĘ Nr albumu Nr zestawu Zadanie 1. Dana jest macierz Leontiefa pewnego zamkniętego trzygałęziowego układu gospodarczego: 0,64 0,3 0,3 0,6 0,88 0,. 0,4 0,8 0,85 W okresie t stosunek zuŝycia środków

Bardziej szczegółowo

Zadanie 3 Na podstawie danych kwartalnych z lat oszacowano następujący model (w nawiasie podano błąd standardowy oszacowania):

Zadanie 3 Na podstawie danych kwartalnych z lat oszacowano następujący model (w nawiasie podano błąd standardowy oszacowania): Zadanie 1 Fabryka Dolce Vita do produkcji czekolady potrzebuje nakładów kapitału i siły roboczej. Na podstawie historycznych danych o wielkości produkcji oraz nakładów czynników produkcji w tej fabryce

Bardziej szczegółowo

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018 Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018 Nr indeksu... Imię i Nazwisko... Nr grupy ćwiczeniowej... Imię i Nazwisko prowadzącego... 1. Specyfikacja modelu

Bardziej szczegółowo

Ekonometria Ćwiczenia 19/01/05

Ekonometria Ćwiczenia 19/01/05 Oszacowano regresję stopy bezrobocia (unemp) na wzroście realnego PKB (pkb) i stopie inflacji (cpi) oraz na zmiennych zero-jedynkowych związanymi z kwartałami (season). Regresję przeprowadzono na danych

Bardziej szczegółowo

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,

Bardziej szczegółowo

Przykład 2. Stopa bezrobocia

Przykład 2. Stopa bezrobocia Przykład 2 Stopa bezrobocia Stopa bezrobocia. Komentarz: model ekonometryczny stopy bezrobocia w Polsce jest modelem nieliniowym autoregresyjnym. Podobnie jak model podaŝy pieniądza zbudowany został w

Bardziej szczegółowo

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych 3.1. Estymacja parametrów i ocena dopasowania modeli z jedną zmienną 23. Właściciel komisu w celu zbadania

Bardziej szczegółowo

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13 Stanisław Cichocki Natalia Neherbecka Zajęcia 13 1 1. Kryteria informacyjne 2. Testowanie autokorelacji 3. Modele dynamiczne: modele o rozłożonych opóźnieniach (DL) modele autoregresyjne o rozłożonych

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów 5. Testowanie

Bardziej szczegółowo

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona Sprawdzanie założeń przyjętych o modelu (etap IIIC przyjętego schematu modelowania regresyjnego) 1. Szum 2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Bardziej szczegółowo

Prognozowanie na podstawie modelu ekonometrycznego

Prognozowanie na podstawie modelu ekonometrycznego Prognozowanie na podstawie modelu ekonometrycznego Przykład. Firma usługowa świadcząca usługi doradcze w ostatnich kwartałach (t) odnotowała wynik finansowy (yt - tys. zł), obsługując liczbę klientów (x1t)

Bardziej szczegółowo

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności. TEST STATYSTYCZNY Testem statystycznym nazywamy regułę postępowania rozstrzygająca, przy jakich wynikach z próby hipotezę sprawdzaną H 0 należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.

Bardziej szczegółowo

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Ze względu na jakość uzyskiwanych ocen parametrów strukturalnych modelu oraz weryfikację modelu, metoda najmniejszych

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

Ekonometria I Weryfikacja: współliniowość i normalność. Dr Michał Gradzewicz Szkoła Główna Handlowa w Warszawie

Ekonometria I Weryfikacja: współliniowość i normalność. Dr Michał Gradzewicz Szkoła Główna Handlowa w Warszawie Ekonometria I Weryfikacja: współliniowość i normalność Dr Michał Gradzewicz Szkoła Główna Handlowa w Warszawie 1 Współliniowość 2 Przypomnienie: Założenia MNK Założenia MNK: 1. Zmienne objaśniające są

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12 Stanisław Cichocki Natalia Nehrebecka Wykład 12 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne 2. Autokorelacja o Testowanie autokorelacji 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne

Bardziej szczegółowo

Stanisław Cihcocki. Natalia Nehrebecka

Stanisław Cihcocki. Natalia Nehrebecka Stanisław Cihcocki Natalia Nehrebecka 1 1. Kryteria informacyjne 2. Testowanie autokorelacji w modelu 3. Modele dynamiczne: modele o rozłożonych opóźnieniach (DL) modele autoregresyjne o rozłożonych opóźnieniach

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Metody Ilościowe w Socjologii

Metody Ilościowe w Socjologii Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

3. Modele tendencji czasowej w prognozowaniu

3. Modele tendencji czasowej w prognozowaniu II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa

Bardziej szczegółowo

Ćwiczenia IV

Ćwiczenia IV Ćwiczenia IV - 17.10.2007 1. Spośród podanych macierzy X wskaż te, których nie można wykorzystać do estymacji MNK parametrów modelu ekonometrycznego postaci y = β 0 + β 1 x 1 + β 2 x 2 + ε 2. Na podstawie

Bardziej szczegółowo

Estymator jest nieobciążony, jeśli jego wartośd oczekiwana pokrywa się z wartością szacowanego parametru.

Estymator jest nieobciążony, jeśli jego wartośd oczekiwana pokrywa się z wartością szacowanego parametru. ZAŁOŻENIA ESYMAORA MNK. E(u) średnia wartośd oczekiwana równa Zakłócenia (składniki losowe, reszty) nie wykazują żadnej tendencji do odchylania wartości empirycznych zmiennej objaśnianej od wartości teoretycznych

Bardziej szczegółowo

Ekonometria. Weryfikacja modelu. Paweł Cibis 12 maja 2007

Ekonometria. Weryfikacja modelu. Paweł Cibis 12 maja 2007 Weryfikacja modelu Paweł Cibis pawel@cibis.pl 12 maja 2007 1 Badanie normalności rozkładu elementu losowego Test Hellwiga dla małej próby Test Kołmogorowa dla dużej próby 2 Testy Pakiet Analiza Danych

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Egzamin z ekonometrii wersja IiE, MSEMAT

Egzamin z ekonometrii wersja IiE, MSEMAT Egzamin z ekonometrii wersja IiE, MSEMAT 04-02-2016 Pytania teoretyczne 1. Za pomocą jakiego testu weryfikowana jest normalność składnika losowego? Jakiemu założeniu KMRL odpowiada w tym teście? Jakie

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

1. Stacjonarnośd i niestacjonarnośd szeregów czasowych 2. Test ADF i test KPSS 3. Budowa modeli ARMA dla zmiennych niestacjonarnych 4.

1. Stacjonarnośd i niestacjonarnośd szeregów czasowych 2. Test ADF i test KPSS 3. Budowa modeli ARMA dla zmiennych niestacjonarnych 4. 1. Stacjonarnośd i niestacjonarnośd szeregów czasowych 2. Test ADF i test KPSS 3. Budowa modeli ARMA dla zmiennych niestacjonarnych 4. Prognozowanie stóp zwrotu na podstawie modeli ARMA 5. Relacje kointegrujące

Bardziej szczegółowo

Metoda Johansena objaśnienia i przykłady

Metoda Johansena objaśnienia i przykłady Metoda Johansena objaśnienia i przykłady Model wektorowej autoregresji rzędu p, VAR(p), ma postad gdzie oznacza wektor zmiennych endogenicznych modelu. Model VAR jest stabilny, jeżeli dla, tzn. wielomian

Bardziej szczegółowo

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna Badanie współzależności zmiennych Uwzględniając ilość zmiennych otrzymamy 4 odmiany zależności: Zmienna zależna jednowymiarowa oraz jedna

Bardziej szczegółowo

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y). Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych

Bardziej szczegółowo

1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej:

1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej: Metoda analizy macierzy współczynników korelacji Idea metody sprowadza się do wyboru takich zmiennych objaśniających, które są silnie skorelowane ze zmienną objaśnianą i równocześnie słabo skorelowane

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

Diagnostyka w Pakiecie Stata

Diagnostyka w Pakiecie Stata Karol Kuhl Zgodnie z twierdzeniem Gaussa-Markowa, estymator MNK w KMRL jest liniowym estymatorem efektywnym i nieobciążonym, co po angielsku opisuje się za pomocą wyrażenia BLUE Best Linear Unbiased Estimator.

Bardziej szczegółowo

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej Ekonometria Ćwiczenia nr 3 Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Ćwiczenia 3 Własności składnika losowego 1 / 18 Agenda KMNK przypomnienie 1 KMNK przypomnienie 2 3 4 Jakub Mućk

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9 Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności

Bardziej szczegółowo

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota Ekonometria ćwiczenia 3 Prowadzący: Sebastian Czarnota Strona - niezbędnik http://sebastianczarnota.com/sgh/ Normalność rozkładu składnika losowego Brak normalności rozkładu nie odbija się na jakości otrzymywanych

Bardziej szczegółowo

Stanisław Cichocki Natalia Neherbecka

Stanisław Cichocki Natalia Neherbecka Stanisław Cichocki Natalia Neherbecka 13 marca 2010 1 1. Kryteria informacyjne 2. Modele dynamiczne: modele o rozłożonych opóźnieniach (DL) modele autoregresyjne o rozłożonych opóźnieniach (ADL) 3. Analiza

Bardziej szczegółowo

Analiza autokorelacji

Analiza autokorelacji Analiza autokorelacji Oblicza się wartości współczynników korelacji między y t oraz y t-i (dla i=1,2,...,k), czyli współczynniki autokorelacji różnych rzędów. Bada się statystyczną istotność tych współczynników.

Bardziej szczegółowo

Model 1: Estymacja KMNK z wykorzystaniem 32 obserwacji 1964-1995 Zmienna zależna: st_g

Model 1: Estymacja KMNK z wykorzystaniem 32 obserwacji 1964-1995 Zmienna zależna: st_g Zadanie 1 Dla modelu DL dla zależności stopy wzrostu konsumpcji benzyny od stopy wzrostu dochodu oraz od stopy wzrostu cen benzyny w latach 1960 i 1995 otrzymaliśmy następujące oszacowanie parametrów.

Bardziej szczegółowo

Rozdział 8. Regresja. Definiowanie modelu

Rozdział 8. Regresja. Definiowanie modelu Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność

Bardziej szczegółowo

Na podstawie danych dotyczacych rocznych wydatków na pizze oszacowano parametry poniższego modelu:

Na podstawie danych dotyczacych rocznych wydatków na pizze oszacowano parametry poniższego modelu: Zadanie 1. Oszacowano model ekonometryczny liczby narodzin dzieci (w tys.) w Polsce w latach 2000 2010 w zależnosci od średniego rocznego wynagrodzenia (w ujęciu realnym, PLN), stopy bezrobocia (w punktach

Bardziej szczegółowo

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe

Bardziej szczegółowo

Przykład 1 ceny mieszkań

Przykład 1 ceny mieszkań Przykład ceny mieszkań Przykład ceny mieszkań Model ekonometryczny zaleŝności ceny mieszkań od metraŝu - naleŝy do klasy modeli nieliniowych. - weryfikację empiryczną modelu przeprowadzono na przykładzie

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8 Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów

Bardziej szczegółowo

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007 , transformacja liniowa i estymacja modelu KMNK Paweł Cibis pawel@cibis.pl 9 marca 2007 1 Miary dopasowania modelu do danych empirycznych Współczynnik determinacji Współczynnik zbieżności Skorygowany R

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12 Stanisław Cichocki Natalia Nehrebecka Wykład 1 1 1. Testy diagnostyczne Testowanie stabilności parametrów modelu: test Chowa. Heteroskedastyczność Konsekwencje Testowanie heteroskedastyczności 1. Testy

Bardziej szczegółowo

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować

Bardziej szczegółowo

Zawartość. Zawartość

Zawartość. Zawartość Opr. dr inż. Grzegorz Biesok. Wer. 2.05 2011 Zawartość Zawartość 1. Rozkład normalny... 3 2. Rozkład normalny standardowy... 5 3. Obliczanie prawdopodobieństw dla zmiennych o rozkładzie norm. z parametrami

Bardziej szczegółowo

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 0/0/0. Egzamin trwa 90 minut.. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu. Złamanie

Bardziej szczegółowo

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej

Bardziej szczegółowo

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy

Bardziej szczegółowo

Niestacjonarne zmienne czasowe własności i testowanie

Niestacjonarne zmienne czasowe własności i testowanie Materiał dla studentów Niestacjonarne zmienne czasowe własności i testowanie (studium przypadku) Część 1: Opis ogólny i plan pracy Nazwa przedmiotu: ekonometria finansowa I (22204), analiza szeregów czasowych

Bardziej szczegółowo

3. Analiza własności szeregu czasowego i wybór typu modelu

3. Analiza własności szeregu czasowego i wybór typu modelu 3. Analiza własności szeregu czasowego i wybór typu modelu 1. Metody analizy własności szeregu czasowego obserwacji 1.1. Analiza wykresu szeregu czasowego 1.2. Analiza statystyk opisowych zmiennej prognozowanej

Bardziej szczegółowo

Ekonometria. Weryfikacja modelu. Paweł Cibis pcibis@o2.pl. 6 kwietnia 2006

Ekonometria. Weryfikacja modelu. Paweł Cibis pcibis@o2.pl. 6 kwietnia 2006 Weryfikacja modelu Paweł Cibis pcibis@o2.pl 6 kwietnia 2006 1 Badanie istotności parametrów strukturalnych modelu Testy Pakiet Analiza Danych Uwagi 2 Test dla małej próby Test dla dużej próby 3 Test Durbina-Watsona

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA Powtórka Powtórki Kowiariancja cov xy lub c xy - kierunek zależności Współczynnik korelacji liniowej Pearsona r siła liniowej zależności Istotność

Bardziej szczegółowo

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp tel.: +48 662 635 712 Liczba stron: 15 Data: 20.07.2010r OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA z wykorzystaniem programu obliczeniowego Q maxp DŁUGIE

Bardziej szczegółowo

1 Modele ADL - interpretacja współczynników

1 Modele ADL - interpretacja współczynników 1 Modele ADL - interpretacja współczynników ZADANIE 1.1 Dany jest proces DL następującej postaci: y t = µ + β 0 x t + β 1 x t 1 + ε t. 1. Wyjaśnić, jaka jest intepretacja współczynników β 0 i β 1. 2. Pokazać

Bardziej szczegółowo

Wstęp... 3 Problem i hipoteza badawcza... 4 Opis modelu. Definicje i założenia... 5 Źródła danych... 6 Szacowanie modelu... 7 Wnioski...

Wstęp... 3 Problem i hipoteza badawcza... 4 Opis modelu. Definicje i założenia... 5 Źródła danych... 6 Szacowanie modelu... 7 Wnioski... Spis treści Wstęp... 3 Problem i hipoteza badawcza... 4 Opis modelu. Definicje i założenia... 5 Źródła danych... 6 Szacowanie modelu... 7 Wnioski... 14 2 Wstęp Podatek od towarów i usług (zwany również

Bardziej szczegółowo

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria Wykład 5 Anna Skowrońska-Szmer lato 2016/2017 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją jako prawdziwą

Bardziej szczegółowo

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 02/02/2011 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;

Bardziej szczegółowo

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde

Bardziej szczegółowo

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie

Bardziej szczegółowo

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej

Bardziej szczegółowo

7.4 Automatyczne stawianie prognoz

7.4 Automatyczne stawianie prognoz szeregów czasowych za pomocą pakietu SPSS Następnie korzystamy z menu DANE WYBIERZ OBSERWACJE i wybieramy opcję WSZYSTKIE OBSERWACJE (wówczas wszystkie obserwacje są aktywne). Wreszcie wybieramy z menu

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

Własności statystyczne regresji liniowej. Wykład 4

Własności statystyczne regresji liniowej. Wykład 4 Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej Ekonometria Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 4 Prognozowanie, stabilność 1 / 17 Agenda

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13 Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Autokorelacja Konsekwencje Testowanie autokorelacji 2. Metody radzenia sobie z heteroskedastycznością i autokorelacją Uogólniona Metoda Najmniejszych

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

Analiza regresji - weryfikacja założeń

Analiza regresji - weryfikacja założeń Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z

Bardziej szczegółowo