CZYNNIKI WPŁYWAJĄCE NA WYDATKI DOKONYWANE ZA POMOCĄ KART KREDYTOWYCH

Wielkość: px
Rozpocząć pokaz od strony:

Download "CZYNNIKI WPŁYWAJĄCE NA WYDATKI DOKONYWANE ZA POMOCĄ KART KREDYTOWYCH"

Transkrypt

1 TOMASZ BĄK KATARZYNA OWCZARSKA gr. 312 CZYNNIKI WPŁYWAJĄCE NA WYDATKI DOKONYWANE ZA POMOCĄ KART KREDYTOWYCH Praca na pisana na ćwiczeniach z Ekonometrii pod kierunkiem mgr Natalii Nehrebeckiej. UNIWERSYTET WARSZAWSKI WYDZIAŁ NAUK EKONOMICZNYCH WARSZAWA 2007

2 SPIS TREŚCI 1. Problem ekonometryczny Fundamenty teoretyczne i hipotezy badawcze Przegląd literatury Opis bazy danych i definicje zmiennych Baza danych Zmienne modelu 7 5. Wstępna analiza danych Statystyki opisowe zmiennych. 10 Macierz korelacji 10 Analiza zmiennych binarnych Histogramy zmiennych Forma funkcyjna modelu Estymacja parametrów modelu Oszacowanie modelu Diagnostyka modelu Interpretacja wyników estymacji Interpretacja ekonomiczna i wnioski Bibliografia Załączniki Załącznik 1. Statystyki opisowe zmiennych Załącznik 2. Wykresy Załącznik 3. Macierz wariancji - kowariancji

3 1. PROBLEM EKONOMETRYCZNY Według encyklopedii Britanica sieci hotelowe w USA już w latach dwudziestych zeszłego stulecia wydawały karty kredytowe dla swoich klientów. Około roku 1938 firmy zaczęły akceptować nawzajem swoje karty. Jednak dopiero 12 lat później powstały pierwsze bankowe karty kredytowe. Od tego czasu przeszły one dynamiczną ewolucję, zarówno pod względem zaawansowania technologicznego, powszechności użycia, czy też znaczenia jako środka płatniczego. Dowodem tego może być cytat z New York Times a: "With more than 641 million credit cards in circulation and accounting for an estimated $1.5 trillion of consumer spending, the U.S. economy has clearly gone plastic." 1 W celu zaspokojenia rosnących potrzeb konsumenckich przyszły nam z pomocą pożyczki, jednak dopiero karty kredytowe znacząco usprawniły przepływ gotówki. Możliwość korzystania z nich uwalnia od zbędnych formalności, jednocześnie gwarantując stały dostęp do pieniędzy. Czy ktoś z nas, wyobraża sobie funkcjonowanie świata, zwłaszcza świata biznesu, bez tych plastikowych pieniędzy? Dostęp do kredytu konsumenckiego w formie kart kredytowych jest obecnie jednym z najczęściej wykorzystywanych przez gospodarstwa domowe instrumentów finansowych w USA. Także w Polsce zdobywa on coraz większą popularność. Karty kredytowe oferują bowiem wygodę bezgotówkowych transakcji, a także pozwalają na zakupy przez telefon czy Internet. Poza tym zapewniają konsumentom elastyczność w opóźnianiu płatności, przez co umożliwiają wygładzanie wydatków. Można by zatem zadać sobie pytanie, co w rzeczywistości wpływa na wielkość wydatków z kart. Zapewne chciałoby się tego dowiedzieć wielu użytkowników, którzy niejednokrotnie ze zdziwieniem patrzyli na swój wyciąg bankowy. Problem ten wydaje się być szczególnie ciekawy właśnie ze względu na coraz większą popularność tego instrumentu płatniczego zarówno na świecie, jak i w Polsce. Zatem celem naszej pracy będzie określenie istotności wybranych czynników, jakie wpływają na wydatki dokonywane za pomocą kart kredytowych. Zmienne zastosowane w modelu odwołują się zarówno do kategorii czysto ekonomicznych, jak i społeczno-demograficznych. 2. FUNDAMENTY TEORETYCZNE I HIPOTEZY BADAWCZE Zgodnie z teorią makroekonomii, wielkość dochodu jest dodatnio skorelowana z popytem na pieniądz. Właśnie ciągła potrzeba pieniądza, będąca cechą rozwijającego się społeczeństwa powoduje zwiększone użycie kart kredytowych. Wpływ na to mają również realia współczesnego świata, które niejednokrotnie wymuszają konieczność szybkiego działania. Z tym bezsprzecznie wiąże się większy procentowy udział wydatków dokonywanych przy użyciu kart kredytowych. Jak podkreślają Brito and Hartley (1995), karty kredytowe mogą być wykorzystywane do wygładzania konsumpcji pomiędzy nieoczekiwanymi spadkami dochodu. Jako ubezpieczenie konsumpcji mają ten sam natychmiastowy efekt, co chociażby oszczędności czy środki z pomocy społecznej. Intuicyjnie można zakładać, że liczba aktywnych kont kredytowych oraz fakt posiadania kart kredytowych największych wydawców również powoduje zwiększenie wspomnianego udziału wydatków z kart. Możemy tak przypuszczać, gdyż pośrednio jest to powiązane ze stanem majątkowym posiadacza oraz procedurą przyznawania kart kredytowych. Dodatkowe

4 karty zapewne nie zostałyby wydane, gdyby bank nie uznał danej osoby za wiarygodną finansowo. Nie wchodząc jednak w szczegóły owej procedury możemy założyć, iż sam fakt posiadania kilku kont/kart kredytowych może świadczyć o ograniczonej płynności finansowej i dokonywaniu większych wydatków z wykorzystaniem kart. W podobny sposób można by się odnieść do samozatrudnienia. Zazwyczaj osoby prowadzące własną działalność gospodarczą są bardziej przedsiębiorcze niż reszta społeczeństwa i potrzebują stałego dostępu do pieniędzy, aby móc rozwijać swoją firmę. Jeśli takiej osobie została przyznana krata kredytowa, to znaczy, że bank uznał ją za wypłacalną, czyli będącą w stanie odpowiednio prosperować w świecie biznesu, a co za tym idzie, w zwiększonym stopniu obracać pieniędzmi, również poprzez użycie kart kredytowych. Biorąc z kolei pod uwagę liczbę monitów bankowych, warto by się zastanowić czy taki rodzaj zmiennej mógłby mieć wpływ na badany przez nas problem. Zasadnicze będzie tu znalezienie odpowiedzi na pytanie, czy osoby którym zdarza się naruszać warunki umowy z bankiem, w przypadku kart kredytowych, będą wykazywały większe czy mniejsze skłonności do korzystania z kart. Naszym zdaniem, już sam fakt otrzymania takiego monitu będzie raczej świadczył o większych wydatkach. Duże wydatki pociągają za sobą konieczność spłaty wysokiego zadłużenia na koniec miesiąca. W przypadku nie dokonania spłaty, klient otrzymuje monit. Zatem respondenci dokonujący mniejszych wydatków z kart będą prawdopodobnie rzadziej otrzymywać monity o naruszeniu umowy. Również charakterystyki społeczno-demograficzne mogą być odpowiedzią na zwiększanie się średnich wydatków dokonywanych przy pomocy kart kredytowych. Morgan i Toll(1997), opierając się na The Survey of Consumer Finances przeprowadzonym w USA, korzystając z permanent income/life-cycle approach powiązali właśnie rosnące zadłużenie kart z socjoekonomicznymi i demograficznymi cechami posiadaczy kart. Według nas charakterystyki takie jak wiek, ilość osób pozostających na utrzymaniu posiadacza karty, fakt posiadania domu/mieszkania i długość zamieszkiwania pod danym adresem nie są zapewne bez znaczenia. Długość okresu zamieszkania pod danym adresem może być odbierana jako cecha pozornie nieistotna w wyjaśnianiu wydatków z kart. Warto się wówczas zastanowić czy nie wykazuje ona jednak istotnego wpływu na badany przez nas problem. Naszym zdaniem bezpośrednio łączy się z wielkością i strukturą wydatków. Mianowicie uważamy, iż dłuższe zamieszkiwanie się pod tym samym adresem implikuje większą świadomość wysokości cen w okolicznych sklepach, przez co zakupy mogą być dokonywane w sposób bardziej efektywny (tańszy). Zatem wielkość tych wydatków jest pośrednio związana również z tymi dokonywanymi poprzez karty kredytowe. Z kolei fakt posiadania własnego domu/mieszkania może wskazywać na większy stan majątkowy respondenta oraz być dla banku rodzajem zabezpieczenia przy wydawaniu kolejnej karty oraz ustalaniu wysokości jej limitu. Osoba posiadająca nieruchomość jest zapewne bardziej wiarygodna w oczach banku, zatem będzie mogła otrzymać lepsze warunki niż osoba wynajmująca mieszkanie (ceteris paribus). Wynika z tego, iż osoby posiadające dom/mieszkanie będą wykazywały większe wydatki dokonywane przy pomocy kart niż inni respondenci. Niewątpliwie na wysokość wydatków z kart kredytowych wpływa także wiek posiadacza karty. Naszym zdaniem jednak przeciętne wydatki z kart kredytowych nie są liniowo zależne od wieku ich posiadacza. Według nas na początku są nieznaczne ze względu na brak własnej 4

5 karty, najwyższe w okresie pracy zawodowej i ponownie niskie w okresie emerytury. Zależność wydatków z karty od wieku przyjmuje zatem kształt paraboli o odwróconym kształcie, dlatego postanowiliśmy podnieść zmienną age, oznaczającą wiek, do kwadratu i przyjąć znak ujemny. 3. PRZEGLĄD LITERATURY Przed rozpoczęciem analizy interesującego nas zjawiska, dokonaliśmy krótkiego przeglądu literatury. Dotyczyła ona zarówno problematyki związanej z kartami kredytowymi, jak i budowy modelu ekonometrycznego. Artykuły i badania, do których dotarliśmy, to wyłącznie pozycje anglojęzyczne. Literatura polska dotycząca kart koncentruje się głównie na samej ich konstrukcji i analizie rynku. Wynika to zapewne z faktu, że w Polsce karty kredytowe nie są tak rozpowszechnione jak w USA. Poniżej przedstawiamy główne myśli zawarte w wybranych przez nas pozycjach. Rozpatrując zmienną dotyczą wielkości dochodu, przyjęliśmy hipotezę, że jest on dodatnio skorelowany z wydatkami z kart kredytowych. Mianowicie, zwiększające się dochody implikują większe wydatki, w tym także te, za które płacimy kartami. Przypuszczenie to oparliśmy na badaniach empirycznych Carola C. Bertauta i Michaela Halisassosa (2005) oraz Peter a S. Yoo (1997). W pierwszej z tych prac bada się wykorzystanie kart kredytowych wśród obywateli USA, opierając się na badaniu SCF 2. Badanie to zostało przeprowadzone na grupie 3000 gospodarstw domowych i dostarcza informacji na ich temat w kwestii posiadania różnych aktywów finansowych, wykorzystania możliwości kredytowych, w tym kart, a także wieku, wykształcenia, rasy, struktury rodziny, zatrudnienia, faktu posiadania domu, etc. Autorzy wnioskują na podstawie kolejno przeprowadzanych regresji, że posiadanie karty kredytowej w USA jest dodatnio skorelowane z dochodem i wykształceniem i ten trend utrzymuje się we wszystkich falach SCF. Natomiast w artykule Peter a S. Yoo analiza dotyczy determinantów wzrostu użycia kart kredytowych, a co się z tym łączy, zwiększonych wydatków. Autor wykorzystuje w/w SFC z lat i na tej podstawie dzieli wzrost użycia kart na dwie kategorie wzrost ilości gospodarstw posiadających karty i zmiany w zadłużeniu posiadanych już kart. W celu wyjaśnienia tego zjawiska wykorzystywane są dane dotyczące dochodów respondentów, a zwłaszcza gospodarstw posiadających niższy dochód. Pod uwagę brane są także dane dotyczące dostępności kart, ilości gospodarstw i przeciętnego zadłużenia. Wyraźne we wnioskach są dwa spostrzeżenia. Po pierwsze, iż prawdopodobieństwo posiadania karty jest dodatnio skorelowane z dochodem. Co wydaje się zastanawiające, mimo, że ilość gospodarstw posiadających karty wzrosła w każdej grupie dochodowej, to wzrost ten jest wyraźnie szybszy w biedniejszych gospodarstwach. Po drugie poziom całkowitego zadłużenia z kart rośnie wraz z poziomem dochodu gospodarstwa, przez co rozumiemy, że wraz ze wzrostem statusu majątkowego, rosną również wydatki w taki sposób, że gospodarstwa domowe nie boją się korzystania z debetu. Wynika to z przekonania, że wielkość ich dochodów jest w stanie pokryć, w chwili obecnej, zwiększoną konsumpcję, a w przyszłości również spłacić dług z karty. W rozpatrywanej przez nas literaturze, jedną z ważniejszych zmiennych określających wielkość wydatków z kart, jest zmienna dotycząca wieku respondenta. Hipotezę o parabolicznej zależności wydatków i wieku oparliśmy na w/w badaniu Carola C. Bertauta i Michaela Halisassosa. W tej pracy zmienna wieku okazała się istotna w wyjaśnianiu faktu 2 Survey of Consumer Finances 5

6 posiadania i użycia kart. Stwierdzono, iż użycie kart jest największe w przedziale wiekowym 50-75, mniejsze w przedziałach do 50 i powyżej 75 lat. Poparcie naszej hipotezy znajdujemy również w pracy Elizabeth C. Hirshman (1981), która zauważa, że dystrybucja kart nie jest skierowana do młodszych osób ze względu na surowe kryteria przyznawania kredytów. Stwierdza się również, że może być to wynikiem powiązania wieku z takimi zmiennymi jak długość okresu zatrudnienia, długość zamieszkania czy wielkość dochodu, które również są zmiennymi zastosowanymi w naszym modelu. Natomiast sprzeczne z naszą hipotezą są wnioski zawarte w artykule Lindy Punch Older debtors, new problems. Artykuł jest poświęcony jest zagadnieniu związanemu z wielkością i strukturą wydatków zmieniającą się wraz z wiekiem. Szczególną uwagę autorka zwraca na emerytów, zauważając, iż ta grupa ludzi wcale nie wykazuje małych lub znikomych wielkości wydatków dokonywanych przy użyciu kart. Omawiając ten problem, Linda Punch bada również motywy i potrzeby kierujące wydatkami emerytów, a także konsekwencje, nierzadko spotykanych, zbyt pochopnych działań. Starając się potwierdzić istotność naszego modelu w sensie ekonomicznym, a także słuszność postawionych założeń, odwoływaliśmy się również do prac Kelly Shermach(2004), Nicole Jonker (2005) oraz Lucii F. Dunn i TaeHyung Kim (2005). Pierwsza z tych prac uzasadnia istotność posiadania oddzielnych kart kredytowych przeznaczonych do celów prywatnych i biznesowych, używanych zwłaszcza przez właścicieli małych firm. Jej głównym przesłaniem jest uświadomienie tym przedsiębiorcom zalet z dokonywania transakcji biznesowych za pomocą kart kredytowych. Kolejny artykuł, autorstwa Nicole Jonker to badanie dotyczące instrumentów płatniczych. Jego autorka porównuje rożne formy płatności podczas dokonywania zakupów, zwracając również uwagę na rożne czynniki wpływające na określony sposób wydatkowania pieniędzy, m.in. wiek, średnie miesięczne dochody, wykształcenie itp. Z kolei Lucia F. Dunn i TaeHyung Kim badają czynniki determinujące opóźnienia w spłacaniu kredytów zaciągniętych poprzez karty. Koncentrują się na związku pomiędzy finansowymi decyzjami konsumentów a wspomnianymi opóźnieniami. W tej pracy znaczące okazują się głownie: stosunek wymaganych minimalnych spłat do dochodu, stopień wykorzystania możliwości kredytowych i liczba kart, których limit został wyczerpany. Uwzględnione są także zmienne nie-finansowe tj. wiek, stan cywilny, liczba dzieci, status zawodowy, fakt posiadania domu czy wykształcenie. Na podstawie wymienionych zmiennych przeprowadzona zostaje regresja wyjaśniającą ryzyko opóźnień w spłacie. 4. OPIS BAZY DANYCH I DEFINICJE ZMIENNYCH 4.1 BAZA DANYCH Model został opracowywany na podstawie danych zaczerpniętych ze strony internetowej: Jest to strona profesora Williama Greene z New York University Leonard N. Stern School of Business Faculty of Entertainment, Media and Technology. Dane zostały zebrane w 1992 roku wśród obywateli USA. Pierwotnie baza danych zawierała 1319 obserwacji, które poddano wstępnej analizie. Z bazy danych przed przystąpieniem do wstępnej estymacji zostało usuniętych 296 obserwacji dla respondentów, którzy nie posiadali karty kredytowej w momencie badania, gdyż obserwacje te nie były istotne ze względu na podejmowany przez nas problem badawczy. Kolejnych 6 obserwacji zostało usuniętych ze względu na błędnie 6

7 podane informacje (wiek był w tych przypadkach mniejszy od 1). Po ich eliminacji w bazie danych pozostało 1017 obserwacji. Bezpośredni link do bazy danych: ZMIENNE MODELU Poza ważnymi zmiennymi objaśniającymi o charakterze czysto finansowym wykorzystaliśmy inne zmienne, aby móc obserwować socjoekonomiczne i demograficzne różnice w próbce. Spośród zmiennych dostępnych w bazie wybraliśmy ekonomiczne, społeczne i demograficzne charakterystyki ludności, które według nas mają uzasadniony wpływ na wydatki dokonywane przy użyciu kart kredytowych. Do tych zmiennych można zaliczyć: dochód respondenta wiek fakt samozatrudnienia fakt posiadania domu/mieszkania ilość osób pozostających na utrzymaniu posiadacza karty liczba posiadanych głównych kart kredytowych 3 liczba monitów bankowych 4 liczba posiadanych aktywnych kont/rachunków kredytowych długość zamieszkiwania pod danym adresem Zmienne te zostały przez nas przekształcone. Poniżej przedstawiamy pełny opis zmiennych wraz z ich przekształceniami. ZMIENNA OBJAŚNIANA przeciętne miesięczne wydatki dokonywane przy użyciu kart kredytowych: y = avg exp Jest to zmienna ciągła. W modelu uwzględniliśmy logarytm tej zmiennej lavgexp. Dla 21 obserwacji wartość avgincome wynosiła 0. Podczas pierwszej próby regresji, w celu policzenia logarytmu, zastąpiliśmy zera jedynkami, oznaczającymi wydatki w symbolicznej wysokości 1$. Jednak w tak oszacowanym modelu wystąpił problem heteroskedastyczności składnika losowego. Podejrzewaliśmy, że heteroskedastyczność spowodowały właśnie obserwacje, w których avgexp=0. Przypuszczenia te potwierdził test Cook a. Zatem, po dokładnej ich analizie, postanowiliśmy te obserwacje usunąć. W bazie pozostało zatem 996 obserwacji. 3 Według naszych ustaleń główne karty kredytowe (w oryginale major credit cards ) to karty typu Visa, Mastercard, American Express, JCB, a więc karty największych wydawców.. 4 W oryginale nazwa zmiennej to major derogatory reports. Jest to zmienna, której wartość (także w ogólnym przypadku) dla większości użytkowników kart będzie wynosiła 0, ale dla istotnej części, która zapomniała dokonać spłaty zaciągniętego kredytu, przyjmuje wartość dodatnią. Typowe wartości to 0, 1 lub 2, ale zmienna może przyjmować także wyższe wartości np.10. Definicja znajdująca się w oryginalnej bazie danych okazała się dość trudna do przetłumaczenia. Według nas można by zdefiniować majordg jako zawiadomienia o naruszeniu umowy/zasad korzystania - w przypadku kart kredytowych: najpewniej znacznego przekroczenia limitu/terminu spłaty. 7

8 ZMIENNE OBJAŚNIAJĄCE przeciętne miesięczne dochody respondenta: x 1 = avgincome = income*10000/12 Jest to zmienna ciągła. Została zbudowana na podstawie zmiennej income oznaczającej średnie roczne dochody respondenta podzielone przez W modelu uwzględniliśmy logarytm zmiennej x 1 lavgincome. kwadrat wieku: x = age2 age* age 2 = Jest to zmienna ciągła. Została zbudowana na podstawie zmiennej age oznaczającej wiek respondenta (podany z dokładnością do 1 miesiąca = 1/12 roku). fakt posiadania domu/mieszkania: x = ownrent 3 Jest to zmienna binarna. ownrent = 1 jeśli respondent jest właścicielem domu/mieszkania ownrent = 0 w pozostałych przypadkach fakt samozatrudnienia x = 4 Jest to zmienna binarna. selfempl selfempl = 1 jeśli respondent jest samozatrudniający się selfempl = 0 w pozostałych przypadkach liczba osób pozostających na utrzymaniu właściciela karty: Zmienna ta została utworzona ze zmiennej dependt, która oznaczała liczbę osób pozostających na utrzymaniu właściciela karty. Zmienna dependt przyjmowała 7 poziomów, dlatego postanowiliśmy ją pogrupować na zmienne binarne: osoby x 5 = dependt x 5 = dependt _1=1 oznacza, że respondent ma na utrzymaniu 1 osobę _1=0 oznacza, że respondent ma na utrzymaniu mniej niż 1 osobę x 6 = dependt _ 2=1 oznacza, że respondent ma na utrzymaniu 2 osoby x 6 = dependt _ 2=0 oznacza, że respondent ma na utrzymaniu mniej niż 2 x 7 = dependt _ 3 =1 oznacza, że respondent ma na utrzymaniu 3 osoby i więcej 8

9 osoby x 7 = dependt _ 3 =0 oznacza, że respondent ma na utrzymaniu mniej niż 3 liczba posiadanych głównych kart kredytowych x = major 8 Jest to zmienna binarna. W oryginalnej bazie danych zmienna major przyjmowała wartość 1 dla posiadacza takiej karty. Jednak przekodowaliśmy ją, aby poziom bazowy zawierał większość obserwacji (patrz statystyki opisowe zmiennych). major = 1 jeśli respondent posiada główną kartę kredytową major = 0 jeśli nie posiada. liczba posiadanych aktywnych rachunków / kont kredytowych x = active 9 Jest to zmienna dyskretna. liczba monitów bankowych: x 10 = major _ drg Jest to zmienna binarna. Powstała on ze zmiennej majordrg, oznaczającej liczbę monitów bankowych, otrzymanych przez respondenta. major_drg = 0 jeśli majordrg = 0 major_drg = 1 jeśli majordrg > 0 długość zamieszkiwania pod danym adresem (w miesiącach): x = curadd 11 Jest to zmienna ciągła. ε i składnik losowy i = 1,2,,N indeks obserwacji Baza danych, którą wykorzystaliśmy w naszym badaniu była podstawą modelu, jaki prof. William Greene zbudował w 1995 roku i zamieścił w książce Econometric Analysis (wydanie V z 2003 roku). Autor stworzył model zachowania konsumenta Credit scoring model, w którym zmienna zależną była liczba major derogatory reports zarejestrowana w historii kredytowej respondenta. Zmiennymi objaśniającymi z kolei były wiek, dochód i przeciętne wydatki z kart. Greene zbudował także model badający fakt przyznania karty kredytowej w zależności od wieku, dochodu, faktu posiadania domu i samozatrudnienia. Nam jednak wydało się interesujące zbadać co determinuje wydatki z kart. Badanie prof. Green a było dla nas źródłem wartościowych informacji i wniosków. 9

10 5. WSTĘPNA ANALIZA DANYCH 5.1 STATYSTYKI OPISOWE ZMIENNYCH Poniżej przedstawiamy podstawowe statystyki opisowe zmiennych wartość średnią, minimalną, maksymalną i odchylenie standardowe. Na tym etapie badania uwzględnionych zostało 1017 obserwacji.. summ avgexp avgincome age ownrent selfempl dependt major active majordrg curadd Variable Obs Mean Std. Dev. Min Max avgexp avgincome age ownrent selfempl dependt major active majordrg curadd Uznaliśmy, iż mimo, że w modelu wykorzystujemy zmienna age2 to łatwiejsza w interpretacji niektórych statystyk opisowych będzie zmienna age. W Załączniku nr 1 znajdują się bardziej szczegółowe statystyki opisowe uwzględniające dodatkowo percentyle, zakres zmiennych, wariancję skośność i kurtozę. 5.2 MACIERZ KORELACJI ZMIENNYCH. corr avgexp avgincome age2 ownrent selfempl dependt_1 dependt_2 dependt_3 major active major_drg curadd (obs=1017) avgexp avginc~e age2 ownrent selfempl depend~1 depend~2 depend~3 major active major_~g curadd avgexp avgincome age ownrent selfempl dependt_ dependt_ dependt_ major active major_drg curadd Współczynniki korelacji pomiędzy poszczególnymi zmiennymi objaśniającymi nie wykazują znaczącej zależności. Jedynie współczynnik pomiędzy curadd a age2 przyjmuje wartość Według nas wiąże się to z faktem, iż osoby starsze rzadziej zmieniają miejsce zamieszkania. 10

11 5.3 ANALIZA ZMIENNYCH BINARNYCH W tym punkcie przedstawiamy wartość średnią i odchylenie standardowe zmiennej avgexp z rozróżnieniem poszczególnych poziomów zmiennych binarnych: ownrent, selfempl, major i major_drg. ownrent. sort ownrent. by ownrent: summarize avgexp -> ownrent = 0 Variable Obs Mean Std. Dev. Min Max avgexp > ownrent = 1 Variable Obs Mean Std. Dev. Min Max avgexp Widzimy, iż średnia i odchylenie avgexp na obu poziomach (o podobnej liczebności) ownrent różnią się nieznacznie, stąd możemy wnioskować, że zmienna ta może okazać się w modelu nieistotna. selfempl. sort selfempl. by selfempl: summarize avgexp -> selfempl = 0 Variable Obs Mean Std. Dev. Min Max avgexp > selfempl = 1 Variable Obs Mean Std. Dev. Min Max avgexp Tutaj także statystyki opisowe nie wykazują dużych różnic. Jednak wartości maksymalne oraz liczebności grup różnią się znacząco, zatem możemy podejrzewać istotność zmiennej selfempl w wyjaśnieniu poziomu wydatków. 11

12 major. sort major. by major: summarize avgexp -> major = 0 Variable Obs Mean Std. Dev. Min Max avgexp > major = 1 Variable Obs Mean Std. Dev. Min Max avgexp W tym przypadku statystyki opisowe wykazują nieco mniejsze różnice niż dla selfempl. Wartości maksymalne oraz liczebności grup także są nieco mniej zróżnicowane. W związku z tym nie możemy jednoznacznie przewidzieć istotności tej zmiennej. major_drg. sort major_drg. by major_drg: summarize avgexp -> major_drg = 0 Variable Obs Mean Std. Dev. Min Max avgexp > major_drg = 1 Variable Obs Mean Std. Dev. Min Max avgexp W przypadku tej zmiennej statystyki opisowe, jak i liczebności podgrup wykazują duże różnice. Zatem spodziewamy się, iż zmienna major_drg będzie istotnie wpływać na wydatki z kart. 12

13 5.4 HISTOGRAMY ZMIENNYCH Poniżej przedstawiamy histogramy zmiennych ciągłych(uwzględniające 1017 obserwacji): avgexp, avgincome, age, curadd wraz z krótkim opisem. Rys. 1. Histogram zmiennej avgexp. Średnie miesięczne wydatki zadeklarowane przez respondentów zaczynają się na poziomie 0$, a największe wynoszą prawie 3100$. Histogram wyraźnie wykazuje prawoskośność, na co wskazuje też wielkość mediany, kształtującej się na poziomie ok. 150$. Rys. 2. Histogram zmiennej avgincome. Zakres średnich dochodów zawiera się pomiędzy 175$ a 11250$ miesięcznie. Histogram nie jest symetryczny ponieważ większość obserwacji należy do przedziału 1000$ do 5000$. Również wartość mediany to 2500$. 13

14 Rys. 3. Histogram zmiennej age. Wykres wskazuje, że wiek respondenta zawiera się w przedziale (18; 83), co wskazuje na fakt, iż w badania wzięły udział osoby reprezentujące wszystkie grupy wiekowe, dla których możliwe jest posiadanie kart kredytowych. Można zauważyć, że histogram nie jest symetryczny, ponieważ przeważająca większość respondentów zawiera się w przedziale od 20 do 40 lat. Wielkość mediany kształtuje się na poziomie 31,25. (Uznaliśmy, iż mimo że w modelu wykorzystujemy age2 to łatwiejszy w interpretacji będzie histogram age.) Rys. 4. Histogram zmiennej curadd. Wartości minimalna i maksymalna długości zamieszkiwania pod danym adresem zadeklarowane przez respondentów to odpowiednio niecały miesiąc i 540 miesięcy. Histogram wyraźnie wskazuje na prawoskośność, gdyż większość obserwacji zawiera się w przedziale Źródło: (0;80), baza a wielkość danych mediany ze strony: to 30 miesięcy obliczenia własne. 6. FORMA FUNKCYJNA MODELU Model powstał w programie Intercoolded Stata 8.1. Wyboru formy funkcyjnej modelu dokonaliśmy po porównaniu histogramów logarytmów zmiennych avgexp i avgincome z rozkładem normalnym. Poniżej przedstawiamy te wykresy (dla 996 obserwacji, dla których przeprowadzono ostateczną regresję). 14

15 Rys. 5. Histogram logarytmu zmiennej avgexp Źródło: baza danych ze strony: obliczenia własne. Rys. 6. Histogram logarytmu zmiennej avgincome Z wykresów wynika, że odpowiednią formą modelu będzie forma, w której wydatki i dochody zostaną logarytmowane. Rozkład logarytmu avgexp jest podobny do rozkładu normalnego. Jeżeli chodzi o logarytm zmiennej avgincome, to rozkład logarytmu nie wykazuje tak wysokiego podobieństwa do rozkładu normalnego, jak poprzednia zmienna. Na histogramie wyraźny jest brak lewego ogona rozkładu. Jednak według nas jest to spowodowane faktem, iż w badaniu odrzucone zostały obserwacje dla respondentów nie posiadających kart. W związku z tym dochód respondentów wziętych pod uwagę znajduje się powyżej pewnego poziomu (zapewne wymaganego przez bank do otrzymania karty kredytowej). Zatem w modelu wykorzystaliśmy zmienną lavgincome. Poniżej przedstawiamy zakładany model końcowy: ln( y) = β + β x 10 10i 0 + β1 ln( x1 i ) + β x 11 11i + ε i + β x 2 2i + β x 3 3i + β x 4 4i + β x 5 5i + β x 6 6i + β x 7 7i + β x 8 8i + β x 9 9i + Postać analityczna szacowanego równania regresji (wraz z przewidywanymi znakami współczynników): (+) ( ) (+) (+) (+) lavgexp = β 0 + β 1 lavgincome + β 2 age2 + β 3 ownrent + β 4 selfempl + β 5 dependt_1 + (+) (+) (+) (+) (+) ( ) +β 6 dependt_2 + β 7 dependt_3 + β 8 major + β 9 active + β 10 major_drg + β 11 curadd + ε i 15

16 7. ESTYMACJA PARAMETRÓW MODELU Końcowa estymacja została przeprowadzona na próbie zawierającej 996 obserwacji. Wyniki tak oszacowanego modelu przedstawia tabela:. reg lavgexp lavgincome age2 ownrent selfempl dependt_1 dependt_2 dependt_3 major active major_drg curadd Source SS df MS Number of obs = F( 11, 984) = 7.30 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = lavgexp Coef. Std. Err. t P> t [95% Conf. Interval] lavgincome age ownrent selfempl dependt_ dependt_ dependt_ major active major_drg curadd _cons Mimo, że wszystkie zmienne w modelu naraz są istotne (Prob>F=0.0000), jednak występują pojedyncze zmienne nieistotne: ownrent, dependt_1, dependt_2, dependt_3, major, active, curadd. Z modelu były usuwane kolejno te zmienne, które posiadały największą wartość P> t. Jako pierwsze usunięto zmienne: ownrent (P> t =0.907). Następnie okazało się, że żaden z ze zmiennych dependt_1 (P> t =0.859), dependt_2 (P> t =0.416), dependt_3 (P> t =0.874) nie jest istotna. Przed usunięciem ich z modelu wykonaliśmy test na łączną nieistotność, który prezentujemy poniżej:. test dependt_1 dependt_2 dependt_3 ( 1) dependt_1 = 0 ( 2) dependt_2 = 0 ( 3) dependt_3 = 0 F( 3, 985) = 0.31 Prob > F = Wartość Prob>F = > 0.05 zatem nie ma podstaw do odrzucenia hipotezy zerowej o łącznej nieistotności zmiennych. Kolejnymi zmiennymi usuniętymi były: curadd (P> t =0.703), major (P> t =0.598), oraz active (P> t =0.168). 16

17 Wyniki estymacji po wyrzuceniu zmiennych nieistotnych przedstawiają się następująco:. reg lavgexp lavgincome age2 selfempl major_drg Source SS df MS Number of obs = F( 4, 991) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = lavgexp Coef. Std. Err. t P> t [95% Conf. Interval] lavgincome age selfempl major_drg _cons Potwierdzeniem łącznej nieistotności wszystkich zmiennych usuniętych jest wynik testu na łączną nieistotność:. test ownrent dependt_1 dependt_2 dependt_2 major active curadd ( 1) ownrent = 0 ( 2) dependt_1 = 0 ( 3) dependt_2 = 0 ( 4) dependt_2 = 0 ( 5) major = 0 ( 6) active = 0 ( 7) curadd = 0 Constraint 4 dropped F( 6, 984) = 0.51 Prob > F = Prob>F wynosi > 0.05 w związku z czym nie ma podstaw do odrzucenia hipotezy zerowej o łącznej nieistotności zmiennych. 8. OSZACOWANIE MODELU Po przeprowadzeniu estymacji wykonaliśmy test na współliniowość vif:. vif Variable VIF 1/VIF lavgincome age selfempl major_drg Mean VIF

18 Widzimy, iż wszystkie wartości są znacznie mniejsze od 10, zatem możemy wnioskować, że w modelu nie występuje problem współliniowości. Kolejnym wykonanym przez nas testem był test Cook a. Wskazał on 54 obserwacje o skrajnych wartościach podejrzane o duży wpływ na wyniki regresji. Jednak po dokładnej ich analizie doszliśmy do wniosku, że nie można tych obserwacji usunąć z próby. Poniżej przedstawiamy dwie przykładowe obserwacje wraz z ich analizą: avgexp majordrg age income ownrent selfempl dependt curadd major active avginc~e age major_~g depend~1 depend~2 depend~3 lavgexp lavgin~e cd Ta obserwacja została wyróżniona zapewne ze względu na bardzo małe wydatki, których wielkość po zlogarytmowaniu dała wartość ujemną. Jednak naszym zdaniem nie należałoby odrzucać tej obserwacji, ponieważ według nas nie jest ona błędna. Po pierwsze dlatego, że avgexp to średnia wielkość wydatków dokonywanych przy użyciu karty kredytowej, a nie wielkość całkowitych wydatków. Po drugie należy zauważyć, iż respondent jest osobą młoda, nie posiadająca nikogo na utrzymaniu. Z tych dwóch względów może wynikać niska wartość avgexp avgexp majordrg age income ownrent selfempl dependt curadd major active avginc~e age major_~g depend~1 depend~2 depend~3 lavgexp lavgin~e cd W przypadku tej obserwacji, sytuacja jest odwrotna niż powyżej. Zauważamy, że mamy tu do czynienia ze stosunkowo wysokimi wydatkami, jak również bardzo wysokimi dochodami u osoby prawie 72 letniej. Jednak nie można stwierdzić, że taka sytuacja nie może mieć miejsca. Prawdopodobne jest, że dany respondent to zamożna starsza osoba, posiadająca dodatkowe źródło utrzymania poza emeryturą, np. udziały w firmie. Aby potwierdzić nasze wnioski wykonaliśmy test dźwigni: Rys. 7. Wykres standaryzowanych reszt i dźwigni. Widzimy, że żadna z obserwacji nie znalazła się w prawej-górnej części wykresu. W związku z tym upewniliśmy się, że nie mamy obserwacji, które znacząco wpływałyby na precyzję oszacowań. Źródło: baza danych z strony: obliczenia własne. 18

19 9. DIAGNOSTYKA MODELU W tym punkcie przedstawiamy kolejno wyniki przeprowadzonych przez nas testów diagnostycznych: test RESET na poprawność formy funkcyjnej. ovtest, rhs Ramsey RESET test using powers of the independent variables Ho: model has no omitted variables F(6, 985) = 0.78 Prob > F = Prob>F = >0.05 zatem nie ma podstaw do odrzucenia hipotezy zerowej. Stąd wnioskujemy, że forma funkcyjna zastosowana w modelu jest poprawna. test BREUSCHA-PAGANA na heteroskedastyczność. hettest, rhs Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: lavgincome age2 selfempl major_drg chi2(4) = 2.22 Prob > chi2 = Prob>chi2 = >0.05 zatem nie ma podstaw do odrzucenia hipotezy zerowej. Stąd wnioskujemy, że składnik losowy jest homoskedastyczny. test WHITE A. imtest, white White's test for Ho: homoskedasticity against Ha: unrestricted heteroskedasticity chi2(12) = 6.05 Prob > chi2 = Cameron & Trivedi's decomposition of IM-test Source chi2 df p Heteroskedasticity Skewness Kurtosis Total Prob>chi2 = >0.05 zatem nie ma podstaw do odrzucenia hipotezy zerowej. Stąd również wnioskujemy, że składnik losowy jest homoskedastyczny. 19

20 test JARQUE-BERRA na normalność składnika losowego:. sktest res Skewness/Kurtosis tests for Normality joint Variable Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi res Z wyników testu (Prob>chi2=0.000) możemy wnioskować, iż składnik losowy nie ma rozkładu normalnego. Jednak w dużych próbach nie jest to istotne, gdyż rozkłady statystyk w takich próbach są bliskie standardowym. 5 (patrz załącznik nr 2.) 10. INTERPRETACJA WYNIKÓW ESTYMACJI Po przeprowadzeniu estymacji możemy przystąpić do interpretacji otrzymanych wyników. Jak widać, zmiennymi istotnymi na poziomie 0,05 okazały się następujące zmienne: kwadrat wieku respondenta logarytm średniego miesięcznego dochodu respondenta fakt otrzymywania monitów bankowych fakt samozatrudnienia Zmienne te są również łącznie istotne (Prob>F = < 0.05). Pozostałe zmienne w modelu okazały się statystycznie nieistotne. Macierz oszacowań wektora β wygląda następująco:. matrix list e(b) e(b)[1,5] lavgincome age2 selfempl major_drg _cons y Wyestymowane parametry można zinterpretować w następujący sposób: Wartość R 2 =7,24% oznacza, że zmienność zmiennej objaśnianej (wydatków z kart) została wyjaśniona w modelu poprzez zmienne objaśniające w 7,24%. Jednocześnie wartość dopasowanego R 2 jest równa 6,86%. Wzrost średniego miesięcznego dochodu o 1% powoduje (średnio rzecz biorąc) wzrost średnich miesięcznych wydatków z kart o 0,73% ceteris paribus Wzrost kwadratu wieku o jednostkę powoduje (średnio rzecz biorąc) spadek średnich miesięcznych wydatków z kart o 0,019% ceteris paribus. Osoby samozatrudniające się wydają przy użyciu kart kredytowych (średnio rzecz biorąc) o 26,83% (e ,731) mniej niż osoby o innym statusie pracy ceteris paribus. 5 Jerzy Mycielski, Skrypt do Ekonometrii semestr 1, Warszawa 2006, str

Diagnostyka w Pakiecie Stata

Diagnostyka w Pakiecie Stata Karol Kuhl Zgodnie z twierdzeniem Gaussa-Markowa, estymator MNK w KMRL jest liniowym estymatorem efektywnym i nieobciążonym, co po angielsku opisuje się za pomocą wyrażenia BLUE Best Linear Unbiased Estimator.

Bardziej szczegółowo

Diagnostyka w Pakiecie Stata

Diagnostyka w Pakiecie Stata Karol Kuhl Zgodnie z twierdzeniem Gaussa-Markowa, estymator MNK w KMRL jest liniowym estymatorem efektywnym i nieobciążonym, co po angielsku opisuje się za pomocą wyrażenia BLUE Best Linear Unbiased Estimator.

Bardziej szczegółowo

Egzamin z ekonometrii wersja IiE, MSEMAT

Egzamin z ekonometrii wersja IiE, MSEMAT Pytania teoretyczne Egzamin z ekonometrii wersja IiE, MSEMAT 08-02-2017 1. W jaki sposób przeprowadzamy test Chowa? 2. Pokazać, że jest nieobciążonym estymatorem. 3. Udowodnić, że w modelu ze stałą TSSESS+RSS.

Bardziej szczegółowo

Ekonometria Ćwiczenia 19/01/05

Ekonometria Ćwiczenia 19/01/05 Oszacowano regresję stopy bezrobocia (unemp) na wzroście realnego PKB (pkb) i stopie inflacji (cpi) oraz na zmiennych zero-jedynkowych związanymi z kwartałami (season). Regresję przeprowadzono na danych

Bardziej szczegółowo

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne Egzamin z ekonometrii wersja ogólna 08-02-2017 Pytania teoretyczne 1. Za pomocą którego testu testujemy stabilność parametrów? Jakiemu założeniu KMRL odpowiada H0 w tym teście? Jaka jest hipoteza alternatywna

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10 Stanisław Cichocki Natalia Nehrebecka Wykład 10 1 1. Testy diagnostyczne Testowanie prawidłowości formy funkcyjnej: test RESET Testowanie normalności składników losowych: test Jarque-Berra Testowanie stabilności

Bardziej szczegółowo

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 0/0/0. Egzamin trwa 90 minut.. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu. Złamanie

Bardziej szczegółowo

Egzamin z ekonometrii wersja IiE, MSEMAT

Egzamin z ekonometrii wersja IiE, MSEMAT Egzamin z ekonometrii wersja IiE, MSEMAT 04-02-2016 Pytania teoretyczne 1. Za pomocą jakiego testu weryfikowana jest normalność składnika losowego? Jakiemu założeniu KMRL odpowiada w tym teście? Jakie

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników

Bardziej szczegółowo

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Natalia Nehrebecka Stanisław Cichocki. Wykład 10 Natalia Nehrebecka Stanisław Cichocki Wykład 10 1 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników

Bardziej szczegółowo

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 02/02/2011 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12 Stanisław Cichocki Natalia Nehrebecka Wykład 1 1 1. Testy diagnostyczne Testowanie stabilności parametrów modelu: test Chowa. Heteroskedastyczność Konsekwencje Testowanie heteroskedastyczności 1. Testy

Bardziej szczegółowo

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu Część 1 Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy małej próby Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy małej próby Testy

Bardziej szczegółowo

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne Egzamin z ekonometrii wersja IiE, MSEMat 31-01-2014 Pytania teoretyczne 1. Podać postać przekształcenia Boxa-Coxa i wyjaśnić, do czego jest stosowane w ekonometrii. 2. Wyjaśnić, jakie korzyści i niebezpieczeństwa

Bardziej szczegółowo

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne Egzamin z ekonometrii wersja ogólna 31-01-2014 Pytania teoretyczne 1. Podać postać przekształcenia Boxa-Coxa i wyjaśnić, do czego jest stosowane w ekonometrii. 2. Porównaj zastosowania znanych ci kontrastów

Bardziej szczegółowo

Ekonometria egzamin 07/03/2018

Ekonometria egzamin 07/03/2018 imię, nazwisko, nr indeksu: Ekonometria egzamin 07/03/2018 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9 Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14 Stanisław Cichocki Natalia Nehrebecka Wykład 14 1 1.Problemy z danymi Współliniowość 2. Heteroskedastyczność i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji Metody radzenia sobie z heteroskedastycznością

Bardziej szczegółowo

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu Część 2 Test Durbina-Watsona Test Durbina-Watsona Weryfikowana hipoteza H 0 : cov(ε t, ε t 1 ) = 0 H 1 : cov(ε t, ε t 1 ) 0 Test Durbina-Watsona Weryfikowana hipoteza H 0 : cov(ε t, ε t 1 ) = 0 H 1 : cov(ε

Bardziej szczegółowo

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2. Zadanie 1 Niech y t ma rozkład logarytmiczno normalny o funkcji gęstości postaci [ ] 1 f (y t ) = y exp (ln y t β ln x t ) 2 t 2πσ 2 2σ 2 Zakładamy, że x t jest nielosowe a y t są nieskorelowane w czasie.

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14 Stanisław Cichocki Natalia Nehrebecka Wykład 14 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne Obserwacje nietypowe i błędne Współliniowość - Mamy 2 modele: y X u 1 1 (1) y X X 1 1 2 2 (2)

Bardziej szczegółowo

Egzamin z ekonometrii wersja ogolna

Egzamin z ekonometrii wersja ogolna Egzamin z ekonometrii wersja ogolna 04-02-2016 Pytania teoretyczne 1. Wymienić założenia Klasycznego Modelu Regresji Liniowej (KMRL). 2. Wyprowadzić estymator MNK dla modelu z wieloma zmiennymi objaśniającymi.

Bardziej szczegółowo

Natalia Nehrebecka. Wykład 1

Natalia Nehrebecka. Wykład 1 Natalia Nehrebecka Wykład 1 1 1. Sprawy organizacyjne Zasady zaliczenia Dwiczenia Literatura 2. Czym zajmuje się ekonometria? 3. Formy danych statystycznych 4. Model ekonometryczny 2 1. Sprawy organizacyjne

Bardziej szczegółowo

Egzamin z ekonometrii wersja IiE, MSEMAT

Egzamin z ekonometrii wersja IiE, MSEMAT Egzamin z ekonometrii wersja IiE, MSEMAT 02022015 Pytania teoretyczne 1. Podać treść twierdzenia GaussaMarkowa i wyjaśnić jego znaczenie. 2. Za pomocą jakich testów testuje się autokorelację? Jakiemu założeniu

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12 Stanisław Cichocki Natalia Nehrebecka Wykład 12 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne 2. Autokorelacja o Testowanie autokorelacji 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne

Bardziej szczegółowo

1.8 Diagnostyka modelu

1.8 Diagnostyka modelu 1.8 Diagnostyka modelu Dotychczas zajmowaliśmy się własnościami estymatorów przy spełnionych założeniach KMRL. W praktyce nie zawsze spełnione są wszystkie założenia modelu. Jeżeli któreś z nich nie jest

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13 Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Autokorelacja Konsekwencje Testowanie autokorelacji 2. Metody radzenia sobie z heteroskedastycznością i autokorelacją Uogólniona Metoda Najmniejszych

Bardziej szczegółowo

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 Zadanie 1 a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 b) W naszym przypadku populacja są inżynierowie w Tajlandii. Czy można jednak przypuszczać, że na zarobki kobiet-inżynierów

Bardziej szczegółowo

Ćwiczenia IV

Ćwiczenia IV Ćwiczenia IV - 17.10.2007 1. Spośród podanych macierzy X wskaż te, których nie można wykorzystać do estymacji MNK parametrów modelu ekonometrycznego postaci y = β 0 + β 1 x 1 + β 2 x 2 + ε 2. Na podstawie

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 01/02/2019 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12 Stanisław Cichocki Natalia Nehrebecka Zajęcia 11-12 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość - Mamy 2 modele: y X u 1 1 (1) y X X 1 1 2 2 (2) - Potencjalnie

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13 Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Testowanie autokorelacji 2. Heteroskedastyczność i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji 3.Problemy z danymi Zmienne pominięte

Bardziej szczegółowo

, a reszta dla pominiętej obserwacji wynosi 0, RSS jest stałe, T SS rośnie, więc zarówno R 2 jak i R2 rosną. R 2 = 1 n 1 n. rosnie. n 2 (1 R2 ) = 1 59

, a reszta dla pominiętej obserwacji wynosi 0, RSS jest stałe, T SS rośnie, więc zarówno R 2 jak i R2 rosną. R 2 = 1 n 1 n. rosnie. n 2 (1 R2 ) = 1 59 Zadanie 1. Ekonometryk szacując funkcję konsumpcji przeprowadził estymację osobno dla tzw. Polski A oraz Polski B. Dla Polski A posiadał n 1 = 40 obserwacji i uzyskał współczynnik dopasowania RA 2 = 0.4,

Bardziej szczegółowo

Egzamin z ekonometrii - wersja ogólna

Egzamin z ekonometrii - wersja ogólna Egzamin z ekonometrii - wersja ogólna 06-02-2019 Regulamin egzaminu 1. Egzamin trwa 90 min. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

Problem równoczesności w MNK

Problem równoczesności w MNK Problem równoczesności w MNK O problemie równoczesności mówimy, gdy występuje korelacja między wartościa oczekiwana ε i i równoczesnym x i Model liniowy y = Xβ + ε, E (u) = 0 Powiedzmy, że występuje w

Bardziej szczegółowo

1 Modele ADL - interpretacja współczynników

1 Modele ADL - interpretacja współczynników 1 Modele ADL - interpretacja współczynników ZADANIE 1.1 Dany jest proces DL następującej postaci: y t = µ + β 0 x t + β 1 x t 1 + ε t. 1. Wyjaśnić, jaka jest intepretacja współczynników β 0 i β 1. 2. Pokazać

Bardziej szczegółowo

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Natalia Nehrebecka Stanisław Cichocki. Wykład 10 Natalia Nehrebecka Stanisław Cichocki Wykład 10 1 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów

Bardziej szczegółowo

Heteroskedastyczość w szeregach czasowyh

Heteroskedastyczość w szeregach czasowyh Heteroskedastyczość w szeregach czasowyh Czesto zakłada się, że szeregi czasowe wykazuja autokorelację ae sa homoskedastyczne W rzeczywistości jednak często wariancja zmienia się w czasie Dobrym przykładem

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka - adres mailowy: scichocki@o2.pl - strona internetowa: www.wne.uw.edu.pl/scichocki - dyżur: po zajęciach lub po umówieniu mailowo - 80% oceny: egzaminy - 20% oceny:

Bardziej szczegółowo

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować

Bardziej szczegółowo

Natalia Nehrebecka. 18 maja 2010

Natalia Nehrebecka. 18 maja 2010 Natalia Nehrebecka 18 maja 2010 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów 5. Testowanie

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji

Bardziej szczegółowo

Rozdział 8. Regresja. Definiowanie modelu

Rozdział 8. Regresja. Definiowanie modelu Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność

Bardziej szczegółowo

Ekonometria dla IiE i MSEMat Z12

Ekonometria dla IiE i MSEMat Z12 Ekonometria dla IiE i MSEMat Z12 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 09-01-2017 Test RESET Ramsey a W pierwszym etapie estymujemy współczynniki regresji w modelu:

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka - adres mailowy: nnehrebecka@wne.uw.edu.pl - strona internetowa: www.wne.uw.edu.pl/nnehrebecka - dyżur: wtorek 18.30-19.30 sala 302 lub 303 - 80% oceny: egzaminy -

Bardziej szczegółowo

Natalia Nehrebecka Stanisław Cichocki. Wykład 13

Natalia Nehrebecka Stanisław Cichocki. Wykład 13 Natalia Nehrebecka Stanisław Cichocki Wykład 13 1 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość 2 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje

Bardziej szczegółowo

Metoda najmniejszych kwadratów

Metoda najmniejszych kwadratów Własności algebraiczne Model liniowy Zapis modelu zarobki = β 0 + β 1 plec + β 2 wiek + ε Oszacowania wartości współczynników zarobki = b 0 + b 1 plec + b 2 wiek + e Model liniowy Tabela: Oszacowania współczynników

Bardziej szczegółowo

Ekonometria egzamin wersja ogólna 17/06/08

Ekonometria egzamin wersja ogólna 17/06/08 imię, nazwisko, nr indeksu: Ekonometria egzamin wersja ogólna 17/06/08 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8 Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13 Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Problemy z danymi Obserwacje nietypowe i błędne Współliniowość. Heteroskedastycznośd i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji

Bardziej szczegółowo

1.6 Zmienne jakościowe i dyskretne w modelu regresji

1.6 Zmienne jakościowe i dyskretne w modelu regresji 1.6 Zmienne jakościowe i dyskretne w modelu regresji 1.6.1 Zmienne dyskretne i zero-jedynkowe (Dummy Variables) W badaniach ekonometrycznych bardzo często występują zjawiska, które opisujemy zmiennymi

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

Zbiór zadań. Makroekonomia II ćwiczenia KONSUMPCJA

Zbiór zadań. Makroekonomia II ćwiczenia KONSUMPCJA Zbiór zadań. Makroekonomia II ćwiczenia KONSUMPCJA Zadanie 1. Konsument żyje przez 4 okresy. W pierwszym i drugim okresie jego dochód jest równy 100; w trzecim rośnie do 300, a w czwartym spada do zera.

Bardziej szczegółowo

Natalia Nehrebecka Stanisław Cichocki. Wykład 6

Natalia Nehrebecka Stanisław Cichocki. Wykład 6 Natalia Nehrebecka Stanisław Cichocki Wykład 6 1 1. Zmienne dyskretne Zmienne zero-jedynkowe 2. Modele z interakcjami 2 Zmienne dyskretne Zmienne nominalne Zmienne uporządkowane 3 4 1 podstawowe i 0 podstawowe

Bardziej szczegółowo

Analiza regresji - weryfikacja założeń

Analiza regresji - weryfikacja założeń Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.

Bardziej szczegółowo

1. Obserwacje nietypowe

1. Obserwacje nietypowe 1. Obserwacje nietypowe Przeanalizujemy następujący eksperyment: 1) Generujemy zmienną x z rozkładu N (,1) (37 obserwacji). ) Generujemy zmienną y w następujący sposób: y = 1+ x + ε, gdzie ε ~ N(0,1).

Bardziej szczegółowo

Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18

Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18 Ekonometria Metodologia budowy modelu Jerzy Mycielski WNE, UW Luty, 2011 Jerzy Mycielski (WNE, UW) Ekonometria Luty, 2011 1 / 18 Sprawy organizacyjne Dyżur: środa godz. 14-15 w sali 302. Strona internetowa

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Wykład 1

Stanisław Cichocki Natalia Nehrebecka. Wykład 1 Stanisław Cichocki Natalia Nehrebecka Wykład 1 1 1. Sprawy organizacyjne Zasady zaliczenia Ćwiczenia Literatura 2. Obciążenie Lovella 3. Metoda od ogólnego do szczególnego 4. Kryteria informacyjne 2 1.

Bardziej szczegółowo

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 06/03/2019 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y). Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

Regresja logistyczna (LOGISTIC)

Regresja logistyczna (LOGISTIC) Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada Stanisław Cichocki Natalia Nehrebecka Katarzyna Rosiak-Lada 1. Sprawy organizacyjne Zasady zaliczenia 2. Czym zajmuje się ekonometria? 3. Formy danych statystycznych 4. Model ekonometryczny 2 1. Sprawy

Bardziej szczegółowo

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności. TEST STATYSTYCZNY Testem statystycznym nazywamy regułę postępowania rozstrzygająca, przy jakich wynikach z próby hipotezę sprawdzaną H 0 należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.

Bardziej szczegółowo

Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08

Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08 imię, nazwisko, nr indeksu: Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz

Bardziej szczegółowo

Model 1: Estymacja KMNK z wykorzystaniem 4877 obserwacji Zmienna zależna: y

Model 1: Estymacja KMNK z wykorzystaniem 4877 obserwacji Zmienna zależna: y Zadanie 1 Rozpatrujemy próbę 4877 pracowników fizycznych, którzy stracili prace w USA miedzy rokiem 1982 i 1991. Nie wszyscy bezrobotni, którym przysługuje świadczenie z tytułu ubezpieczenia od utraty

Bardziej szczegółowo

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy

Bardziej szczegółowo

Ekonometria dla IiE i MSEMat Z7

Ekonometria dla IiE i MSEMat Z7 Ekonometria dla IiE i MSEMat Z7 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 21-11-2016 Na podstawie zbioru danych cps_small.dat z książki Principles of Econometrics oszacowany

Bardziej szczegółowo

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:

Bardziej szczegółowo

Jak zarabiają najbardziej wpływowi - determinanty zarobków CEO

Jak zarabiają najbardziej wpływowi - determinanty zarobków CEO Uniwersytet Warszawski Wydział Nauk Ekonomicznych Cyryl Kasperski Nr albumu: 276885 Jak zarabiają najbardziej wpływowi - determinanty zarobków CEO Praca na kierunku: Informatyka i Ekonometria Praca wykonana

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Analiza wariancji - ANOVA

Analiza wariancji - ANOVA Analiza wariancji - ANOVA Analiza wariancji jest metodą pozwalającą na podział zmienności zaobserwowanej wśród wyników eksperymentalnych na oddzielne części. Każdą z tych części możemy przypisać oddzielnemu

Bardziej szczegółowo

Prognozowanie na podstawie modelu ekonometrycznego

Prognozowanie na podstawie modelu ekonometrycznego Prognozowanie na podstawie modelu ekonometrycznego Przykład. Firma usługowa świadcząca usługi doradcze w ostatnich kwartałach (t) odnotowała wynik finansowy (yt - tys. zł), obsługując liczbę klientów (x1t)

Bardziej szczegółowo

Kolokwium ze statystyki matematycznej

Kolokwium ze statystyki matematycznej Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę

Bardziej szczegółowo

Ekonometria I Weryfikacja: współliniowość i normalność. Dr Michał Gradzewicz Szkoła Główna Handlowa w Warszawie

Ekonometria I Weryfikacja: współliniowość i normalność. Dr Michał Gradzewicz Szkoła Główna Handlowa w Warszawie Ekonometria I Weryfikacja: współliniowość i normalność Dr Michał Gradzewicz Szkoła Główna Handlowa w Warszawie 1 Współliniowość 2 Przypomnienie: Założenia MNK Założenia MNK: 1. Zmienne objaśniające są

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

Jednowskaźnikowy model Sharpe`a

Jednowskaźnikowy model Sharpe`a Uniwersytet Warszawski Wydział Nauk Ekonomicznych Milena Jamroziak i Paweł Androszczuk Model ekonometryczny Jednowskaźnikowy model Sharpe`a dla akcji Amici Praca zaliczeniowa napisana pod kierunkiem mgr

Bardziej szczegółowo

Chcesz zwiększyć swój dochód? Przenieś się i pracuj w Urzędzie!

Chcesz zwiększyć swój dochód? Przenieś się i pracuj w Urzędzie! Uniwersytet Warszawski Wydział Nauk Ekonomicznych Mateusz Błażej Nr albumu: 308521 Chcesz zwiększyć swój dochód? Przenieś się i pracuj w Urzędzie! Model ekonometryczny na kierunku: Informatyka i Ekonometria

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM

Bardziej szczegółowo

Autokorelacja i heteroskedastyczność

Autokorelacja i heteroskedastyczność Autokorelacja i heteroskedastyczność Założenie o braku autokorelacji Cov (ε i, ε j ) = E (ε i ε j ) = 0 dla i j Oczekiwana wielkość elementu losowego nie zależy od wielkości elementu losowego dla innych

Bardziej szczegółowo

1.5 Problemy ze zbiorem danych

1.5 Problemy ze zbiorem danych 1.5 Problemy ze zbiorem danych W praktyce ekonometrycznej bardzo rzadko spełnione są wszystkie założenia klasycznego modelu regresji liniowej. Częstym przypadkiem jest, że zbiór danych którymi dysponujemy

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10 Stanisław Cichoci Natalia Nehrebeca Wyład 10 1 1. Testowanie hipotez prostych Rozład estymatora b Testowanie hipotez prostych przy użyciu statystyi t Przedziały ufności Badamy czy hipotezy teoretyczne

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników

Bardziej szczegółowo

Ekonometria. Zajęcia

Ekonometria. Zajęcia Ekonometria Zajęcia 16.05.2018 Wstęp hipoteza itp. Model gęstości zaludnienia ( model gradientu gęstości ) zakłada, że gęstość zaludnienia zależy od odległości od okręgu centralnego: y t = Ae βx t (1)

Bardziej szczegółowo

Ekonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 31/01/2018 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

Przykład 1 ceny mieszkań

Przykład 1 ceny mieszkań Przykład ceny mieszkań Przykład ceny mieszkań Model ekonometryczny zaleŝności ceny mieszkań od metraŝu - naleŝy do klasy modeli nieliniowych. - weryfikację empiryczną modelu przeprowadzono na przykładzie

Bardziej szczegółowo

e) Oszacuj parametry modelu za pomocą MNK. Zapisz postać modelu po oszacowaniu wraz z błędami szacunku.

e) Oszacuj parametry modelu za pomocą MNK. Zapisz postać modelu po oszacowaniu wraz z błędami szacunku. Zajęcia 4. Estymacja i weryfikacja modelu model potęgowy Wersja rozszerzona W pliku Funkcja produkcji.xls zostały przygotowane przykładowe dane o produkcji, kapitale i zatrudnieniu dla 27 przedsiębiorstw

Bardziej szczegółowo

Inteligentna analiza danych

Inteligentna analiza danych Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki

Bardziej szczegółowo

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 5 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.medexp3.dta przygotuj model regresji kwantylowej 1. Przygotuj model regresji kwantylowej w którym logarytm wydatków

Bardziej szczegółowo

1.9 Czasowy wymiar danych

1.9 Czasowy wymiar danych 1.9 Czasowy wymiar danych Do tej pory rozpatrywaliśmy jedynie modele tworzone na podstawie danych empirycznych pochodzących z prób przekrojowych. Teraz zajmiemy się zagadnieniem budowy modeli regresji,

Bardziej szczegółowo

Zmienne zależne i niezależne

Zmienne zależne i niezależne Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }

Bardziej szczegółowo

Analiza zależności liniowych

Analiza zależności liniowych Narzędzie do ustalenia, które zmienne są ważne dla Inwestora Analiza zależności liniowych Identyfikuje siłę i kierunek powiązania pomiędzy zmiennymi Umożliwia wybór zmiennych wpływających na giełdę Ustala

Bardziej szczegółowo

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:

Bardziej szczegółowo

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13 Stanisław Cichocki Natalia Neherbecka Zajęcia 13 1 1. Kryteria informacyjne 2. Testowanie autokorelacji 3. Modele dynamiczne: modele o rozłożonych opóźnieniach (DL) modele autoregresyjne o rozłożonych

Bardziej szczegółowo

A.Światkowski. Wroclaw University of Economics. Working paper

A.Światkowski. Wroclaw University of Economics. Working paper A.Światkowski Wroclaw University of Economics Working paper 1 Planowanie sprzedaży na przykładzie przedsiębiorstwa z branży deweloperskiej Cel pracy: Zaplanowanie sprzedaży spółki na rok 2012 Słowa kluczowe:

Bardziej szczegółowo

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres

Bardziej szczegółowo