CZYNNIKI WPŁYWAJĄCE NA WYDATKI DOKONYWANE ZA POMOCĄ KART KREDYTOWYCH



Podobne dokumenty
Diagnostyka w Pakiecie Stata

Diagnostyka w Pakiecie Stata

Egzamin z ekonometrii wersja IiE, MSEMAT

Ekonometria Ćwiczenia 19/01/05

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Egzamin z ekonometrii wersja IiE, MSEMAT

Stanisław Cichocki. Natalia Nehrebecka

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Ekonometria egzamin 07/03/2018

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Egzamin z ekonometrii wersja ogolna

Natalia Nehrebecka. Wykład 1

Egzamin z ekonometrii wersja IiE, MSEMAT

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

1.8 Diagnostyka modelu

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Ćwiczenia IV

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

, a reszta dla pominiętej obserwacji wynosi 0, RSS jest stałe, T SS rośnie, więc zarówno R 2 jak i R2 rosną. R 2 = 1 n 1 n. rosnie. n 2 (1 R2 ) = 1 59

Egzamin z ekonometrii - wersja ogólna

Problem równoczesności w MNK

1 Modele ADL - interpretacja współczynników

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Heteroskedastyczość w szeregach czasowyh

Wprowadzenie do analizy korelacji i regresji

Stanisław Cichocki. Natalia Nehrebecka

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Natalia Nehrebecka. 18 maja 2010

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Rozdział 8. Regresja. Definiowanie modelu

Ekonometria dla IiE i MSEMat Z12

Stanisław Cichocki. Natalia Nehrebecka

Natalia Nehrebecka Stanisław Cichocki. Wykład 13

Metoda najmniejszych kwadratów

Ekonometria egzamin wersja ogólna 17/06/08

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

1.6 Zmienne jakościowe i dyskretne w modelu regresji

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Zbiór zadań. Makroekonomia II ćwiczenia KONSUMPCJA

Natalia Nehrebecka Stanisław Cichocki. Wykład 6

Analiza regresji - weryfikacja założeń

1. Obserwacje nietypowe

Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18

Stanisław Cichocki Natalia Nehrebecka. Wykład 1

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

MODELE LINIOWE. Dr Wioleta Drobik

Regresja logistyczna (LOGISTIC)

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08

Model 1: Estymacja KMNK z wykorzystaniem 4877 obserwacji Zmienna zależna: y

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Ekonometria dla IiE i MSEMat Z7

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Jak zarabiają najbardziej wpływowi - determinanty zarobków CEO

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Analiza wariancji - ANOVA

Prognozowanie na podstawie modelu ekonometrycznego

Kolokwium ze statystyki matematycznej

Ekonometria I Weryfikacja: współliniowość i normalność. Dr Michał Gradzewicz Szkoła Główna Handlowa w Warszawie

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Jednowskaźnikowy model Sharpe`a

Chcesz zwiększyć swój dochód? Przenieś się i pracuj w Urzędzie!

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Autokorelacja i heteroskedastyczność

1.5 Problemy ze zbiorem danych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria. Zajęcia

Ekonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Przykład 1 ceny mieszkań

e) Oszacuj parametry modelu za pomocą MNK. Zapisz postać modelu po oszacowaniu wraz z błędami szacunku.

Inteligentna analiza danych

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

1.9 Czasowy wymiar danych

Zmienne zależne i niezależne

Analiza zależności liniowych

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

A.Światkowski. Wroclaw University of Economics. Working paper

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Transkrypt:

TOMASZ BĄK KATARZYNA OWCZARSKA gr. 312 CZYNNIKI WPŁYWAJĄCE NA WYDATKI DOKONYWANE ZA POMOCĄ KART KREDYTOWYCH Praca na pisana na ćwiczeniach z Ekonometrii pod kierunkiem mgr Natalii Nehrebeckiej. UNIWERSYTET WARSZAWSKI WYDZIAŁ NAUK EKONOMICZNYCH WARSZAWA 2007

SPIS TREŚCI 1. Problem ekonometryczny... 3 2. Fundamenty teoretyczne i hipotezy badawcze.... 3 3. Przegląd literatury... 5 4. Opis bazy danych i definicje zmiennych.... 6 Baza danych.... 6 Zmienne modelu 7 5. Wstępna analiza danych.....10 Statystyki opisowe zmiennych. 10 Macierz korelacji 10 Analiza zmiennych binarnych....11 Histogramy zmiennych. 13 6. Forma funkcyjna modelu... 14 7. Estymacja parametrów modelu..... 16 8. Oszacowanie modelu...17 9. Diagnostyka modelu. 19 10. Interpretacja wyników estymacji. 20 11. Interpretacja ekonomiczna i wnioski. 21 12. Bibliografia. 22 13. Załączniki... 23 Załącznik 1. Statystyki opisowe zmiennych... 23 Załącznik 2. Wykresy..... 27 Załącznik 3. Macierz wariancji - kowariancji.... 30 2

1. PROBLEM EKONOMETRYCZNY Według encyklopedii Britanica sieci hotelowe w USA już w latach dwudziestych zeszłego stulecia wydawały karty kredytowe dla swoich klientów. Około roku 1938 firmy zaczęły akceptować nawzajem swoje karty. Jednak dopiero 12 lat później powstały pierwsze bankowe karty kredytowe. Od tego czasu przeszły one dynamiczną ewolucję, zarówno pod względem zaawansowania technologicznego, powszechności użycia, czy też znaczenia jako środka płatniczego. Dowodem tego może być cytat z New York Times a: "With more than 641 million credit cards in circulation and accounting for an estimated $1.5 trillion of consumer spending, the U.S. economy has clearly gone plastic." 1 W celu zaspokojenia rosnących potrzeb konsumenckich przyszły nam z pomocą pożyczki, jednak dopiero karty kredytowe znacząco usprawniły przepływ gotówki. Możliwość korzystania z nich uwalnia od zbędnych formalności, jednocześnie gwarantując stały dostęp do pieniędzy. Czy ktoś z nas, wyobraża sobie funkcjonowanie świata, zwłaszcza świata biznesu, bez tych plastikowych pieniędzy? Dostęp do kredytu konsumenckiego w formie kart kredytowych jest obecnie jednym z najczęściej wykorzystywanych przez gospodarstwa domowe instrumentów finansowych w USA. Także w Polsce zdobywa on coraz większą popularność. Karty kredytowe oferują bowiem wygodę bezgotówkowych transakcji, a także pozwalają na zakupy przez telefon czy Internet. Poza tym zapewniają konsumentom elastyczność w opóźnianiu płatności, przez co umożliwiają wygładzanie wydatków. Można by zatem zadać sobie pytanie, co w rzeczywistości wpływa na wielkość wydatków z kart. Zapewne chciałoby się tego dowiedzieć wielu użytkowników, którzy niejednokrotnie ze zdziwieniem patrzyli na swój wyciąg bankowy. Problem ten wydaje się być szczególnie ciekawy właśnie ze względu na coraz większą popularność tego instrumentu płatniczego zarówno na świecie, jak i w Polsce. Zatem celem naszej pracy będzie określenie istotności wybranych czynników, jakie wpływają na wydatki dokonywane za pomocą kart kredytowych. Zmienne zastosowane w modelu odwołują się zarówno do kategorii czysto ekonomicznych, jak i społeczno-demograficznych. 2. FUNDAMENTY TEORETYCZNE I HIPOTEZY BADAWCZE Zgodnie z teorią makroekonomii, wielkość dochodu jest dodatnio skorelowana z popytem na pieniądz. Właśnie ciągła potrzeba pieniądza, będąca cechą rozwijającego się społeczeństwa powoduje zwiększone użycie kart kredytowych. Wpływ na to mają również realia współczesnego świata, które niejednokrotnie wymuszają konieczność szybkiego działania. Z tym bezsprzecznie wiąże się większy procentowy udział wydatków dokonywanych przy użyciu kart kredytowych. Jak podkreślają Brito and Hartley (1995), karty kredytowe mogą być wykorzystywane do wygładzania konsumpcji pomiędzy nieoczekiwanymi spadkami dochodu. Jako ubezpieczenie konsumpcji mają ten sam natychmiastowy efekt, co chociażby oszczędności czy środki z pomocy społecznej. Intuicyjnie można zakładać, że liczba aktywnych kont kredytowych oraz fakt posiadania kart kredytowych największych wydawców również powoduje zwiększenie wspomnianego udziału wydatków z kart. Możemy tak przypuszczać, gdyż pośrednio jest to powiązane ze stanem majątkowym posiadacza oraz procedurą przyznawania kart kredytowych. Dodatkowe 1 http://www.pbs.org/wgbh/pages/frontline/shows/credit/view/, 18.01.2007 3

karty zapewne nie zostałyby wydane, gdyby bank nie uznał danej osoby za wiarygodną finansowo. Nie wchodząc jednak w szczegóły owej procedury możemy założyć, iż sam fakt posiadania kilku kont/kart kredytowych może świadczyć o ograniczonej płynności finansowej i dokonywaniu większych wydatków z wykorzystaniem kart. W podobny sposób można by się odnieść do samozatrudnienia. Zazwyczaj osoby prowadzące własną działalność gospodarczą są bardziej przedsiębiorcze niż reszta społeczeństwa i potrzebują stałego dostępu do pieniędzy, aby móc rozwijać swoją firmę. Jeśli takiej osobie została przyznana krata kredytowa, to znaczy, że bank uznał ją za wypłacalną, czyli będącą w stanie odpowiednio prosperować w świecie biznesu, a co za tym idzie, w zwiększonym stopniu obracać pieniędzmi, również poprzez użycie kart kredytowych. Biorąc z kolei pod uwagę liczbę monitów bankowych, warto by się zastanowić czy taki rodzaj zmiennej mógłby mieć wpływ na badany przez nas problem. Zasadnicze będzie tu znalezienie odpowiedzi na pytanie, czy osoby którym zdarza się naruszać warunki umowy z bankiem, w przypadku kart kredytowych, będą wykazywały większe czy mniejsze skłonności do korzystania z kart. Naszym zdaniem, już sam fakt otrzymania takiego monitu będzie raczej świadczył o większych wydatkach. Duże wydatki pociągają za sobą konieczność spłaty wysokiego zadłużenia na koniec miesiąca. W przypadku nie dokonania spłaty, klient otrzymuje monit. Zatem respondenci dokonujący mniejszych wydatków z kart będą prawdopodobnie rzadziej otrzymywać monity o naruszeniu umowy. Również charakterystyki społeczno-demograficzne mogą być odpowiedzią na zwiększanie się średnich wydatków dokonywanych przy pomocy kart kredytowych. Morgan i Toll(1997), opierając się na The Survey of Consumer Finances przeprowadzonym w USA, korzystając z permanent income/life-cycle approach powiązali właśnie rosnące zadłużenie kart z socjoekonomicznymi i demograficznymi cechami posiadaczy kart. Według nas charakterystyki takie jak wiek, ilość osób pozostających na utrzymaniu posiadacza karty, fakt posiadania domu/mieszkania i długość zamieszkiwania pod danym adresem nie są zapewne bez znaczenia. Długość okresu zamieszkania pod danym adresem może być odbierana jako cecha pozornie nieistotna w wyjaśnianiu wydatków z kart. Warto się wówczas zastanowić czy nie wykazuje ona jednak istotnego wpływu na badany przez nas problem. Naszym zdaniem bezpośrednio łączy się z wielkością i strukturą wydatków. Mianowicie uważamy, iż dłuższe zamieszkiwanie się pod tym samym adresem implikuje większą świadomość wysokości cen w okolicznych sklepach, przez co zakupy mogą być dokonywane w sposób bardziej efektywny (tańszy). Zatem wielkość tych wydatków jest pośrednio związana również z tymi dokonywanymi poprzez karty kredytowe. Z kolei fakt posiadania własnego domu/mieszkania może wskazywać na większy stan majątkowy respondenta oraz być dla banku rodzajem zabezpieczenia przy wydawaniu kolejnej karty oraz ustalaniu wysokości jej limitu. Osoba posiadająca nieruchomość jest zapewne bardziej wiarygodna w oczach banku, zatem będzie mogła otrzymać lepsze warunki niż osoba wynajmująca mieszkanie (ceteris paribus). Wynika z tego, iż osoby posiadające dom/mieszkanie będą wykazywały większe wydatki dokonywane przy pomocy kart niż inni respondenci. Niewątpliwie na wysokość wydatków z kart kredytowych wpływa także wiek posiadacza karty. Naszym zdaniem jednak przeciętne wydatki z kart kredytowych nie są liniowo zależne od wieku ich posiadacza. Według nas na początku są nieznaczne ze względu na brak własnej 4

karty, najwyższe w okresie pracy zawodowej i ponownie niskie w okresie emerytury. Zależność wydatków z karty od wieku przyjmuje zatem kształt paraboli o odwróconym kształcie, dlatego postanowiliśmy podnieść zmienną age, oznaczającą wiek, do kwadratu i przyjąć znak ujemny. 3. PRZEGLĄD LITERATURY Przed rozpoczęciem analizy interesującego nas zjawiska, dokonaliśmy krótkiego przeglądu literatury. Dotyczyła ona zarówno problematyki związanej z kartami kredytowymi, jak i budowy modelu ekonometrycznego. Artykuły i badania, do których dotarliśmy, to wyłącznie pozycje anglojęzyczne. Literatura polska dotycząca kart koncentruje się głównie na samej ich konstrukcji i analizie rynku. Wynika to zapewne z faktu, że w Polsce karty kredytowe nie są tak rozpowszechnione jak w USA. Poniżej przedstawiamy główne myśli zawarte w wybranych przez nas pozycjach. Rozpatrując zmienną dotyczą wielkości dochodu, przyjęliśmy hipotezę, że jest on dodatnio skorelowany z wydatkami z kart kredytowych. Mianowicie, zwiększające się dochody implikują większe wydatki, w tym także te, za które płacimy kartami. Przypuszczenie to oparliśmy na badaniach empirycznych Carola C. Bertauta i Michaela Halisassosa (2005) oraz Peter a S. Yoo (1997). W pierwszej z tych prac bada się wykorzystanie kart kredytowych wśród obywateli USA, opierając się na badaniu SCF 2. Badanie to zostało przeprowadzone na grupie 3000 gospodarstw domowych i dostarcza informacji na ich temat w kwestii posiadania różnych aktywów finansowych, wykorzystania możliwości kredytowych, w tym kart, a także wieku, wykształcenia, rasy, struktury rodziny, zatrudnienia, faktu posiadania domu, etc. Autorzy wnioskują na podstawie kolejno przeprowadzanych regresji, że posiadanie karty kredytowej w USA jest dodatnio skorelowane z dochodem i wykształceniem i ten trend utrzymuje się we wszystkich falach SCF. Natomiast w artykule Peter a S. Yoo analiza dotyczy determinantów wzrostu użycia kart kredytowych, a co się z tym łączy, zwiększonych wydatków. Autor wykorzystuje w/w SFC z lat 1983 1992 i na tej podstawie dzieli wzrost użycia kart na dwie kategorie wzrost ilości gospodarstw posiadających karty i zmiany w zadłużeniu posiadanych już kart. W celu wyjaśnienia tego zjawiska wykorzystywane są dane dotyczące dochodów respondentów, a zwłaszcza gospodarstw posiadających niższy dochód. Pod uwagę brane są także dane dotyczące dostępności kart, ilości gospodarstw i przeciętnego zadłużenia. Wyraźne we wnioskach są dwa spostrzeżenia. Po pierwsze, iż prawdopodobieństwo posiadania karty jest dodatnio skorelowane z dochodem. Co wydaje się zastanawiające, mimo, że ilość gospodarstw posiadających karty wzrosła w każdej grupie dochodowej, to wzrost ten jest wyraźnie szybszy w biedniejszych gospodarstwach. Po drugie poziom całkowitego zadłużenia z kart rośnie wraz z poziomem dochodu gospodarstwa, przez co rozumiemy, że wraz ze wzrostem statusu majątkowego, rosną również wydatki w taki sposób, że gospodarstwa domowe nie boją się korzystania z debetu. Wynika to z przekonania, że wielkość ich dochodów jest w stanie pokryć, w chwili obecnej, zwiększoną konsumpcję, a w przyszłości również spłacić dług z karty. W rozpatrywanej przez nas literaturze, jedną z ważniejszych zmiennych określających wielkość wydatków z kart, jest zmienna dotycząca wieku respondenta. Hipotezę o parabolicznej zależności wydatków i wieku oparliśmy na w/w badaniu Carola C. Bertauta i Michaela Halisassosa. W tej pracy zmienna wieku okazała się istotna w wyjaśnianiu faktu 2 Survey of Consumer Finances 5

posiadania i użycia kart. Stwierdzono, iż użycie kart jest największe w przedziale wiekowym 50-75, mniejsze w przedziałach do 50 i powyżej 75 lat. Poparcie naszej hipotezy znajdujemy również w pracy Elizabeth C. Hirshman (1981), która zauważa, że dystrybucja kart nie jest skierowana do młodszych osób ze względu na surowe kryteria przyznawania kredytów. Stwierdza się również, że może być to wynikiem powiązania wieku z takimi zmiennymi jak długość okresu zatrudnienia, długość zamieszkania czy wielkość dochodu, które również są zmiennymi zastosowanymi w naszym modelu. Natomiast sprzeczne z naszą hipotezą są wnioski zawarte w artykule Lindy Punch Older debtors, new problems. Artykuł jest poświęcony jest zagadnieniu związanemu z wielkością i strukturą wydatków zmieniającą się wraz z wiekiem. Szczególną uwagę autorka zwraca na emerytów, zauważając, iż ta grupa ludzi wcale nie wykazuje małych lub znikomych wielkości wydatków dokonywanych przy użyciu kart. Omawiając ten problem, Linda Punch bada również motywy i potrzeby kierujące wydatkami emerytów, a także konsekwencje, nierzadko spotykanych, zbyt pochopnych działań. Starając się potwierdzić istotność naszego modelu w sensie ekonomicznym, a także słuszność postawionych założeń, odwoływaliśmy się również do prac Kelly Shermach(2004), Nicole Jonker (2005) oraz Lucii F. Dunn i TaeHyung Kim (2005). Pierwsza z tych prac uzasadnia istotność posiadania oddzielnych kart kredytowych przeznaczonych do celów prywatnych i biznesowych, używanych zwłaszcza przez właścicieli małych firm. Jej głównym przesłaniem jest uświadomienie tym przedsiębiorcom zalet z dokonywania transakcji biznesowych za pomocą kart kredytowych. Kolejny artykuł, autorstwa Nicole Jonker to badanie dotyczące instrumentów płatniczych. Jego autorka porównuje rożne formy płatności podczas dokonywania zakupów, zwracając również uwagę na rożne czynniki wpływające na określony sposób wydatkowania pieniędzy, m.in. wiek, średnie miesięczne dochody, wykształcenie itp. Z kolei Lucia F. Dunn i TaeHyung Kim badają czynniki determinujące opóźnienia w spłacaniu kredytów zaciągniętych poprzez karty. Koncentrują się na związku pomiędzy finansowymi decyzjami konsumentów a wspomnianymi opóźnieniami. W tej pracy znaczące okazują się głownie: stosunek wymaganych minimalnych spłat do dochodu, stopień wykorzystania możliwości kredytowych i liczba kart, których limit został wyczerpany. Uwzględnione są także zmienne nie-finansowe tj. wiek, stan cywilny, liczba dzieci, status zawodowy, fakt posiadania domu czy wykształcenie. Na podstawie wymienionych zmiennych przeprowadzona zostaje regresja wyjaśniającą ryzyko opóźnień w spłacie. 4. OPIS BAZY DANYCH I DEFINICJE ZMIENNYCH 4.1 BAZA DANYCH Model został opracowywany na podstawie danych zaczerpniętych ze strony internetowej: http://pages.stern.nyu.edu/~wgreene/ Jest to strona profesora Williama Greene z New York University Leonard N. Stern School of Business Faculty of Entertainment, Media and Technology. Dane zostały zebrane w 1992 roku wśród obywateli USA. Pierwotnie baza danych zawierała 1319 obserwacji, które poddano wstępnej analizie. Z bazy danych przed przystąpieniem do wstępnej estymacji zostało usuniętych 296 obserwacji dla respondentów, którzy nie posiadali karty kredytowej w momencie badania, gdyż obserwacje te nie były istotne ze względu na podejmowany przez nas problem badawczy. Kolejnych 6 obserwacji zostało usuniętych ze względu na błędnie 6

podane informacje (wiek był w tych przypadkach mniejszy od 1). Po ich eliminacji w bazie danych pozostało 1017 obserwacji. Bezpośredni link do bazy danych: http://pages.stern.nyu.edu/~wgreene/text/tables/tablef21-4.txt 4.2 ZMIENNE MODELU Poza ważnymi zmiennymi objaśniającymi o charakterze czysto finansowym wykorzystaliśmy inne zmienne, aby móc obserwować socjoekonomiczne i demograficzne różnice w próbce. Spośród zmiennych dostępnych w bazie wybraliśmy ekonomiczne, społeczne i demograficzne charakterystyki ludności, które według nas mają uzasadniony wpływ na wydatki dokonywane przy użyciu kart kredytowych. Do tych zmiennych można zaliczyć: dochód respondenta wiek fakt samozatrudnienia fakt posiadania domu/mieszkania ilość osób pozostających na utrzymaniu posiadacza karty liczba posiadanych głównych kart kredytowych 3 liczba monitów bankowych 4 liczba posiadanych aktywnych kont/rachunków kredytowych długość zamieszkiwania pod danym adresem Zmienne te zostały przez nas przekształcone. Poniżej przedstawiamy pełny opis zmiennych wraz z ich przekształceniami. ZMIENNA OBJAŚNIANA przeciętne miesięczne wydatki dokonywane przy użyciu kart kredytowych: y = avg exp Jest to zmienna ciągła. W modelu uwzględniliśmy logarytm tej zmiennej lavgexp. Dla 21 obserwacji wartość avgincome wynosiła 0. Podczas pierwszej próby regresji, w celu policzenia logarytmu, zastąpiliśmy zera jedynkami, oznaczającymi wydatki w symbolicznej wysokości 1$. Jednak w tak oszacowanym modelu wystąpił problem heteroskedastyczności składnika losowego. Podejrzewaliśmy, że heteroskedastyczność spowodowały właśnie obserwacje, w których avgexp=0. Przypuszczenia te potwierdził test Cook a. Zatem, po dokładnej ich analizie, postanowiliśmy te obserwacje usunąć. W bazie pozostało zatem 996 obserwacji. 3 Według naszych ustaleń główne karty kredytowe (w oryginale major credit cards ) to karty typu Visa, Mastercard, American Express, JCB, a więc karty największych wydawców.. 4 W oryginale nazwa zmiennej to major derogatory reports. Jest to zmienna, której wartość (także w ogólnym przypadku) dla większości użytkowników kart będzie wynosiła 0, ale dla istotnej części, która zapomniała dokonać spłaty zaciągniętego kredytu, przyjmuje wartość dodatnią. Typowe wartości to 0, 1 lub 2, ale zmienna może przyjmować także wyższe wartości np.10. Definicja znajdująca się w oryginalnej bazie danych okazała się dość trudna do przetłumaczenia. Według nas można by zdefiniować majordg jako zawiadomienia o naruszeniu umowy/zasad korzystania - w przypadku kart kredytowych: najpewniej znacznego przekroczenia limitu/terminu spłaty. 7

ZMIENNE OBJAŚNIAJĄCE przeciętne miesięczne dochody respondenta: x 1 = avgincome = income*10000/12 Jest to zmienna ciągła. Została zbudowana na podstawie zmiennej income oznaczającej średnie roczne dochody respondenta podzielone przez 10 000. W modelu uwzględniliśmy logarytm zmiennej x 1 lavgincome. kwadrat wieku: x = age2 age* age 2 = Jest to zmienna ciągła. Została zbudowana na podstawie zmiennej age oznaczającej wiek respondenta (podany z dokładnością do 1 miesiąca = 1/12 roku). fakt posiadania domu/mieszkania: x = ownrent 3 Jest to zmienna binarna. ownrent = 1 jeśli respondent jest właścicielem domu/mieszkania ownrent = 0 w pozostałych przypadkach fakt samozatrudnienia x = 4 Jest to zmienna binarna. selfempl selfempl = 1 jeśli respondent jest samozatrudniający się selfempl = 0 w pozostałych przypadkach liczba osób pozostających na utrzymaniu właściciela karty: Zmienna ta została utworzona ze zmiennej dependt, która oznaczała liczbę osób pozostających na utrzymaniu właściciela karty. Zmienna dependt przyjmowała 7 poziomów, dlatego postanowiliśmy ją pogrupować na zmienne binarne: osoby x 5 = dependt x 5 = dependt _1=1 oznacza, że respondent ma na utrzymaniu 1 osobę _1=0 oznacza, że respondent ma na utrzymaniu mniej niż 1 osobę x 6 = dependt _ 2=1 oznacza, że respondent ma na utrzymaniu 2 osoby x 6 = dependt _ 2=0 oznacza, że respondent ma na utrzymaniu mniej niż 2 x 7 = dependt _ 3 =1 oznacza, że respondent ma na utrzymaniu 3 osoby i więcej 8

osoby x 7 = dependt _ 3 =0 oznacza, że respondent ma na utrzymaniu mniej niż 3 liczba posiadanych głównych kart kredytowych x = major 8 Jest to zmienna binarna. W oryginalnej bazie danych zmienna major przyjmowała wartość 1 dla posiadacza takiej karty. Jednak przekodowaliśmy ją, aby poziom bazowy zawierał większość obserwacji (patrz statystyki opisowe zmiennych). major = 1 jeśli respondent posiada główną kartę kredytową major = 0 jeśli nie posiada. liczba posiadanych aktywnych rachunków / kont kredytowych x = active 9 Jest to zmienna dyskretna. liczba monitów bankowych: x 10 = major _ drg Jest to zmienna binarna. Powstała on ze zmiennej majordrg, oznaczającej liczbę monitów bankowych, otrzymanych przez respondenta. major_drg = 0 jeśli majordrg = 0 major_drg = 1 jeśli majordrg > 0 długość zamieszkiwania pod danym adresem (w miesiącach): x = curadd 11 Jest to zmienna ciągła. ε i składnik losowy i = 1,2,,N indeks obserwacji Baza danych, którą wykorzystaliśmy w naszym badaniu była podstawą modelu, jaki prof. William Greene zbudował w 1995 roku i zamieścił w książce Econometric Analysis (wydanie V z 2003 roku). Autor stworzył model zachowania konsumenta Credit scoring model, w którym zmienna zależną była liczba major derogatory reports zarejestrowana w historii kredytowej respondenta. Zmiennymi objaśniającymi z kolei były wiek, dochód i przeciętne wydatki z kart. Greene zbudował także model badający fakt przyznania karty kredytowej w zależności od wieku, dochodu, faktu posiadania domu i samozatrudnienia. Nam jednak wydało się interesujące zbadać co determinuje wydatki z kart. Badanie prof. Green a było dla nas źródłem wartościowych informacji i wniosków. 9

5. WSTĘPNA ANALIZA DANYCH 5.1 STATYSTYKI OPISOWE ZMIENNYCH Poniżej przedstawiamy podstawowe statystyki opisowe zmiennych wartość średnią, minimalną, maksymalną i odchylenie standardowe. Na tym etapie badania uwzględnionych zostało 1017 obserwacji.. summ avgexp avgincome age ownrent selfempl dependt major active majordrg curadd Variable Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- avgexp 1017 238.6245 288.3611 0 3099.505 avgincome 1017 2878.206 1425.615 175 11250 age 1017 33.40896 9.925835 18.16667 83.5 ownrent 1017.480826.499878 0 1 selfempl 1017.0619469.2411777 0 1 -------------+-------------------------------------------------------- dependt 1017.9685349 1.2419 0 6 major 1017.1602753.3670417 0 1 active 1017 7.26942 6.091832 0 31 majordrg 1017.1288102.4163559 0 4 curadd 1017 55.11209 64.65436 0 540 Uznaliśmy, iż mimo, że w modelu wykorzystujemy zmienna age2 to łatwiejsza w interpretacji niektórych statystyk opisowych będzie zmienna age. W Załączniku nr 1 znajdują się bardziej szczegółowe statystyki opisowe uwzględniające dodatkowo percentyle, zakres zmiennych, wariancję skośność i kurtozę. 5.2 MACIERZ KORELACJI ZMIENNYCH. corr avgexp avgincome age2 ownrent selfempl dependt_1 dependt_2 dependt_3 major active major_drg curadd (obs=1017) avgexp avginc~e age2 ownrent selfempl depend~1 depend~2 depend~3 major active major_~g curadd -------------+-------------- avgexp 1.0000 avgincome 0.2990 1.0000 age2 0.0027 0.3275 1.0000 ownrent 0.0457 0.3324 0.3566 1.0000 selfempl -0.0203 0.1307 0.1208 0.0711 1.0000 dependt_1 0.0348 0.2640 0.2323 0.3251 0.0492 1.0000 dependt_2 0.0637 0.3195 0.1425 0.2906 0.0286 0.6391 1.0000 dependt_3 0.0807 0.3135 0.1255 0.2455 0.0334 0.3944 0.6171 1.0000 major -0.0472-0.1061 0.0218-0.0288-0.0122 0.0207-0.0128-0.0423 1.0000 active 0.0305 0.1922 0.1659 0.2638 0.0409 0.1425 0.1184 0.0920-0.1399 1.0000 major_drg 0.1071 0.1090 0.0758 0.0292 0.0448-0.0039-0.0021 0.0191-0.0362 0.2096 1.0000 curadd -0.0343 0.1243 0.4773 0.2655 0.0834 0.0975 0.0450 0.0748 0.0465 0.1281 0.1175 1.0000 Współczynniki korelacji pomiędzy poszczególnymi zmiennymi objaśniającymi nie wykazują znaczącej zależności. Jedynie współczynnik pomiędzy curadd a age2 przyjmuje wartość 0.4773. Według nas wiąże się to z faktem, iż osoby starsze rzadziej zmieniają miejsce zamieszkania. 10

5.3 ANALIZA ZMIENNYCH BINARNYCH W tym punkcie przedstawiamy wartość średnią i odchylenie standardowe zmiennej avgexp z rozróżnieniem poszczególnych poziomów zmiennych binarnych: ownrent, selfempl, major i major_drg. ownrent. sort ownrent. by ownrent: summarize avgexp -> ownrent = 0 Variable Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- avgexp 528 225.9462 275.0703 0 2291.174 -> ownrent = 1 Variable Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- avgexp 489 252.314 301.7413 0 3099.505 Widzimy, iż średnia i odchylenie avgexp na obu poziomach (o podobnej liczebności) ownrent różnią się nieznacznie, stąd możemy wnioskować, że zmienna ta może okazać się w modelu nieistotna. selfempl. sort selfempl. by selfempl: summarize avgexp -> selfempl = 0 Variable Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- avgexp 954 240.1286 290.0074 0 3099.505 -> selfempl = 1 Variable Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- avgexp 63 215.848 263.2414 0 1292.003 Tutaj także statystyki opisowe nie wykazują dużych różnic. Jednak wartości maksymalne oraz liczebności grup różnią się znacząco, zatem możemy podejrzewać istotność zmiennej selfempl w wyjaśnieniu poziomu wydatków. 11

major. sort major. by major: summarize avgexp -> major = 0 Variable Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- avgexp 854 244.5737 296.653 0 3099.505 -> major = 1 Variable Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- avgexp 163 207.4555 238.6622 0 2001.547 W tym przypadku statystyki opisowe wykazują nieco mniejsze różnice niż dla selfempl. Wartości maksymalne oraz liczebności grup także są nieco mniej zróżnicowane. W związku z tym nie możemy jednoznacznie przewidzieć istotności tej zmiennej. major_drg. sort major_drg. by major_drg: summarize avgexp -> major_drg = 0 Variable Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- avgexp 910 228.0378 280.8782 0 3099.505 - > major_drg = 1 Variable Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- avgexp 107 328.6613 333.6452 0 1836.976 W przypadku tej zmiennej statystyki opisowe, jak i liczebności podgrup wykazują duże różnice. Zatem spodziewamy się, iż zmienna major_drg będzie istotnie wpływać na wydatki z kart. 12

5.4 HISTOGRAMY ZMIENNYCH Poniżej przedstawiamy histogramy zmiennych ciągłych(uwzględniające 1017 obserwacji): avgexp, avgincome, age, curadd wraz z krótkim opisem. Rys. 1. Histogram zmiennej avgexp. Średnie miesięczne wydatki zadeklarowane przez respondentów zaczynają się na poziomie 0$, a największe wynoszą prawie 3100$. Histogram wyraźnie wykazuje prawoskośność, na co wskazuje też wielkość mediany, kształtującej się na poziomie ok. 150$. Rys. 2. Histogram zmiennej avgincome. Zakres średnich dochodów zawiera się pomiędzy 175$ a 11250$ miesięcznie. Histogram nie jest symetryczny ponieważ większość obserwacji należy do przedziału 1000$ do 5000$. Również wartość mediany to 2500$. 13

Rys. 3. Histogram zmiennej age. Wykres wskazuje, że wiek respondenta zawiera się w przedziale (18; 83), co wskazuje na fakt, iż w badania wzięły udział osoby reprezentujące wszystkie grupy wiekowe, dla których możliwe jest posiadanie kart kredytowych. Można zauważyć, że histogram nie jest symetryczny, ponieważ przeważająca większość respondentów zawiera się w przedziale od 20 do 40 lat. Wielkość mediany kształtuje się na poziomie 31,25. (Uznaliśmy, iż mimo że w modelu wykorzystujemy age2 to łatwiejszy w interpretacji będzie histogram age.) Rys. 4. Histogram zmiennej curadd. Wartości minimalna i maksymalna długości zamieszkiwania pod danym adresem zadeklarowane przez respondentów to odpowiednio niecały miesiąc i 540 miesięcy. Histogram wyraźnie wskazuje na prawoskośność, gdyż większość obserwacji zawiera się w przedziale Źródło: (0;80), baza a wielkość danych mediany ze strony: to 30 miesięcy http://pages.stern.nyu.edu/~wgreene/, obliczenia własne. 6. FORMA FUNKCYJNA MODELU Model powstał w programie Intercoolded Stata 8.1. Wyboru formy funkcyjnej modelu dokonaliśmy po porównaniu histogramów logarytmów zmiennych avgexp i avgincome z rozkładem normalnym. Poniżej przedstawiamy te wykresy (dla 996 obserwacji, dla których przeprowadzono ostateczną regresję). 14

Rys. 5. Histogram logarytmu zmiennej avgexp Źródło: baza danych ze strony: http://pages.stern.nyu.edu/~wgreene/, obliczenia własne. Rys. 6. Histogram logarytmu zmiennej avgincome Z wykresów wynika, że odpowiednią formą modelu będzie forma, w której wydatki i dochody zostaną logarytmowane. Rozkład logarytmu avgexp jest podobny do rozkładu normalnego. Jeżeli chodzi o logarytm zmiennej avgincome, to rozkład logarytmu nie wykazuje tak wysokiego podobieństwa do rozkładu normalnego, jak poprzednia zmienna. Na histogramie wyraźny jest brak lewego ogona rozkładu. Jednak według nas jest to spowodowane faktem, iż w badaniu odrzucone zostały obserwacje dla respondentów nie posiadających kart. W związku z tym dochód respondentów wziętych pod uwagę znajduje się powyżej pewnego poziomu (zapewne wymaganego przez bank do otrzymania karty kredytowej). Zatem w modelu wykorzystaliśmy zmienną lavgincome. Poniżej przedstawiamy zakładany model końcowy: ln( y) = β + β x 10 10i 0 + β1 ln( x1 i ) + β x 11 11i + ε i + β x 2 2i + β x 3 3i + β x 4 4i + β x 5 5i + β x 6 6i + β x 7 7i + β x 8 8i + β x 9 9i + Postać analityczna szacowanego równania regresji (wraz z przewidywanymi znakami współczynników): (+) ( ) (+) (+) (+) lavgexp = β 0 + β 1 lavgincome + β 2 age2 + β 3 ownrent + β 4 selfempl + β 5 dependt_1 + (+) (+) (+) (+) (+) ( ) +β 6 dependt_2 + β 7 dependt_3 + β 8 major + β 9 active + β 10 major_drg + β 11 curadd + ε i 15

7. ESTYMACJA PARAMETRÓW MODELU Końcowa estymacja została przeprowadzona na próbie zawierającej 996 obserwacji. Wyniki tak oszacowanego modelu przedstawia tabela:. reg lavgexp lavgincome age2 ownrent selfempl dependt_1 dependt_2 dependt_3 major active major_drg curadd Source SS df MS Number of obs = 996 -------------+------------------------------ F( 11, 984) = 7.30 Model 111.858104 11 10.1689185 Prob > F = 0.0000 Residual 1371.36225 984 1.39366082 R-squared = 0.0754 -------------+------------------------------ Adj R-squared = 0.0651 Total 1483.22035 995 1.49067372 Root MSE = 1.1805 ------------------------------------------------------------------------------ lavgexp Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- lavgincome.770035.1013201 7.60 0.000.5712067.9688632 age2 -.0001858.0000605-3.07 0.002 -.0003045 -.0000672 ownrent.010179.0874887 0.12 0.907 -.1615069.1818649 selfempl -.3149052.159317-1.98 0.048 -.6275454 -.002265 dependt_1.0162824.100727 0.16 0.872 -.181382.2139469 dependt_2 -.1038487.1269254-0.82 0.413 -.3529243.1452269 dependt_3.0217364.1420291 0.15 0.878 -.2569782.3004511 major -.0544622.1038936-0.52 0.600 -.2583406.1494162 active -.0092515.0066352-1.39 0.164 -.0222723.0037693 major_drg.3838722.125379 3.06 0.002.1378312.6299131 curadd.0002245.0006688 0.34 0.737 -.0010879.001537 _cons -.8719802.7709352-1.13 0.258-2.384846.6408859 ------------------------------------------------------------------------------ Mimo, że wszystkie zmienne w modelu naraz są istotne (Prob>F=0.0000), jednak występują pojedyncze zmienne nieistotne: ownrent, dependt_1, dependt_2, dependt_3, major, active, curadd. Z modelu były usuwane kolejno te zmienne, które posiadały największą wartość P> t. Jako pierwsze usunięto zmienne: ownrent (P> t =0.907). Następnie okazało się, że żaden z ze zmiennych dependt_1 (P> t =0.859), dependt_2 (P> t =0.416), dependt_3 (P> t =0.874) nie jest istotna. Przed usunięciem ich z modelu wykonaliśmy test na łączną nieistotność, który prezentujemy poniżej:. test dependt_1 dependt_2 dependt_3 ( 1) dependt_1 = 0 ( 2) dependt_2 = 0 ( 3) dependt_3 = 0 F( 3, 985) = 0.31 Prob > F = 0.8213 Wartość Prob>F = 0.8213 > 0.05 zatem nie ma podstaw do odrzucenia hipotezy zerowej o łącznej nieistotności zmiennych. Kolejnymi zmiennymi usuniętymi były: curadd (P> t =0.703), major (P> t =0.598), oraz active (P> t =0.168). 16

Wyniki estymacji po wyrzuceniu zmiennych nieistotnych przedstawiają się następująco:. reg lavgexp lavgincome age2 selfempl major_drg Source SS df MS Number of obs = 996 -------------+------------------------------ F( 4, 991) = 19.33 Model 107.329484 4 26.8323711 Prob > F = 0.0000 Residual 1375.89087 991 1.38838635 R-squared = 0.0724 -------------+------------------------------ Adj R-squared = 0.0686 Total 1483.22035 995 1.49067372 Root MSE = 1.1783 ------------------------------------------------------------------------------ lavgexp Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- lavgincome.7344315.0931433 7.88 0.000.5516507.9172123 age2 -.0001857.0000522-3.56 0.000 -.0002881 -.0000834 selfempl -.3123675.1588796-1.97 0.050 -.6241465 -.0005885 major_drg.3589016.1218842 2.94 0.003.1197209.5980823 _cons -.6670125.714611-0.93 0.351-2.069337.7353119 ------------------------------------------------------------------------------ Potwierdzeniem łącznej nieistotności wszystkich zmiennych usuniętych jest wynik testu na łączną nieistotność:. test ownrent dependt_1 dependt_2 dependt_2 major active curadd ( 1) ownrent = 0 ( 2) dependt_1 = 0 ( 3) dependt_2 = 0 ( 4) dependt_2 = 0 ( 5) major = 0 ( 6) active = 0 ( 7) curadd = 0 Constraint 4 dropped F( 6, 984) = 0.51 Prob > F = 0.8013 Prob>F wynosi 0.8013 > 0.05 w związku z czym nie ma podstaw do odrzucenia hipotezy zerowej o łącznej nieistotności zmiennych. 8. OSZACOWANIE MODELU Po przeprowadzeniu estymacji wykonaliśmy test na współliniowość vif:. vif Variable VIF 1/VIF -------------+---------------------- lavgincome 1.14 0.873704 age2 1.13 0.883091 selfempl 1.03 0.975453 major_drg 1.01 0.986686 -------------+---------------------- Mean VIF 1.08 17

Widzimy, iż wszystkie wartości są znacznie mniejsze od 10, zatem możemy wnioskować, że w modelu nie występuje problem współliniowości. Kolejnym wykonanym przez nas testem był test Cook a. Wskazał on 54 obserwacje o skrajnych wartościach podejrzane o duży wpływ na wyniki regresji. Jednak po dokładnej ich analizie doszliśmy do wniosku, że nie można tych obserwacji usunąć z próby. Poniżej przedstawiamy dwie przykładowe obserwacje wraz z ich analizą: +---------------------------+ 104. avgexp majordrg age income ownrent selfempl dependt curadd major active avginc~e age2.3125 0 24.91667 2.9 1 0 0 60 0 8 2416.667 620.8405 --------------------------- major_~g depend~1 depend~2 depend~3 lavgexp lavgin~e cd 0 0 0 0-1.163151 7.790144.0092725 +---------------------------+ Ta obserwacja została wyróżniona zapewne ze względu na bardzo małe wydatki, których wielkość po zlogarytmowaniu dała wartość ujemną. Jednak naszym zdaniem nie należałoby odrzucać tej obserwacji, ponieważ według nas nie jest ona błędna. Po pierwsze dlatego, że avgexp to średnia wielkość wydatków dokonywanych przy użyciu karty kredytowej, a nie wielkość całkowitych wydatków. Po drugie należy zauważyć, iż respondent jest osobą młoda, nie posiadająca nikogo na utrzymaniu. Z tych dwóch względów może wynikać niska wartość avgexp. +----------------------------------------+ 766. avgexp majordrg age income ownrent selfempl dependt curadd major active avginc~e age2 400.9117 0 71.83334 7.701 1 0 1 24 0 9 6417.5 5160.029 --------------------------- major_~g depend~1 depend~2 depend~3 lavgexp lavgin~e cd 0 1 0 0 5.993741 8.766784.0063028 +---------------------------+ W przypadku tej obserwacji, sytuacja jest odwrotna niż powyżej. Zauważamy, że mamy tu do czynienia ze stosunkowo wysokimi wydatkami, jak również bardzo wysokimi dochodami u osoby prawie 72 letniej. Jednak nie można stwierdzić, że taka sytuacja nie może mieć miejsca. Prawdopodobne jest, że dany respondent to zamożna starsza osoba, posiadająca dodatkowe źródło utrzymania poza emeryturą, np. udziały w firmie. Aby potwierdzić nasze wnioski wykonaliśmy test dźwigni: Rys. 7. Wykres standaryzowanych reszt i dźwigni. Widzimy, że żadna z obserwacji nie znalazła się w prawej-górnej części wykresu. W związku z tym upewniliśmy się, że nie mamy obserwacji, które znacząco wpływałyby na precyzję oszacowań. Źródło: baza danych z strony: http://pages.stern.nyu.edu/~wgreene/, obliczenia własne. 18

9. DIAGNOSTYKA MODELU W tym punkcie przedstawiamy kolejno wyniki przeprowadzonych przez nas testów diagnostycznych: test RESET na poprawność formy funkcyjnej. ovtest, rhs Ramsey RESET test using powers of the independent variables Ho: model has no omitted variables F(6, 985) = 0.78 Prob > F = 0.5848 Prob>F = 0.5848 >0.05 zatem nie ma podstaw do odrzucenia hipotezy zerowej. Stąd wnioskujemy, że forma funkcyjna zastosowana w modelu jest poprawna. test BREUSCHA-PAGANA na heteroskedastyczność. hettest, rhs Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: lavgincome age2 selfempl major_drg chi2(4) = 2.22 Prob > chi2 = 0.6957 Prob>chi2 = 0.6957 >0.05 zatem nie ma podstaw do odrzucenia hipotezy zerowej. Stąd wnioskujemy, że składnik losowy jest homoskedastyczny. test WHITE A. imtest, white White's test for Ho: homoskedasticity against Ha: unrestricted heteroskedasticity chi2(12) = 6.05 Prob > chi2 = 0.9137 Cameron & Trivedi's decomposition of IM-test --------------------------------------------------- Source chi2 df p ---------------------+----------------------------- Heteroskedasticity 6.05 12 0.9137 Skewness 30.07 4 0.0000 Kurtosis 4.42 1 0.0355 ---------------------+----------------------------- Total 40.54 17 0.0011 --------------------------------------------------- Prob>chi2 = 0.9137 >0.05 zatem nie ma podstaw do odrzucenia hipotezy zerowej. Stąd również wnioskujemy, że składnik losowy jest homoskedastyczny. 19

test JARQUE-BERRA na normalność składnika losowego:. sktest res Skewness/Kurtosis tests for Normality ------- joint ------ Variable Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2 -------------+------------------------------------------------------- res 0.000 0.000. 0.0000 Z wyników testu (Prob>chi2=0.000) możemy wnioskować, iż składnik losowy nie ma rozkładu normalnego. Jednak w dużych próbach nie jest to istotne, gdyż rozkłady statystyk w takich próbach są bliskie standardowym. 5 (patrz załącznik nr 2.) 10. INTERPRETACJA WYNIKÓW ESTYMACJI Po przeprowadzeniu estymacji możemy przystąpić do interpretacji otrzymanych wyników. Jak widać, zmiennymi istotnymi na poziomie 0,05 okazały się następujące zmienne: kwadrat wieku respondenta logarytm średniego miesięcznego dochodu respondenta fakt otrzymywania monitów bankowych fakt samozatrudnienia Zmienne te są również łącznie istotne (Prob>F = 0.0000 < 0.05). Pozostałe zmienne w modelu okazały się statystycznie nieistotne. Macierz oszacowań wektora β wygląda następująco:. matrix list e(b) e(b)[1,5] lavgincome age2 selfempl major_drg _cons y1.73443151 -.00018574 -.31236749.35890159 -.66701253 Wyestymowane parametry można zinterpretować w następujący sposób: Wartość R 2 =7,24% oznacza, że zmienność zmiennej objaśnianej (wydatków z kart) została wyjaśniona w modelu poprzez zmienne objaśniające w 7,24%. Jednocześnie wartość dopasowanego R 2 jest równa 6,86%. Wzrost średniego miesięcznego dochodu o 1% powoduje (średnio rzecz biorąc) wzrost średnich miesięcznych wydatków z kart o 0,73% ceteris paribus Wzrost kwadratu wieku o jednostkę powoduje (średnio rzecz biorąc) spadek średnich miesięcznych wydatków z kart o 0,019% ceteris paribus. Osoby samozatrudniające się wydają przy użyciu kart kredytowych (średnio rzecz biorąc) o 26,83% (e -0.31236749 0,731) mniej niż osoby o innym statusie pracy ceteris paribus. 5 Jerzy Mycielski, Skrypt do Ekonometrii semestr 1, Warszawa 2006, str. 134 20