CZYNNIKI WPŁYWAJĄCE NA WYDATKI DOKONYWANE ZA POMOCĄ KART KREDYTOWYCH

Wielkość: px
Rozpocząć pokaz od strony:

Download "CZYNNIKI WPŁYWAJĄCE NA WYDATKI DOKONYWANE ZA POMOCĄ KART KREDYTOWYCH"

Transkrypt

1 TOMASZ BĄK KATARZYNA OWCZARSKA gr. 312 CZYNNIKI WPŁYWAJĄCE NA WYDATKI DOKONYWANE ZA POMOCĄ KART KREDYTOWYCH Praca na pisana na ćwiczeniach z Ekonometrii pod kierunkiem mgr Natalii Nehrebeckiej. UNIWERSYTET WARSZAWSKI WYDZIAŁ NAUK EKONOMICZNYCH WARSZAWA 2007

2 SPIS TREŚCI 1. Problem ekonometryczny Fundamenty teoretyczne i hipotezy badawcze Przegląd literatury Opis bazy danych i definicje zmiennych Baza danych Zmienne modelu 7 5. Wstępna analiza danych Statystyki opisowe zmiennych. 10 Macierz korelacji 10 Analiza zmiennych binarnych Histogramy zmiennych Forma funkcyjna modelu Estymacja parametrów modelu Oszacowanie modelu Diagnostyka modelu Interpretacja wyników estymacji Interpretacja ekonomiczna i wnioski Bibliografia Załączniki Załącznik 1. Statystyki opisowe zmiennych Załącznik 2. Wykresy Załącznik 3. Macierz wariancji - kowariancji

3 1. PROBLEM EKONOMETRYCZNY Według encyklopedii Britanica sieci hotelowe w USA już w latach dwudziestych zeszłego stulecia wydawały karty kredytowe dla swoich klientów. Około roku 1938 firmy zaczęły akceptować nawzajem swoje karty. Jednak dopiero 12 lat później powstały pierwsze bankowe karty kredytowe. Od tego czasu przeszły one dynamiczną ewolucję, zarówno pod względem zaawansowania technologicznego, powszechności użycia, czy też znaczenia jako środka płatniczego. Dowodem tego może być cytat z New York Times a: "With more than 641 million credit cards in circulation and accounting for an estimated $1.5 trillion of consumer spending, the U.S. economy has clearly gone plastic." 1 W celu zaspokojenia rosnących potrzeb konsumenckich przyszły nam z pomocą pożyczki, jednak dopiero karty kredytowe znacząco usprawniły przepływ gotówki. Możliwość korzystania z nich uwalnia od zbędnych formalności, jednocześnie gwarantując stały dostęp do pieniędzy. Czy ktoś z nas, wyobraża sobie funkcjonowanie świata, zwłaszcza świata biznesu, bez tych plastikowych pieniędzy? Dostęp do kredytu konsumenckiego w formie kart kredytowych jest obecnie jednym z najczęściej wykorzystywanych przez gospodarstwa domowe instrumentów finansowych w USA. Także w Polsce zdobywa on coraz większą popularność. Karty kredytowe oferują bowiem wygodę bezgotówkowych transakcji, a także pozwalają na zakupy przez telefon czy Internet. Poza tym zapewniają konsumentom elastyczność w opóźnianiu płatności, przez co umożliwiają wygładzanie wydatków. Można by zatem zadać sobie pytanie, co w rzeczywistości wpływa na wielkość wydatków z kart. Zapewne chciałoby się tego dowiedzieć wielu użytkowników, którzy niejednokrotnie ze zdziwieniem patrzyli na swój wyciąg bankowy. Problem ten wydaje się być szczególnie ciekawy właśnie ze względu na coraz większą popularność tego instrumentu płatniczego zarówno na świecie, jak i w Polsce. Zatem celem naszej pracy będzie określenie istotności wybranych czynników, jakie wpływają na wydatki dokonywane za pomocą kart kredytowych. Zmienne zastosowane w modelu odwołują się zarówno do kategorii czysto ekonomicznych, jak i społeczno-demograficznych. 2. FUNDAMENTY TEORETYCZNE I HIPOTEZY BADAWCZE Zgodnie z teorią makroekonomii, wielkość dochodu jest dodatnio skorelowana z popytem na pieniądz. Właśnie ciągła potrzeba pieniądza, będąca cechą rozwijającego się społeczeństwa powoduje zwiększone użycie kart kredytowych. Wpływ na to mają również realia współczesnego świata, które niejednokrotnie wymuszają konieczność szybkiego działania. Z tym bezsprzecznie wiąże się większy procentowy udział wydatków dokonywanych przy użyciu kart kredytowych. Jak podkreślają Brito and Hartley (1995), karty kredytowe mogą być wykorzystywane do wygładzania konsumpcji pomiędzy nieoczekiwanymi spadkami dochodu. Jako ubezpieczenie konsumpcji mają ten sam natychmiastowy efekt, co chociażby oszczędności czy środki z pomocy społecznej. Intuicyjnie można zakładać, że liczba aktywnych kont kredytowych oraz fakt posiadania kart kredytowych największych wydawców również powoduje zwiększenie wspomnianego udziału wydatków z kart. Możemy tak przypuszczać, gdyż pośrednio jest to powiązane ze stanem majątkowym posiadacza oraz procedurą przyznawania kart kredytowych. Dodatkowe

4 karty zapewne nie zostałyby wydane, gdyby bank nie uznał danej osoby za wiarygodną finansowo. Nie wchodząc jednak w szczegóły owej procedury możemy założyć, iż sam fakt posiadania kilku kont/kart kredytowych może świadczyć o ograniczonej płynności finansowej i dokonywaniu większych wydatków z wykorzystaniem kart. W podobny sposób można by się odnieść do samozatrudnienia. Zazwyczaj osoby prowadzące własną działalność gospodarczą są bardziej przedsiębiorcze niż reszta społeczeństwa i potrzebują stałego dostępu do pieniędzy, aby móc rozwijać swoją firmę. Jeśli takiej osobie została przyznana krata kredytowa, to znaczy, że bank uznał ją za wypłacalną, czyli będącą w stanie odpowiednio prosperować w świecie biznesu, a co za tym idzie, w zwiększonym stopniu obracać pieniędzmi, również poprzez użycie kart kredytowych. Biorąc z kolei pod uwagę liczbę monitów bankowych, warto by się zastanowić czy taki rodzaj zmiennej mógłby mieć wpływ na badany przez nas problem. Zasadnicze będzie tu znalezienie odpowiedzi na pytanie, czy osoby którym zdarza się naruszać warunki umowy z bankiem, w przypadku kart kredytowych, będą wykazywały większe czy mniejsze skłonności do korzystania z kart. Naszym zdaniem, już sam fakt otrzymania takiego monitu będzie raczej świadczył o większych wydatkach. Duże wydatki pociągają za sobą konieczność spłaty wysokiego zadłużenia na koniec miesiąca. W przypadku nie dokonania spłaty, klient otrzymuje monit. Zatem respondenci dokonujący mniejszych wydatków z kart będą prawdopodobnie rzadziej otrzymywać monity o naruszeniu umowy. Również charakterystyki społeczno-demograficzne mogą być odpowiedzią na zwiększanie się średnich wydatków dokonywanych przy pomocy kart kredytowych. Morgan i Toll(1997), opierając się na The Survey of Consumer Finances przeprowadzonym w USA, korzystając z permanent income/life-cycle approach powiązali właśnie rosnące zadłużenie kart z socjoekonomicznymi i demograficznymi cechami posiadaczy kart. Według nas charakterystyki takie jak wiek, ilość osób pozostających na utrzymaniu posiadacza karty, fakt posiadania domu/mieszkania i długość zamieszkiwania pod danym adresem nie są zapewne bez znaczenia. Długość okresu zamieszkania pod danym adresem może być odbierana jako cecha pozornie nieistotna w wyjaśnianiu wydatków z kart. Warto się wówczas zastanowić czy nie wykazuje ona jednak istotnego wpływu na badany przez nas problem. Naszym zdaniem bezpośrednio łączy się z wielkością i strukturą wydatków. Mianowicie uważamy, iż dłuższe zamieszkiwanie się pod tym samym adresem implikuje większą świadomość wysokości cen w okolicznych sklepach, przez co zakupy mogą być dokonywane w sposób bardziej efektywny (tańszy). Zatem wielkość tych wydatków jest pośrednio związana również z tymi dokonywanymi poprzez karty kredytowe. Z kolei fakt posiadania własnego domu/mieszkania może wskazywać na większy stan majątkowy respondenta oraz być dla banku rodzajem zabezpieczenia przy wydawaniu kolejnej karty oraz ustalaniu wysokości jej limitu. Osoba posiadająca nieruchomość jest zapewne bardziej wiarygodna w oczach banku, zatem będzie mogła otrzymać lepsze warunki niż osoba wynajmująca mieszkanie (ceteris paribus). Wynika z tego, iż osoby posiadające dom/mieszkanie będą wykazywały większe wydatki dokonywane przy pomocy kart niż inni respondenci. Niewątpliwie na wysokość wydatków z kart kredytowych wpływa także wiek posiadacza karty. Naszym zdaniem jednak przeciętne wydatki z kart kredytowych nie są liniowo zależne od wieku ich posiadacza. Według nas na początku są nieznaczne ze względu na brak własnej 4

5 karty, najwyższe w okresie pracy zawodowej i ponownie niskie w okresie emerytury. Zależność wydatków z karty od wieku przyjmuje zatem kształt paraboli o odwróconym kształcie, dlatego postanowiliśmy podnieść zmienną age, oznaczającą wiek, do kwadratu i przyjąć znak ujemny. 3. PRZEGLĄD LITERATURY Przed rozpoczęciem analizy interesującego nas zjawiska, dokonaliśmy krótkiego przeglądu literatury. Dotyczyła ona zarówno problematyki związanej z kartami kredytowymi, jak i budowy modelu ekonometrycznego. Artykuły i badania, do których dotarliśmy, to wyłącznie pozycje anglojęzyczne. Literatura polska dotycząca kart koncentruje się głównie na samej ich konstrukcji i analizie rynku. Wynika to zapewne z faktu, że w Polsce karty kredytowe nie są tak rozpowszechnione jak w USA. Poniżej przedstawiamy główne myśli zawarte w wybranych przez nas pozycjach. Rozpatrując zmienną dotyczą wielkości dochodu, przyjęliśmy hipotezę, że jest on dodatnio skorelowany z wydatkami z kart kredytowych. Mianowicie, zwiększające się dochody implikują większe wydatki, w tym także te, za które płacimy kartami. Przypuszczenie to oparliśmy na badaniach empirycznych Carola C. Bertauta i Michaela Halisassosa (2005) oraz Peter a S. Yoo (1997). W pierwszej z tych prac bada się wykorzystanie kart kredytowych wśród obywateli USA, opierając się na badaniu SCF 2. Badanie to zostało przeprowadzone na grupie 3000 gospodarstw domowych i dostarcza informacji na ich temat w kwestii posiadania różnych aktywów finansowych, wykorzystania możliwości kredytowych, w tym kart, a także wieku, wykształcenia, rasy, struktury rodziny, zatrudnienia, faktu posiadania domu, etc. Autorzy wnioskują na podstawie kolejno przeprowadzanych regresji, że posiadanie karty kredytowej w USA jest dodatnio skorelowane z dochodem i wykształceniem i ten trend utrzymuje się we wszystkich falach SCF. Natomiast w artykule Peter a S. Yoo analiza dotyczy determinantów wzrostu użycia kart kredytowych, a co się z tym łączy, zwiększonych wydatków. Autor wykorzystuje w/w SFC z lat i na tej podstawie dzieli wzrost użycia kart na dwie kategorie wzrost ilości gospodarstw posiadających karty i zmiany w zadłużeniu posiadanych już kart. W celu wyjaśnienia tego zjawiska wykorzystywane są dane dotyczące dochodów respondentów, a zwłaszcza gospodarstw posiadających niższy dochód. Pod uwagę brane są także dane dotyczące dostępności kart, ilości gospodarstw i przeciętnego zadłużenia. Wyraźne we wnioskach są dwa spostrzeżenia. Po pierwsze, iż prawdopodobieństwo posiadania karty jest dodatnio skorelowane z dochodem. Co wydaje się zastanawiające, mimo, że ilość gospodarstw posiadających karty wzrosła w każdej grupie dochodowej, to wzrost ten jest wyraźnie szybszy w biedniejszych gospodarstwach. Po drugie poziom całkowitego zadłużenia z kart rośnie wraz z poziomem dochodu gospodarstwa, przez co rozumiemy, że wraz ze wzrostem statusu majątkowego, rosną również wydatki w taki sposób, że gospodarstwa domowe nie boją się korzystania z debetu. Wynika to z przekonania, że wielkość ich dochodów jest w stanie pokryć, w chwili obecnej, zwiększoną konsumpcję, a w przyszłości również spłacić dług z karty. W rozpatrywanej przez nas literaturze, jedną z ważniejszych zmiennych określających wielkość wydatków z kart, jest zmienna dotycząca wieku respondenta. Hipotezę o parabolicznej zależności wydatków i wieku oparliśmy na w/w badaniu Carola C. Bertauta i Michaela Halisassosa. W tej pracy zmienna wieku okazała się istotna w wyjaśnianiu faktu 2 Survey of Consumer Finances 5

6 posiadania i użycia kart. Stwierdzono, iż użycie kart jest największe w przedziale wiekowym 50-75, mniejsze w przedziałach do 50 i powyżej 75 lat. Poparcie naszej hipotezy znajdujemy również w pracy Elizabeth C. Hirshman (1981), która zauważa, że dystrybucja kart nie jest skierowana do młodszych osób ze względu na surowe kryteria przyznawania kredytów. Stwierdza się również, że może być to wynikiem powiązania wieku z takimi zmiennymi jak długość okresu zatrudnienia, długość zamieszkania czy wielkość dochodu, które również są zmiennymi zastosowanymi w naszym modelu. Natomiast sprzeczne z naszą hipotezą są wnioski zawarte w artykule Lindy Punch Older debtors, new problems. Artykuł jest poświęcony jest zagadnieniu związanemu z wielkością i strukturą wydatków zmieniającą się wraz z wiekiem. Szczególną uwagę autorka zwraca na emerytów, zauważając, iż ta grupa ludzi wcale nie wykazuje małych lub znikomych wielkości wydatków dokonywanych przy użyciu kart. Omawiając ten problem, Linda Punch bada również motywy i potrzeby kierujące wydatkami emerytów, a także konsekwencje, nierzadko spotykanych, zbyt pochopnych działań. Starając się potwierdzić istotność naszego modelu w sensie ekonomicznym, a także słuszność postawionych założeń, odwoływaliśmy się również do prac Kelly Shermach(2004), Nicole Jonker (2005) oraz Lucii F. Dunn i TaeHyung Kim (2005). Pierwsza z tych prac uzasadnia istotność posiadania oddzielnych kart kredytowych przeznaczonych do celów prywatnych i biznesowych, używanych zwłaszcza przez właścicieli małych firm. Jej głównym przesłaniem jest uświadomienie tym przedsiębiorcom zalet z dokonywania transakcji biznesowych za pomocą kart kredytowych. Kolejny artykuł, autorstwa Nicole Jonker to badanie dotyczące instrumentów płatniczych. Jego autorka porównuje rożne formy płatności podczas dokonywania zakupów, zwracając również uwagę na rożne czynniki wpływające na określony sposób wydatkowania pieniędzy, m.in. wiek, średnie miesięczne dochody, wykształcenie itp. Z kolei Lucia F. Dunn i TaeHyung Kim badają czynniki determinujące opóźnienia w spłacaniu kredytów zaciągniętych poprzez karty. Koncentrują się na związku pomiędzy finansowymi decyzjami konsumentów a wspomnianymi opóźnieniami. W tej pracy znaczące okazują się głownie: stosunek wymaganych minimalnych spłat do dochodu, stopień wykorzystania możliwości kredytowych i liczba kart, których limit został wyczerpany. Uwzględnione są także zmienne nie-finansowe tj. wiek, stan cywilny, liczba dzieci, status zawodowy, fakt posiadania domu czy wykształcenie. Na podstawie wymienionych zmiennych przeprowadzona zostaje regresja wyjaśniającą ryzyko opóźnień w spłacie. 4. OPIS BAZY DANYCH I DEFINICJE ZMIENNYCH 4.1 BAZA DANYCH Model został opracowywany na podstawie danych zaczerpniętych ze strony internetowej: Jest to strona profesora Williama Greene z New York University Leonard N. Stern School of Business Faculty of Entertainment, Media and Technology. Dane zostały zebrane w 1992 roku wśród obywateli USA. Pierwotnie baza danych zawierała 1319 obserwacji, które poddano wstępnej analizie. Z bazy danych przed przystąpieniem do wstępnej estymacji zostało usuniętych 296 obserwacji dla respondentów, którzy nie posiadali karty kredytowej w momencie badania, gdyż obserwacje te nie były istotne ze względu na podejmowany przez nas problem badawczy. Kolejnych 6 obserwacji zostało usuniętych ze względu na błędnie 6

7 podane informacje (wiek był w tych przypadkach mniejszy od 1). Po ich eliminacji w bazie danych pozostało 1017 obserwacji. Bezpośredni link do bazy danych: 4.2 ZMIENNE MODELU Poza ważnymi zmiennymi objaśniającymi o charakterze czysto finansowym wykorzystaliśmy inne zmienne, aby móc obserwować socjoekonomiczne i demograficzne różnice w próbce. Spośród zmiennych dostępnych w bazie wybraliśmy ekonomiczne, społeczne i demograficzne charakterystyki ludności, które według nas mają uzasadniony wpływ na wydatki dokonywane przy użyciu kart kredytowych. Do tych zmiennych można zaliczyć: dochód respondenta wiek fakt samozatrudnienia fakt posiadania domu/mieszkania ilość osób pozostających na utrzymaniu posiadacza karty liczba posiadanych głównych kart kredytowych 3 liczba monitów bankowych 4 liczba posiadanych aktywnych kont/rachunków kredytowych długość zamieszkiwania pod danym adresem Zmienne te zostały przez nas przekształcone. Poniżej przedstawiamy pełny opis zmiennych wraz z ich przekształceniami. ZMIENNA OBJAŚNIANA przeciętne miesięczne wydatki dokonywane przy użyciu kart kredytowych: y = avg exp Jest to zmienna ciągła. W modelu uwzględniliśmy logarytm tej zmiennej lavgexp. Dla 21 obserwacji wartość avgincome wynosiła 0. Podczas pierwszej próby regresji, w celu policzenia logarytmu, zastąpiliśmy zera jedynkami, oznaczającymi wydatki w symbolicznej wysokości 1$. Jednak w tak oszacowanym modelu wystąpił problem heteroskedastyczności składnika losowego. Podejrzewaliśmy, że heteroskedastyczność spowodowały właśnie obserwacje, w których avgexp=0. Przypuszczenia te potwierdził test Cook a. Zatem, po dokładnej ich analizie, postanowiliśmy te obserwacje usunąć. W bazie pozostało zatem 996 obserwacji. 3 Według naszych ustaleń główne karty kredytowe (w oryginale major credit cards ) to karty typu Visa, Mastercard, American Express, JCB, a więc karty największych wydawców.. 4 W oryginale nazwa zmiennej to major derogatory reports. Jest to zmienna, której wartość (także w ogólnym przypadku) dla większości użytkowników kart będzie wynosiła 0, ale dla istotnej części, która zapomniała dokonać spłaty zaciągniętego kredytu, przyjmuje wartość dodatnią. Typowe wartości to 0, 1 lub 2, ale zmienna może przyjmować także wyższe wartości np.10. Definicja znajdująca się w oryginalnej bazie danych okazała się dość trudna do przetłumaczenia. Według nas można by zdefiniować majordg jako zawiadomienia o naruszeniu umowy/zasad korzystania - w przypadku kart kredytowych: najpewniej znacznego przekroczenia limitu/terminu spłaty. 7

8 ZMIENNE OBJAŚNIAJĄCE przeciętne miesięczne dochody respondenta: x 1 = avgincome = income*10000/12 Jest to zmienna ciągła. Została zbudowana na podstawie zmiennej income oznaczającej średnie roczne dochody respondenta podzielone przez W modelu uwzględniliśmy logarytm zmiennej x 1 lavgincome. kwadrat wieku: x = age2 age* age 2 = Jest to zmienna ciągła. Została zbudowana na podstawie zmiennej age oznaczającej wiek respondenta (podany z dokładnością do 1 miesiąca = 1/12 roku). fakt posiadania domu/mieszkania: x = ownrent 3 Jest to zmienna binarna. ownrent = 1 jeśli respondent jest właścicielem domu/mieszkania ownrent = 0 w pozostałych przypadkach fakt samozatrudnienia x = 4 Jest to zmienna binarna. selfempl selfempl = 1 jeśli respondent jest samozatrudniający się selfempl = 0 w pozostałych przypadkach liczba osób pozostających na utrzymaniu właściciela karty: Zmienna ta została utworzona ze zmiennej dependt, która oznaczała liczbę osób pozostających na utrzymaniu właściciela karty. Zmienna dependt przyjmowała 7 poziomów, dlatego postanowiliśmy ją pogrupować na zmienne binarne: osoby x 5 = dependt x 5 = dependt _1=1 oznacza, że respondent ma na utrzymaniu 1 osobę _1=0 oznacza, że respondent ma na utrzymaniu mniej niż 1 osobę x 6 = dependt _ 2=1 oznacza, że respondent ma na utrzymaniu 2 osoby x 6 = dependt _ 2=0 oznacza, że respondent ma na utrzymaniu mniej niż 2 x 7 = dependt _ 3 =1 oznacza, że respondent ma na utrzymaniu 3 osoby i więcej 8

9 osoby x 7 = dependt _ 3 =0 oznacza, że respondent ma na utrzymaniu mniej niż 3 liczba posiadanych głównych kart kredytowych x = major 8 Jest to zmienna binarna. W oryginalnej bazie danych zmienna major przyjmowała wartość 1 dla posiadacza takiej karty. Jednak przekodowaliśmy ją, aby poziom bazowy zawierał większość obserwacji (patrz statystyki opisowe zmiennych). major = 1 jeśli respondent posiada główną kartę kredytową major = 0 jeśli nie posiada. liczba posiadanych aktywnych rachunków / kont kredytowych x = active 9 Jest to zmienna dyskretna. liczba monitów bankowych: x 10 = major _ drg Jest to zmienna binarna. Powstała on ze zmiennej majordrg, oznaczającej liczbę monitów bankowych, otrzymanych przez respondenta. major_drg = 0 jeśli majordrg = 0 major_drg = 1 jeśli majordrg > 0 długość zamieszkiwania pod danym adresem (w miesiącach): x = curadd 11 Jest to zmienna ciągła. ε i składnik losowy i = 1,2,,N indeks obserwacji Baza danych, którą wykorzystaliśmy w naszym badaniu była podstawą modelu, jaki prof. William Greene zbudował w 1995 roku i zamieścił w książce Econometric Analysis (wydanie V z 2003 roku). Autor stworzył model zachowania konsumenta Credit scoring model, w którym zmienna zależną była liczba major derogatory reports zarejestrowana w historii kredytowej respondenta. Zmiennymi objaśniającymi z kolei były wiek, dochód i przeciętne wydatki z kart. Greene zbudował także model badający fakt przyznania karty kredytowej w zależności od wieku, dochodu, faktu posiadania domu i samozatrudnienia. Nam jednak wydało się interesujące zbadać co determinuje wydatki z kart. Badanie prof. Green a było dla nas źródłem wartościowych informacji i wniosków. 9

10 5. WSTĘPNA ANALIZA DANYCH 5.1 STATYSTYKI OPISOWE ZMIENNYCH Poniżej przedstawiamy podstawowe statystyki opisowe zmiennych wartość średnią, minimalną, maksymalną i odchylenie standardowe. Na tym etapie badania uwzględnionych zostało 1017 obserwacji.. summ avgexp avgincome age ownrent selfempl dependt major active majordrg curadd Variable Obs Mean Std. Dev. Min Max avgexp avgincome age ownrent selfempl dependt major active majordrg curadd Uznaliśmy, iż mimo, że w modelu wykorzystujemy zmienna age2 to łatwiejsza w interpretacji niektórych statystyk opisowych będzie zmienna age. W Załączniku nr 1 znajdują się bardziej szczegółowe statystyki opisowe uwzględniające dodatkowo percentyle, zakres zmiennych, wariancję skośność i kurtozę. 5.2 MACIERZ KORELACJI ZMIENNYCH. corr avgexp avgincome age2 ownrent selfempl dependt_1 dependt_2 dependt_3 major active major_drg curadd (obs=1017) avgexp avginc~e age2 ownrent selfempl depend~1 depend~2 depend~3 major active major_~g curadd avgexp avgincome age ownrent selfempl dependt_ dependt_ dependt_ major active major_drg curadd Współczynniki korelacji pomiędzy poszczególnymi zmiennymi objaśniającymi nie wykazują znaczącej zależności. Jedynie współczynnik pomiędzy curadd a age2 przyjmuje wartość Według nas wiąże się to z faktem, iż osoby starsze rzadziej zmieniają miejsce zamieszkania. 10

11 5.3 ANALIZA ZMIENNYCH BINARNYCH W tym punkcie przedstawiamy wartość średnią i odchylenie standardowe zmiennej avgexp z rozróżnieniem poszczególnych poziomów zmiennych binarnych: ownrent, selfempl, major i major_drg. ownrent. sort ownrent. by ownrent: summarize avgexp -> ownrent = 0 Variable Obs Mean Std. Dev. Min Max avgexp > ownrent = 1 Variable Obs Mean Std. Dev. Min Max avgexp Widzimy, iż średnia i odchylenie avgexp na obu poziomach (o podobnej liczebności) ownrent różnią się nieznacznie, stąd możemy wnioskować, że zmienna ta może okazać się w modelu nieistotna. selfempl. sort selfempl. by selfempl: summarize avgexp -> selfempl = 0 Variable Obs Mean Std. Dev. Min Max avgexp > selfempl = 1 Variable Obs Mean Std. Dev. Min Max avgexp Tutaj także statystyki opisowe nie wykazują dużych różnic. Jednak wartości maksymalne oraz liczebności grup różnią się znacząco, zatem możemy podejrzewać istotność zmiennej selfempl w wyjaśnieniu poziomu wydatków. 11

12 major. sort major. by major: summarize avgexp -> major = 0 Variable Obs Mean Std. Dev. Min Max avgexp > major = 1 Variable Obs Mean Std. Dev. Min Max avgexp W tym przypadku statystyki opisowe wykazują nieco mniejsze różnice niż dla selfempl. Wartości maksymalne oraz liczebności grup także są nieco mniej zróżnicowane. W związku z tym nie możemy jednoznacznie przewidzieć istotności tej zmiennej. major_drg. sort major_drg. by major_drg: summarize avgexp -> major_drg = 0 Variable Obs Mean Std. Dev. Min Max avgexp > major_drg = 1 Variable Obs Mean Std. Dev. Min Max avgexp W przypadku tej zmiennej statystyki opisowe, jak i liczebności podgrup wykazują duże różnice. Zatem spodziewamy się, iż zmienna major_drg będzie istotnie wpływać na wydatki z kart. 12

13 5.4 HISTOGRAMY ZMIENNYCH Poniżej przedstawiamy histogramy zmiennych ciągłych(uwzględniające 1017 obserwacji): avgexp, avgincome, age, curadd wraz z krótkim opisem. Rys. 1. Histogram zmiennej avgexp. Średnie miesięczne wydatki zadeklarowane przez respondentów zaczynają się na poziomie 0$, a największe wynoszą prawie 3100$. Histogram wyraźnie wykazuje prawoskośność, na co wskazuje też wielkość mediany, kształtującej się na poziomie ok. 150$. Rys. 2. Histogram zmiennej avgincome. Zakres średnich dochodów zawiera się pomiędzy 175$ a 11250$ miesięcznie. Histogram nie jest symetryczny ponieważ większość obserwacji należy do przedziału 1000$ do 5000$. Również wartość mediany to 2500$. 13

14 Rys. 3. Histogram zmiennej age. Wykres wskazuje, że wiek respondenta zawiera się w przedziale (18; 83), co wskazuje na fakt, iż w badania wzięły udział osoby reprezentujące wszystkie grupy wiekowe, dla których możliwe jest posiadanie kart kredytowych. Można zauważyć, że histogram nie jest symetryczny, ponieważ przeważająca większość respondentów zawiera się w przedziale od 20 do 40 lat. Wielkość mediany kształtuje się na poziomie 31,25. (Uznaliśmy, iż mimo że w modelu wykorzystujemy age2 to łatwiejszy w interpretacji będzie histogram age.) Rys. 4. Histogram zmiennej curadd. Wartości minimalna i maksymalna długości zamieszkiwania pod danym adresem zadeklarowane przez respondentów to odpowiednio niecały miesiąc i 540 miesięcy. Histogram wyraźnie wskazuje na prawoskośność, gdyż większość obserwacji zawiera się w przedziale Źródło: (0;80), baza a wielkość danych mediany ze strony: to 30 miesięcy obliczenia własne. 6. FORMA FUNKCYJNA MODELU Model powstał w programie Intercoolded Stata 8.1. Wyboru formy funkcyjnej modelu dokonaliśmy po porównaniu histogramów logarytmów zmiennych avgexp i avgincome z rozkładem normalnym. Poniżej przedstawiamy te wykresy (dla 996 obserwacji, dla których przeprowadzono ostateczną regresję). 14

15 Rys. 5. Histogram logarytmu zmiennej avgexp Źródło: baza danych ze strony: obliczenia własne. Rys. 6. Histogram logarytmu zmiennej avgincome Z wykresów wynika, że odpowiednią formą modelu będzie forma, w której wydatki i dochody zostaną logarytmowane. Rozkład logarytmu avgexp jest podobny do rozkładu normalnego. Jeżeli chodzi o logarytm zmiennej avgincome, to rozkład logarytmu nie wykazuje tak wysokiego podobieństwa do rozkładu normalnego, jak poprzednia zmienna. Na histogramie wyraźny jest brak lewego ogona rozkładu. Jednak według nas jest to spowodowane faktem, iż w badaniu odrzucone zostały obserwacje dla respondentów nie posiadających kart. W związku z tym dochód respondentów wziętych pod uwagę znajduje się powyżej pewnego poziomu (zapewne wymaganego przez bank do otrzymania karty kredytowej). Zatem w modelu wykorzystaliśmy zmienną lavgincome. Poniżej przedstawiamy zakładany model końcowy: ln( y) = β + β x 10 10i 0 + β1 ln( x1 i ) + β x 11 11i + ε i + β x 2 2i + β x 3 3i + β x 4 4i + β x 5 5i + β x 6 6i + β x 7 7i + β x 8 8i + β x 9 9i + Postać analityczna szacowanego równania regresji (wraz z przewidywanymi znakami współczynników): (+) ( ) (+) (+) (+) lavgexp = β 0 + β 1 lavgincome + β 2 age2 + β 3 ownrent + β 4 selfempl + β 5 dependt_1 + (+) (+) (+) (+) (+) ( ) +β 6 dependt_2 + β 7 dependt_3 + β 8 major + β 9 active + β 10 major_drg + β 11 curadd + ε i 15

16 7. ESTYMACJA PARAMETRÓW MODELU Końcowa estymacja została przeprowadzona na próbie zawierającej 996 obserwacji. Wyniki tak oszacowanego modelu przedstawia tabela:. reg lavgexp lavgincome age2 ownrent selfempl dependt_1 dependt_2 dependt_3 major active major_drg curadd Source SS df MS Number of obs = F( 11, 984) = 7.30 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = lavgexp Coef. Std. Err. t P> t [95% Conf. Interval] lavgincome age ownrent selfempl dependt_ dependt_ dependt_ major active major_drg curadd _cons Mimo, że wszystkie zmienne w modelu naraz są istotne (Prob>F=0.0000), jednak występują pojedyncze zmienne nieistotne: ownrent, dependt_1, dependt_2, dependt_3, major, active, curadd. Z modelu były usuwane kolejno te zmienne, które posiadały największą wartość P> t. Jako pierwsze usunięto zmienne: ownrent (P> t =0.907). Następnie okazało się, że żaden z ze zmiennych dependt_1 (P> t =0.859), dependt_2 (P> t =0.416), dependt_3 (P> t =0.874) nie jest istotna. Przed usunięciem ich z modelu wykonaliśmy test na łączną nieistotność, który prezentujemy poniżej:. test dependt_1 dependt_2 dependt_3 ( 1) dependt_1 = 0 ( 2) dependt_2 = 0 ( 3) dependt_3 = 0 F( 3, 985) = 0.31 Prob > F = Wartość Prob>F = > 0.05 zatem nie ma podstaw do odrzucenia hipotezy zerowej o łącznej nieistotności zmiennych. Kolejnymi zmiennymi usuniętymi były: curadd (P> t =0.703), major (P> t =0.598), oraz active (P> t =0.168). 16

17 Wyniki estymacji po wyrzuceniu zmiennych nieistotnych przedstawiają się następująco:. reg lavgexp lavgincome age2 selfempl major_drg Source SS df MS Number of obs = F( 4, 991) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = lavgexp Coef. Std. Err. t P> t [95% Conf. Interval] lavgincome age selfempl major_drg _cons Potwierdzeniem łącznej nieistotności wszystkich zmiennych usuniętych jest wynik testu na łączną nieistotność:. test ownrent dependt_1 dependt_2 dependt_2 major active curadd ( 1) ownrent = 0 ( 2) dependt_1 = 0 ( 3) dependt_2 = 0 ( 4) dependt_2 = 0 ( 5) major = 0 ( 6) active = 0 ( 7) curadd = 0 Constraint 4 dropped F( 6, 984) = 0.51 Prob > F = Prob>F wynosi > 0.05 w związku z czym nie ma podstaw do odrzucenia hipotezy zerowej o łącznej nieistotności zmiennych. 8. OSZACOWANIE MODELU Po przeprowadzeniu estymacji wykonaliśmy test na współliniowość vif:. vif Variable VIF 1/VIF lavgincome age selfempl major_drg Mean VIF

18 Widzimy, iż wszystkie wartości są znacznie mniejsze od 10, zatem możemy wnioskować, że w modelu nie występuje problem współliniowości. Kolejnym wykonanym przez nas testem był test Cook a. Wskazał on 54 obserwacje o skrajnych wartościach podejrzane o duży wpływ na wyniki regresji. Jednak po dokładnej ich analizie doszliśmy do wniosku, że nie można tych obserwacji usunąć z próby. Poniżej przedstawiamy dwie przykładowe obserwacje wraz z ich analizą: avgexp majordrg age income ownrent selfempl dependt curadd major active avginc~e age major_~g depend~1 depend~2 depend~3 lavgexp lavgin~e cd Ta obserwacja została wyróżniona zapewne ze względu na bardzo małe wydatki, których wielkość po zlogarytmowaniu dała wartość ujemną. Jednak naszym zdaniem nie należałoby odrzucać tej obserwacji, ponieważ według nas nie jest ona błędna. Po pierwsze dlatego, że avgexp to średnia wielkość wydatków dokonywanych przy użyciu karty kredytowej, a nie wielkość całkowitych wydatków. Po drugie należy zauważyć, iż respondent jest osobą młoda, nie posiadająca nikogo na utrzymaniu. Z tych dwóch względów może wynikać niska wartość avgexp avgexp majordrg age income ownrent selfempl dependt curadd major active avginc~e age major_~g depend~1 depend~2 depend~3 lavgexp lavgin~e cd W przypadku tej obserwacji, sytuacja jest odwrotna niż powyżej. Zauważamy, że mamy tu do czynienia ze stosunkowo wysokimi wydatkami, jak również bardzo wysokimi dochodami u osoby prawie 72 letniej. Jednak nie można stwierdzić, że taka sytuacja nie może mieć miejsca. Prawdopodobne jest, że dany respondent to zamożna starsza osoba, posiadająca dodatkowe źródło utrzymania poza emeryturą, np. udziały w firmie. Aby potwierdzić nasze wnioski wykonaliśmy test dźwigni: Rys. 7. Wykres standaryzowanych reszt i dźwigni. Widzimy, że żadna z obserwacji nie znalazła się w prawej-górnej części wykresu. W związku z tym upewniliśmy się, że nie mamy obserwacji, które znacząco wpływałyby na precyzję oszacowań. Źródło: baza danych z strony: obliczenia własne. 18

19 9. DIAGNOSTYKA MODELU W tym punkcie przedstawiamy kolejno wyniki przeprowadzonych przez nas testów diagnostycznych: test RESET na poprawność formy funkcyjnej. ovtest, rhs Ramsey RESET test using powers of the independent variables Ho: model has no omitted variables F(6, 985) = 0.78 Prob > F = Prob>F = >0.05 zatem nie ma podstaw do odrzucenia hipotezy zerowej. Stąd wnioskujemy, że forma funkcyjna zastosowana w modelu jest poprawna. test BREUSCHA-PAGANA na heteroskedastyczność. hettest, rhs Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: lavgincome age2 selfempl major_drg chi2(4) = 2.22 Prob > chi2 = Prob>chi2 = >0.05 zatem nie ma podstaw do odrzucenia hipotezy zerowej. Stąd wnioskujemy, że składnik losowy jest homoskedastyczny. test WHITE A. imtest, white White's test for Ho: homoskedasticity against Ha: unrestricted heteroskedasticity chi2(12) = 6.05 Prob > chi2 = Cameron & Trivedi's decomposition of IM-test Source chi2 df p Heteroskedasticity Skewness Kurtosis Total Prob>chi2 = >0.05 zatem nie ma podstaw do odrzucenia hipotezy zerowej. Stąd również wnioskujemy, że składnik losowy jest homoskedastyczny. 19

20 test JARQUE-BERRA na normalność składnika losowego:. sktest res Skewness/Kurtosis tests for Normality joint Variable Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi res Z wyników testu (Prob>chi2=0.000) możemy wnioskować, iż składnik losowy nie ma rozkładu normalnego. Jednak w dużych próbach nie jest to istotne, gdyż rozkłady statystyk w takich próbach są bliskie standardowym. 5 (patrz załącznik nr 2.) 10. INTERPRETACJA WYNIKÓW ESTYMACJI Po przeprowadzeniu estymacji możemy przystąpić do interpretacji otrzymanych wyników. Jak widać, zmiennymi istotnymi na poziomie 0,05 okazały się następujące zmienne: kwadrat wieku respondenta logarytm średniego miesięcznego dochodu respondenta fakt otrzymywania monitów bankowych fakt samozatrudnienia Zmienne te są również łącznie istotne (Prob>F = < 0.05). Pozostałe zmienne w modelu okazały się statystycznie nieistotne. Macierz oszacowań wektora β wygląda następująco:. matrix list e(b) e(b)[1,5] lavgincome age2 selfempl major_drg _cons y Wyestymowane parametry można zinterpretować w następujący sposób: Wartość R 2 =7,24% oznacza, że zmienność zmiennej objaśnianej (wydatków z kart) została wyjaśniona w modelu poprzez zmienne objaśniające w 7,24%. Jednocześnie wartość dopasowanego R 2 jest równa 6,86%. Wzrost średniego miesięcznego dochodu o 1% powoduje (średnio rzecz biorąc) wzrost średnich miesięcznych wydatków z kart o 0,73% ceteris paribus Wzrost kwadratu wieku o jednostkę powoduje (średnio rzecz biorąc) spadek średnich miesięcznych wydatków z kart o 0,019% ceteris paribus. Osoby samozatrudniające się wydają przy użyciu kart kredytowych (średnio rzecz biorąc) o 26,83% (e ,731) mniej niż osoby o innym statusie pracy ceteris paribus. 5 Jerzy Mycielski, Skrypt do Ekonometrii semestr 1, Warszawa 2006, str

Diagnostyka w Pakiecie Stata

Diagnostyka w Pakiecie Stata Karol Kuhl Zgodnie z twierdzeniem Gaussa-Markowa, estymator MNK w KMRL jest liniowym estymatorem efektywnym i nieobciążonym, co po angielsku opisuje się za pomocą wyrażenia BLUE Best Linear Unbiased Estimator.

Bardziej szczegółowo

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu Część 2 Test Durbina-Watsona Test Durbina-Watsona Weryfikowana hipoteza H 0 : cov(ε t, ε t 1 ) = 0 H 1 : cov(ε t, ε t 1 ) 0 Test Durbina-Watsona Weryfikowana hipoteza H 0 : cov(ε t, ε t 1 ) = 0 H 1 : cov(ε

Bardziej szczegółowo

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 Zadanie 1 a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 b) W naszym przypadku populacja są inżynierowie w Tajlandii. Czy można jednak przypuszczać, że na zarobki kobiet-inżynierów

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka - adres mailowy: scichocki@o2.pl - strona internetowa: www.wne.uw.edu.pl/scichocki - dyżur: po zajęciach lub po umówieniu mailowo - 80% oceny: egzaminy - 20% oceny:

Bardziej szczegółowo

1.6 Zmienne jakościowe i dyskretne w modelu regresji

1.6 Zmienne jakościowe i dyskretne w modelu regresji 1.6 Zmienne jakościowe i dyskretne w modelu regresji 1.6.1 Zmienne dyskretne i zero-jedynkowe (Dummy Variables) W badaniach ekonometrycznych bardzo często występują zjawiska, które opisujemy zmiennymi

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Zbiór zadań. Makroekonomia II ćwiczenia KONSUMPCJA

Zbiór zadań. Makroekonomia II ćwiczenia KONSUMPCJA Zbiór zadań. Makroekonomia II ćwiczenia KONSUMPCJA Zadanie 1. Konsument żyje przez 4 okresy. W pierwszym i drugim okresie jego dochód jest równy 100; w trzecim rośnie do 300, a w czwartym spada do zera.

Bardziej szczegółowo

1. Obserwacje nietypowe

1. Obserwacje nietypowe 1. Obserwacje nietypowe Przeanalizujemy następujący eksperyment: 1) Generujemy zmienną x z rozkładu N (,1) (37 obserwacji). ) Generujemy zmienną y w następujący sposób: y = 1+ x + ε, gdzie ε ~ N(0,1).

Bardziej szczegółowo

Jak zarabiają najbardziej wpływowi - determinanty zarobków CEO

Jak zarabiają najbardziej wpływowi - determinanty zarobków CEO Uniwersytet Warszawski Wydział Nauk Ekonomicznych Cyryl Kasperski Nr albumu: 276885 Jak zarabiają najbardziej wpływowi - determinanty zarobków CEO Praca na kierunku: Informatyka i Ekonometria Praca wykonana

Bardziej szczegółowo

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności. TEST STATYSTYCZNY Testem statystycznym nazywamy regułę postępowania rozstrzygająca, przy jakich wynikach z próby hipotezę sprawdzaną H 0 należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.

Bardziej szczegółowo

Analiza wariancji - ANOVA

Analiza wariancji - ANOVA Analiza wariancji - ANOVA Analiza wariancji jest metodą pozwalającą na podział zmienności zaobserwowanej wśród wyników eksperymentalnych na oddzielne części. Każdą z tych części możemy przypisać oddzielnemu

Bardziej szczegółowo

Prognozowanie na podstawie modelu ekonometrycznego

Prognozowanie na podstawie modelu ekonometrycznego Prognozowanie na podstawie modelu ekonometrycznego Przykład. Firma usługowa świadcząca usługi doradcze w ostatnich kwartałach (t) odnotowała wynik finansowy (yt - tys. zł), obsługując liczbę klientów (x1t)

Bardziej szczegółowo

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:

Bardziej szczegółowo

Jednowskaźnikowy model Sharpe`a

Jednowskaźnikowy model Sharpe`a Uniwersytet Warszawski Wydział Nauk Ekonomicznych Milena Jamroziak i Paweł Androszczuk Model ekonometryczny Jednowskaźnikowy model Sharpe`a dla akcji Amici Praca zaliczeniowa napisana pod kierunkiem mgr

Bardziej szczegółowo

Chcesz zwiększyć swój dochód? Przenieś się i pracuj w Urzędzie!

Chcesz zwiększyć swój dochód? Przenieś się i pracuj w Urzędzie! Uniwersytet Warszawski Wydział Nauk Ekonomicznych Mateusz Błażej Nr albumu: 308521 Chcesz zwiększyć swój dochód? Przenieś się i pracuj w Urzędzie! Model ekonometryczny na kierunku: Informatyka i Ekonometria

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

Przykład 1 ceny mieszkań

Przykład 1 ceny mieszkań Przykład ceny mieszkań Przykład ceny mieszkań Model ekonometryczny zaleŝności ceny mieszkań od metraŝu - naleŝy do klasy modeli nieliniowych. - weryfikację empiryczną modelu przeprowadzono na przykładzie

Bardziej szczegółowo

REGRESJA (postać liniowa funkcji) - ROZWIĄZANIA Komentarze kursywą, rozwiązania oraz treści zadań pismem prostym.

REGRESJA (postać liniowa funkcji) - ROZWIĄZANIA Komentarze kursywą, rozwiązania oraz treści zadań pismem prostym. REGRESJA (postać liniowa funkcji) - ROZWIĄZANIA Komentarze kursywą, rozwiązania oraz treści zadań pismem prostym. Zadanie 1 W celu ustalenia zależności między liczbą braków a wielkością produkcji części

Bardziej szczegółowo

Regresja liniowa wprowadzenie

Regresja liniowa wprowadzenie Regresja liniowa wprowadzenie a) Model regresji liniowej ma postać: gdzie jest zmienną objaśnianą (zależną); są zmiennymi objaśniającymi (niezależnymi); natomiast są parametrami modelu. jest składnikiem

Bardziej szczegółowo

A.Światkowski. Wroclaw University of Economics. Working paper

A.Światkowski. Wroclaw University of Economics. Working paper A.Światkowski Wroclaw University of Economics Working paper 1 Planowanie sprzedaży na przykładzie przedsiębiorstwa z branży deweloperskiej Cel pracy: Zaplanowanie sprzedaży spółki na rok 2012 Słowa kluczowe:

Bardziej szczegółowo

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Przykład 2 Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Sondaż sieciowy analiza wyników badania sondażowego dotyczącego motywacji w drodze do sukcesu Cel badania: uzyskanie

Bardziej szczegółowo

Analiza procesu odzyskiwania środków z masy upadłości banków

Analiza procesu odzyskiwania środków z masy upadłości banków Tomasz Obal Analiza procesu odzyskiwania środków z masy upadłości banków Charakter działalności Bankowego Funduszu Gwarancyjnego daje unikalną szansę na przeprowadzenie pogłębionej analizy procesów upadłościowych

Bardziej szczegółowo

Inteligentna analiza danych

Inteligentna analiza danych Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki

Bardziej szczegółowo

Analiza zależności liniowych

Analiza zależności liniowych Narzędzie do ustalenia, które zmienne są ważne dla Inwestora Analiza zależności liniowych Identyfikuje siłę i kierunek powiązania pomiędzy zmiennymi Umożliwia wybór zmiennych wpływających na giełdę Ustala

Bardziej szczegółowo

Przykład 2. Stopa bezrobocia

Przykład 2. Stopa bezrobocia Przykład 2 Stopa bezrobocia Stopa bezrobocia. Komentarz: model ekonometryczny stopy bezrobocia w Polsce jest modelem nieliniowym autoregresyjnym. Podobnie jak model podaŝy pieniądza zbudowany został w

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

Ekonometria egzamin wersja ogólna 29/01/08

Ekonometria egzamin wersja ogólna 29/01/08 imię, nazwisko, nr indeksu: Ekonometria egzamin wersja ogólna 29/0/08. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych 3.1. Estymacja parametrów i ocena dopasowania modeli z jedną zmienną 23. Właściciel komisu w celu zbadania

Bardziej szczegółowo

Szymon Bargłowski, sb39345 MODEL. 1. Równania rozpatrywanego modelu: 1 PKB t = a 1 a 2 E t a 3 Invest t 1

Szymon Bargłowski, sb39345 MODEL. 1. Równania rozpatrywanego modelu: 1 PKB t = a 1 a 2 E t a 3 Invest t 1 Szymon Bargłowski, sb39345 MODEL 1. Równania rozpatrywanego modelu: 1 PKB t = a 1 a 2 E t a 3 Invest t 1 2 C t = b 1 b 2 PKB t b 3 Invest t 1 b 4 G t 2 3 Invest t = d 1 d 2 C t d 3 R t 3 gdzie: G - wydatki

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska Anna Stankiewicz Izabela Słomska Wstęp- statystyka w politologii Rzadkie stosowanie narzędzi statystycznych Pisma Karla Poppera

Bardziej szczegółowo

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp. Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.

Bardziej szczegółowo

Analizy wariancji ANOVA (analysis of variance)

Analizy wariancji ANOVA (analysis of variance) ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna 1 Laboratorium VIII: Analiza kanoniczna Spis treści Laboratorium VIII: Analiza kanoniczna... 1 Wiadomości ogólne... 2 1. Wstęp teoretyczny.... 2 Przykład... 2 Podstawowe pojęcia... 2 Założenia analizy

Bardziej szczegółowo

R-PEARSONA Zależność liniowa

R-PEARSONA Zależność liniowa R-PEARSONA Zależność liniowa Interpretacja wyników: wraz ze wzrostem wartości jednej zmiennej (np. zarobków) liniowo rosną wartości drugiej zmiennej (np. kwoty przeznaczanej na wakacje) czyli np. im wyższe

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ Korelacja oznacza fakt współzależności zmiennych, czyli istnienie powiązania pomiędzy nimi. Siłę i kierunek powiązania określa się za pomocą współczynnika korelacji

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

3. Modele tendencji czasowej w prognozowaniu

3. Modele tendencji czasowej w prognozowaniu II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa

Bardziej szczegółowo

Szkice rozwiązań z R:

Szkice rozwiązań z R: Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami

Bardziej szczegółowo

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna Badanie współzależności zmiennych Uwzględniając ilość zmiennych otrzymamy 4 odmiany zależności: Zmienna zależna jednowymiarowa oraz jedna

Bardziej szczegółowo

czerwiec 2013 Uwaga: Przy rozwiązywaniu zadań, jeśli to konieczne, należy przyjąć poziom istotności 0,1 i współczynnik ufności 0,90

czerwiec 2013 Uwaga: Przy rozwiązywaniu zadań, jeśli to konieczne, należy przyjąć poziom istotności 0,1 i współczynnik ufności 0,90 Uwaga: Przy rozwiązywaniu zadań, jeśli to konieczne, należy przyjąć poziom istotności 0,1 i współczynnik ufności 0,90 czerwiec 2013 Zadanie 1 Poniższe tabele przestawiają dane dotyczące umieralności dzieci

Bardziej szczegółowo

Zaawansowana eksploracja danych - sprawozdanie nr 1 Rafał Kwiatkowski 89777, Poznań

Zaawansowana eksploracja danych - sprawozdanie nr 1 Rafał Kwiatkowski 89777, Poznań Zaawansowana eksploracja danych - sprawozdanie nr 1 Rafał Kwiatkowski 89777, Poznań 6.11.1 1 Badanie współzależności atrybutów jakościowych w wielowymiarowych tabelach danych. 1.1 Analiza współzależności

Bardziej szczegółowo

S t a t y s t y k a, część 3. Michał Żmihorski

S t a t y s t y k a, część 3. Michał Żmihorski S t a t y s t y k a, część 3 Michał Żmihorski Porównanie średnich -test T Założenia: Zmienne ciągłe (masa, temperatura) Dwie grupy (populacje) Rozkład normalny* Równe wariancje (homoscedasticity) w grupach

Bardziej szczegółowo

Egzamin z Ekonometrii

Egzamin z Ekonometrii Pytania teoretyczne Egzamin z Ekonometrii 18.06.2015 1. Opisać procedurę od ogólnego do szczegółowego na przykładzie doboru liczby opóźnień w modelu. 2. Na czym polega najważniejsza różnica między testowaniem

Bardziej szczegółowo

Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego Przykład Cena metra kwadratowego (w tys. zł) z dla 14 losowo wybranych mieszkań w

Bardziej szczegółowo

1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej:

1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej: Metoda analizy macierzy współczynników korelacji Idea metody sprowadza się do wyboru takich zmiennych objaśniających, które są silnie skorelowane ze zmienną objaśnianą i równocześnie słabo skorelowane

Bardziej szczegółowo

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Ze względu na jakość uzyskiwanych ocen parametrów strukturalnych modelu oraz weryfikację modelu, metoda najmniejszych

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 Inne układy doświadczalne 1) Układ losowanych bloków Stosujemy, gdy podejrzewamy, że może występować systematyczna zmienność między powtórzeniami np. - zmienność

Bardziej szczegółowo

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 4 Mikołaj Czajkowski Wiktor Budziński Regresja kwantylowa W standardowej Metodzie Najmniejszych Kwadratów modelujemy warunkową średnią zmiennej objaśnianej: E( yi Xi) = μ ( Xi) Pokazaliśmy,

Bardziej szczegółowo

Etapy modelowania ekonometrycznego

Etapy modelowania ekonometrycznego Etapy modelowania ekonometrycznego jest podstawowym narzędziem badawczym, jakim posługuje się ekonometria. Stanowi on matematyczno-statystyczną formę zapisu prawidłowości statystycznej w zakresie rozkładu,

Bardziej szczegółowo

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki Maszyna ustawiona jest tak, by produkowała kulki łożyskowe o średnicy 1 cm. Pomiar dziesięciu wylosowanych z produkcji kulek dał x = 1.1 oraz s 2 = 0.009. Czy można uznać, że maszyna nie rozregulowała

Bardziej szczegółowo

Na podstawie danych dotyczacych rocznych wydatków na pizze oszacowano parametry poniższego modelu:

Na podstawie danych dotyczacych rocznych wydatków na pizze oszacowano parametry poniższego modelu: Zadanie 1. Oszacowano model ekonometryczny liczby narodzin dzieci (w tys.) w Polsce w latach 2000 2010 w zależnosci od średniego rocznego wynagrodzenia (w ujęciu realnym, PLN), stopy bezrobocia (w punktach

Bardziej szczegółowo

Wydział Matematyki. Testy zgodności. Wykład 03

Wydział Matematyki. Testy zgodności. Wykład 03 Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Zarządzanie ryzykiem. Opracował: Dr inŝ. Tomasz Zieliński

Zarządzanie ryzykiem. Opracował: Dr inŝ. Tomasz Zieliński Zarządzanie ryzykiem Opracował: Dr inŝ. Tomasz Zieliński I. OGÓLNE INFORMACJE O PRZEDMIOCIE Cel przedmiotu: Celem przedmiotu jest zaprezentowanie studentom podstawowych pojęć z zakresu ryzyka w działalności

Bardziej szczegółowo

Analiza zdarzeń Event studies

Analiza zdarzeń Event studies Analiza zdarzeń Event studies Dobromił Serwa akson.sgh.waw.pl/~dserwa/ef.htm Leratura Campbell J., Lo A., MacKinlay A.C.(997) he Econometrics of Financial Markets. Princeton Universy Press, Rozdział 4.

Bardziej szczegółowo

Analiza Statystyczna

Analiza Statystyczna Lekcja 5. Strona 1 z 12 Analiza Statystyczna Do analizy statystycznej wykorzystać można wbudowany w MS Excel pakiet Analysis Toolpak. Jest on instalowany w programie Excel jako pakiet dodatkowy. Oznacza

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.

Bardziej szczegółowo

Statystyka opisowa Opracował: dr hab. Eugeniusz Gatnar, prof. WSBiF

Statystyka opisowa Opracował: dr hab. Eugeniusz Gatnar, prof. WSBiF Statystyka opisowa Opracował: dr hab. Eugeniusz Gatnar, prof. WSBiF 120 I. Ogólne informacje o przedmiocie Cel przedmiotu: Opanowanie podstaw teoretycznych, poznanie przykładów zastosowań metod statystycznych.

Bardziej szczegółowo

Zajęcia 1. Statystyki opisowe

Zajęcia 1. Statystyki opisowe Zajęcia 1. Statystyki opisowe 1. Znajdź dane dotyczące liczby mieszkańców w polskich województwach. Dla tych danych oblicz: a) Średnią, b) Medianę, c) Dominantę, d) Wariancję, e) Odchylenie standardowe,

Bardziej szczegółowo

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych

Bardziej szczegółowo

Proces modelowania zjawiska handlu zagranicznego towarami

Proces modelowania zjawiska handlu zagranicznego towarami Załącznik nr 1 do raportu końcowego z wykonania pracy badawczej pt. Handel zagraniczny w województwach (NTS2) realizowanej przez Centrum Badań i Edukacji Statystycznej z siedzibą w Jachrance na podstawie

Bardziej szczegółowo

ANALIZA RYNKU NIERUCHOMOŚCI PRZY ZASTOSOWANIU PROGRAMU GRETL

ANALIZA RYNKU NIERUCHOMOŚCI PRZY ZASTOSOWANIU PROGRAMU GRETL ANALIZA RYNKU NIERUCHOMOŚCI PRZY ZASTOSOWANIU PROGRAMU GRETL Joanna B. Waluk-Pacholska Jak przy pomocy ogólnie dostępnego oprogramowania przeprowadzić analizę rynku nieruchomości i w jaki sposób określić

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

Wiadomości ogólne o ekonometrii

Wiadomości ogólne o ekonometrii Wiadomości ogólne o ekonometrii Materiały zostały przygotowane w oparciu o podręcznik Ekonometria Wybrane Zagadnienia, którego autorami są: Bolesław Borkowski, Hanna Dudek oraz Wiesław Szczęsny. Ekonometria

Bardziej szczegółowo

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp tel.: +48 662 635 712 Liczba stron: 15 Data: 20.07.2010r OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA z wykorzystaniem programu obliczeniowego Q maxp DŁUGIE

Bardziej szczegółowo

1. Udział dochodów z działalności rolniczej w dochodach gospodarstw domowych z użytkownikiem gospodarstwa rolnego w 2002 r.

1. Udział dochodów z działalności rolniczej w dochodach gospodarstw domowych z użytkownikiem gospodarstwa rolnego w 2002 r. 1 UWAGI ANALITYCZNE 1. Udział dochodów z działalności rolniczej w dochodach gospodarstw domowych z użytkownikiem gospodarstwa rolnego w 2002 r. W maju 2002 r. w województwie łódzkim było 209,4 tys. gospodarstw

Bardziej szczegółowo

SPIS TREŚCI. Do Czytelnika... 7

SPIS TREŚCI. Do Czytelnika... 7 SPIS TREŚCI Do Czytelnika.................................................. 7 Rozdział I. Wprowadzenie do analizy statystycznej.............. 11 1.1. Informacje ogólne..........................................

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

ANALIZA DANYCH W STATA 8.0

ANALIZA DANYCH W STATA 8.0 ANALIZA DANYCH W STATA 8.0 1. Opis wyglądu programu Stata ZAJĘCIA 1 Menu i ikonki Okna: wpisywania poleceń (command) wynikowe (results) dotychczasowych poleceń (review) zmiennych (variables) viewer danych

Bardziej szczegółowo

1 Metoda Najmniejszych Kwadratów (MNK) 2 Interpretacja parametrów modelu. 3 Klasyczny Model Regresji Liniowej (KMRL)

1 Metoda Najmniejszych Kwadratów (MNK) 2 Interpretacja parametrów modelu. 3 Klasyczny Model Regresji Liniowej (KMRL) 1 Metoda Najmniejszych Kwadratów (MNK) 1. Co to jest zmienna endogeniczna, a co to zmienne egzogeniczna? 2. Podaj postać macierzy obserwacji dla modelu y t = a + bt + ε t 3. Co to jest wartość dopasowana,

Bardziej szczegółowo

Ubóstwo ekonomiczne w Polsce w 2014 r. (na podstawie badania budżetów gospodarstw domowych)

Ubóstwo ekonomiczne w Polsce w 2014 r. (na podstawie badania budżetów gospodarstw domowych) 015 GŁÓWNY URZĄD STATYSTYCZNY Opracowanie sygnalne Warszawa, 9.06.2015 r. Ubóstwo ekonomiczne w Polsce w 2014 r. (na podstawie badania budżetów gospodarstw domowych) Jaki był zasięg ubóstwa ekonomicznego

Bardziej szczegółowo

Ćwiczenia 10. Analiza regresji. Część I.

Ćwiczenia 10. Analiza regresji. Część I. Ćwiczenia 10. Analiza regresji. Część I. Zadania obowiązkowe UWAGA! Elementy zadań oznaczone kolorem czerwonym należy przygotować lub wypełnić. Zadanie 10.1. (R/STATISTICA) Twoim zadaniem jest możliwie

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota Ekonometria ćwiczenia 3 Prowadzący: Sebastian Czarnota Strona - niezbędnik http://sebastianczarnota.com/sgh/ Normalność rozkładu składnika losowego Brak normalności rozkładu nie odbija się na jakości otrzymywanych

Bardziej szczegółowo

Wykład 3 Hipotezy statystyczne

Wykład 3 Hipotezy statystyczne Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza

Bardziej szczegółowo

Modele dla zmiennej binarnej w pakiecie STATA materiały na ćwiczenia z ekonometrii 18.03.2005 r. Piotr Wójcik, KTRG WNE UW

Modele dla zmiennej binarnej w pakiecie STATA materiały na ćwiczenia z ekonometrii 18.03.2005 r. Piotr Wójcik, KTRG WNE UW Modele dla zmiennej binarnej w pakiecie STATA materiały na ćwiczenia z ekonometrii 18.03.2005 r. Piotr Wójcik, KTRG WNE UW Dane Dane wykorzystane w przykładzie pochodzą z pracy McCall, B.P., 1995, The

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

OCENA RYZYKA ZAKUPU I SPRZEDAZY NIERUCHOMOSCI ZA POŚREDNICTWEM INTERNETOWYCH SERWISOW AUKCYJNYCH

OCENA RYZYKA ZAKUPU I SPRZEDAZY NIERUCHOMOSCI ZA POŚREDNICTWEM INTERNETOWYCH SERWISOW AUKCYJNYCH Daniel Rodzeń OCENA RYZYKA ZAKUPU., I SPRZEDAZY NIERUCHOMOSCI ZA POŚREDNICTWEM INTERNETOWYCH, SERWISOW AUKCYJNYCH Przedstawiona w pierwszej części artykułu tematyka dotycząca zakupu, sprzedaży nieruchomości

Bardziej szczegółowo

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej KATEDRA MATEMATYKI TEMAT PRACY: ROZKŁAD NORMALNY ROZKŁAD GAUSSA AUTOR: BARBARA MARDOSZ Kraków, styczeń 2008 Spis treści 1 Wprowadzenie 2 2 Definicja

Bardziej szczegółowo

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo

Bardziej szczegółowo

Analiza statystyczna. Ogólne własności funkcji. Funkcja liniowa. Równania i nierówności liniowe

Analiza statystyczna. Ogólne własności funkcji. Funkcja liniowa. Równania i nierówności liniowe Analiza statystyczna Ogólne własności funkcji. Funkcja liniowa. Równania i nierówności liniowe Dokument zawiera opracowanie wyników analizy statystycznej e-sprawdzianu Edyta Landkauf, Zdzisław Porosiński

Bardziej szczegółowo

POLITECHNIKA OPOLSKA

POLITECHNIKA OPOLSKA POLITECHNIKA OPOLSKA WYDZIAŁ MECHANICZNY Katedra Technologii Maszyn i Automatyzacji Produkcji Laboratorium Podstaw Inżynierii Jakości Ćwiczenie nr 4 Temat: Analiza korelacji i regresji dwóch zmiennych

Bardziej szczegółowo

1.1 Klasyczny Model Regresji Liniowej

1.1 Klasyczny Model Regresji Liniowej 1.1 Klasyczny Model Regresji Liniowej Klasyczny model Regresji Liniowej jest bardzo użytecznym narzędziem służącym do analizy danych empirycznych. Analiza regresji zajmuje się opisem zależności między

Bardziej szczegółowo

Nieliniowe. Liniowe. Nieliniowe. Liniowe. względem parametrów. Linearyzowane. sensu stricto

Nieliniowe. Liniowe. Nieliniowe. Liniowe. względem parametrów. Linearyzowane. sensu stricto Ekonometria jak dorać funkcję? Przykłady użyte w materiałach opracowano w większości na azie danych ze skryptu B.Guzik, W.Jurek Podstawowe metody ekonometrii (wyd. AE Poznań 3) W doorze postaci funkcji

Bardziej szczegółowo

2.2 Autokorelacja Wprowadzenie

2.2 Autokorelacja Wprowadzenie 2.2 Autokorelacja 2.2.1 Wprowadzenie Przy wyprowadzaniu estymatorów Klasycznego Modelu Regresji Liniowej (KMRL) zakładaliśmy, że są spełnione założenia Gaussa-Markowa, tzn. składniki losowe są homoscedastyczne

Bardziej szczegółowo

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej

Bardziej szczegółowo

Egzamin ze statystyki, Studia Licencjackie Stacjonarne. TEMAT C grupa 1 Czerwiec 2007

Egzamin ze statystyki, Studia Licencjackie Stacjonarne. TEMAT C grupa 1 Czerwiec 2007 Egzamin ze statystyki, Studia Licencjackie Stacjonarne TEMAT C grupa 1 Czerwiec 2007 (imię, nazwisko, nr albumu).. Przy rozwiązywaniu zadań, jeśli to konieczne, naleŝy przyjąć poziom istotności 0,01 i

Bardziej szczegółowo

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś.

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś. Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś. Województwo Urodzenia według płci noworodka i województwa. ; Rok 2008; POLSKA Ogółem Miasta Wieś Pozamałżeńskie- Miasta Pozamałżeńskie-

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu

Bardziej szczegółowo