NIE STRASZNY NAM KRYZYS, CZYLI JAK NIE DAĆ SIĘ DEPRESJI Determinanty depresji w Polsce

Wielkość: px
Rozpocząć pokaz od strony:

Download "NIE STRASZNY NAM KRYZYS, CZYLI JAK NIE DAĆ SIĘ DEPRESJI Determinanty depresji w Polsce"

Transkrypt

1 Model ekonometryczny NIE STRASZNY NAM KRYZYS, CZYLI JAK NIE DAĆ SIĘ DEPRESJI Determinanty depresji w Polsce Michał Danilewski Paweł Klimaszewski UNIWERSYTET WARSZAWSKI WYDZIAŁ NAUK EKONOMICZNYCH WARSZAWA 2009

2 SPIS TREŚCI 1. Problem ekonometryczny Opis hipotez badawczych, podstawy teoretyczne oraz próba ekonomicznego uzasadnienia Podstawy teoretyczne modelu Hipotezy badawcze Opis zbioru danych oraz definicje zmiennych Oszacowanie modelu Zastosowanie Liniowego Modelu Prawdopodobieństwa Estymacja modelu logit i probit Model logit - wybór zmiennych do modelu Diagnostyka i testy modelu logit Analiza dopasowania Wybór zmiennych do modelu probit Diagnostyka i testy modelu probit Analiza dopasowania Wybór właściwego modelu Interpretacja wyników Efekty cząstkowe Ilorazy szans Efekty cząstkowe i wnioski dla wybranej grupy respondentów Oszacowanie i interpretacja efektów cząstkowych Wnioski z efektów cząstkowych Wnioski końcowe Bibliografia Załączniki Skala Depresji Becka Wykresy zależności ciągłych zmiennych objaśniających i prawdopodobieństwa bycia w depresji

3 1. Problem ekonometryczny Prognozy ekonomistów stały się faktem kryzys ekonomiczny dotarł również do Polski i raczej nie ominie nikogo z nas. Przede wszystkim odczuje go (o ile jeszcze nie odczuła) zdecydowana większość firm i ich menedżerowie. Co zrobić, aby skutki kryzysu dotknęły nas w jak najmniejszym stopniu? Jak podejmować decyzje, aby pomimo trudności nie stracić zimnej krwi i, co za tym idzie, profitów osiągniętych w czasie hossy? W obliczu kryzysu nic nie jest pewne. Nie można liczyć na to, że firmy mające dziś wielu kontrahentów, jutro bądź za miesiąc nadal będą ich miały. Z dnia na dzień możemy być zaskoczeni wiadomościami, że przedsiębiorstwo będące naszym partnerem upadło lub ma poważne problemy. Dlatego do kryzysu trzeba się przygotować. Strategia rozwoju musi być dobrze przemyślana i zaplanowana. Lepiej już teraz się zabezpieczyć, pozyskując skuteczne narzędzia obniżające koszty i rozszerzając działalność o nowe kontrakty, które pomogą zdywersyfikować dostawców i odbiorców. Przedsiębiorstwa powinny mieć gotowe rozwiązania, kiedy kryzys już przyjdzie. Należałoby też pomyśleć o opcjach, które byłyby lepsze i tańsze od obecnie używanych. Próby konkurowania przez proste zwiększanie wielkości produkcji mogą okazać się zbyt ryzykowne. Nie ma bowiem gwarancji, że świeżo wyprodukowane towary znajdą nabywców. Wydatki włożone w rozbudowę linii produkcyjnych, magazynów itp. mogą się po prostu nie zwrócić. W efekcie, nawet wzrost sprzedaży, przy nieproporcjonalnie większym wzroście kosztów produkcji, będzie oznaczał ujemne wyniki finansowe firmy. Kluczowym czynnikiem (szczególnie w sektorze małych i średnich przedsiębiorstw), który może zdecydować o przetrwaniu czasu kryzysu, jest postawa menedżera. To on staje się odpowiedzialny za realizowanie strategii, podejmowanie trudnych decyzji i wykonywanie ryzykownych działań. Sukces nie zależy jednak wyłącznie od wiedzy i doświadczenia osób na stanowiskach kierowniczych. Równie ważna jest sfera emocjonalna: kondycja psychiczna, pewność siebie i odporność na stres. Coraz więcej menedżerów, w związku z załamaniem na rynku, nie potrafi poradzić sobie z trudnościami własnego przedsiębiorstwa. Ryzyko nietrafionych decyzji, konieczność wzięcia odpowiedzialności za spadającą sprzedaż, typowanie 3

4 pracowników do zwolnienia wpływają na zwiększenie napięcia w miejscach pracy. Stres, zdenerwowanie i przemęczenie prowadzą do spadku motywacji, przejawiającego się rezygnacją, długotrwałym przygnębieniem i niechęcią do działania. Pojawiająca się depresja 1 powoduje, że zamiast dokonywać odpowiednich działań w celu ratowania firmy, zarządzający podejmują błędne decyzje, które tylko pogarszają sytuację. Depresja, choć dotyka coraz więcej osób, często aktywnych i pełnych życia, nie jest wyrokiem i skutecznie można się przed nią zabezpieczyć. Im wcześniej pozna się jej determinanty, tym szybciej będzie można podjąć kroki w celu ich wyeliminowania. Celem naszej pracy jest zbadanie czynników wpływających na depresję wśród Polaków, a następnie zbadanie wpływu tych czynników na osoby o charakterystyce typowej dla menedżera. Wśród czynników wpływających na depresję, ważną rolę odgrywają z pewnością cechy wewnętrzne, które są niemierzalne i różne dla każdej jednostki. Istnieje jednak szereg zmiennych mierzalnych, które wpływają na nasz dobrostan, szczęście, odporność na stres, a co za tym idzie skłonność do depresji. Takie zmienne będą podlegały badaniu w modelu ekonometrycznym przedstawionym w niniejszej pracy Opis hipotez badawczych, podstawy teoretyczne oraz próba ekonomicznego uzasadnienia W rozdziale tym przedstawione zostaną prace naukowców którzy zajmowali się badaniem czynników determinujących depresję. Wnioski z prezentowanych artykułów były nam pomocne przy formułowaniu hipotez, które zamieszczone są w dalszej części pracy Podstawy teoretyczne modelu V. Lorant, C. Croux, S. Weich, D. Deliege, J. Mackenbach i M. Ansseau w artykule Depression and socio-economic risk factors 2 opisali swoje badania na temat 1 Według prof. Antoniego Kępińskiego depresja to stan chorobowy charakteryzujący się nasileniem objawów i wydłużonym czasem ich utrzymywania się. Niepokój powinno wzbudzić nie samo przygnębienie, ale to, że trwa ono już długo i zmienia nasze funkcjonowanie, dezorganizuje codzienne życie. Smutek nie jest już tym, co pojawia się od czasu do czasu, ale czymś stale towarzyszącym. Antoni Kępiński ( ) wybitny lekarz psychiatra, autor znanych książek na temat depresji, m.in.: Melancholia. 2 V. Lorant, C. Croux, S. Weich, D. Deliege, J. Mackenbach, M. Ansseau, Depression and socioeconomic risk factors: 7-year longitudinal population study, The British Journal of Psychiatry 2007, nr 190, s

5 czynników socjo-ekonomicznych determinujących depresję. W swojej pracy wykorzystali dane pochodzące z siedmiu fal badania panelowego przeprowadzanych w rocznych odstępach czasu. Dane gromadzono w oparciu o Belgijski Sondaż Gospodarstw Domowych obejmujący osoby w wieku powyżej 16 lat w latach Próba liczyła respondentów, wśród których u 17,3% stwierdzono objawy depresji. W oszacowanym przez autorów modelu logit prawdopodobieństwo znalezienia się w stanie depresji zostało uzależnione od takich zmiennych niezależnych, jak: własna ocena zamożności dokonywana przez respondenta, ubóstwo (jako zmienna zero-jedynkowa), dochód gospodarstwa domowego, bezrobocie, działalność społeczna oraz stan cywilny. Otrzymane rezultaty pozwoliły stwierdzić, iż powyższe czynniki mają istotny wpływ na prawdopodobieństwo depresji wśród Belgów. Potwierdziły się przypuszczenia naukowców, że pogarszający się stan materialny, związany ze spadkiem dochodów respondenta lub byciem bezrobotnym, zwiększa prawdopodobieństwo depresji. Ciekawym wnioskiem był fakt, iż osoby które deklarowały swoją społeczną aktywność, rozumianą jako czynny udział w organizacjach non-profit, wolontariacie, kampaniach społecznych itp., wykazywały się dużo mniejszą podatnością na depresję. Badanie pokazało również, że kobiety mają większe prawdopodobieństwo wpadnięcia w depresję niż mężczyźni. Okazało się natomiast, że posiadanie partnera skutecznie zmniejsza ryzyko załamania depresyjnego. R. M. Nesse i G. C. Williams w swojej pracy Why we get sick opublikowanej w 1994 r. w New York Times Books opisali wyniki swoich badań na temat depresji i jej determinantów. W pięciu badaniach, obejmujących łącznie 39 tys. osób z różnych krajów zachodnich, stwierdzono, że dzisiejsi młodzi ludzie mają znacznie wyższe ryzyko doświadczenia co najmniej jednego epizodu depresyjnego w porównaniu ze starszymi pokoleniami. Autorzy tłumaczą to m.in. procesami cywilizacyjnymi (ryzyko depresji rośnie wraz ze wzrostem poziomu ekonomicznego rozwoju kraju), które znacznie silniej odbijają się na psychice młodych pokoleń niż osób starszych, dorastających w tzw. erze lęku po drugiej wojnie światowej. Nesse i Williams zaproponowali następujące wyjaśnienie: Komunikacja masowa, zwłaszcza telewizja i filmy, czyni z nas wszystkich jeden wielki zespół rywali, współzawodniczących ze sobą kosztem bliskich związków z ludźmi (...) Dawniej miałeś spore szanse wybić się w czymś. Nawet jeśli nie byłeś najlepszy, twoje własne otoczenie doceniało twoje zdolności. Dziś wszyscy rywalizujemy z tymi, którzy są najlepsi na świecie. Oglądając ludzi sukcesu w telewizji, stajemy się zawistni. Zawiść przyczyniała się zapewne do 5

6 motywowania naszych przodków do osiągania tego, co osiągnęli inni. Dziś natomiast, nieliczni z nas mogą zdobyć to, do czego skłania nas zazdrość i nikt z nas nie jest w stanie mieć tak fantastycznego życia, jakie oglądamy w telewizji 3. Do zupełnie odwrotnych wniosków doszedł jednak J. Czapiński w badaniach przeprowadzonych w Polsce i opublikowanych w Diagnozie Społecznej w 2005 r. 4 W przeciwieństwie do społeczeństw zachodnich (USA, Kanada), zależność między wiekiem i depresją w Polsce jest nie negatywna, lecz pozytywna. Jest ona również u nas kilkakrotnie silniejsza. W Polsce to ludzie starsi częściej cierpią na depresję niż młodzi. Nie wiemy, skąd bierze się polski fenomen odwrócenia zależności między wiekiem i depresją. Czapiński sugeruje, że być może wynika on z pokoleniowo zróżnicowanych zdolności adaptacyjnych: ludzie, którzy dorastali i żyli w czasach PRL, mają większe trudności z odnalezieniem się w nowej rzeczywistości wolnej gospodarki 5. Ludzie starsi czują się więc bardziej zagubieni i niechciani (choćby na rynku pracy). Zgodnie z badaniami, odwrócony i nadzwyczaj silny związek między wiekiem i depresją nie słabnie jednak w miarę upływu czasu. Dzisiejsi 30-latkowie, którzy wchodzili w dorosłość już po upadku komunizmu, są dużo bardziej skłonni do depresji od obecnych 20-latków. Takie zachowanie, niespotykane w krajach Europy Zachodniej, pozostaje największą tajemnicą transformacji i Polaków. Podsumowując poprzedni akapit, według badań Czapińskiego 6, najważniejszym czynnikiem wyjaśniającym stan psychiczny Polaków jest wiek. Drugim, równie istotnym kryterium okazała się być liczba przyjaciół. W trudnych chwilach, zwłaszcza w obliczu problemów osobistych, poczucie bezinteresownej życzliwości i pomocy ze strony innych ludzi może być kluczowym czynnikiem chroniącym człowieka od depresji. Jak mawia przysłowie, prawdziwych przyjaciół poznaje się w biedzie i tego dowodzi badanie Czapińskiego. Zgodnie z wynikami Diagnozy Społecznej 7 kolejnym ważnym determinantem okazał się dochód na osobę. Wraz ze spadkiem dochodu rośnie prawdopodobieństwo depresji. Na osłabienie poczucia dobrostanu, a co za tym idzie, wzrost ryzyka depresji, wpływa również bezrobocie i nadużywanie alkoholu. Badania dowiodły również istotną 3 R.M. Nesse, G. C. Williams, Why we get sick, New York Times Books, 1994 r., s Badanie to zostało przeprowadzone na próbie Polaków i zawiera kompleksowe dane na temat gospodarstw domowych oraz postaw, stanu ducha i zachowań osób tworzących te gospodarstwa. 5 J. Czapiński, T. Panek, Diagnoza Społeczna 2005, s Ibidem, s Ibidem. 6

7 rolę małżeństwa, które staje się czynnikiem wzmacniającym kondycję psychiczną i ma znaczny wpływ na ograniczenie prawdopodobieństwa wpadnięcia w depresję Hipotezy badawcze Wyciągając wstępne wnioski z badań przywołanych w poprzednim podrozdziale, można zauważyć, iż skłonności do depresji są uwarunkowane przez wiele czynników. Nie ma zgody, co do kierunku wpływu niektórych z nich np. wieku respondenta. Istnieje również wiele przeciwstawnych poglądów o istotności poszczególnych kryteriów. Celem naszej pracy będzie weryfikacja części z tych poglądów oraz analiza determinantów depresji wśród Polaków. Praca ta będzie stanowiła odpowiedź na następujące pytania: Jak wiek osoby wpływa na prawdopodobieństwo bycia w depresji? Opierając się na wynikach przedstawionych badań skłaniamy się do tezy, że wśród Polaków takie prawdopodobieństwo rośnie wraz ze wzrostem wieku. Im człowiek starszy, tym jego sytuacja materialna i zdrowotna jest trudniejsza, co zwiększa podatność do depresji. Czy kobiety są bardziej podatne na depresję? Przypuszczamy, że można zauważyć taką zależność, co wynika z większej wrażliwości w porównaniu z mężczyznami. Czy dochód ma wpływ na prawdopodobieństwo bycia w depresji? Sądzimy, że ludzie zamożniejsi mają mniejszą skłonność do wpadnięcia w depresję 8. Wynika to z tego, że mając zagwarantowany dobrobyt, nie trzeba się nieustannie martwić o zaspokojenie podstawowych potrzeb. Czy fakt bycia bezrobotnym ma wpływ na depresję? Można stwierdzić, że fakt utraty pracy może mieć znaczny wpływ na prawdopodobieństwo bycia w depresji, co wynika z braku regularnych dochodów sytuacji nieustannego napięcia nerwowego. 8 Pomijamy tu pojedyncze przypadki milionerów (ze względu na ich znikomość w badanej próbie), u których faktycznie można byłoby zaobserwować dodatni wpływ dochodu na prawdopodobieństwo bycia w depresji. 7

8 Jakie znaczenie na badane zjawisko ma wykształcenie respondenta? Uważamy, iż osoby posiadające wyższe wykształcenie znajdują się w lepszej sytuacji życiowej, a także posiadają lepsze perspektywy na przyszłość, zatem są mniej podatne na popadnięcie w depresję. Czy praktyki religijne, chodzenie do kościoła, wiara ma wpływ na bycie w depresji? Badanie przeprowadzone w Diagnozie Społecznej wykazało, że wiara wpływa ujemnie na skłonności depresyjne. Biorąc pod uwagę charakterystykę społeczeństwa polskiego, można twierdzić, iż praktyki religijne powodują, że ludzie w trudnych chwilach znajdują oparcie w wierze i rzadziej popadają w depresję, niż osoby czujące się pozostawione samym sobie. Czy nadużywanie alkoholu ma wpływ na skłonności depresyjne? Naszym zdaniem problemy z alkoholem mogą istotnie wpływać na pojawienie się skłonności depresyjnych. Jak stan cywilny wpływa na prawdopodobieństwo wystąpienia badanego zjawiska? Naszym zdaniem osoby będące w związku małżeńskim powinny cechować się mniejszym prawdopodobieństwem bycia w depresji, niż osoby, które owdowiały, są w separacji lub po rozwodzie. 2. Opis zbioru danych oraz definicje zmiennych Dane wykorzystane do budowy poniższego modelu pochodzą z badania Diagnoza Społeczna przeprowadzonego w 2005 r. Wyniki kolejnych edycji badania, wraz z bazami danych i metodologią są publikowane na stronie internetowej Z udostępnionej bazy danych, w pierwszym kroku wybrano zmienne zawarte w hipotezach przedstawionych w poprzednim rozdziale. Z tego zbioru usunięto następnie obserwacje, dla których respondent nie udzielił odpowiedzi na pytania dotyczące badanych przez nas zmiennych. W efekcie, ostateczną analizą objęto osób. 8

9 Większość zmiennych została pozyskana za pomocą pojedynczych pytań. Wyjątek stanowiła zmienna depr. Została ona uzyskana na podstawie skali depresji psychicznej, złożonej z siedmiu pozycji symptomów 9, zapożyczonych ze znanego i często stosowanego w badaniach psychologicznych Inwentarza Depresji autorstwa A. T. Becka, na który składa się dwadzieścia jeden pytań 10. Wybór siedmiu pozycji spośród dwudziestu jeden symptomów został dokonany przez prof. Czapińskiego jednego z autorów Diagnozy Społecznej. Decyzję podyktowano względami psychometrycznymi: w poprzednich badaniach zmienne wykazały najsilniejszy związek z obiektywnymi wyznacznikami warunków życia. Wskaźnikiem depresji była więc suma odpowiedzi na wszystkie siedem pytań. Wynik powyżej siedmiu świadczył o stanie depresyjnym respondenta. Wskaźnik depresji traktować można jako miarę stopnia nieprzystosowania psychicznego, odzwierciedlającą nieskuteczność radzenia sobie z problemami czy stresem życiowym. Wskaźników opartych na tej skali nie należy odczytywać jako diagnozy poziomu klinicznych zaburzeń depresyjnych w wymiarze populacji. Poniżej zostały przedstawione zmienne użyte przez nas w modelu. Zmienna objaśniana: depr - jest to zmienna binarna, przyjmująca wartości: 0 gdy osoba nie ma depresji 1 gdy osoba ma depresję Tabela 1. Charakterystyka zmiennej zależnej depr bycie w depresji Freq. Percent Cum , , Total 6, Powyższe zestawienie pokazuje, że wśród badanych osób 27,83% było w trakcie badania w depresji. Osób, które nie były w depresji jest 4 443, co stanowi 72,17% liczebności próby. 9 Wykaz tych symptomów został zamieszczony w załącznikach. 10 A. T. Beck, C. H. Ward, M. Mendelson, J. Mock, J. Erbaugh, An inventory for measuring depression, Archives of General Psychiatry, 1961, nr 4,s

10 Zmienne objaśniające: wiek zmienna ciągła odzwierciedlająca wiek respondenta Przyjmuje wartości od 16 do 95 lat, średnia wynosi 45 lat. Wykres 1. Histogram zmiennej wiek Density wiek respondenta stan_cyw zmienna binarna kodująca stan cywilny respondenta 1 kawaler/panna 2 będący w związku małżeńskim 3 wdowa/wdowiec 4 rozwodnik/rozwódka 5 osoba w separacji 6 będący w nieformalnym związku Tabela 2. Charakterystyka zmiennej stan_cyw stan cywilny respondenta Freq. Percent Cum kawaler 1, Ŝonaty 3, wdowiec rozwiedziony separacja nieformalny_związek Total 6,

11 Badana próba dobrze odzwierciedla przekrój polskiego społeczeństwa, w którym większość stanowią małżeństwa, w naszej próbie jest ich 61,09%. Najmniejszy udział mają osoby w separacji i będące w nieformalnym związku, odpowiednio 0,52% i 0,65%. Na potrzeby estymacji zmienna została podzielona na zmienne zerojedynkowe: stan_cyw_1 0 gdy respondent jest stanu innego niż wolny 1 gdy respondent jest stanu wolnego stan_cyw_2 0 gdy respondent nie jest w związku małżeńskim 1 gdy respondent jest w związku małżeńskim stan_cyw_3 0 gdy respondent nie jest wdowcem lub wdową 1 gdy respondent jest wdowcem lub wdową stan_cyw_4 0 gdy respondent nie jest rozwiedziony 1 gdy respondent jest rozwiedziony stan_cyw_5 0 gdy respondent nie znajduje się w separacji 1 gdy respondent jest w separacji stan_cyw_6 0 gdy respondent nie znajduje się w nieformalnym związku 1 gdy respondent jest w nieformalnym związku 11

12 doch zmienna ciągła odzwierciedlająca miesięczny dochód na osobę w rodzinie respondenta. 750,70 zł. Przyjmuje wartości od 20 złotych do złotych. Średnia wartość wyniosła Wykres 2. Histogram zmiennej doch Density 0 5.0e miesięczny dochód na osobę w rodzinie respondenta przyjaciele liczba przyjaciół posiadanych przez respondenta, zmienna skokowa ciągła. Średnia liczba przyjaciół, posiadanych przez przebadanych respondentów, wyniosła 5 przyjaciół. Wykres 3. Histogram zmiennej przyjaciele Density liczba przyjaciół respondenta alkohol zmienna binarna określająca czy respondent nadużywa alkoholu 0 jeśli respondent nie nadużywa alkoholu 1 jeśli respondent nadużywa alkoholu 12

13 Tabela 3. Charakterystyka zmiennej alkohol naduŝywanie alkoholu Freq. Percent Cum nie 5, tak Total 6, alkoholu. W badanej próbie 6,17% osób przyznało się, że zdarza się im nadużywać bezrobocie zm. binarna odzwierciedlająca fakt czy respondent jest bezrobotny 0 jeśli respondent nie jest bezrobotny 1 jeśli respondent jest bezrobotny Tabela 4. Charakterystyka zmiennej bezrobocie bycie na bezrobociu Freq. Percent Cum tak nie 5, Total 6, Wśród ankietowanych, blisko co dziesiąta osoba była bezrobotna. plec zmienna binarna kodująca płeć respondenta, przyjmuje wartości: 0 jeśli respondent jest mężczyzną 1 jeśli respondent jest kobietą Tabela 5. Charakterystyka zmiennej plec płeć respondenta Freq. Percent Cum męŝczyzna 2, kobieta 3, Total 6, % badanej próby stanowili mężczyźni, kobiety 53%. wyksz zmienna binarna przedstawiająca poziom wykształcenia respondenta: 13

14 1 podstawowe 2 zawodowe 3 średnie 4 wyższe Tabela 6. Charakterystyka zmiennej wyksz wykształcen ie respondenta Freq. Percent Cum podstawowe 1, zawodowe 1, średnie 2, wyŝsze Total 6, Na potrzeby estymacji zmienna wyksz została podzielona na zmienne zerojedynkowe: wyksz_1 0 gdy respondent ma wykształcenie inne niż podstawowe 1 gdy respondent ma wykształcenie podstawowe wyksz_2 0 gdy respondent ma wykształcenie inne niż zawodowe 1 gdy respondent ma wykształcenie zawodowe wyksz_3 0 gdy respondent ma wykształcenie inne niż średnie 1 gdy respondent ma wykształcenie średnie wyksz_4 0 gdy respondent ma wykształcenie inne niż wyższe 1 gdy respondent ma wyższe wykształcenie 14

15 rel zmienna binarna kodująca częstotliwość brania udziału w nabożeństwach lub innych spotkaniach o charakterze religijnym; przyjmowała następujące poziomy: 0 0 razy w miesiącu razy w miesiącu 4 4 razy w miesiącu 5 5 i więcej razy w miesiącu Tabela 7. Charakterystyka zmiennej rel ile razy w miesiącu bierze respondent udział w naboŝeństwa ch lub innych spot Freq. Percent Cum , , , Total 6, Wśród przebadanych respondentów ok. 33% zadeklarowało, że 4 razy w miesiącu uczestniczy w nabożeństwach lub innych spotkaniach o charakterze religijnym. 30,7% osób odpowiedziało, że są niepraktykujący. W spotkaniach religijnych i nabożeństwach sporadycznie (od 1 do 3 razy w miesiącu) bierze udział 22,32%, natomiast ok. 14% respondentów chodzi na nie częściej niż 4 razy w miesiącu. Na potrzeby estymacji zmienna rel została podzielona na następujące zmienne zerojedynkowe: rel_0 0 gdy respondent bierze udział nabożeństwach lub innych spotkaniach o charakterze religijnym 1 gdy respondent nie bierze udziału w praktykach religijnych rel_1 0 gdy respondent nie bierze udziału w nabożeństwach lub uczestniczy w nich częściej niż 3 razy w miesiącu 1 gdy respondent bierze udział w nabożeństwach 1-3 razy w miesiącu 15

16 rel_4 0 gdy respondent nie uczestniczy w nabożeństwach i innych spotkaniach religijnych równo 4 razy w miesiącu 1 gdy respondent bierze udział w nabożeństwach lub innych spotkaniach religijnych 4 razy w miesiącu rel_5 0 gdy respondent nie bierze udziału w nabożeństwach lub uczestniczy w nich rzadziej niż 5 razy w miesiącu 1 gdy respondent bierze udział w nabożeństwach lub innych spotkaniach religijnych częściej niż 4 razy w miesiącu 3. Oszacowanie modelu 3.1. Zastosowanie Liniowego Modelu Prawdopodobieństwa W tym podrozdziale zostanie przedstawiony najprostszy model - Liniowy Model Prawdopodobieństwa (LMP). Przy pomocy komendy reg wyestymowano na początku następujący model MNK: Wykres 4. Wynik regresji LMP. xi: reg depr wiek i.stan_cyw doch przyjaciele i.alkohol i.bezrobocie i.plec i.wyksz i.rel Source SS df MS Number of obs = F( 17, 6138) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = depr Coef. Std. Err. t P> t [95% Conf. Interval] wiek _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ doch e e-06 przyjaciele _Ialkohol_ _Ibezroboc~ _Iplec_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Irel_ _Irel_ _Irel_ _cons

17 W celu zbadania czy zmienne stan_cyw_4, stan_cyw_6, bezrobocie, rel_1, rel_5 łącznie są nieistotne wykonujemy test Walda, którego wyniki znajdują się w poniższej: (H 0 : β bezrobocie_2 = β stan_cyw_6 =β stan_cyw_4 = = β rel_1 =β rel_5 =0; H 1 : zmienne istotne) ( 1) _Ibezroboci_2 = 0 ( 2) _Istan_cyw_6 = 0 ( 3) _Istan_cyw_4 = 0 ( 4) _Irel_1 = 0 ( 5) _Irel_5 = 0 F( 5, 6138) = 1.32 Prob > F = Wyniki testu Walda mówią nam, że zmienne: stan_cyw_4, stan_cyw_6, bezrobocie, rel_1, rel_5 są nieistotne (p-value=0.2513, a zatem nie ma podstaw do odrzucenia H0 o tym, że zmienne te są nieistotne). Po usunięciu powyższych zmiennych, uzyskano następujący model: Tabela 8. Tabela 12. Wynik regresji LMP. xi: reg depr wiek Istan_cyw_2 Istan_cyw_3 Istan_cyw_5 doch przyjaciele i.alkohol i.plec i.wyksz Irel > _4 i.alkohol _Ialkohol_1-2 (naturally coded; _Ialkohol_1 omitted) i.plec _Iplec_1-2 (naturally coded; _Iplec_1 omitted) i.wyksz _Iwyksz_1-4 (naturally coded; _Iwyksz_1 omitted) Source SS df MS Number of obs = F( 12, 6143) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE =.383 depr Coef. Std. Err. t P> t [95% Conf. Interval] wiek Istan_cyw_ Istan_cyw_ Istan_cyw_ doch e e-06 przyjaciele _Ialkohol_ _Iplec_ _Iwyksz_ _Iwyksz_ _Iwyksz_ Irel_ _cons Model wydaje się poprawny, gdyż zmienne objaśniające łącznie są istotne: Prob > F = , co jest mniejsze od założonego poziomu istotności 5 %, a zatem odrzucamy hipotezę zerową o łącznej nieistotności zmiennych. Zmienne objaśniające pojedynczo również są istotne (p-value < 0.05, a zatem odrzucamy hipotezę zerową o nieistotności zmiennej). 17

18 Jednak z LMP wiąże się występowanie dwóch wad: heteroskedastyczność składnika losowego oraz brak gwarancji, że prawdopodobieństwo wystąpienia wartości dopasowanych znajdzie się w przedziale [0,1]. Homoskedastyczność składnika losowego zbadano za pomocą testu Breuscha- Pagana, którego wyniki zamieszczono poniżej. H 0 : Var (ε i ) = σ 2 (składnik losowy jest homoskedastyczny) H 1 : Var (ε i ) = σ 2 (składnik losowy jest heteroskedastyczny). hettest Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: fitted values of depr chi2(1) = Prob > chi2 = Ponieważ Prob > chi2 = więc jest mniejsze niż zadany poziom istotności 5 %, a zatem odrzucamy hipotezę zerową o homoskedastyczności. Przeprowadzona analiza potwierdziła występowanie w modelu heteroskedastyczności. Drugą wadę sprawdzono poprzez użycie komendy sum yhat, gdzie yhat to wartości dopasowane i otrzymano: Tabela 9. Wartości dopasowane w LPM sum yhat Variable Obs Mean Std. Dev. Min Max yhat Dwie ostatnie wartości z powyższej tabeli wskazują na występowanie w LMP również drugiej wady prawdopodobieństwo wystąpienia wartości dopasowanych należy do przedziału [-0,25;1,08]. W estymacji wystąpiło 14 przypadków, w których wartość dopasowana była większa od 1 i 515 przypadków gdzie była mniejsza od 0. Wartości dopasowanych spoza przedziału [0,1] nie da się zinterpretować, gdyż prawdopodobieństwo nie może być mniejsze od 0 lub większe od 1. Heteroskedastyczność składnika losowego, powoduje, iż otrzymane statystyki testowe są nieprawidłowe i nie możliwe jest dokonanie wnioskowania statystycznego. Otrzymane wyniki jednoznacznie wykluczają Liniowy Model Prawdopodobieństwa. 18

19 3.2. Estymacja modelu logit i probit Decyzja związana z odrzuceniem Liniowego Modelu Prawdopodobieństwa skłania do wybrania pomiędzy modelem logit a probit. Estymowaliśmy kilkakrotnie modele logit, a następnie probit tak aby wyeliminować nieistotne zmienne objaśniające. Następnie dokonaliśmy diagnostyki i interpretacji miar dopasowania. Przebieg naszej pracy został przedstawiony w dalszej części tego rozdziału Model logit - wybór zmiennych do modelu Na początku dokonaliśmy regresji modelu logit wykorzystując wszystkie zaproponowane przez nas zmienne objaśniające. Model ten nazwaliśmy logit bez ograniczeń. Tabela 10. Regresja modelu logit bez ograniczeń xi: logit depr wiek i.stan_cyw doch przyjaciele i.alkohol i.bezrobocie i.plec i.wyksz i.rel Logistic regression Number of obs = 6156 LR chi2(17) = Prob > chi2 = Log likelihood = Pseudo R2 = depr Coef. Std. Err. z P> z [95% Conf. Interval] wiek _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ doch przyjaciele _Ialkohol_ _Ibezroboc~ _Iplec_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Irel_ _Irel_ _Irel_ _cons Wśród estymowanych zmiennych uwagę zwróciły zmienne nieistotne: stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5. W celu zweryfikowania ich istotności za pomocą odpowiednich testów, dokonaliśmy regresji modelu logit z ograniczeniami - bez zmiennych stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5. 19

20 Tabela 11. Regresja modelu logit z ograniczeniami xi: logit depr wiek Istan_cyw_3 Istan_cyw_4 Istan_cyw_5 doch przyjaciele i.alkohol i.plec i.wyksz Irel_4 Logistic regression Number of obs = 6156 LR chi2(12) = Prob > chi2 = Log likelihood = Pseudo R2 = depr Coef. Std. Err. z P> z [95% Conf. Interval] wiek Istan_cyw_ Istan_cyw_ Istan_cyw_ doch przyjaciele _Ialkohol_ _Iplec_ _Iwyksz_ _Iwyksz_ _Iwyksz_ Irel_ _cons W celu zbadania czy zmienne stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5 łącznie są nieistotne wykonujemy test LR, którego wyniki znajdują się poniżej: (H 0 : β stan_cyw_2 =β stan_cyw_6 = β bezrobocie_2 = β rel_1 =β rel_5 =0; H 1 : zmienne istotne). lrtest logit_bez_ogr logit_z_ogr, stats Likelihood-ratio test LR chi2(5) = 5.69 (Assumption: logit_z_ogr nested in logit_bez_ogr) Prob > chi2 = Model Obs ll(null) ll(model) df AIC BIC logit_z_ogr logit_bez_~r Statystyka testu LR wynosi 5.69, p-value=0.3380>0.05, a zatem nie ma podstaw do odrzucenia H0 o istotności ograniczeń. Również kryteria informacyjne AIC i BIC (mniejsze dla logitu z ograniczeniami) świadczą o tym, że lepszy jest model logit z ograniczeniami. Zmienne stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5 można uznać za nieistotne w modelu. Aby jeszcze to potwierdzić stosujemy test Walda: (H 0 : β stan_cyw_2 =β stan_cyw_6 = β bezrobocie_2 = β rel_1 =β rel_5 =0; H 1 : zmienne istotne). test _Ibezroboci_2 _Istan_cyw_6 _Istan_cyw_2 _Irel_1 _Irel_5 ( 1) _Ibezroboci_2 = 0 ( 2) _Istan_cyw_6 = 0 ( 3) _Istan_cyw_2 = 0 ( 4) _Irel_1 = 0 ( 5) _Irel_5 = 0 chi2( 5) = 5.41 Prob > chi2 =

21 Również test Walda mówi, że zmienne stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5 są nieistotne (p-value=0.3684, a zatem nie ma podstaw do odrzucenia H0 o tym, że zmienne te są nieistotne). Przyjmujemy więc do dalszej analizy model bez tych zmiennych. W modelu tym łącznie wszystkie zmienne objaśniające są istotne (statystyka LR chi2 = , Prob > chi2 = jest mniejsze niż zadany poziom istotności α = 0.05, a zatem odrzucamy H0 o łącznej nieistotności zm. objaśniających) Diagnostyka i testy modelu logit Test typu związku (linktest) Przed przystąpieniem do weryfikacji hipotez należy sprawdzić czy przyjęty model jest prawidłowo wyspecyfikowany. W tym celu przeprowadzono test typu związku, który jest uogólnieniem testu RESET. Wyniki prezentuje poniższa tabela: Tabela 12. Test typu związku. linktest Logistic regression Number of obs = 6156 LR chi2(2) = Prob > chi2 = Log likelihood = Pseudo R2 = depr Coef. Std. Err. z P> z [95% Conf. Interval] _hat _hatsq _cons Jak widać zmienna hatsq jest nieistotna (p-value=0.798>0.05, nie mamy podstaw do odrzucenia H0 o nieistotności zmiennej hatsq). Wskazywało by to, iż dla wartości dopasowanych ważne są ich pierwsze a nie wyższe potęgi, a zatem mamy do czynienia z prawidłową postacią modelu. Wykonano również, znajdujące się poniżej, testy Pearsona i Hosmera Lemeshow a, na poprawność formy funkcyjnej, w których: H 0 : zastosowana forma funkcyjna jest prawidłowa H 1 : zastosowana forma funkcyjna nie jest prawidłowa 21

22 Test jakości dopasowania Pearsona (goodness of fit test) Tabela 13. Wynik testu Pearsona. estat gof Logistic model for depr, goodness-of-fit test number of observations = 6156 number of covariate patterns = 6105 Pearson chi2(6092) = Prob > chi2 = Test wersja Hosmera-Lemeshow'a - dzielimy na 10 podprób według decyli wartości dopasowanych: Tabela 14. Wynik testu Hosmera Lemeshow a.. estat gof, group(10) table /*H0: poprawna forma funkcyjna*/ Logistic model for depr, goodness-of-fit test (Table collapsed on quantiles of estimated probabilities) Group Prob Obs_1 Exp_1 Obs_0 Exp_0 Total number of observations = 6156 number of groups = 10 Hosmer-Lemeshow chi2(8) = 8.73 Prob > chi2 = W teście Pearsona chi2(6092) = , p-value = < 0.05, który jest wartością zadanego poziomu istotności, zatem odrzucamy hipotezę zerową wskazującą na poprawność formy funkcyjnej. Gdybyśmy jednak przyjęli istotność na poziomie 0.01 (p-value = > 0.01) to nie mielibyśmy podstaw do odrzucenie H0 o poprawności funkcyjnej modelu. 22

23 Wyniki testu Hausmana Lemeshow a, to: chi2(7) = 8.73, a p-value = > 0.05 (zadany poziom istotności), zatem w tym teście nie odrzucamy hipotezy zerowej, wskazującej na poprawność formy funkcyjnej. W związku z tym, że użyta tu wersja testu Pearsona charakteryzuje się małą mocą (w szczególności, jeśli podpróby są mało liczne; tak jest w naszym przypadku) możemy zaufać pozostałym testom - Hausmana Lemeshow a i uogólnionemu testowi RESET, które potwierdziły, iż przyjęta forma funkcyjna jest prawidłowa i model został odpowiednio wyspecyfikowany Analiza dopasowania W tym miejscu należałoby przyjrzeć się bliżej wskaźnikom determinacji. Miary dopasowania Tabela 15. Miary dopasowania modelu logit. fitstat Measures of Fit for logit of depr Log-Lik Intercept Only: Log-Lik Full Model: D(6143): LR(12): Prob > LR: McFadden's R2: McFadden's Adj R2: Maximum Likelihood R2: Cragg & Uhler's R2: McKelvey and Zavoina's R2: Efron's R2: Variance of y*: Variance of error: Count R2: Adj Count R2: AIC: AIC*n: BIC: BIC': Uzyskany model dla zmiennej ukrytej y * i byłby wyjaśniany w 38,4%, gdyby zmienna ta była bezpośrednio obserwowalna (pseudo R² McKelvey-Zavoina=0.384). Model prawidłowo przewiduje sukcesy i porażki w 79,5% przypadków (R² liczebnościowe=0.795). Dzięki użyciu w zmiennych objaśniających model prawidłowo przewiduje sukcesy i porażki w 26,4% przypadków (skorygowane liczebnościowe R²=0.264). Kolejnym analizowanym elementem jest wrażliwość i specyficzność modelu. Wrażliwość i specyficzność Im lepiej model przewiduje, tym bardziej krzywa ROC odgięta jest w kierunku górnego rogu rysunku. Pole pod krzywą używane jest jako miara jakości dopasowania modelu. U nas wynosi ono 0,8224 (max 1). Jest to procent dobrze zakwalifikowanych 23

24 pozytywnych i negatywnych odpowiedzi przy różnych wyborach punktu rozdzielającego decyzję. Wynik 82,24% świadczy o dobrej trafności dopasowania modelu do danych wyjściowych. Wykres 5. Krzywa ROC. lroc, title(roc dla logitu) Logistic model for depr number of observations = 6156 area under ROC curve = Sensitivity ROC dla logitu Specificity Area under ROC curve = Z kolejnego wykresu odczytać można, prawdopodobieństwo ucięcia poziom rozgraniczenia maksymalizującego trafność klasyfikacji wartości dopasowanych. Przyjęliśmy, iż najlepsze cięcie jest w punkcie 0,27. Wykres 6. Wykres wrażliwości i specyficzności. Sensitivity/Specificity Probability cutoff Sensitivity Specificity 24

25 liczebności: Dla wyznaczonego prawdopodobieństwa cięcia wyznaczona zostały tabela Tabela 16. Klasyfikacja modelu ( punkt odcięcia równy 0.27). lstat,cutoff(0.27) Logistic model for depr True Classified D ~D Total Total Classified + if predicted Pr(D) >=.27 True D defined as depr!= Sensitivity Pr( + D) 75.89% Specificity Pr( - ~D) 74.07% Positive predictive value Pr( D +) 53.02% Negative predictive value Pr(~D -) 88.85% False + rate for true ~D Pr( + ~D) 25.93% False - rate for true D Pr( - D) 24.11% False + rate for classified + Pr(~D +) 46.98% False - rate for classified - Pr( D -) 11.15% Correctly classified 74.58% Powyższa tabela pokazuje, że na 1713 obserwacji, w których u badanego respondenta zaobserwowano objawy depresji, model prawidłowo przewidział 1300 z nich, a tylko 413 osób (24,11 % liczebności grupy) zakwalifikował błędnie. Wrażliwość wyniosła 75,89%, co znaczy że model prawidłowo przewidział 75,89% przypadków depresji tam gdzie faktycznie była ona zaobserwowana. Specyficzność równa 74,07% świadczy o tym, że wśród osób u których nie zaobserwowano depresji prawidłowo zostało przewidziane 74,07% takich przypadków. Wśród 4443 ankietowanych, którzy nie wykazywali depresji, 1152 osób (czyli 25,93%) zostało błędnie zdiagnozowanych. Podsumowując, średnio 74,58 % wszystkich obserwacji zostało trafnie zaklasyfikowanych Wybór zmiennych do modelu probit Na początku dokonaliśmy regresji modelu probit wykorzystując wszystkie zaproponowane przez nas zmienne objaśniające. Model ten nazwaliśmy probit bez ograniczeń. Wyniki estymacji znajdują się w tabeli na następnej stronie. 25

26 Tabela 17. Regresja modelu probit bez ograniczeń xi: probit depr wiek i.stan_cyw doch przyjaciele i.alkohol i.bezrobocie i.plec i.wyksz i.rel Probit regression Number of obs = 6156 LR chi2(17) = Prob > chi2 = Log likelihood = Pseudo R2 = depr Coef. Std. Err. z P> z [95% Conf. Interval] wiek _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ doch przyjaciele _Ialkohol_ _Ibezroboc~ _Iplec_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Irel_ _Irel_ _Irel_ _cons Wśród estymowanych zmiennych uwagę zwróciły zmienne nieistotne: stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5. W celu zweryfikowania ich istotności za pomocą odpowiednich testów, dokonaliśmy regresji modelu probit z ograniczeniami - bez zmiennych stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5. Tabela 18. Regresja modelu probit z ograniczeniami. xi: probit depr wiek Istan_cyw_3 Istan_cyw_4 Istan_cyw_5 doch przyjaciele i.alkohol i.plec i.wyksz Irel_4 Probit regression Number of obs = 6156 LR chi2(12) = Prob > chi2 = Log likelihood = Pseudo R2 = depr Coef. Std. Err. z P> z [95% Conf. Interval] wiek Istan_cyw_ Istan_cyw_ Istan_cyw_ doch przyjaciele _Ialkohol_ _Iplec_ _Iwyksz_ _Iwyksz_ _Iwyksz_ Irel_ _cons W celu zbadania czy zmienne stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5 łącznie są nieistotne wykonujemy test LR; wyniki znajdują się na następnej stronie. (H 0 : β stan_cyw_2 =β stan_cyw_6 = β bezrobocie_2 = β rel_1 =β rel_5 =0; H 1 : zmienne istotne) 26

27 Likelihood-ratio test LR chi2(5) = 5.01 (Assumption: probit_z_ogr nested in probit_bez_ogr) Prob > chi2 = Model Obs ll(null) ll(model) df AIC BIC probit_z_ogr probit_bez~r Statystyka testu LR wynosi 5.01, p-value=0.4146>0.05, a zatem nie ma podstaw do odrzucenia H0 o istotności ograniczeń. Również kryteria informacyjne AIC i BIC (mniejsze dla probitu z ograniczeniami) świadczą o tym, że lepszy jest model probit z ograniczeniami. Zmienne stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5 można uznać za nieistotne w modelu. Aby jeszcze to potwierdzić stosujemy test Walda: (H 0 : β stan_cyw_2 =β stan_cyw_6 = β bezrobocie_2 = β rel_1 =β rel_5 =0; H 1 : zmienne istotne). test _Ibezroboci_2 _Istan_cyw_6 _Istan_cyw_2 _Irel_1 _Irel_5 ( 1) _Ibezroboci_2 = 0 ( 2) _Istan_cyw_6 = 0 ( 3) _Istan_cyw_2 = 0 ( 4) _Irel_1 = 0 ( 5) _Irel_5 = 0 chi2( 5) = 4.78 Prob > chi2 = Również test Walda mówi, że zmienne stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5 są nieistotne (p-value=0.4430>0.05, a zatem nie ma podstaw do odrzucenia H0 o tym, że zmienne te są nieistotne). Do dalszych rozważań przyjmujemy więc model probit z ograniczeniami. W modelu tym łącznie wszystkie zmienne objaśniające są istotne (stat. LR chi2 = , Prob > chi2 = 0 i jest mniejsze niż zadany poziom istotności α = 0.05, a zatem odrzucamy H0 o łącznej nieistotności zm. objaśniających) Diagnostyka i testy modelu probit Test typu związku (linktest) Przed przystąpieniem do weryfikacji hipotez należy sprawdzić czy przyjęty model jest prawidłowo wyspecyfikowany. W tym celu przeprowadzono test typu związku, który jest uogólnieniem testu RESET. Wyniki prezentuje poniższa tabela: Tabela 19. Test typu związku. linktest Probit regression Number of obs = 6156 LR chi2(2) = Prob > chi2 = Log likelihood = Pseudo R2 = depr Coef. Std. Err. z P> z [95% Conf. Interval] _hat _hatsq _cons

28 Jak widać zmienna hatsq jest nieistotna (p-value=0.343>0.05, nie mamy podstaw do odrzucenia H0 o nieistotności zmiennej hatsq ), Wskazywało by to, iż dla wartości dopasowanych ważne są ich pierwsze a nie wyższe potęgi, a zatem mamy do czynienia z prawidłową postacią modelu. Wykonano również, znajdujące się poniżej, testy Pearsona i Hosmera Lemeshow a, na poprawność formy funkcyjnej, w których: H 0 : zastosowana forma funkcyjna jest prawidłowa H 1 : zastosowana forma funkcyjna nie jest prawidłowa Test jakości dopasowania Pearsona (goodness of fit test) Tabela 20. Wynik testu Pearsona. estat gof Probit model for depr, goodness-of-fit test number of observations = 6156 number of covariate patterns = 6105 Pearson chi2(6092) = Prob > chi2 = Test wersja Hosmera-Lemeshow'a - dzielimy na 10 podprób według decyli wartości dopasowanych: Tabela 21. Wynik testu Hosmera Lemeshow a estat gof, group(10) table Probit model for depr, goodness-of-fit test (Table collapsed on quantiles of estimated probabilities) Group Prob Obs_1 Exp_1 Obs_0 Exp_0 Total number of observations = 6156 number of groups = 10 Hosmer-Lemeshow chi2(8) = Prob > chi2 = W teście Pearsona chi2(6092) = , p-value = < 0.05, który jest wartością zadanego poziomu istotności, zatem odrzucamy hipotezę zerową wskazującą na poprawność formy funkcyjnej. 28

29 Wyniki testu Hausmana Lemeshow a, to: chi2(8) = 13.57, a p-value = > 0.05 (zadany poziom istotności), zatem w tym teście nie odrzucamy hipotezy zerowej, wskazującej na poprawność formy funkcyjnej. W związku z tym, że użyta tu wersja testu Pearsona charakteryzuje się małą mocą (w szczególności, jeśli podpróby są mało liczne; tak jest w naszym przypadku) możemy zaufać pozostałym testom - Hausmana Lemeshow a i uogólnionemu testowi RESET, które potwierdziły, iż przyjęta forma funkcyjna jest prawidłowa i model został odpowiednio wyspecyfikowany Analiza dopasowania W tym miejscu należałoby przyjrzeć się bliżej wskaźnikom determinacji. Miary dopasowania Tabela 22. Miary dopasowania modelu probit. fitstat Measures of Fit for probit of depr Log-Lik Intercept Only: Log-Lik Full Model: D(6143): LR(12): Prob > LR: McFadden's R2: McFadden's Adj R2: Maximum Likelihood R2: Cragg & Uhler's R2: McKelvey and Zavoina's R2: Efron's R2: Variance of y*: Variance of error: Count R2: Adj Count R2: AIC: AIC*n: BIC: BIC': Uzyskany model dla zmiennej ukrytej y * i byłby wyjaśniany w 40%, gdyby zmienna ta była bezpośrednio obserwowalna (pseudo R² McKelvey-Zavoina=0.4). Model prawidłowo przewiduje sukcesy i porażki w 79,5% przypadków (R² liczebnościowe=0.795). Dzięki użyciu w zmiennych objaśniających model prawidłowo przewiduje sukcesy i porażki w 26,3% przypadków (skorygowane liczebnościowe R²=0.264). Kolejnym analizowanym elementem jest wrażliwość i specyficzność modelu. Wrażliwość i specyficzność Im lepiej model przewiduje, tym bardziej krzywa ROC odgięta jest w kierunku górnego rogu rysunku. Pole pod krzywą używane jest jako miara jakości dopasowania 29

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników

Bardziej szczegółowo

Egzamin z ekonometrii wersja IiE, MSEMAT

Egzamin z ekonometrii wersja IiE, MSEMAT Pytania teoretyczne Egzamin z ekonometrii wersja IiE, MSEMAT 08-02-2017 1. W jaki sposób przeprowadzamy test Chowa? 2. Pokazać, że jest nieobciążonym estymatorem. 3. Udowodnić, że w modelu ze stałą TSSESS+RSS.

Bardziej szczegółowo

Egzamin z ekonometrii wersja IiE, MSEMAT

Egzamin z ekonometrii wersja IiE, MSEMAT Egzamin z ekonometrii wersja IiE, MSEMAT 04-02-2016 Pytania teoretyczne 1. Za pomocą jakiego testu weryfikowana jest normalność składnika losowego? Jakiemu założeniu KMRL odpowiada w tym teście? Jakie

Bardziej szczegółowo

Modele dla zmiennej binarnej w pakiecie STATA materiały na ćwiczenia z ekonometrii 18.03.2005 r. Piotr Wójcik, KTRG WNE UW

Modele dla zmiennej binarnej w pakiecie STATA materiały na ćwiczenia z ekonometrii 18.03.2005 r. Piotr Wójcik, KTRG WNE UW Modele dla zmiennej binarnej w pakiecie STATA materiały na ćwiczenia z ekonometrii 18.03.2005 r. Piotr Wójcik, KTRG WNE UW Dane Dane wykorzystane w przykładzie pochodzą z pracy McCall, B.P., 1995, The

Bardziej szczegółowo

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne Egzamin z ekonometrii wersja ogólna 08-02-2017 Pytania teoretyczne 1. Za pomocą którego testu testujemy stabilność parametrów? Jakiemu założeniu KMRL odpowiada H0 w tym teście? Jaka jest hipoteza alternatywna

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników

Bardziej szczegółowo

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2. Zadanie 1 Niech y t ma rozkład logarytmiczno normalny o funkcji gęstości postaci [ ] 1 f (y t ) = y exp (ln y t β ln x t ) 2 t 2πσ 2 2σ 2 Zakładamy, że x t jest nielosowe a y t są nieskorelowane w czasie.

Bardziej szczegółowo

Ekonometria Ćwiczenia 19/01/05

Ekonometria Ćwiczenia 19/01/05 Oszacowano regresję stopy bezrobocia (unemp) na wzroście realnego PKB (pkb) i stopie inflacji (cpi) oraz na zmiennych zero-jedynkowych związanymi z kwartałami (season). Regresję przeprowadzono na danych

Bardziej szczegółowo

Ekonometria dla IiE i MSEMat Z12

Ekonometria dla IiE i MSEMat Z12 Ekonometria dla IiE i MSEMat Z12 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 09-01-2017 Test RESET Ramsey a W pierwszym etapie estymujemy współczynniki regresji w modelu:

Bardziej szczegółowo

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 0/0/0. Egzamin trwa 90 minut.. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu. Złamanie

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10 Stanisław Cichocki Natalia Nehrebecka Wykład 10 1 1. Testy diagnostyczne Testowanie prawidłowości formy funkcyjnej: test RESET Testowanie normalności składników losowych: test Jarque-Berra Testowanie stabilności

Bardziej szczegółowo

Diagnostyka w Pakiecie Stata

Diagnostyka w Pakiecie Stata Karol Kuhl Zgodnie z twierdzeniem Gaussa-Markowa, estymator MNK w KMRL jest liniowym estymatorem efektywnym i nieobciążonym, co po angielsku opisuje się za pomocą wyrażenia BLUE Best Linear Unbiased Estimator.

Bardziej szczegółowo

Egzamin z ekonometrii wersja ogolna

Egzamin z ekonometrii wersja ogolna Egzamin z ekonometrii wersja ogolna 04-02-2016 Pytania teoretyczne 1. Wymienić założenia Klasycznego Modelu Regresji Liniowej (KMRL). 2. Wyprowadzić estymator MNK dla modelu z wieloma zmiennymi objaśniającymi.

Bardziej szczegółowo

Egzamin z ekonometrii wersja IiE, MSEMAT

Egzamin z ekonometrii wersja IiE, MSEMAT Egzamin z ekonometrii wersja IiE, MSEMAT 02022015 Pytania teoretyczne 1. Podać treść twierdzenia GaussaMarkowa i wyjaśnić jego znaczenie. 2. Za pomocą jakich testów testuje się autokorelację? Jakiemu założeniu

Bardziej szczegółowo

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu Część 2 Test Durbina-Watsona Test Durbina-Watsona Weryfikowana hipoteza H 0 : cov(ε t, ε t 1 ) = 0 H 1 : cov(ε t, ε t 1 ) 0 Test Durbina-Watsona Weryfikowana hipoteza H 0 : cov(ε t, ε t 1 ) = 0 H 1 : cov(ε

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12 Stanisław Cichocki Natalia Nehrebecka Wykład 1 1 1. Testy diagnostyczne Testowanie stabilności parametrów modelu: test Chowa. Heteroskedastyczność Konsekwencje Testowanie heteroskedastyczności 1. Testy

Bardziej szczegółowo

Diagnostyka w Pakiecie Stata

Diagnostyka w Pakiecie Stata Karol Kuhl Zgodnie z twierdzeniem Gaussa-Markowa, estymator MNK w KMRL jest liniowym estymatorem efektywnym i nieobciążonym, co po angielsku opisuje się za pomocą wyrażenia BLUE Best Linear Unbiased Estimator.

Bardziej szczegółowo

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 02/02/2011 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Natalia Nehrebecka Stanisław Cichocki. Wykład 10 Natalia Nehrebecka Stanisław Cichocki Wykład 10 1 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów

Bardziej szczegółowo

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu Część 1 Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy małej próby Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy małej próby Testy

Bardziej szczegółowo

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne Egzamin z ekonometrii wersja IiE, MSEMat 31-01-2014 Pytania teoretyczne 1. Podać postać przekształcenia Boxa-Coxa i wyjaśnić, do czego jest stosowane w ekonometrii. 2. Wyjaśnić, jakie korzyści i niebezpieczeństwa

Bardziej szczegółowo

Model 1: Estymacja KMNK z wykorzystaniem 4877 obserwacji Zmienna zależna: y

Model 1: Estymacja KMNK z wykorzystaniem 4877 obserwacji Zmienna zależna: y Zadanie 1 Rozpatrujemy próbę 4877 pracowników fizycznych, którzy stracili prace w USA miedzy rokiem 1982 i 1991. Nie wszyscy bezrobotni, którym przysługuje świadczenie z tytułu ubezpieczenia od utraty

Bardziej szczegółowo

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Natalia Nehrebecka Stanisław Cichocki. Wykład 10 Natalia Nehrebecka Stanisław Cichocki Wykład 10 1 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów

Bardziej szczegółowo

Natalia Nehrebecka Stanisław Cichocki. Wykład 6

Natalia Nehrebecka Stanisław Cichocki. Wykład 6 Natalia Nehrebecka Stanisław Cichocki Wykład 6 1 1. Zmienne dyskretne Zmienne zero-jedynkowe 2. Modele z interakcjami 2 Zmienne dyskretne Zmienne nominalne Zmienne uporządkowane 3 4 1 podstawowe i 0 podstawowe

Bardziej szczegółowo

Stanisław Cichocki. Natalia Neherebecka. Zajęcia 15-17

Stanisław Cichocki. Natalia Neherebecka. Zajęcia 15-17 Stanisław Cichocki Natalia Neherebecka Zajęcia 15-17 1 1. Binarne zmienne zależne 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników 3. Probit a) Interpretacja współczynników b) Miary

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 1. Binarne zmienne zależne 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników 3. Probit a) Interpretacja współczynników b) Miary dopasowania 4.

Bardziej szczegółowo

Budowa modelu i testowanie hipotez

Budowa modelu i testowanie hipotez Problemy metodologiczne Gdzie jest problem? Obciążenie Lovella Dysponujemy oszacowaniami parametrów następującego modelu y t = β 0 + β 1 x 1 +... + β k x k + ε t Gdzie jest problem? Obciążenie Lovella

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9 Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności

Bardziej szczegółowo

Regresja logistyczna (LOGISTIC)

Regresja logistyczna (LOGISTIC) Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12 Stanisław Cichocki Natalia Nehrebecka Wykład 12 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne 2. Autokorelacja o Testowanie autokorelacji 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne

Bardziej szczegółowo

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 Zadanie 1 a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 b) W naszym przypadku populacja są inżynierowie w Tajlandii. Czy można jednak przypuszczać, że na zarobki kobiet-inżynierów

Bardziej szczegółowo

Regresja liniowa wprowadzenie

Regresja liniowa wprowadzenie Regresja liniowa wprowadzenie a) Model regresji liniowej ma postać: gdzie jest zmienną objaśnianą (zależną); są zmiennymi objaśniającymi (niezależnymi); natomiast są parametrami modelu. jest składnikiem

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13 Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Autokorelacja Konsekwencje Testowanie autokorelacji 2. Metody radzenia sobie z heteroskedastycznością i autokorelacją Uogólniona Metoda Najmniejszych

Bardziej szczegółowo

Egzamin z ekonometrii - wersja ogólna

Egzamin z ekonometrii - wersja ogólna Egzamin z ekonometrii - wersja ogólna 06-02-2019 Regulamin egzaminu 1. Egzamin trwa 90 min. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

Zmienne Binarne w Pakiecie Stata

Zmienne Binarne w Pakiecie Stata Karol Kuhl Zbiór (hipotetyczny) dummy.dta zawiera dane, na podstawie których prowadzono analizy opisane poniżej. Nazwy zmiennych oznaczają: doch dochód w jednostkach pieniężnych; plec płeć: kobieta (0),

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13 Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Testowanie autokorelacji 2. Heteroskedastyczność i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji 3.Problemy z danymi Zmienne pominięte

Bardziej szczegółowo

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne Egzamin z ekonometrii wersja ogólna 31-01-2014 Pytania teoretyczne 1. Podać postać przekształcenia Boxa-Coxa i wyjaśnić, do czego jest stosowane w ekonometrii. 2. Porównaj zastosowania znanych ci kontrastów

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1 1. Wprowadzenie do danych panelowych a) Charakterystyka danych panelowych b) Zalety i ograniczenia 2. Modele ekonometryczne danych panelowych a) Model efektów nieobserwowalnych

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14 Stanisław Cichocki Natalia Nehrebecka Wykład 14 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne Obserwacje nietypowe i błędne Współliniowość - Mamy 2 modele: y X u 1 1 (1) y X X 1 1 2 2 (2)

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14 Stanisław Cichocki Natalia Nehrebecka Wykład 14 1 1.Problemy z danymi Współliniowość 2. Heteroskedastyczność i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji Metody radzenia sobie z heteroskedastycznością

Bardziej szczegółowo

Szacowanie modeli wielowartościowych w pakiecie STATA

Szacowanie modeli wielowartościowych w pakiecie STATA Szacowanie modeli wielowartościowych w pakiecie STATA Uniwersytet Warszawski Wydział Nauk Ekonomicznych 25 kwietnia 2007 W badaniach ekonomicznych i społecznych często odpowiedzi na pytania są kodowane

Bardziej szczegółowo

Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18

Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18 Ekonometria Metodologia budowy modelu Jerzy Mycielski WNE, UW Luty, 2011 Jerzy Mycielski (WNE, UW) Ekonometria Luty, 2011 1 / 18 Sprawy organizacyjne Dyżur: środa godz. 14-15 w sali 302. Strona internetowa

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8 Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów

Bardziej szczegółowo

Egzamin z Ekonometrii

Egzamin z Ekonometrii Pytania teoretyczne Egzamin z Ekonometrii 18.06.2015 1. Opisać procedurę od ogólnego do szczegółowego na przykładzie doboru liczby opóźnień w modelu. 2. Na czym polega najważniejsza różnica między testowaniem

Bardziej szczegółowo

Metoda najmniejszych kwadratów

Metoda najmniejszych kwadratów Własności algebraiczne Model liniowy Zapis modelu zarobki = β 0 + β 1 plec + β 2 wiek + ε Oszacowania wartości współczynników zarobki = b 0 + b 1 plec + b 2 wiek + e Model liniowy Tabela: Oszacowania współczynników

Bardziej szczegółowo

Natalia Nehrebecka. Wykład 1

Natalia Nehrebecka. Wykład 1 Natalia Nehrebecka Wykład 1 1 1. Sprawy organizacyjne Zasady zaliczenia Dwiczenia Literatura 2. Czym zajmuje się ekonometria? 3. Formy danych statystycznych 4. Model ekonometryczny 2 1. Sprawy organizacyjne

Bardziej szczegółowo

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska Anna Stankiewicz Izabela Słomska Wstęp- statystyka w politologii Rzadkie stosowanie narzędzi statystycznych Pisma Karla Poppera

Bardziej szczegółowo

Czasowy wymiar danych

Czasowy wymiar danych Problem autokorelacji Model regresji dla szeregów czasowych Model regresji dla szeregów czasowych y t = X t β + ε t Zasadnicze różnice 1 Budowa prognoz 2 Problem stabilności parametrów 3 Problem autokorelacji

Bardziej szczegółowo

Ekonometria dla IiE i MSEMat Z7

Ekonometria dla IiE i MSEMat Z7 Ekonometria dla IiE i MSEMat Z7 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 21-11-2016 Na podstawie zbioru danych cps_small.dat z książki Principles of Econometrics oszacowany

Bardziej szczegółowo

Analiza Szeregów Czasowych. Egzamin

Analiza Szeregów Czasowych. Egzamin Analiza Szeregów Czasowych Egzamin 12-06-2018 Zadanie 1: Zadanie 2: Zadanie 3: Zadanie 4: / 12 pkt. / 12 pkt. / 12 pkt. / 14 pkt. Projekt zaliczeniowy: Razem: / 100 pkt. / 50 pkt. Regulamin egzaminu 1.

Bardziej szczegółowo

Ćwiczenia IV

Ćwiczenia IV Ćwiczenia IV - 17.10.2007 1. Spośród podanych macierzy X wskaż te, których nie można wykorzystać do estymacji MNK parametrów modelu ekonometrycznego postaci y = β 0 + β 1 x 1 + β 2 x 2 + ε 2. Na podstawie

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Wykład 1

Stanisław Cichocki Natalia Nehrebecka. Wykład 1 Stanisław Cichocki Natalia Nehrebecka Wykład 1 1 1. Sprawy organizacyjne Zasady zaliczenia Ćwiczenia Literatura 2. Obciążenie Lovella 3. Metoda od ogólnego do szczególnego 4. Kryteria informacyjne 2 1.

Bardziej szczegółowo

Analiza czynników wpływających na poziom wykształcenia.

Analiza czynników wpływających na poziom wykształcenia. Analiza czynników wpływających na poziom wykształcenia. Celem tej pracy jest potwierdzenie lub odrzucenie opinii, którą większość społeczeństwa uznaje za oczywistą, o tym ė w Polsce lepiej wykształceni

Bardziej szczegółowo

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności. TEST STATYSTYCZNY Testem statystycznym nazywamy regułę postępowania rozstrzygająca, przy jakich wynikach z próby hipotezę sprawdzaną H 0 należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Część 2 Hipoteza złożona Testowanie hipotez łącznych Zapis matematyczny Rozkład statystyki testowej Hipoteza łączna H 0 : Rβ = q Hipoteza złożona Testowanie hipotez łącznych Zapis matematyczny Rozkład

Bardziej szczegółowo

1 Modele ADL - interpretacja współczynników

1 Modele ADL - interpretacja współczynników 1 Modele ADL - interpretacja współczynników ZADANIE 1.1 Dany jest proces DL następującej postaci: y t = µ + β 0 x t + β 1 x t 1 + ε t. 1. Wyjaśnić, jaka jest intepretacja współczynników β 0 i β 1. 2. Pokazać

Bardziej szczegółowo

Ekonometria egzamin semestr drugi 14/06/09

Ekonometria egzamin semestr drugi 14/06/09 imię, nazwisko, nr indeksu: Ekonometria egzamin semestr drugi 14/06/09 1. Przed przystąpieniem do pisania egzaminu należy podpisać wszystkie kartki arkusza egzaminacyjnego (na dole w przewidzianym miejscu).

Bardziej szczegółowo

Binarne zmienne zależne

Binarne zmienne zależne Binarne zmienne zależne Zmienna zależna nie jest ciagła ale przyjmuje zero lub jeden Przykład: szukanie determinant bezrobocia (próba przekrojowa) zmienna objaśniana: zerojedynkowa (pracujacy, bezrobotny)

Bardziej szczegółowo

Ekonometria egzamin wersja ogólna 17/06/08

Ekonometria egzamin wersja ogólna 17/06/08 imię, nazwisko, nr indeksu: Ekonometria egzamin wersja ogólna 17/06/08 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca

Bardziej szczegółowo

Badanie zależności skala nominalna

Badanie zależności skala nominalna Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność

Bardziej szczegółowo

, a reszta dla pominiętej obserwacji wynosi 0, RSS jest stałe, T SS rośnie, więc zarówno R 2 jak i R2 rosną. R 2 = 1 n 1 n. rosnie. n 2 (1 R2 ) = 1 59

, a reszta dla pominiętej obserwacji wynosi 0, RSS jest stałe, T SS rośnie, więc zarówno R 2 jak i R2 rosną. R 2 = 1 n 1 n. rosnie. n 2 (1 R2 ) = 1 59 Zadanie 1. Ekonometryk szacując funkcję konsumpcji przeprowadził estymację osobno dla tzw. Polski A oraz Polski B. Dla Polski A posiadał n 1 = 40 obserwacji i uzyskał współczynnik dopasowania RA 2 = 0.4,

Bardziej szczegółowo

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego

Bardziej szczegółowo

Problem równoczesności w MNK

Problem równoczesności w MNK Problem równoczesności w MNK O problemie równoczesności mówimy, gdy występuje korelacja między wartościa oczekiwana ε i i równoczesnym x i Model liniowy y = Xβ + ε, E (u) = 0 Powiedzmy, że występuje w

Bardziej szczegółowo

Zmienne sztuczne i jakościowe

Zmienne sztuczne i jakościowe Zmienne o ograniczonym zbiorze wartości Przykład 1. zarobki = β 0 + β 1 liczba godzin pracy + β 2 wykształcenie + ε Przykład 2. zarobki = β 0 + β 1 liczba godzin pracy + β 2 klm + ε zarobki = β 0 + β 1

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13 Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Problemy z danymi Obserwacje nietypowe i błędne Współliniowość. Heteroskedastycznośd i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10 Stanisław Cichoci Natalia Nehrebeca Wyład 10 1 1. Testowanie hipotez prostych Rozład estymatora b Testowanie hipotez prostych przy użyciu statystyi t Przedziały ufności Badamy czy hipotezy teoretyczne

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka - adres mailowy: scichocki@o2.pl - strona internetowa: www.wne.uw.edu.pl/scichocki - dyżur: po zajęciach lub po umówieniu mailowo - 80% oceny: egzaminy - 20% oceny:

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów 5. Testowanie

Bardziej szczegółowo

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej, Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (punktowa, przedziałowa) Weryfikacja

Bardziej szczegółowo

Heteroskedastyczość w szeregach czasowyh

Heteroskedastyczość w szeregach czasowyh Heteroskedastyczość w szeregach czasowyh Czesto zakłada się, że szeregi czasowe wykazuja autokorelację ae sa homoskedastyczne W rzeczywistości jednak często wariancja zmienia się w czasie Dobrym przykładem

Bardziej szczegółowo

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 01/02/2019 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej Ekonometria Modelowanie zmiennej jakościowej Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 1 / 25 Zmienna jakościowa Zmienna ilościowa może zostać zmierzona

Bardziej szczegółowo

Chcesz zwiększyć swój dochód? Przenieś się i pracuj w Urzędzie!

Chcesz zwiększyć swój dochód? Przenieś się i pracuj w Urzędzie! Uniwersytet Warszawski Wydział Nauk Ekonomicznych Mateusz Błażej Nr albumu: 308521 Chcesz zwiększyć swój dochód? Przenieś się i pracuj w Urzędzie! Model ekonometryczny na kierunku: Informatyka i Ekonometria

Bardziej szczegółowo

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA Ważną klasę modeli dynamicznych stanowią modele ARMA(p, q) Ważną klasę modeli dynamicznych stanowią modele ARMA(p, q) Modele tej klasy są modelami ateoretycznymi Ważną klasę modeli dynamicznych stanowią

Bardziej szczegółowo

Przykład 1 ceny mieszkań

Przykład 1 ceny mieszkań Przykład ceny mieszkań Przykład ceny mieszkań Model ekonometryczny zaleŝności ceny mieszkań od metraŝu - naleŝy do klasy modeli nieliniowych. - weryfikację empiryczną modelu przeprowadzono na przykładzie

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego

Bardziej szczegółowo

Natalia Nehrebecka Stanisław Cichocki. Wykład 13

Natalia Nehrebecka Stanisław Cichocki. Wykład 13 Natalia Nehrebecka Stanisław Cichocki Wykład 13 1 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość 2 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje

Bardziej szczegółowo

Ekonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 31/01/2018 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 06/03/2019 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

Metodologia badań psychologicznych. Wykład 12. Korelacje

Metodologia badań psychologicznych. Wykład 12. Korelacje Metodologia badań psychologicznych Lucyna Golińska SPOŁECZNA AKADEMIA NAUK Wykład 12. Korelacje Korelacja Korelacja występuje wtedy gdy dwie różne miary dotyczące tych samych osób, zdarzeń lub obiektów

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4 Stanisław Cichocki Natalia Nehrebecka Wykład 4 1 1. Własności hiperpłaszczyzny regresji 2. Dobroć dopasowania równania regresji. Współczynnik determinacji R 2 Dekompozycja wariancji zmiennej zależnej Współczynnik

Bardziej szczegółowo

1 Metoda Największej Wiarogodności

1 Metoda Największej Wiarogodności 1 Metoda Największej Wiarogodności 1.0.1 Wprowadzenie Dotychczas omawiane modele szacowane były za pomocą metody najmniejszych kwadratów. Jednak takie modele nie wyczerpują wszystkich możliwości. Istnieje

Bardziej szczegółowo

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Natalia Nehrebecka Stanisław Cichocki. Wykład 10 Natala Nehrebecka Stansław Cchock Wykład 10 1 1. Testy dagnostyczne 2. Testowane prawdłowośc formy funkcyjnej modelu 3. Testowane normalnośc składnków losowych 4. Testowane stablnośc parametrów 5. Testowane

Bardziej szczegółowo

Ekonometria egzamin 07/03/2018

Ekonometria egzamin 07/03/2018 imię, nazwisko, nr indeksu: Ekonometria egzamin 07/03/2018 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

Natalia Nehrebecka. 18 maja 2010

Natalia Nehrebecka. 18 maja 2010 Natalia Nehrebecka 18 maja 2010 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów 5. Testowanie

Bardziej szczegółowo

Materiaªy do zaawans. ekon. Z10

Materiaªy do zaawans. ekon. Z10 Faculty of Economic Sciences, University of Warsaw Warsaw, 23-04-2012 Probit wiczenie 1. Moshe Ben-Akiva and Steven Lerman, Discrete Choice Analysis, Theory and Application to Travel Demand, MIT Press,

Bardziej szczegółowo

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej, Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (estymacja punktowa, przedziałowa)

Bardziej szczegółowo

Przyczynowość Kointegracja. Kointegracja. Kointegracja

Przyczynowość Kointegracja. Kointegracja. Kointegracja korelacja a związek o charakterze przyczynowo-skutkowym korelacja a związek o charakterze przyczynowo-skutkowym Przyczynowość w sensie Grangera Zmienna x jest przyczyną w sensie Grangera zmiennej y jeżeli

Bardziej szczegółowo

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe? 2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali

Bardziej szczegółowo

Rozdział 8. Regresja. Definiowanie modelu

Rozdział 8. Regresja. Definiowanie modelu Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność

Bardziej szczegółowo

Analiza wariancji - ANOVA

Analiza wariancji - ANOVA Analiza wariancji - ANOVA Analiza wariancji jest metodą pozwalającą na podział zmienności zaobserwowanej wśród wyników eksperymentalnych na oddzielne części. Każdą z tych części możemy przypisać oddzielnemu

Bardziej szczegółowo

Analiza szeregów czasowych bezrobocia i inflacji w Danii

Analiza szeregów czasowych bezrobocia i inflacji w Danii Uniwersytet Warszawski Wydział Nauk Ekonomicznych Mateusz Błażej Nr albumu: 308521 Analiza szeregów czasowych bezrobocia i inflacji w Danii Projekt zaliczeniowy z przedmiotu: Analiza Szeregów Czasowych

Bardziej szczegółowo

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Przykład 2 Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Sondaż sieciowy analiza wyników badania sondażowego dotyczącego motywacji w drodze do sukcesu Cel badania: uzyskanie

Bardziej szczegółowo