NIE STRASZNY NAM KRYZYS, CZYLI JAK NIE DAĆ SIĘ DEPRESJI Determinanty depresji w Polsce

Transkrypt

1 Model ekonometryczny NIE STRASZNY NAM KRYZYS, CZYLI JAK NIE DAĆ SIĘ DEPRESJI Determinanty depresji w Polsce Michał Danilewski Paweł Klimaszewski UNIWERSYTET WARSZAWSKI WYDZIAŁ NAUK EKONOMICZNYCH WARSZAWA 2009

2 SPIS TREŚCI 1. Problem ekonometryczny Opis hipotez badawczych, podstawy teoretyczne oraz próba ekonomicznego uzasadnienia Podstawy teoretyczne modelu Hipotezy badawcze Opis zbioru danych oraz definicje zmiennych Oszacowanie modelu Zastosowanie Liniowego Modelu Prawdopodobieństwa Estymacja modelu logit i probit Model logit - wybór zmiennych do modelu Diagnostyka i testy modelu logit Analiza dopasowania Wybór zmiennych do modelu probit Diagnostyka i testy modelu probit Analiza dopasowania Wybór właściwego modelu Interpretacja wyników Efekty cząstkowe Ilorazy szans Efekty cząstkowe i wnioski dla wybranej grupy respondentów Oszacowanie i interpretacja efektów cząstkowych Wnioski z efektów cząstkowych Wnioski końcowe Bibliografia Załączniki Skala Depresji Becka Wykresy zależności ciągłych zmiennych objaśniających i prawdopodobieństwa bycia w depresji

3 1. Problem ekonometryczny Prognozy ekonomistów stały się faktem kryzys ekonomiczny dotarł również do Polski i raczej nie ominie nikogo z nas. Przede wszystkim odczuje go (o ile jeszcze nie odczuła) zdecydowana większość firm i ich menedżerowie. Co zrobić, aby skutki kryzysu dotknęły nas w jak najmniejszym stopniu? Jak podejmować decyzje, aby pomimo trudności nie stracić zimnej krwi i, co za tym idzie, profitów osiągniętych w czasie hossy? W obliczu kryzysu nic nie jest pewne. Nie można liczyć na to, że firmy mające dziś wielu kontrahentów, jutro bądź za miesiąc nadal będą ich miały. Z dnia na dzień możemy być zaskoczeni wiadomościami, że przedsiębiorstwo będące naszym partnerem upadło lub ma poważne problemy. Dlatego do kryzysu trzeba się przygotować. Strategia rozwoju musi być dobrze przemyślana i zaplanowana. Lepiej już teraz się zabezpieczyć, pozyskując skuteczne narzędzia obniżające koszty i rozszerzając działalność o nowe kontrakty, które pomogą zdywersyfikować dostawców i odbiorców. Przedsiębiorstwa powinny mieć gotowe rozwiązania, kiedy kryzys już przyjdzie. Należałoby też pomyśleć o opcjach, które byłyby lepsze i tańsze od obecnie używanych. Próby konkurowania przez proste zwiększanie wielkości produkcji mogą okazać się zbyt ryzykowne. Nie ma bowiem gwarancji, że świeżo wyprodukowane towary znajdą nabywców. Wydatki włożone w rozbudowę linii produkcyjnych, magazynów itp. mogą się po prostu nie zwrócić. W efekcie, nawet wzrost sprzedaży, przy nieproporcjonalnie większym wzroście kosztów produkcji, będzie oznaczał ujemne wyniki finansowe firmy. Kluczowym czynnikiem (szczególnie w sektorze małych i średnich przedsiębiorstw), który może zdecydować o przetrwaniu czasu kryzysu, jest postawa menedżera. To on staje się odpowiedzialny za realizowanie strategii, podejmowanie trudnych decyzji i wykonywanie ryzykownych działań. Sukces nie zależy jednak wyłącznie od wiedzy i doświadczenia osób na stanowiskach kierowniczych. Równie ważna jest sfera emocjonalna: kondycja psychiczna, pewność siebie i odporność na stres. Coraz więcej menedżerów, w związku z załamaniem na rynku, nie potrafi poradzić sobie z trudnościami własnego przedsiębiorstwa. Ryzyko nietrafionych decyzji, konieczność wzięcia odpowiedzialności za spadającą sprzedaż, typowanie 3

4 pracowników do zwolnienia wpływają na zwiększenie napięcia w miejscach pracy. Stres, zdenerwowanie i przemęczenie prowadzą do spadku motywacji, przejawiającego się rezygnacją, długotrwałym przygnębieniem i niechęcią do działania. Pojawiająca się depresja 1 powoduje, że zamiast dokonywać odpowiednich działań w celu ratowania firmy, zarządzający podejmują błędne decyzje, które tylko pogarszają sytuację. Depresja, choć dotyka coraz więcej osób, często aktywnych i pełnych życia, nie jest wyrokiem i skutecznie można się przed nią zabezpieczyć. Im wcześniej pozna się jej determinanty, tym szybciej będzie można podjąć kroki w celu ich wyeliminowania. Celem naszej pracy jest zbadanie czynników wpływających na depresję wśród Polaków, a następnie zbadanie wpływu tych czynników na osoby o charakterystyce typowej dla menedżera. Wśród czynników wpływających na depresję, ważną rolę odgrywają z pewnością cechy wewnętrzne, które są niemierzalne i różne dla każdej jednostki. Istnieje jednak szereg zmiennych mierzalnych, które wpływają na nasz dobrostan, szczęście, odporność na stres, a co za tym idzie skłonność do depresji. Takie zmienne będą podlegały badaniu w modelu ekonometrycznym przedstawionym w niniejszej pracy Opis hipotez badawczych, podstawy teoretyczne oraz próba ekonomicznego uzasadnienia W rozdziale tym przedstawione zostaną prace naukowców którzy zajmowali się badaniem czynników determinujących depresję. Wnioski z prezentowanych artykułów były nam pomocne przy formułowaniu hipotez, które zamieszczone są w dalszej części pracy Podstawy teoretyczne modelu V. Lorant, C. Croux, S. Weich, D. Deliege, J. Mackenbach i M. Ansseau w artykule Depression and socio-economic risk factors 2 opisali swoje badania na temat 1 Według prof. Antoniego Kępińskiego depresja to stan chorobowy charakteryzujący się nasileniem objawów i wydłużonym czasem ich utrzymywania się. Niepokój powinno wzbudzić nie samo przygnębienie, ale to, że trwa ono już długo i zmienia nasze funkcjonowanie, dezorganizuje codzienne życie. Smutek nie jest już tym, co pojawia się od czasu do czasu, ale czymś stale towarzyszącym. Antoni Kępiński ( ) wybitny lekarz psychiatra, autor znanych książek na temat depresji, m.in.: Melancholia. 2 V. Lorant, C. Croux, S. Weich, D. Deliege, J. Mackenbach, M. Ansseau, Depression and socioeconomic risk factors: 7-year longitudinal population study, The British Journal of Psychiatry 2007, nr 190, s

5 czynników socjo-ekonomicznych determinujących depresję. W swojej pracy wykorzystali dane pochodzące z siedmiu fal badania panelowego przeprowadzanych w rocznych odstępach czasu. Dane gromadzono w oparciu o Belgijski Sondaż Gospodarstw Domowych obejmujący osoby w wieku powyżej 16 lat w latach Próba liczyła respondentów, wśród których u 17,3% stwierdzono objawy depresji. W oszacowanym przez autorów modelu logit prawdopodobieństwo znalezienia się w stanie depresji zostało uzależnione od takich zmiennych niezależnych, jak: własna ocena zamożności dokonywana przez respondenta, ubóstwo (jako zmienna zero-jedynkowa), dochód gospodarstwa domowego, bezrobocie, działalność społeczna oraz stan cywilny. Otrzymane rezultaty pozwoliły stwierdzić, iż powyższe czynniki mają istotny wpływ na prawdopodobieństwo depresji wśród Belgów. Potwierdziły się przypuszczenia naukowców, że pogarszający się stan materialny, związany ze spadkiem dochodów respondenta lub byciem bezrobotnym, zwiększa prawdopodobieństwo depresji. Ciekawym wnioskiem był fakt, iż osoby które deklarowały swoją społeczną aktywność, rozumianą jako czynny udział w organizacjach non-profit, wolontariacie, kampaniach społecznych itp., wykazywały się dużo mniejszą podatnością na depresję. Badanie pokazało również, że kobiety mają większe prawdopodobieństwo wpadnięcia w depresję niż mężczyźni. Okazało się natomiast, że posiadanie partnera skutecznie zmniejsza ryzyko załamania depresyjnego. R. M. Nesse i G. C. Williams w swojej pracy Why we get sick opublikowanej w 1994 r. w New York Times Books opisali wyniki swoich badań na temat depresji i jej determinantów. W pięciu badaniach, obejmujących łącznie 39 tys. osób z różnych krajów zachodnich, stwierdzono, że dzisiejsi młodzi ludzie mają znacznie wyższe ryzyko doświadczenia co najmniej jednego epizodu depresyjnego w porównaniu ze starszymi pokoleniami. Autorzy tłumaczą to m.in. procesami cywilizacyjnymi (ryzyko depresji rośnie wraz ze wzrostem poziomu ekonomicznego rozwoju kraju), które znacznie silniej odbijają się na psychice młodych pokoleń niż osób starszych, dorastających w tzw. erze lęku po drugiej wojnie światowej. Nesse i Williams zaproponowali następujące wyjaśnienie: Komunikacja masowa, zwłaszcza telewizja i filmy, czyni z nas wszystkich jeden wielki zespół rywali, współzawodniczących ze sobą kosztem bliskich związków z ludźmi (...) Dawniej miałeś spore szanse wybić się w czymś. Nawet jeśli nie byłeś najlepszy, twoje własne otoczenie doceniało twoje zdolności. Dziś wszyscy rywalizujemy z tymi, którzy są najlepsi na świecie. Oglądając ludzi sukcesu w telewizji, stajemy się zawistni. Zawiść przyczyniała się zapewne do 5

6 motywowania naszych przodków do osiągania tego, co osiągnęli inni. Dziś natomiast, nieliczni z nas mogą zdobyć to, do czego skłania nas zazdrość i nikt z nas nie jest w stanie mieć tak fantastycznego życia, jakie oglądamy w telewizji 3. Do zupełnie odwrotnych wniosków doszedł jednak J. Czapiński w badaniach przeprowadzonych w Polsce i opublikowanych w Diagnozie Społecznej w 2005 r. 4 W przeciwieństwie do społeczeństw zachodnich (USA, Kanada), zależność między wiekiem i depresją w Polsce jest nie negatywna, lecz pozytywna. Jest ona również u nas kilkakrotnie silniejsza. W Polsce to ludzie starsi częściej cierpią na depresję niż młodzi. Nie wiemy, skąd bierze się polski fenomen odwrócenia zależności między wiekiem i depresją. Czapiński sugeruje, że być może wynika on z pokoleniowo zróżnicowanych zdolności adaptacyjnych: ludzie, którzy dorastali i żyli w czasach PRL, mają większe trudności z odnalezieniem się w nowej rzeczywistości wolnej gospodarki 5. Ludzie starsi czują się więc bardziej zagubieni i niechciani (choćby na rynku pracy). Zgodnie z badaniami, odwrócony i nadzwyczaj silny związek między wiekiem i depresją nie słabnie jednak w miarę upływu czasu. Dzisiejsi 30-latkowie, którzy wchodzili w dorosłość już po upadku komunizmu, są dużo bardziej skłonni do depresji od obecnych 20-latków. Takie zachowanie, niespotykane w krajach Europy Zachodniej, pozostaje największą tajemnicą transformacji i Polaków. Podsumowując poprzedni akapit, według badań Czapińskiego 6, najważniejszym czynnikiem wyjaśniającym stan psychiczny Polaków jest wiek. Drugim, równie istotnym kryterium okazała się być liczba przyjaciół. W trudnych chwilach, zwłaszcza w obliczu problemów osobistych, poczucie bezinteresownej życzliwości i pomocy ze strony innych ludzi może być kluczowym czynnikiem chroniącym człowieka od depresji. Jak mawia przysłowie, prawdziwych przyjaciół poznaje się w biedzie i tego dowodzi badanie Czapińskiego. Zgodnie z wynikami Diagnozy Społecznej 7 kolejnym ważnym determinantem okazał się dochód na osobę. Wraz ze spadkiem dochodu rośnie prawdopodobieństwo depresji. Na osłabienie poczucia dobrostanu, a co za tym idzie, wzrost ryzyka depresji, wpływa również bezrobocie i nadużywanie alkoholu. Badania dowiodły również istotną 3 R.M. Nesse, G. C. Williams, Why we get sick, New York Times Books, 1994 r., s Badanie to zostało przeprowadzone na próbie Polaków i zawiera kompleksowe dane na temat gospodarstw domowych oraz postaw, stanu ducha i zachowań osób tworzących te gospodarstwa. 5 J. Czapiński, T. Panek, Diagnoza Społeczna 2005, s Ibidem, s Ibidem. 6

7 rolę małżeństwa, które staje się czynnikiem wzmacniającym kondycję psychiczną i ma znaczny wpływ na ograniczenie prawdopodobieństwa wpadnięcia w depresję Hipotezy badawcze Wyciągając wstępne wnioski z badań przywołanych w poprzednim podrozdziale, można zauważyć, iż skłonności do depresji są uwarunkowane przez wiele czynników. Nie ma zgody, co do kierunku wpływu niektórych z nich np. wieku respondenta. Istnieje również wiele przeciwstawnych poglądów o istotności poszczególnych kryteriów. Celem naszej pracy będzie weryfikacja części z tych poglądów oraz analiza determinantów depresji wśród Polaków. Praca ta będzie stanowiła odpowiedź na następujące pytania: Jak wiek osoby wpływa na prawdopodobieństwo bycia w depresji? Opierając się na wynikach przedstawionych badań skłaniamy się do tezy, że wśród Polaków takie prawdopodobieństwo rośnie wraz ze wzrostem wieku. Im człowiek starszy, tym jego sytuacja materialna i zdrowotna jest trudniejsza, co zwiększa podatność do depresji. Czy kobiety są bardziej podatne na depresję? Przypuszczamy, że można zauważyć taką zależność, co wynika z większej wrażliwości w porównaniu z mężczyznami. Czy dochód ma wpływ na prawdopodobieństwo bycia w depresji? Sądzimy, że ludzie zamożniejsi mają mniejszą skłonność do wpadnięcia w depresję 8. Wynika to z tego, że mając zagwarantowany dobrobyt, nie trzeba się nieustannie martwić o zaspokojenie podstawowych potrzeb. Czy fakt bycia bezrobotnym ma wpływ na depresję? Można stwierdzić, że fakt utraty pracy może mieć znaczny wpływ na prawdopodobieństwo bycia w depresji, co wynika z braku regularnych dochodów sytuacji nieustannego napięcia nerwowego. 8 Pomijamy tu pojedyncze przypadki milionerów (ze względu na ich znikomość w badanej próbie), u których faktycznie można byłoby zaobserwować dodatni wpływ dochodu na prawdopodobieństwo bycia w depresji. 7

8 Jakie znaczenie na badane zjawisko ma wykształcenie respondenta? Uważamy, iż osoby posiadające wyższe wykształcenie znajdują się w lepszej sytuacji życiowej, a także posiadają lepsze perspektywy na przyszłość, zatem są mniej podatne na popadnięcie w depresję. Czy praktyki religijne, chodzenie do kościoła, wiara ma wpływ na bycie w depresji? Badanie przeprowadzone w Diagnozie Społecznej wykazało, że wiara wpływa ujemnie na skłonności depresyjne. Biorąc pod uwagę charakterystykę społeczeństwa polskiego, można twierdzić, iż praktyki religijne powodują, że ludzie w trudnych chwilach znajdują oparcie w wierze i rzadziej popadają w depresję, niż osoby czujące się pozostawione samym sobie. Czy nadużywanie alkoholu ma wpływ na skłonności depresyjne? Naszym zdaniem problemy z alkoholem mogą istotnie wpływać na pojawienie się skłonności depresyjnych. Jak stan cywilny wpływa na prawdopodobieństwo wystąpienia badanego zjawiska? Naszym zdaniem osoby będące w związku małżeńskim powinny cechować się mniejszym prawdopodobieństwem bycia w depresji, niż osoby, które owdowiały, są w separacji lub po rozwodzie. 2. Opis zbioru danych oraz definicje zmiennych Dane wykorzystane do budowy poniższego modelu pochodzą z badania Diagnoza Społeczna przeprowadzonego w 2005 r. Wyniki kolejnych edycji badania, wraz z bazami danych i metodologią są publikowane na stronie internetowej Z udostępnionej bazy danych, w pierwszym kroku wybrano zmienne zawarte w hipotezach przedstawionych w poprzednim rozdziale. Z tego zbioru usunięto następnie obserwacje, dla których respondent nie udzielił odpowiedzi na pytania dotyczące badanych przez nas zmiennych. W efekcie, ostateczną analizą objęto osób. 8

9 Większość zmiennych została pozyskana za pomocą pojedynczych pytań. Wyjątek stanowiła zmienna depr. Została ona uzyskana na podstawie skali depresji psychicznej, złożonej z siedmiu pozycji symptomów 9, zapożyczonych ze znanego i często stosowanego w badaniach psychologicznych Inwentarza Depresji autorstwa A. T. Becka, na który składa się dwadzieścia jeden pytań 10. Wybór siedmiu pozycji spośród dwudziestu jeden symptomów został dokonany przez prof. Czapińskiego jednego z autorów Diagnozy Społecznej. Decyzję podyktowano względami psychometrycznymi: w poprzednich badaniach zmienne wykazały najsilniejszy związek z obiektywnymi wyznacznikami warunków życia. Wskaźnikiem depresji była więc suma odpowiedzi na wszystkie siedem pytań. Wynik powyżej siedmiu świadczył o stanie depresyjnym respondenta. Wskaźnik depresji traktować można jako miarę stopnia nieprzystosowania psychicznego, odzwierciedlającą nieskuteczność radzenia sobie z problemami czy stresem życiowym. Wskaźników opartych na tej skali nie należy odczytywać jako diagnozy poziomu klinicznych zaburzeń depresyjnych w wymiarze populacji. Poniżej zostały przedstawione zmienne użyte przez nas w modelu. Zmienna objaśniana: depr - jest to zmienna binarna, przyjmująca wartości: 0 gdy osoba nie ma depresji 1 gdy osoba ma depresję Tabela 1. Charakterystyka zmiennej zależnej depr bycie w depresji Freq. Percent Cum , , Total 6, Powyższe zestawienie pokazuje, że wśród badanych osób 27,83% było w trakcie badania w depresji. Osób, które nie były w depresji jest 4 443, co stanowi 72,17% liczebności próby. 9 Wykaz tych symptomów został zamieszczony w załącznikach. 10 A. T. Beck, C. H. Ward, M. Mendelson, J. Mock, J. Erbaugh, An inventory for measuring depression, Archives of General Psychiatry, 1961, nr 4,s

10 Zmienne objaśniające: wiek zmienna ciągła odzwierciedlająca wiek respondenta Przyjmuje wartości od 16 do 95 lat, średnia wynosi 45 lat. Wykres 1. Histogram zmiennej wiek Density wiek respondenta stan_cyw zmienna binarna kodująca stan cywilny respondenta 1 kawaler/panna 2 będący w związku małżeńskim 3 wdowa/wdowiec 4 rozwodnik/rozwódka 5 osoba w separacji 6 będący w nieformalnym związku Tabela 2. Charakterystyka zmiennej stan_cyw stan cywilny respondenta Freq. Percent Cum kawaler 1, Ŝonaty 3, wdowiec rozwiedziony separacja nieformalny_związek Total 6,

11 Badana próba dobrze odzwierciedla przekrój polskiego społeczeństwa, w którym większość stanowią małżeństwa, w naszej próbie jest ich 61,09%. Najmniejszy udział mają osoby w separacji i będące w nieformalnym związku, odpowiednio 0,52% i 0,65%. Na potrzeby estymacji zmienna została podzielona na zmienne zerojedynkowe: stan_cyw_1 0 gdy respondent jest stanu innego niż wolny 1 gdy respondent jest stanu wolnego stan_cyw_2 0 gdy respondent nie jest w związku małżeńskim 1 gdy respondent jest w związku małżeńskim stan_cyw_3 0 gdy respondent nie jest wdowcem lub wdową 1 gdy respondent jest wdowcem lub wdową stan_cyw_4 0 gdy respondent nie jest rozwiedziony 1 gdy respondent jest rozwiedziony stan_cyw_5 0 gdy respondent nie znajduje się w separacji 1 gdy respondent jest w separacji stan_cyw_6 0 gdy respondent nie znajduje się w nieformalnym związku 1 gdy respondent jest w nieformalnym związku 11

12 doch zmienna ciągła odzwierciedlająca miesięczny dochód na osobę w rodzinie respondenta. 750,70 zł. Przyjmuje wartości od 20 złotych do złotych. Średnia wartość wyniosła Wykres 2. Histogram zmiennej doch Density 0 5.0e miesięczny dochód na osobę w rodzinie respondenta przyjaciele liczba przyjaciół posiadanych przez respondenta, zmienna skokowa ciągła. Średnia liczba przyjaciół, posiadanych przez przebadanych respondentów, wyniosła 5 przyjaciół. Wykres 3. Histogram zmiennej przyjaciele Density liczba przyjaciół respondenta alkohol zmienna binarna określająca czy respondent nadużywa alkoholu 0 jeśli respondent nie nadużywa alkoholu 1 jeśli respondent nadużywa alkoholu 12

13 Tabela 3. Charakterystyka zmiennej alkohol naduŝywanie alkoholu Freq. Percent Cum nie 5, tak Total 6, alkoholu. W badanej próbie 6,17% osób przyznało się, że zdarza się im nadużywać bezrobocie zm. binarna odzwierciedlająca fakt czy respondent jest bezrobotny 0 jeśli respondent nie jest bezrobotny 1 jeśli respondent jest bezrobotny Tabela 4. Charakterystyka zmiennej bezrobocie bycie na bezrobociu Freq. Percent Cum tak nie 5, Total 6, Wśród ankietowanych, blisko co dziesiąta osoba była bezrobotna. plec zmienna binarna kodująca płeć respondenta, przyjmuje wartości: 0 jeśli respondent jest mężczyzną 1 jeśli respondent jest kobietą Tabela 5. Charakterystyka zmiennej plec płeć respondenta Freq. Percent Cum męŝczyzna 2, kobieta 3, Total 6, % badanej próby stanowili mężczyźni, kobiety 53%. wyksz zmienna binarna przedstawiająca poziom wykształcenia respondenta: 13

14 1 podstawowe 2 zawodowe 3 średnie 4 wyższe Tabela 6. Charakterystyka zmiennej wyksz wykształcen ie respondenta Freq. Percent Cum podstawowe 1, zawodowe 1, średnie 2, wyŝsze Total 6, Na potrzeby estymacji zmienna wyksz została podzielona na zmienne zerojedynkowe: wyksz_1 0 gdy respondent ma wykształcenie inne niż podstawowe 1 gdy respondent ma wykształcenie podstawowe wyksz_2 0 gdy respondent ma wykształcenie inne niż zawodowe 1 gdy respondent ma wykształcenie zawodowe wyksz_3 0 gdy respondent ma wykształcenie inne niż średnie 1 gdy respondent ma wykształcenie średnie wyksz_4 0 gdy respondent ma wykształcenie inne niż wyższe 1 gdy respondent ma wyższe wykształcenie 14

15 rel zmienna binarna kodująca częstotliwość brania udziału w nabożeństwach lub innych spotkaniach o charakterze religijnym; przyjmowała następujące poziomy: 0 0 razy w miesiącu razy w miesiącu 4 4 razy w miesiącu 5 5 i więcej razy w miesiącu Tabela 7. Charakterystyka zmiennej rel ile razy w miesiącu bierze respondent udział w naboŝeństwa ch lub innych spot Freq. Percent Cum , , , Total 6, Wśród przebadanych respondentów ok. 33% zadeklarowało, że 4 razy w miesiącu uczestniczy w nabożeństwach lub innych spotkaniach o charakterze religijnym. 30,7% osób odpowiedziało, że są niepraktykujący. W spotkaniach religijnych i nabożeństwach sporadycznie (od 1 do 3 razy w miesiącu) bierze udział 22,32%, natomiast ok. 14% respondentów chodzi na nie częściej niż 4 razy w miesiącu. Na potrzeby estymacji zmienna rel została podzielona na następujące zmienne zerojedynkowe: rel_0 0 gdy respondent bierze udział nabożeństwach lub innych spotkaniach o charakterze religijnym 1 gdy respondent nie bierze udziału w praktykach religijnych rel_1 0 gdy respondent nie bierze udziału w nabożeństwach lub uczestniczy w nich częściej niż 3 razy w miesiącu 1 gdy respondent bierze udział w nabożeństwach 1-3 razy w miesiącu 15

16 rel_4 0 gdy respondent nie uczestniczy w nabożeństwach i innych spotkaniach religijnych równo 4 razy w miesiącu 1 gdy respondent bierze udział w nabożeństwach lub innych spotkaniach religijnych 4 razy w miesiącu rel_5 0 gdy respondent nie bierze udziału w nabożeństwach lub uczestniczy w nich rzadziej niż 5 razy w miesiącu 1 gdy respondent bierze udział w nabożeństwach lub innych spotkaniach religijnych częściej niż 4 razy w miesiącu 3. Oszacowanie modelu 3.1. Zastosowanie Liniowego Modelu Prawdopodobieństwa W tym podrozdziale zostanie przedstawiony najprostszy model - Liniowy Model Prawdopodobieństwa (LMP). Przy pomocy komendy reg wyestymowano na początku następujący model MNK: Wykres 4. Wynik regresji LMP. xi: reg depr wiek i.stan_cyw doch przyjaciele i.alkohol i.bezrobocie i.plec i.wyksz i.rel Source SS df MS Number of obs = F( 17, 6138) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = depr Coef. Std. Err. t P> t [95% Conf. Interval] wiek _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ doch e e-06 przyjaciele _Ialkohol_ _Ibezroboc~ _Iplec_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Irel_ _Irel_ _Irel_ _cons

17 W celu zbadania czy zmienne stan_cyw_4, stan_cyw_6, bezrobocie, rel_1, rel_5 łącznie są nieistotne wykonujemy test Walda, którego wyniki znajdują się w poniższej: (H 0 : β bezrobocie_2 = β stan_cyw_6 =β stan_cyw_4 = = β rel_1 =β rel_5 =0; H 1 : zmienne istotne) ( 1) _Ibezroboci_2 = 0 ( 2) _Istan_cyw_6 = 0 ( 3) _Istan_cyw_4 = 0 ( 4) _Irel_1 = 0 ( 5) _Irel_5 = 0 F( 5, 6138) = 1.32 Prob > F = Wyniki testu Walda mówią nam, że zmienne: stan_cyw_4, stan_cyw_6, bezrobocie, rel_1, rel_5 są nieistotne (p-value=0.2513, a zatem nie ma podstaw do odrzucenia H0 o tym, że zmienne te są nieistotne). Po usunięciu powyższych zmiennych, uzyskano następujący model: Tabela 8. Tabela 12. Wynik regresji LMP. xi: reg depr wiek Istan_cyw_2 Istan_cyw_3 Istan_cyw_5 doch przyjaciele i.alkohol i.plec i.wyksz Irel > _4 i.alkohol _Ialkohol_1-2 (naturally coded; _Ialkohol_1 omitted) i.plec _Iplec_1-2 (naturally coded; _Iplec_1 omitted) i.wyksz _Iwyksz_1-4 (naturally coded; _Iwyksz_1 omitted) Source SS df MS Number of obs = F( 12, 6143) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE =.383 depr Coef. Std. Err. t P> t [95% Conf. Interval] wiek Istan_cyw_ Istan_cyw_ Istan_cyw_ doch e e-06 przyjaciele _Ialkohol_ _Iplec_ _Iwyksz_ _Iwyksz_ _Iwyksz_ Irel_ _cons Model wydaje się poprawny, gdyż zmienne objaśniające łącznie są istotne: Prob > F = , co jest mniejsze od założonego poziomu istotności 5 %, a zatem odrzucamy hipotezę zerową o łącznej nieistotności zmiennych. Zmienne objaśniające pojedynczo również są istotne (p-value < 0.05, a zatem odrzucamy hipotezę zerową o nieistotności zmiennej). 17

18 Jednak z LMP wiąże się występowanie dwóch wad: heteroskedastyczność składnika losowego oraz brak gwarancji, że prawdopodobieństwo wystąpienia wartości dopasowanych znajdzie się w przedziale [0,1]. Homoskedastyczność składnika losowego zbadano za pomocą testu Breuscha- Pagana, którego wyniki zamieszczono poniżej. H 0 : Var (ε i ) = σ 2 (składnik losowy jest homoskedastyczny) H 1 : Var (ε i ) = σ 2 (składnik losowy jest heteroskedastyczny). hettest Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: fitted values of depr chi2(1) = Prob > chi2 = Ponieważ Prob > chi2 = więc jest mniejsze niż zadany poziom istotności 5 %, a zatem odrzucamy hipotezę zerową o homoskedastyczności. Przeprowadzona analiza potwierdziła występowanie w modelu heteroskedastyczności. Drugą wadę sprawdzono poprzez użycie komendy sum yhat, gdzie yhat to wartości dopasowane i otrzymano: Tabela 9. Wartości dopasowane w LPM sum yhat Variable Obs Mean Std. Dev. Min Max yhat Dwie ostatnie wartości z powyższej tabeli wskazują na występowanie w LMP również drugiej wady prawdopodobieństwo wystąpienia wartości dopasowanych należy do przedziału [-0,25;1,08]. W estymacji wystąpiło 14 przypadków, w których wartość dopasowana była większa od 1 i 515 przypadków gdzie była mniejsza od 0. Wartości dopasowanych spoza przedziału [0,1] nie da się zinterpretować, gdyż prawdopodobieństwo nie może być mniejsze od 0 lub większe od 1. Heteroskedastyczność składnika losowego, powoduje, iż otrzymane statystyki testowe są nieprawidłowe i nie możliwe jest dokonanie wnioskowania statystycznego. Otrzymane wyniki jednoznacznie wykluczają Liniowy Model Prawdopodobieństwa. 18

19 3.2. Estymacja modelu logit i probit Decyzja związana z odrzuceniem Liniowego Modelu Prawdopodobieństwa skłania do wybrania pomiędzy modelem logit a probit. Estymowaliśmy kilkakrotnie modele logit, a następnie probit tak aby wyeliminować nieistotne zmienne objaśniające. Następnie dokonaliśmy diagnostyki i interpretacji miar dopasowania. Przebieg naszej pracy został przedstawiony w dalszej części tego rozdziału Model logit - wybór zmiennych do modelu Na początku dokonaliśmy regresji modelu logit wykorzystując wszystkie zaproponowane przez nas zmienne objaśniające. Model ten nazwaliśmy logit bez ograniczeń. Tabela 10. Regresja modelu logit bez ograniczeń xi: logit depr wiek i.stan_cyw doch przyjaciele i.alkohol i.bezrobocie i.plec i.wyksz i.rel Logistic regression Number of obs = 6156 LR chi2(17) = Prob > chi2 = Log likelihood = Pseudo R2 = depr Coef. Std. Err. z P> z [95% Conf. Interval] wiek _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ doch przyjaciele _Ialkohol_ _Ibezroboc~ _Iplec_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Irel_ _Irel_ _Irel_ _cons Wśród estymowanych zmiennych uwagę zwróciły zmienne nieistotne: stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5. W celu zweryfikowania ich istotności za pomocą odpowiednich testów, dokonaliśmy regresji modelu logit z ograniczeniami - bez zmiennych stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5. 19

20 Tabela 11. Regresja modelu logit z ograniczeniami xi: logit depr wiek Istan_cyw_3 Istan_cyw_4 Istan_cyw_5 doch przyjaciele i.alkohol i.plec i.wyksz Irel_4 Logistic regression Number of obs = 6156 LR chi2(12) = Prob > chi2 = Log likelihood = Pseudo R2 = depr Coef. Std. Err. z P> z [95% Conf. Interval] wiek Istan_cyw_ Istan_cyw_ Istan_cyw_ doch przyjaciele _Ialkohol_ _Iplec_ _Iwyksz_ _Iwyksz_ _Iwyksz_ Irel_ _cons W celu zbadania czy zmienne stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5 łącznie są nieistotne wykonujemy test LR, którego wyniki znajdują się poniżej: (H 0 : β stan_cyw_2 =β stan_cyw_6 = β bezrobocie_2 = β rel_1 =β rel_5 =0; H 1 : zmienne istotne). lrtest logit_bez_ogr logit_z_ogr, stats Likelihood-ratio test LR chi2(5) = 5.69 (Assumption: logit_z_ogr nested in logit_bez_ogr) Prob > chi2 = Model Obs ll(null) ll(model) df AIC BIC logit_z_ogr logit_bez_~r Statystyka testu LR wynosi 5.69, p-value=0.3380>0.05, a zatem nie ma podstaw do odrzucenia H0 o istotności ograniczeń. Również kryteria informacyjne AIC i BIC (mniejsze dla logitu z ograniczeniami) świadczą o tym, że lepszy jest model logit z ograniczeniami. Zmienne stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5 można uznać za nieistotne w modelu. Aby jeszcze to potwierdzić stosujemy test Walda: (H 0 : β stan_cyw_2 =β stan_cyw_6 = β bezrobocie_2 = β rel_1 =β rel_5 =0; H 1 : zmienne istotne). test _Ibezroboci_2 _Istan_cyw_6 _Istan_cyw_2 _Irel_1 _Irel_5 ( 1) _Ibezroboci_2 = 0 ( 2) _Istan_cyw_6 = 0 ( 3) _Istan_cyw_2 = 0 ( 4) _Irel_1 = 0 ( 5) _Irel_5 = 0 chi2( 5) = 5.41 Prob > chi2 =

21 Również test Walda mówi, że zmienne stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5 są nieistotne (p-value=0.3684, a zatem nie ma podstaw do odrzucenia H0 o tym, że zmienne te są nieistotne). Przyjmujemy więc do dalszej analizy model bez tych zmiennych. W modelu tym łącznie wszystkie zmienne objaśniające są istotne (statystyka LR chi2 = , Prob > chi2 = jest mniejsze niż zadany poziom istotności α = 0.05, a zatem odrzucamy H0 o łącznej nieistotności zm. objaśniających) Diagnostyka i testy modelu logit Test typu związku (linktest) Przed przystąpieniem do weryfikacji hipotez należy sprawdzić czy przyjęty model jest prawidłowo wyspecyfikowany. W tym celu przeprowadzono test typu związku, który jest uogólnieniem testu RESET. Wyniki prezentuje poniższa tabela: Tabela 12. Test typu związku. linktest Logistic regression Number of obs = 6156 LR chi2(2) = Prob > chi2 = Log likelihood = Pseudo R2 = depr Coef. Std. Err. z P> z [95% Conf. Interval] _hat _hatsq _cons Jak widać zmienna hatsq jest nieistotna (p-value=0.798>0.05, nie mamy podstaw do odrzucenia H0 o nieistotności zmiennej hatsq). Wskazywało by to, iż dla wartości dopasowanych ważne są ich pierwsze a nie wyższe potęgi, a zatem mamy do czynienia z prawidłową postacią modelu. Wykonano również, znajdujące się poniżej, testy Pearsona i Hosmera Lemeshow a, na poprawność formy funkcyjnej, w których: H 0 : zastosowana forma funkcyjna jest prawidłowa H 1 : zastosowana forma funkcyjna nie jest prawidłowa 21

22 Test jakości dopasowania Pearsona (goodness of fit test) Tabela 13. Wynik testu Pearsona. estat gof Logistic model for depr, goodness-of-fit test number of observations = 6156 number of covariate patterns = 6105 Pearson chi2(6092) = Prob > chi2 = Test wersja Hosmera-Lemeshow'a - dzielimy na 10 podprób według decyli wartości dopasowanych: Tabela 14. Wynik testu Hosmera Lemeshow a.. estat gof, group(10) table /*H0: poprawna forma funkcyjna*/ Logistic model for depr, goodness-of-fit test (Table collapsed on quantiles of estimated probabilities) Group Prob Obs_1 Exp_1 Obs_0 Exp_0 Total number of observations = 6156 number of groups = 10 Hosmer-Lemeshow chi2(8) = 8.73 Prob > chi2 = W teście Pearsona chi2(6092) = , p-value = < 0.05, który jest wartością zadanego poziomu istotności, zatem odrzucamy hipotezę zerową wskazującą na poprawność formy funkcyjnej. Gdybyśmy jednak przyjęli istotność na poziomie 0.01 (p-value = > 0.01) to nie mielibyśmy podstaw do odrzucenie H0 o poprawności funkcyjnej modelu. 22

23 Wyniki testu Hausmana Lemeshow a, to: chi2(7) = 8.73, a p-value = > 0.05 (zadany poziom istotności), zatem w tym teście nie odrzucamy hipotezy zerowej, wskazującej na poprawność formy funkcyjnej. W związku z tym, że użyta tu wersja testu Pearsona charakteryzuje się małą mocą (w szczególności, jeśli podpróby są mało liczne; tak jest w naszym przypadku) możemy zaufać pozostałym testom - Hausmana Lemeshow a i uogólnionemu testowi RESET, które potwierdziły, iż przyjęta forma funkcyjna jest prawidłowa i model został odpowiednio wyspecyfikowany Analiza dopasowania W tym miejscu należałoby przyjrzeć się bliżej wskaźnikom determinacji. Miary dopasowania Tabela 15. Miary dopasowania modelu logit. fitstat Measures of Fit for logit of depr Log-Lik Intercept Only: Log-Lik Full Model: D(6143): LR(12): Prob > LR: McFadden's R2: McFadden's Adj R2: Maximum Likelihood R2: Cragg & Uhler's R2: McKelvey and Zavoina's R2: Efron's R2: Variance of y*: Variance of error: Count R2: Adj Count R2: AIC: AIC*n: BIC: BIC': Uzyskany model dla zmiennej ukrytej y * i byłby wyjaśniany w 38,4%, gdyby zmienna ta była bezpośrednio obserwowalna (pseudo R² McKelvey-Zavoina=0.384). Model prawidłowo przewiduje sukcesy i porażki w 79,5% przypadków (R² liczebnościowe=0.795). Dzięki użyciu w zmiennych objaśniających model prawidłowo przewiduje sukcesy i porażki w 26,4% przypadków (skorygowane liczebnościowe R²=0.264). Kolejnym analizowanym elementem jest wrażliwość i specyficzność modelu. Wrażliwość i specyficzność Im lepiej model przewiduje, tym bardziej krzywa ROC odgięta jest w kierunku górnego rogu rysunku. Pole pod krzywą używane jest jako miara jakości dopasowania modelu. U nas wynosi ono 0,8224 (max 1). Jest to procent dobrze zakwalifikowanych 23

24 pozytywnych i negatywnych odpowiedzi przy różnych wyborach punktu rozdzielającego decyzję. Wynik 82,24% świadczy o dobrej trafności dopasowania modelu do danych wyjściowych. Wykres 5. Krzywa ROC. lroc, title(roc dla logitu) Logistic model for depr number of observations = 6156 area under ROC curve = Sensitivity ROC dla logitu Specificity Area under ROC curve = Z kolejnego wykresu odczytać można, prawdopodobieństwo ucięcia poziom rozgraniczenia maksymalizującego trafność klasyfikacji wartości dopasowanych. Przyjęliśmy, iż najlepsze cięcie jest w punkcie 0,27. Wykres 6. Wykres wrażliwości i specyficzności. Sensitivity/Specificity Probability cutoff Sensitivity Specificity 24

25 liczebności: Dla wyznaczonego prawdopodobieństwa cięcia wyznaczona zostały tabela Tabela 16. Klasyfikacja modelu ( punkt odcięcia równy 0.27). lstat,cutoff(0.27) Logistic model for depr True Classified D ~D Total Total Classified + if predicted Pr(D) >=.27 True D defined as depr!= Sensitivity Pr( + D) 75.89% Specificity Pr( - ~D) 74.07% Positive predictive value Pr( D +) 53.02% Negative predictive value Pr(~D -) 88.85% False + rate for true ~D Pr( + ~D) 25.93% False - rate for true D Pr( - D) 24.11% False + rate for classified + Pr(~D +) 46.98% False - rate for classified - Pr( D -) 11.15% Correctly classified 74.58% Powyższa tabela pokazuje, że na 1713 obserwacji, w których u badanego respondenta zaobserwowano objawy depresji, model prawidłowo przewidział 1300 z nich, a tylko 413 osób (24,11 % liczebności grupy) zakwalifikował błędnie. Wrażliwość wyniosła 75,89%, co znaczy że model prawidłowo przewidział 75,89% przypadków depresji tam gdzie faktycznie była ona zaobserwowana. Specyficzność równa 74,07% świadczy o tym, że wśród osób u których nie zaobserwowano depresji prawidłowo zostało przewidziane 74,07% takich przypadków. Wśród 4443 ankietowanych, którzy nie wykazywali depresji, 1152 osób (czyli 25,93%) zostało błędnie zdiagnozowanych. Podsumowując, średnio 74,58 % wszystkich obserwacji zostało trafnie zaklasyfikowanych Wybór zmiennych do modelu probit Na początku dokonaliśmy regresji modelu probit wykorzystując wszystkie zaproponowane przez nas zmienne objaśniające. Model ten nazwaliśmy probit bez ograniczeń. Wyniki estymacji znajdują się w tabeli na następnej stronie. 25

26 Tabela 17. Regresja modelu probit bez ograniczeń xi: probit depr wiek i.stan_cyw doch przyjaciele i.alkohol i.bezrobocie i.plec i.wyksz i.rel Probit regression Number of obs = 6156 LR chi2(17) = Prob > chi2 = Log likelihood = Pseudo R2 = depr Coef. Std. Err. z P> z [95% Conf. Interval] wiek _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ _Istan_cyw_ doch przyjaciele _Ialkohol_ _Ibezroboc~ _Iplec_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Irel_ _Irel_ _Irel_ _cons Wśród estymowanych zmiennych uwagę zwróciły zmienne nieistotne: stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5. W celu zweryfikowania ich istotności za pomocą odpowiednich testów, dokonaliśmy regresji modelu probit z ograniczeniami - bez zmiennych stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5. Tabela 18. Regresja modelu probit z ograniczeniami. xi: probit depr wiek Istan_cyw_3 Istan_cyw_4 Istan_cyw_5 doch przyjaciele i.alkohol i.plec i.wyksz Irel_4 Probit regression Number of obs = 6156 LR chi2(12) = Prob > chi2 = Log likelihood = Pseudo R2 = depr Coef. Std. Err. z P> z [95% Conf. Interval] wiek Istan_cyw_ Istan_cyw_ Istan_cyw_ doch przyjaciele _Ialkohol_ _Iplec_ _Iwyksz_ _Iwyksz_ _Iwyksz_ Irel_ _cons W celu zbadania czy zmienne stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5 łącznie są nieistotne wykonujemy test LR; wyniki znajdują się na następnej stronie. (H 0 : β stan_cyw_2 =β stan_cyw_6 = β bezrobocie_2 = β rel_1 =β rel_5 =0; H 1 : zmienne istotne) 26

27 Likelihood-ratio test LR chi2(5) = 5.01 (Assumption: probit_z_ogr nested in probit_bez_ogr) Prob > chi2 = Model Obs ll(null) ll(model) df AIC BIC probit_z_ogr probit_bez~r Statystyka testu LR wynosi 5.01, p-value=0.4146>0.05, a zatem nie ma podstaw do odrzucenia H0 o istotności ograniczeń. Również kryteria informacyjne AIC i BIC (mniejsze dla probitu z ograniczeniami) świadczą o tym, że lepszy jest model probit z ograniczeniami. Zmienne stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5 można uznać za nieistotne w modelu. Aby jeszcze to potwierdzić stosujemy test Walda: (H 0 : β stan_cyw_2 =β stan_cyw_6 = β bezrobocie_2 = β rel_1 =β rel_5 =0; H 1 : zmienne istotne). test _Ibezroboci_2 _Istan_cyw_6 _Istan_cyw_2 _Irel_1 _Irel_5 ( 1) _Ibezroboci_2 = 0 ( 2) _Istan_cyw_6 = 0 ( 3) _Istan_cyw_2 = 0 ( 4) _Irel_1 = 0 ( 5) _Irel_5 = 0 chi2( 5) = 4.78 Prob > chi2 = Również test Walda mówi, że zmienne stan_cyw_2, stan_cyw_6, bezrobocie, rel_1, rel_5 są nieistotne (p-value=0.4430>0.05, a zatem nie ma podstaw do odrzucenia H0 o tym, że zmienne te są nieistotne). Do dalszych rozważań przyjmujemy więc model probit z ograniczeniami. W modelu tym łącznie wszystkie zmienne objaśniające są istotne (stat. LR chi2 = , Prob > chi2 = 0 i jest mniejsze niż zadany poziom istotności α = 0.05, a zatem odrzucamy H0 o łącznej nieistotności zm. objaśniających) Diagnostyka i testy modelu probit Test typu związku (linktest) Przed przystąpieniem do weryfikacji hipotez należy sprawdzić czy przyjęty model jest prawidłowo wyspecyfikowany. W tym celu przeprowadzono test typu związku, który jest uogólnieniem testu RESET. Wyniki prezentuje poniższa tabela: Tabela 19. Test typu związku. linktest Probit regression Number of obs = 6156 LR chi2(2) = Prob > chi2 = Log likelihood = Pseudo R2 = depr Coef. Std. Err. z P> z [95% Conf. Interval] _hat _hatsq _cons

28 Jak widać zmienna hatsq jest nieistotna (p-value=0.343>0.05, nie mamy podstaw do odrzucenia H0 o nieistotności zmiennej hatsq ), Wskazywało by to, iż dla wartości dopasowanych ważne są ich pierwsze a nie wyższe potęgi, a zatem mamy do czynienia z prawidłową postacią modelu. Wykonano również, znajdujące się poniżej, testy Pearsona i Hosmera Lemeshow a, na poprawność formy funkcyjnej, w których: H 0 : zastosowana forma funkcyjna jest prawidłowa H 1 : zastosowana forma funkcyjna nie jest prawidłowa Test jakości dopasowania Pearsona (goodness of fit test) Tabela 20. Wynik testu Pearsona. estat gof Probit model for depr, goodness-of-fit test number of observations = 6156 number of covariate patterns = 6105 Pearson chi2(6092) = Prob > chi2 = Test wersja Hosmera-Lemeshow'a - dzielimy na 10 podprób według decyli wartości dopasowanych: Tabela 21. Wynik testu Hosmera Lemeshow a estat gof, group(10) table Probit model for depr, goodness-of-fit test (Table collapsed on quantiles of estimated probabilities) Group Prob Obs_1 Exp_1 Obs_0 Exp_0 Total number of observations = 6156 number of groups = 10 Hosmer-Lemeshow chi2(8) = Prob > chi2 = W teście Pearsona chi2(6092) = , p-value = < 0.05, który jest wartością zadanego poziomu istotności, zatem odrzucamy hipotezę zerową wskazującą na poprawność formy funkcyjnej. 28

29 Wyniki testu Hausmana Lemeshow a, to: chi2(8) = 13.57, a p-value = > 0.05 (zadany poziom istotności), zatem w tym teście nie odrzucamy hipotezy zerowej, wskazującej na poprawność formy funkcyjnej. W związku z tym, że użyta tu wersja testu Pearsona charakteryzuje się małą mocą (w szczególności, jeśli podpróby są mało liczne; tak jest w naszym przypadku) możemy zaufać pozostałym testom - Hausmana Lemeshow a i uogólnionemu testowi RESET, które potwierdziły, iż przyjęta forma funkcyjna jest prawidłowa i model został odpowiednio wyspecyfikowany Analiza dopasowania W tym miejscu należałoby przyjrzeć się bliżej wskaźnikom determinacji. Miary dopasowania Tabela 22. Miary dopasowania modelu probit. fitstat Measures of Fit for probit of depr Log-Lik Intercept Only: Log-Lik Full Model: D(6143): LR(12): Prob > LR: McFadden's R2: McFadden's Adj R2: Maximum Likelihood R2: Cragg & Uhler's R2: McKelvey and Zavoina's R2: Efron's R2: Variance of y*: Variance of error: Count R2: Adj Count R2: AIC: AIC*n: BIC: BIC': Uzyskany model dla zmiennej ukrytej y * i byłby wyjaśniany w 40%, gdyby zmienna ta była bezpośrednio obserwowalna (pseudo R² McKelvey-Zavoina=0.4). Model prawidłowo przewiduje sukcesy i porażki w 79,5% przypadków (R² liczebnościowe=0.795). Dzięki użyciu w zmiennych objaśniających model prawidłowo przewiduje sukcesy i porażki w 26,3% przypadków (skorygowane liczebnościowe R²=0.264). Kolejnym analizowanym elementem jest wrażliwość i specyficzność modelu. Wrażliwość i specyficzność Im lepiej model przewiduje, tym bardziej krzywa ROC odgięta jest w kierunku górnego rogu rysunku. Pole pod krzywą używane jest jako miara jakości dopasowania 29

Pokazać jeszcze