Rozdział 6 MODELE ZMIENNEJ JAKOŚCIOWEJ



Podobne dokumenty
Natalia Nehrebecka. Zajęcia 4

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

Natalia Nehrebecka. Zajęcia 3

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada. Zajęcia 3

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Natalia Nehrebecka. Wykład 2

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. Strona 1

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

65120/ / / /200

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

EKONOMETRIA I Spotkanie 1, dn

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Ntli Natalia Nehrebecka. Dariusz Szymański. Zajęcia 4

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

dy dx stąd w przybliżeniu: y

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

Egzamin ze statystyki/ Studia Licencjackie Stacjonarne/ Termin I /czerwiec 2010

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

0 0,2 0, p 0,1 0,2 0,5 0, p 0,3 0,1 0,2 0,4

EKONOMETRIA Wykład 4: Model ekonometryczny - dodatkowe zagadnienia

Mikroekonometria 10. Mikołaj Czajkowski Wiktor Budziński

Natalia Nehrebecka. Dariusz Szymański

KURS STATYSTYKA. Lekcja 1 Statystyka opisowa ZADANIE DOMOWE. Strona 1

ANALIZA KORELACJI WYDATKÓW NA KULTURĘ Z BUDŻETU GMIN ORAZ WYKSZTAŁCENIA RADNYCH

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

Analiza rodzajów skutków i krytyczności uszkodzeń FMECA/FMEA według MIL STD A

Weryfikacja hipotez dla wielu populacji

1.1. Uprość opis zdarzeń: 1.2. Uprościć opis zdarzeń: a) A B A Uprościć opis zdarzeń: 1.4. Uprościć opis zdarzeń:

Statystyka Opisowa 2014 część 2. Katarzyna Lubnauer

Statystyka. Zmienne losowe

Modele wieloczynnikowe. Modele wieloczynnikowe. Modele wieloczynnikowe ogólne. α β β β ε. Analiza i Zarządzanie Portfelem cz. 4.

Analiza danych OGÓLNY SCHEMAT. Dane treningowe (znana decyzja) Klasyfikator. Dane testowe (znana decyzja)

Rozkład dwupunktowy. Rozkład dwupunktowy. Rozkład dwupunktowy x i p i 0 1-p 1 p suma 1


Dobór zmiennych objaśniających

Proces narodzin i śmierci

Mikroekonometria 10. Mikołaj Czajkowski Wiktor Budziński

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

Analiza struktury zbiorowości statystycznej

Mikroekonometria 15. Mikołaj Czajkowski Wiktor Budziński

Funkcje i charakterystyki zmiennych losowych

Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE

Stanisław Cichocki. Natalia Nehrebecka. Wykład 11

Statystyka Inżynierska

Analiza korelacji i regresji

Parametry zmiennej losowej

Badania sondażowe. Braki danych Konstrukcja wag. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

Nieparametryczne Testy Istotności

IID = 2. i i i i. x nx nx nx

Procedura normalizacji

Prawdopodobieństwo i statystyka r.

I. Elementy analizy matematycznej

Badanie współzaleŝności dwóch cech ilościowych X i Y. Analiza korelacji prostej. Badanie zaleŝności dwóch cech ilościowych. Analiza regresji prostej

STATYSTYKA MATEMATYCZNA

0. Oszacowanie kilku prostych regresji, interpretacja oszacować parametrów

Wykłady Jacka Osiewalskiego. z Ekonometrii. CZĘŚĆ PIERWSZA: Modele Regresji. zebrane ku pouczeniu i przestrodze

Plan wykładu: Typowe dane. Jednoczynnikowa Analiza wariancji. Zasada: porównać zmienność pomiędzy i wewnątrz grup

WPROWADZENIE DO ANALIZY KORELACJI I REGRESJI

Zjawiska masowe takie, które mogą wystąpid nieograniczoną ilośd razy. Wyrazów Obcych)

Kształtowanie się firm informatycznych jako nowych elementów struktury przestrzennej przemysłu

STATYSTYKA. Zmienna losowa skokowa i jej rozkład

6. ROŻNICE MIĘDZY OBSERWACJAMI STATYSTYCZNYMI RUCHU KOLEJOWEGO A SAMOCHODOWEGO

DZIAŁALNOŚĆ INWESTYCYJNA GOSPODARSTW ROLNYCH

Metody predykcji analiza regresji

Problemy jednoczesnego testowania wielu hipotez statystycznych i ich zastosowania w analizie mikromacierzy DNA

Zaawansowane metody numeryczne Komputerowa analiza zagadnień różniczkowych 1. Układy równań liniowych

OeconomiA copernicana 2013 Nr 3. Modele ekonometryczne w opisie wartości rezydualnej inwestycji

Regresja liniowa i nieliniowa

Statystyka Opisowa 2014 część 1. Katarzyna Lubnauer

Ekonometria ćwiczenia Kolokwium 1 semestr 20/12/08. / 5 pkt. / 5 pkt. / 5 pkt. / 5 pkt. /20 pkt. Regulamin i informacje dodatkowe

Zapis informacji, systemy pozycyjne 1. Literatura Jerzy Grębosz, Symfonia C++ standard. Harvey M. Deitl, Paul J. Deitl, Arkana C++. Programowanie.

Proste modele ze złożonym zachowaniem czyli o chaosie

MATEMATYKA POZIOM ROZSZERZONY Kryteria oceniania odpowiedzi. Arkusz A II. Strona 1 z 5

SZTUCZNA INTELIGENCJA

SYSTEMY UCZĄCE SIĘ WYKŁAD 7. KLASYFIKATORY BAYESA. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Definicje ogólne

Model 1: Estymacja KMNK z wykorzystaniem 4877 obserwacji Zmienna zależna: y

Portfele zawierające walor pozbawiony ryzyka. Elementy teorii rynku kapitałowego

Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej

gdzie. Dla funkcja ma własności:

Matematyka ubezpieczeń majątkowych r.

Model ASAD. ceny i płace mogą ulegać zmianom (w odróżnieniu od poprzednio omawianych modeli)

Rozwiązania (lub wskazówki do rozwiązań) większości zadań ze skryptu STATYSTYKA: MATERIAŁY POMOCNICZE DO ZAJĘĆ oraz EGZAMINÓW Z LAT

Polityka dywidend w spółkach notowanych na Giełdzie Papierów Wartościowych w Warszawie w latach

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Oligopol dynamiczny. Rozpatrzmy model sekwencyjnej konkurencji ilościowej jako gra jednokrotna z pełną i doskonalej informacją

Modelowanie procesów i wspomaganie decyzji finansowych

Analiza regresji modele ekonometryczne

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

Trzecie laboratoria komputerowe ze Staty Testy


ELEKTROCHEMIA. ( i = i ) Wykład II b. Nadnapięcie Równanie Buttlera-Volmera Równania Tafela. Wykład II. Równowaga dynamiczna i prąd wymiany

8. Optymalizacja decyzji inwestycyjnych

Analiza zależności zmiennych ilościowych korelacja i regresja

Zad 2 Dynamika zatrudnienia mierzona indeksami łańcuchowymi w ostatnich pięciu latach kształtowały się następująco: Lata Indeksy ( w %)

Transkrypt:

Rozdzał 6 MODELE ZMIENNEJ JAKOŚCIOWEJ Wprowadzene W tym rozdzale zajmemy sę modelam dla zmennych jakoścowych jako zmennych objaśnanych w jednorównanowym modelu. To są take zmenne Y, których wartośc mają postać nemerzalnych kategor, na przykład: zatrudnony bezrobotny albo: bankrut ne-bankrut czy też: wykształcene podstawowe, średne, studa lcencjacke, studa magsterske nne. W tej sytuacj klasyczny model regresj ne jest specjalne użyteczny. Jeśl chodz o zmenne objaśnające (X, to nadal warto posługwać sę ch kombnacją lnową, jak w klasycznym jednorównanowym modelu. Jednak obecne ta lnowa kombnacja pownna być powązana ze zmenną objaśnaną za pomocą pewnej funkcj o postac nelnowej. Dlaczego? Z tego powodu, że kategore zmennej Y ne dają sę sensowne wyrazć lczbowo, można jedyne mówć o prawdopodobeństwe, że dla pewnej kombnacj zmennych X zmenna Y znajdze sę w pewnej kategor. Przyjęty w modelu rozkład prawdopodobeństwa decyduje właśne o postac wspomnanej nelnowej funkcj. Modele zmennych jakoścowych należą do mkroekonometr. A to dlatego, że są zazwyczaj stosowane do mkrodanych czyl danych ndywdualnych: o pracownkach, o bezrobotnych, o klentach banku, o frmach, o obywatelach, o osobach anketowanych td. Mkrodane gromadzone są w urzędach statystycznych, urzędach rejestracyjnych, burach badana opn, agencjach ratngowych, burach marketngowych td. To są zwykle dane przekrojowe, czasem też można meć do czynena z danym panelowym Mkrodane często powstają jako wynk badana anketowego: osób, konsumentów, frm, nwestorów td. Jeśl w drugej turze wyborów prezydenckch w Polsce anketer pyta przed lokalem wyborczym: na kogo pan/ pan głosowała, to otrzymuje odpowedź: na A lub na B (pomjając odpowedz ne głosowałam, skreślłam obu, oddałam głos neważny. Dla analtyka ważne byłoby powązane takch wynków (zmenna Y ze zmennym charakteryzującym daną osobę (zmenne X. Jako wartośc zmennych X anketer może podać płeć oraz przyblżony przedzał weku respondenta. Jeśl zada mu dodatkowe pytana, to otrzyma dalsze nformacje (wartośc kolejnych zmennych X. Tak czy naczej, na tej podstawe można próbować wyśwetlć zwązek zmennych X ze zmenną Y przy użycu pojęca prawdopodobeństwa. Warunkem jest odpowedno duża lczba obserwacj. Rozdzał 6 1

Modele zmennych jakoścowych znajdują zastosowane w ekonom, w fnansach, a także w welu naukach społecznych, w tym w demograf. Po przeczytanu tego rozdzału rozwązanu zadań oczekuje sę, że Czytelnk pownen umeć: skonstruować model dwumanowy dla opsu zmennej jakoścowej, odróżnć lnowy model prawdopodobeństwa od modelu probtowego logtowego, określć wrażlwość prawdopodobeństwa w modelu probtowym logtowym na zmenne objaśnające, podać przykładowe zastosowana modelu dla zmennych ucętych (modelu tobtowego. 6.1. Lnowy model prawdopodobeństwa Rozpocznemy od sytuacj, w której mmo, że zmenna Y jest zmenną jakoścową stosujemy jednak lnowy model regresj. PRZYKŁAD 6.1 Pęcuset studentów SGH pochodzących z Warszawy spytalśmy o to, gdze meszkają. Przy tym możlwe były tylko dwe odpowedz: z rodzcam lub samodzelne (zmenna Y. Zmenne X określające sytuację Y ( meszkam-ne-meszkam z rodzcam to: rok studów, płeć dochód rodzny za poprzedn rok (według PIT. Wartośc zmennej Y ustallśmy jako 0 (z rodzcam oraz 1 ( samodzelne. Dane meszkane_z_rodzcam, dostępne są na strone nternetowej podręcznka w formace programu gretl. Oszacowalśmy odpowedn model regresj za pomocą MNK otrzymalśmy następujący wynk: Model 1: Estymacja KMNK z wykorzystanem 500 obserwacj 1-500 Zmenna zależna: Y Zmenna Współczynnk Błąd stand. Statystyka t Wartość p const -0,0312077 0,0860583-0,363 0,71703 X1 0,0320255 0,0152510 2,100 0,03624 ** X2 0,00396163 0,000600157 6,601 <0,00001 *** X3-0,0996585 0,0425353-2,343 0,01953 ** Średna arytmetyczna zmennej zależnej = 0,476 Błąd standardowy reszt = 0,474389 Wsp. determnacj R-kwadrat = 0,10496 Statystyka F (3, 496 = 19,3884 (wartość p < 0,00001 Rozdzał 6 2

Zmenna X1 to rok studów (od 1 do 5, zmenna X2 oznacza dochód rodzny studenta w zeszłym roku (dokładnej: procent trzecego kwartyla przecętnego dochodu rodzny w Warszawe, X3 to płeć studenta/studentk (1 dla kobety, 0 dla mężczyzny. Mamy węc: Yˆ = 0,0312 + 0,0320 X1 + 0,0040 X2 0,0996 X3 Zmenna Y jest zmenną objaśnaną szczególnego rodzaju. To zmenna jakoścowa, która przyjmuje dwe wartośc 1 oraz 0. Można zadać pytane: co tak naprawdę przedstawa oszacowany model? Na jego podstawe można na przykład prognozować, że dla studentk trzecego roku, której rodzna mała dochód X2=100 wartość Y wynos 0,3652. Co oznacza ta lczba? Aby odpowedzeć na te pytana, zapszmy na początek model dla zmennej jakoścowej Y, dla prostoty z jedną tylko zmenną objaśnającą X: Y = α 0 + α 1 X + ε =1,2,...,n. (6.1 Nech Y oznacza fakt posadana domu przez tą rodznę (1=tak, 0=ne natomast X oznacza dochód tej rodzny. Czasam zmenną jakoścową Y można sobe wyobrazć jako zero-jedynkową reprezentantkę pewnej zmennej cągłej Y*, która jest neobserwowana (zmenna ukryta. W naszym przykładze Y* może oznaczać skłonność do posadana domu czyl coś czego ne da sę wyrazć lczbowo lecz możemy to coś wyobrazć sobe jako zmenną cągłą. Jeśl na przykład skłonność do posadana domu jest dodatna, to wówczas dana rodzna ma dom, a jeśl nedodatna to ne posada domu. Przy tym skłonność to tylko jedno z możlwych określeń zmennej Y* (można np. mówć o nklnacj, cążenu do, dążnośc td.. Poza tą teorą fakty są po prostu take, że ktoś ma dom, a ktoś nny go ne posada, czyl zamast Y* obserwujemy Y=1 lub Y=0. Typowy zbór obserwacj oraz wynk oszacowana klasyczną MNK wygląda tak jak na rys. 6.1 (tutaj: 50 obserwacj; dane posadane_domu na strone nternetowej podręcznka. Rozdzał 6 3

6.1. JPG Rysunek 6.1. Zależność pomędzy posadanem domu (Y dochodem (X Musmy teraz posunąć sę dalej, poza klasyczne rozważana o modelu lnowym szacowanym za pomocą MNK. Pownnśmy posłużyć sę nnym nż dotąd sposobem opsywana zmennej Y. Jest to zmenna jakoścowa, która ma dwa możlwe waranty (stany, sytuacje tp. opsane przy użycu kodów 0 1. Jest zatem dwumanowa. Pomyślmy o nej jak o zmennej losowej o dwóch możlwych wartoścach spytajmy o rozkład prawdopodobeństwa tej zmennej. Nech p oznacza prawdopodobeństwo zdarzena Y =1. Wtedy 1 p jest prawdopodobeństwem zdarzena Y =0. Wartość oczekwana zmennej Y to po prostu: E(Y = 1 p + 0 (1 p = p (6.2 Z kole, w modelu (6.1 zwykle zakładamy, że E(ε = 0, czyl wartość oczekwana Y według (6.1 równa sę: E(Y = α 0 + α 1 X, a zatem: p = α 0 + α 1 X. (6.3 W ten sposób dochodzmy do wnosku, że lna MNK na rysunku 6.1 reprezentuje p = P(Y =1, gdze P oznacza prawdopodobeństwo. Stąd sę berze nazwa modelu typu (6.1. Jest to lnowy model prawdopodobeństwa, w skróce LMP. Jeśl jest tak, że lna MNK z rysunku 6.1 reprezentuje prawdopodobeństwo, to wdać, że ma z tym kłopoty. Welkość prawdopodobeństwa pownna znajdować sę w przedzale <0,1>. LMP tego ne zapewna. Wdzmy, że dla klku wartośc X oszacowana lna regresj wykracza poza przedzał <0,1>. Druga wada LMP to heteroskedastyczność składnków losowych co powoduje, że dla estymacj pownno sę korzystać raczej z uogólnonej nż z kla- Rozdzał 6 4

sycznej MNK. Mmo tych nedoskonałośc, w praktycznych zastosowanach LMP stanow akceptowalne przyblżene zwązku mędzy p zmennym objaśnającym. Zapszmy LMP w ogólnejszej postac z k zmennym objaśnającym: Y = α 0 + α 1 X 1 +... + α k X k + ε =1,2,...,n. (6.4 Warto pamętać, że parametr α j (j=1,...,k w tym modelu nterpretuje sę jako przyrost prawdopodobeństwa p zwązany z przyrostem X j o jednostkę. PRZYKŁAD 6.1 (cąg dalszy Model oszacowany w przykładze 6.1 to lnowy model prawdopodobeństwa typu (6.4 gdze n=500 oraz k=3. Dla przykładu znterpretujmy ocenę parametru przy zmennej X1: z każdym rokem studów (ceters parbus prawdopodobeństwo meszkana samodzelne zwększa sę o 0,032. Podobne nterpretuje sę pozostałe parametry. Jak pamętamy, na podstawe modelu otrzymalśmy wartość 0,3652 jako prognozę zmennej Y dla studentk trzecego roku, której rodzna mała dochód X2=100. Jest to po prostu oszacowane pˆ prawdopodobeństwa tego, że Y=1 ( studentka meszka samodzelne. Na tej podstawe można postawć prognozę samej wartośc Y. Jeśl w próbe melśmy mnej węcej tyle samo wartośc Y=1 le Y=0, to zasadne jest postawene wnosku, że Y=1 dla pˆ > 0,5 oraz Y=0 dla pˆ < 0,5. W tym konkretnym przypadku próba mała strukturę 48:52. Prognozujemy zatem, że studentka meszka z rodzcam (czyl że Y=0. Warto przy okazj dodać, że akurat w tym modelu wszystke wartośc teoretyczne zmennej objaśnanej (czyl oszacowane prawdopodobeństwa znajdują sę w przedzale <0,1> LMP jest najprostszym modelem dla dwumanowej zmennej jakoścowej. Oszacowane wartośc zmennej Y reprezentują tu prawdopodobeństwo, że Y = 1. Jak wemy (por. rysunek 6.1 funkcja lnowa ne nadaje sę dobrze do reprezentowana zwązku mędzy zmenną objaśnającą a welkoścą tego prawdopodobeństwa. Takej wady ne mają nne modele, które omówmy w kolejnych podrozdzałach. Uwaga na temat R-kwadrat w mkroekonometr W LMP oszacowanym w przykładze 6.1 wartość R 2 jest równa 0,10. Czy to mało czy dużo? Żeby odpowedzeć na to pytane trzeba wedzeć, że: współczynnk R-kwadrat dla model szacowanych na podstawe szeregów czasowych jest zwykle wększy, nż dla szacowanych przy użycu danych przekrojowych; szereg czaso- Rozdzał 6 5

we w ekonom dotyczą na ogół kategor zagregowanych (np. w makroekonom, a agregaty wyjaśna sę zwykle łatwej nż wynk obserwacj dla pojedynczych osób, rodzn, frm (Wooldrdge 2003; test F łącznej stotnośc wszystkch zmennych w modelu lnowym w stoce weryfkuje hpotezę o stotnośc R 2 (to jest H 0 : R 2 =0; łatwo sprawdzć, że dla R-kwadrat równego 0,2 oraz n = 1000 k = 5 wartość F równa sę 49,7 oznacza odrzucene hpotezy zerowej na bardzo nskm pozome stotnośc; granczną (dla pozomu stotnośc 0,01 wartoścą R- kwadrat jest w tym przykładze 0,015; nawet tak nska wartość jest stotne różna od zera przy dostateczne dużej próbe; z kole, jeśl na przykład n = 20, to wartość granczna R- kwadrat wynos aż 0,63; jak wdać, dla dużych n nska wartość R 2 ne śwadczy o złym modelu; w LMP wartość R-kwadrat jest z reguły nska; można pokazać, że gdy prawdopodobeństwa p ne mają wartośc ekstremalnych (np. są w przedzale od 0,2 do 0,8, to R-kwadrat ma wartość ogranczoną do przedzału wartośc małych, blskch zeru; model może być całkem poprawny, a wartość współczynnka determnacj jest newelka (Cox Wermuth 1992. W śwetle tych wyjaśneń uznajemy, że wartość R 2 =0,10 z przykładu 6.1 ne jest mała. Przy tym, ne pownno sę jej używać do oceny dopasowana modelu, a co najwyżej do porównań mędzy konkurencyjnym nezagneżdżonym LMP. 6.2. Model logtowy W odróżnenu od LMP model logtowy dla danych posadane_domu wygląda tak jak na rysunku 6.2. Obecne lna ma tak kształt, że może reprezentować prawdopodobeństwo dla każdej wartośc X. Ta lna to dystrybuanta tzw. rozkładu logstycznego (przypomnamy rozważana o funkcj logstycznej z poprzednego rozdzału. Jest to jedna z ln o kształce podobnym do ltery S, określanych jako krzywe typu S. Rozdzał 6 6

6.2. JPG Rysunek 6.2. Oszacowany model logtowy zależnośc pomędzy posadanem domu (Y dochodem (X Jak pamętamy, w LMP funkcja, która wąże prawdopodobeństwo p ze zmenną objaśnającą X ma postać p = α 0 + α 1 X. W modelu logtowym ten zwązek jest następujący: exp( α0 + α1x p = (6.5 1+ exp( α + α X 0 1 gdze exp(v = e V. Model ten nos też nazwę regresj logstycznej lub model logstycznego. Jego ogólnejsza postać przyjmuje, że p jest funkcją następującej lnowej kombnacj k zmennych objaśnających: Z = α 0 + α 1 X 1 +... + α k X k czyl exp( Z p = (6.6 1+ exp( Z Jeśl oblczymy 1 p 1 = 1+ exp( Z a następne podzelmy p przez 1 p : p 1 p = exp( Z oblczymy stąd Z = α 0 + α 1 X 1 +... + α k X k, to otrzymamy: p 1 p ln = α 0 + α 1 X 1 +... + α k X k (6.7 Rozdzał 6 7

Model (6.7 jest lnowy względem parametrów α zmennych X. Zmenną objaśnaną w tym modelu jest ln (p/(1 p. Ta welkość nazywa sę logtem. Przypomnjmy, że p to prawdopodobeństwo tego, ż Y =1. Zatem logt to logarytm lorazu szans 1 przyjęca oraz neprzyjęca wartośc 1 przez zmenną Y. Jeśl szanse są jednakowe (p =0,5, to logt równa sę zeru. Dla p >0,5 logt jest ujemny, a dla p <0,5 jest dodatn. PRZYKŁAD 6.2 (cąg dalszy przykładu 6.1 Oto wydruk oszacowanego w programe gretl modelu logtowego zależnośc mędzy Y (meszkane z rodzcam oraz X1 (rok studów, X2 (dochód rodzny X3 (płeć: Model MIESZKANIE Z RODZICAMI: Estymacja Logt z wykorzystanem 500 obserwacj 1-500 Zmenna zależna: Y Zmenna Współczynnk Błąd stand. Statystyka t Efekt krańcowy dla średnch const -2,35743 0,408173-5,776 X1 0,140685 0,0680044 2,069 0,0350719 X2 0,0176054 0,00288574 6,101 0,00438890 X3-0,438766 0,189761-2,312-0,109381 Średna dla zmennej Y = 0,476 Lczba przypadków 'poprawnej predykcj' = 377 (75,4% f(beta'x dla średnch nezależnych zmennych = 0,249 McFaddena pseudo-r-kwadrat = 0,0796924 Logarytm warygodnośc = -318,424 Test lorazu warygodnośc: Ch-kwadrat(3 = 55,1467 (wartość p 0,000000 Prognoza 0 1 Empryczne 0 209 53 1 70 168 Będzemy analzować elementy tego wydruku. Na początek ustalmy, że oszacowana wartość logtu czyl Z jest następująca Ẑ = 2,3574 + 0,1407 X1 + 0,0176 X2 0,4388 X3 Oznacza to, że prawdopodobeństwo p (czyl sytuacj Y =1 szacuje sę jako: ˆ p exp(2,3574 + 0,1407X1+ 0,0176X 2 0,4388X 3 = 1+ exp(2,3574 + 0,1407X1+ 0,0176X 2 0,4388X 3 Na tej podstawe możemy oblczyć, że dla X1=3, X2=100 oraz X3=1 oszacowana wartość p wynos 0,3512. Warto przypomneć, że w przypadku LMP było to 0,3652. 1 Tutaj przez szansę rozumemy prawdopodobeństwo. Na ogół jednak szansa czyl w języku angelskm odds oznacza od razu loraz prawdopodobeństw. Jeśl prawdopodobeństwo sukcesu równa sę 0,8, to szansa na sukces wynos 4 do 1 czyl jest właśne lorazem prawdopodobeństw p oraz 1 p. Mmo tego, w angelskojęzycznych podręcznkach też mów sę o odds-rato czyl o loraze szans. Rozdzał 6 8

Estymacja modelu logtowego W jak sposób szacuje sę model logtowy (6.7? Jest to model nelnowy. Zauważmy jednak, że welkośc p ne są obserwowalne. Jedyne co znamy, to wartośc Y czyl jedynk lub zera. Właścwą metodą estymacj jest tu metoda najwększej warygodnośc (MNW, która wykorzystuje założene o postac rozkładu logstycznego. Ne wdając sę w szczegóły powedzmy jedyne, że termn logarytm warygodnośc w wydruku wynków estymacj oznacza wartość logarytmu naturalnego funkcj warygodnośc, którą maksymalzuje sę poszukując ocen parametrów przy pomocy MNW. Czyl jest to wartość maksymalna dla danego modelu. Cekawostka: średna wartość Y w modelu logtowym (czyl udzał jedynek równa sę średnej wartośc oszacowanych za pomocą MNW prawdopodobeństw p. Efekty krańcowe w modelu logtowym Pochodna prawdopodobeństwa p względem zmennej objaśnającej X j w modelu logtowym (6.7 jest następująca: p X j exp( α + α X 0 1 1 k k = α j p (1 p = α j [ ] 2 1+ exp( α + α X 0 1 +... + α X 1 +... + α X k k. (6.8 Jest węc neco skomplkowana w porównanu z taką samą pochodną równą α j dla lnowego modelu prawdopodobeństwa. Wdzmy, że efekt krańcowej zmany X j na wartośc p w modelu logtowym ne jest stały, zależy od wartośc wszystkch zmennych X. W praktyce podaje sę tak efekt dla średnch wartośc zmennych X. Uwaga: Znak oszacowana parametru stojącego przy zmennej X j w modelu logtowym określa kerunek wpływu X j na Y: dla dodatnego α j wzrost X j wąże sę ze wzrostem szans na to, że Y = 1; natomast spadkow X j towarzyszy spadek szans na to, że Y = 1; dla ujemnego α j wzrost X j wąże sę ze spadkem szans na to, że Y = 1; natomast spadkow X j towarzyszy wzrost szans na to, że Y = 1. Stąd wynka, że nterpretacja parametru strukturalnego modelu logtowego jest podobna do nterpretacj znanej dla modelu lnowego: znak parametru określa kerunek zależnośc mędzy zmennym X j oraz Y. PRZYKŁAD 6.2 (cąg dalszy W modelu z przykładu 6.2 efekty krańcowe dla średnch to: 0,0351 dla zmennej X1, 0,0044 dla zmennej X2, 0,1094 dla zmennej X3. Perwszą z tych lczb możemy nterpretować na- Rozdzał 6 9

stępująco: dla osób, których charakterystyk odpowadają średnm wartoścom zmennych X1, X2, X3 z każdym rokem studów (ceters parbus prawdopodobeństwo meszkana samodzelne zwększa sę o 0,035. Podobne nterpretujemy pozostałe efekty krańcowe. Interpretacja z wykorzystanem lorazu szans Iloraz szans p /(1 p dobrze nadaje sę do nterpretacj oszacowanego modelu logtowego. Można pokazać, że jeśl jedna ze zmennych objaśnających, na przykład X j wzrośne o jednostkę (ceters parbus, to loraz szans zmen sę exp(α j razy. W przypadku exp(α j > 1 mamy wzrost, a w przypadku exp(α j < 1 mamy spadek lorazu szans. Jeśl X j jest zmenną zerojedynkową, to exp(α j mów le razy wzrasta loraz szans wartośc Y = 1 dla kategor 1 zmennej X j w porównanu z tym samym lorazem dla kategor 0 zmennej X j. W naszym modelu z przykładu 6.2 logt jest oszacowany jako Ẑ = 2,3574 + 0,1407 X1 + 0,0176 X2 0,4388 X3 natomast loraz szans to exp( Ẑ. Zatem: krotność o jaką zmen sę loraz szans przy wzrośce każdej ze zmennych o jednostkę równa sę: exp(0,1407 = 1,1511 dla zmennej X1, exp(0,0176 = 1,0178 dla zmennej X2, exp( 0,4388 = 0,6448 dla zmennej X3. Przykładowa nterpretacja: każdy dodatkowy rok studów zwększa loraz szans (szansę samodzelnego meszkana o 1,15 raza czyl o 15%. Mary dopasowana, testowane modelu, dobór zmennych W modelu logtowym ne można stosować zwykłego współczynnka determnacj R-kwadrat (ze względu na nelnowość. W programe gretl podaje sę w zaman wartość pseudo-rkwadrat McFaddena, który oblcza sę według wzoru: pseudo R 2 ln LMP = 1 (6.9 ln L MZ gdze ln L MP jest logarytmem funkcj warygodnośc dla modelu pełnego, natomast ln L MZ dla modelu zredukowanego do wyrazu wolnego. Pseudo-R-kwadrat może służyć do porównań pomędzy logtowym modelam nezagneżdżonym dla tej samej zmennej. Podana w wydruku wynków estymacj wartość statystyk testu lorazu warygodnośc służy do testowana stotnośc całego modelu logtowego. Hpoteza zerowa mów, że wszyst- Rozdzał 6 10

ke parametry modelu poza wyrazem wolnym są równe zeru. Statystyka testu zdefnowana jako: 2 (ln L MP ln L MZ (6.10 ma rozkład ch-kwadrat z lczbą stopn swobody równą lczbe zmennych objaśnających modelu pełnego. Na wydruku wynków estymacj w programe gretl podaje sę wartość pozomu stotnośc (p, przy którym odrzucamy hpotezę zerową. Wartość mnejsza od 0,05 oznacza, że co najmnej jedna zmenna objaśnająca w modelu jest stotna statystyczne. Podane w wynkach estymacj wartośc statystyk t dla parametrów służą jak w klasycznym modelu lnowym do testowana stotnośc każdej zmennej oddzelne. Ważna uwaga w sprawe doboru zmennych. W modelu logtowym występuje kombnacja lnowa zmennych objaśnających X, jak w klasycznym modelu lnowym z rozdzałów 1-4. Stąd wynka, że problemy specyfkacj modelu, jak na przykład współlnowość zmennych objaśnających, są w modelu logtowym take same jak w modelu lnowym. Ta uwaga odnos sę do każdego z model zmennych jakoścowych omawanych w tym rozdzale. Tablca trafnośc Po oszacowanu modelu logtowego można oblczyć wartośc empryczne zmennej objaśnanej czyl wartośc logtów ln (p/(1 p dla każdej z n obserwacj. Na tej podstawe wyznacza sę wartośc empryczne pˆ prawdopodobeństw p. Wtedy, jak w przypadku LMP, można oblczyć prognozę ex post wartośc Y dla każdej obserwacj. Są przy tym dwe zasady: zasada standardowa stosowana przy próbe zblansowanej, to jest takej gdze lczba zer jedynek dla zmennej Y jest mnej węcej jednakowa; wówczas prognozujemy, że Y=1 dla pˆ > 0,5 oraz Y=0 dla pˆ < 0,5; zasada optymalnej wartośc grancznej (Cramer 1999 stosowana przy próbe nezblansowanej, w której udzał wartośc Y=1 w próbe wynos δ; wówczas prognozujemy, że Y=1 dla pˆ > δ oraz Y=0 dla pˆ < δ. Trafność prognozy ex post wygodne jest przedstawć za pomocą tablcy trafnośc. Jest to czteropolowa tablca, której elementam są następujące lczebnośc przypadków: Rozdzał 6 11

Empryczne Prognozowane Razem Y = 1 Y = 0 Y = 1 n11 n10 n1. Y = 0 n01 n00 n0. Razem n.1 n.0 n Udzał przypadków z trafnym prognozam (n11 + n00 w łącznej lczne obserwacj (n to mara trafnośc prognoz ex post, a zarazem mara jakośc dopasowana modelu. Lczbę tę nazywa sę nekedy zlczenowym R-kwadrat (count-r 2. PRZYKŁAD 6.2 (cąg dalszy Z tablcy trafnośc wynka, że n11=168 oraz n00=209. Zatem trafność prognozy wynos 377/500 czyl 75,4%. Uwaga: w tym przypadku stosowano standardową zasadę prognozy, bowem udzał wartośc Y=1 w próbe jest blsk 50%. [Obecna wersja programu gretl stosuje wyłączne tę zasadę, nezależne od stopna zblansowana próby]. PRZYKŁAD 6.3 Wracamy do omawanego w tekśce przykładu z posadanem domu. Y oznacza fakt posadana domu przez tą rodznę (1=tak, 0=ne natomast X oznacza dochód tej rodzny (50 obserwacj; dane posadane_domu na strone nternetowej podręcznka. Wynk estymacj modelu logtowego w programe gretl jest następujący: Model POSIADANIE DOMU: Estymacja Logt z wykorzystanem 50 obserwacj 1-50 Zmenna zależna: Y Zmenna Współczynnk Błąd stand. Statystyka t Efekt krańcowy dla średnch const -4,79156 1,24921-3,836 X 0,0396580 0,0117456 3,376 0,00718633 Sredna dla zmennej Y = 0,300 Lczba przypadków 'poprawnej predykcj' = 41 (82,0% f(beta'x do średnch nezależnych zmennych = 0,181 McFaddena pseudo-r-kwadrat = 0,407392 Logarytm warygodnośc = -18,1002 Test lorazu warygodnośc: Ch-kwadrat(1 = 24,8861 (wartość p 0,000001 Prognoza 0 1 Empryczne 0 33 2 1 7 8 Rozdzał 6 12

W tym przypadku lczba wartośc Y=1 w próbe wynos 30%, zatem do prognozowana ex post należy stosować zasadę Cramera. Poprawna tablca trafnośc dla tego modelu jest następująca (można ją wyznaczyć przenosząc do Excela oszacowane z modelu wartośc p : Prognoza 0 1 Empryczne 0 29 6 1 4 11 W porównanu z zasadą standardową model gorzej prognozuje zera, a lepej jedynk. Łączna trafność prognoz ex post wynos 40/50 czyl 80%. Duży model logtowy Przykład modelu logtowego o wększych rozmarach jest oparty na wynkach badana Dagnoza społeczna 2005. Warunk jakość życa Polaków. Dane dostępne są na strone nternetowej www.dagnoza.com. PRZYKŁAD 6.4 Zmenna objaśnana Y jest zmenną jakoścową dwumanową oznacza odpowedź anketowanego na pytane Czy w ostatnch 4 tygodnach poszukwał pracy? (1=tak, 0=ne. Zmenne objaśnające wybrane do modelu to: płeć (1=mężczyzna, 0=kobeta, stan cywlny, pozom wykształcena, mesęczny dochód netto w gospodarstwe domowym (w tys. zł. Zmenna stan cywlny może przybrać następujące kategore, odpowadające poszczególnym stanom: kawaler/panna (1, żonaty/zamężna (2, wdowec/wdowa (3, rozwedzony/ rozwedzona (4, w separacj (5. Na baze poszczególnych kategor skonstruowane zostało 5 zmennych bnarnych, przyjmujących wartośc 1, jeśl respondent reprezentował dany stan (kategorę 0 w przecwnym przypadku. Wykształcene może przyjmować 8 kategor: 1 wyższe 2 polcealne 3 średne zawodowe 4 średne ogólnokształcące 5 zasadncze zawodowe 6 podstawowe ukończone 7 bez wykształcena 8 osoba w weku 0-15 lat Na baze zmennej wykształcene skonstruowane zostały 3 zmenne dwumanowe: wykszt_brak przyjmujące wartość 1 dla respondentów z kategorą wykształcene 7 lub 8 oraz 0 w przecwnym przypadku; wykszt_zasad odpowedno wartość 1 dla kategor 5 lub 6 oraz Rozdzał 6 13

wykszt_sredne 1 dla kategor 1,2,3 lub 4. Aby unknąć problemu dokładnej współlnowośc zmennych, do modelu można było włączyć co najwyżej 4 zmenne bnarne reprezentujące stan cywlny oraz 2 reprezentujące wykształcene (dlaczego?. Ponższy wydruk z programu gretl przedstawa wynk estymacj: Model 2: Estymacja Logt z wykorzystanem 3902 obserwacj Zmenna zależna: czy_szukal Zmenna Współczynnk Błąd stand. Statystyka t Efekt krańcowy dla średnch const -4,14627 0,718449-5,771 dochod_w_tys -0,690690 0,0743099-9,295-0,0609709 wykszt_sredne 3,87839 0,715297 5,422 0,342367 wykszt_zasad 3,53906 0,712719 4,966 0,312413 plec 0,263516 0,0942064 2,797 0,0232620 zonaty -0,168893 0,0981567-1,721-0,0149091 wdowec -2,34247 0,318518-7,354-0,206783 rozwedzony -0,0278297 0,238629-0,117-0,00245668 separacja -0,0550951 0,532782-0,103-0,00486354 Sredna dla zmennej czy_szukal = 0,153 Lczba przypadków 'poprawnej predykcj' = 3305 (84,7% f(beta'x do średnch nezależnych zmennych = 0,088 McFaddena pseudo-r-kwadrat = 0,127963 Logarytm warygodnośc = -1501,37 Test lorazu warygodnośc: Ch-kwadrat(8 = 440,623 (wartość p 0,000000 Kryterum nformacyjne Akake'a (AIC = 3020,74 Kryterum bayesowske Schwarza (BIC = 3077,16 Kryterum nfor. Hannana-Qunna (HQC = 3040,77 Ne wszystke zmenne są stotne statystyczne. Model można próbować poprawać. Zatrzymajmy sę przy tym wynku estymacj jako zadane do samodzelnego rozwązana spróbujmy dokonać nterpretacj ocen parametrów, korzystając z: a efektów krańcowych, b lorazów szans. Szczególne stotne jest przy tym porównane pomędzy zmennym bnarnym reprezentującym różne kategore zmennej stan cywlny oraz zmennej wykształcene. 6.3. Model probtowy Model logtowy omówlśmy dość szczegółowo w poprzednm podrozdzale. Całkem podobne omówene należałoby sę modelow probtowemu, który jest drugm ważnym modelem dla jakoścowych zmennych dwumanowych. To omówene jednak pomnemy, albowem Rozdzał 6 14

oba modele są blźnaczo podobne. Na rysunku 6.3 pokazany jest wykres modelu probtowego dla danych posadane_domu. Do złudzena przypomna rysunek 6.2 z modelem logtowym. Przyczyna jest taka, że w modelu probtowym posługujemy sę dystrybuantą rozkładu normalnego, bardzo podobną do dystrybuanty rozkładu logstycznego. 6.3.JPG Rysunek 6.3. Oszacowany model probtowy zależnośc pomędzy posadanem domu (Y dochodem (X W modelu probtowym funkcja, która wąże prawdopodobeństwo p z lnową kombnacją zmennych objaśnających Z = α 0 + α 1 X 1 +... + α k X k ma postać: Z 2 1 t p = exp ( dt (6.10 2 2 π W tym modelu wartośc prawdopodobeństwa p są wartoścam dystrybuanty rozkładu normalnego N(0,1 w punktach Z. Wartośc Z nazywa sę probtam lub normtam. Są to wartośc kombnacj lnowej (zborczego ndeksu zmennych objaśnających dla określonego pozomu prawdopodobeństwa, przy założenu, że kombnacja ta ma rozkład N(0,1. Efekty krańcowe w modelu probtowym Pochodna prawdopodobeństwa p względem zmennej objaśnającej X j w modelu logtowym (6.7 jest następująca: p X j = α j φ(z (6.11 gdze φ( jest funkcją gęstośc standardowego rozkładu normalnego. Wartośc (6.11, które zależą od pozomów zmennych X podaje sę zwykle dla średnch wartośc tych zmennych. Rozdzał 6 15

PRZYKŁAD 6.5 (cąg dalszy przykładu 6.2 Wydruk oszacowanego w programe gretl modelu probtowego zależnośc mędzy Y (meszkane z rodzcam oraz X1 (rok studów, X2 (dochód rodzny X3 (płeć jest następujący: Model MIESZKANIE Z RODZICAMI: Estymacja Probt z wykorzystanem 500 obserwacj 1-500 Zmenna zależna: Y Zmenna Współczynnk Błąd stand. Statystyka t Efekt krańcowy dla średnch const -1,33736 0,230186-5,810 X1 0,0873128 0,0416130 2,098 0,0347606 X2 0,00984407 0,00156297 6,298 0,00391908 X3-0,270730 0,115867-2,337-0,107782 Sredna dla zmennej Y = 0,476 Lczba przypadków 'poprawnej predykcj' = 368 (73,6% f(beta'x do średnch nezależnych zmennych = 0,398 McFaddena pseudo-r-kwadrat = 0,0760671 Logarytm warygodnośc = -319,678 Test lorazu warygodnośc: Ch-kwadrat(3 = 52,638 (wartość p 0,000000 Prognoza 0 1 Empryczne 0 208 54 1 78 160 Wynk estymacj potwerdza podobeństwo modelu probtowego logtowego. Efekty krańcowe oblczone dla średnch wartośc zmennych objaśnających X1, X2 X3 są prawe dentyczne: w modelu logtowym to 0,0351, 0,0044 oraz 0,1094 natomast w modelu probtowym 0,0348, 0,0039 oraz 0,1078. Na przykład w obu przypadkach stwerdzamy, że prawdopodobeństwo samodzelnego meszkana studentk jest o 0,11 nższe nż studenta (w okolcy wartośc średnch w próbe. Porównane z parametram modelu logtowego Pomędzy parametram α w modelu logtowym probtowym zachodz relacja: α logt γ α probt gdze γ = 1,6 1,7 co pozwala łatwo przelczać wynk estymacj parametrów jednego modelu na drug. Sprawdźmy to na przykładach 6.2 6.4: Rozdzał 6 16

Zmenna\Ocena parametru Model logtowy (1 Model probtowy (2 (1/(2 Const -2,35743-1,33736 1,763 X1 0,14069 0,08731 1,611 X2 0,01761 0,00984 1,788 X3-0,43877-0,27073 1,621 PRZYKŁAD 6.6 (cąg dalszy przykładu 6.3 Dla danych posadane_domu na wynk estymacj modelu probtowego jest następujący: Model POSIADANIE DOMU: Estymacja Probt z wykorzystanem 50 obserwacj 1-50 Zmenna zależna: Y Zmenna Współczynnk Błąd stand. Statystyka t Efekt krańcowy dla średnch const -2,78725 0,647303-4,306 X 0,0230812 0,00622350 3,709 0,00732372 Sredna dla zmennej Y = 0,300 Lczba przypadków poprawnej predykcj = 41 (82,0% f(beta x do średnch nezależnych zmennych = 0,317 McFaddena pseudo-r-kwadrat = 0,412028 Logarytm warygodnośc = -17,9585 Tutaj także zwązek mędzy ocenam parametrów modelu logtowego probtowego jest podobny: 4,79156/ 2,78725=1,719 oraz 0,03966/0,02308=1,718. 6.4. Model tobtowy Zdarza sę, że zmenna objaśnana jest zmenną cągłą lecz jej zakres jest ogranczony. Wtedy nazywamy ją zmenną ogranczoną. Zmenne ogranczone to rodzaj zmennych jakoścowo-loścowych. Ich wartośc obserwujemy wtedy są zwykłym kategoram loścowym lub ch ne obserwujemy wtedy nadajemy m jakąś umowną wartość, np. zero. Oto przykłady: wydatk na zakup samochodu w rodzne w danym roku: wartość tej zmennej dla welu gospodarstw domowych równa sę zeru; przychody z pracy: dane te są dostępne od osób pracujących; dla nektórych osób równają sę zeru osoby te wyberają stan bezroboca; kwota przeznaczona na cele dobroczynne w danym roku; lczba godzn pracy przepracowanych w ostatnm mesącu. Rozdzał 6 17

Zmenna ogranczona jako zmenna endogenczna w jednorównanowym modelu ekonometrycznym jest wyjaśnana przy użycu nnych zmennych egzogencznych. Sposób zberana danych o zmennych lub dostępność tych danych determnują rodzaj próby, z którą mamy do czynena. Może tu wystąpć jedna z dwóch sytuacj: próba ucęta dane dla zmennych egzogencznych dostępne tylko wówczas, gdy obserwuje sę zmenną endogenczną; przykład: losujemy w ZUS próbę 1000 osób płacących składk emerytalne w wysokośc co najmnej 400 zł mesęczne badamy zależność wysokośc składk od weku od lczby lat wykształcena; wtedy ne jesteśmy w stane nc powedzeć o osobach płacących mesęczne składk emerytalne nższe nż 400 zł; wszystke nformacje są ucęte poprzez warunek mnmum 400 zł składk ; próba cenzurowana dane dla zmennych egzogencznych dostępne także wtedy, gdy ne obserwuje sę zmennej endogencznej (to jest: dla całej zborowośc. przykład: pytamy 1000 osób w sondze ulcznej o ch wydatk na wczasy w zeszłym roku badamy zależność tych wydatków od płc weku respondenta; wtedy dla nektórych osób otrzymujemy odpowedź: wydatk = 0; posadamy jednak nformację o ch weku płc. PRZYKŁAD 6.7 Nech Y oraz X oznaczają, odpowedno, zmenną endo egzogenczną w modelu, który dotyczy 500 jednostek obserwacj. Zmenna Y przyjmuje wartośc nezerowe dla 300 obserwacj. Próba cenzurowana to: x 1,..., x 300, x 300+1,..., x 500 y 1,..., y 300, 0,...,0 Zmenną Y nazywa sę zmenną cenzurowaną. Z kole próba ucęta to: x 1,..., x 300 y 1,..., y 300 Zmenną Y nazywa sę tu zmenną ucętą. W tym podręcznku zajmemy sę jedyne próbam cenzurowanym. W takch przypadkach właścwym modelem regresj zmennej endogencznej względem zmennych egzogencznych jest model regresj cenzurowanej, zwany modelem tobtowym. Dla najprostszej sytuacj z jedną zmenną objaśnającą model tobtowy ma postać: Rozdzał 6 18

Y = α 0 + α 1 X + ε =1,2,...,n (6.12 Y = dla > 0 Y Y Y = 0 dla Y 0 Zmenna * Y to jest właśne zmenna objaśnana, którą modelujemy. Jest to zmenna ukryta. Jej wartośc są obserwowane tylko wtedy, gdy są wększe od zera. Wartośc mnejsze od zera oraz wartośc równe zero traktowane są jednakowo są reprezentowane przez Y=0. Wartośc X są obserwowane dla wszystkch = 1,...,n. Zmenna wększa od 0. Y ne jest obserwowana, jeśl ne jest PRZYKŁAD 6.8 Zmenna nwestycja oznacza kwotę, którą klenc banku przeznaczają na nwestycję w nowym funduszu. Spośród 40 klentów, do których skerowano ofertę, 20 postanowło dokonać nwestycj. Znana jest wartość zmennej nwestycja oraz zmennej wek dla tych 40 klentów (dane nwestycja dostępne na strone nternetowej podręcznka. Próba jest cenzurowana (20 osób ne odpowedzało; znamy charakterystyk tych osób, zmenna nwestycja jest cenzurowana, bowem 50% jej wartośc równa sę zeru z racj wyboru dokonanego przez klentów banku. Skłonność do zanwestowana w nowym funduszu to zmenna Y*. Obserwujemy ją wówczas, gdy jest dodatna: wtedy równa sę dodatnm wartoścom zmennej Y=nwestycja. W pozostałych przypadkach (skłonność Y* ujemna lub równa zeru wartość zmennej Y=nwestycja jest po prostu równa 0. 6.4.JPG Rysunek 6.4. Oszacowany MNK model lnowy zależnośc pomędzy nwestycją (Y wekem (X Rozdzał 6 19

Dane wyglądają tak jak na rysunku 6.4. Jeśl tę zależność Y od X oszacujemy przy pomocy klasycznej MNK, ne martwąc sę o to, że połowa wartośc Y to zera, otrzymamy: MNK Yˆ = 78,924 + 4,309 X co oznaczałoby, że z każdym rokem weku nwestora jego nwestycja wzrasta o 4,3 jednostk penężne (jp. Szacowane tego modelu klasyczną MNK ne jest jednak prawdłowe. Dlaczego? Wartośc oczekwane zmennej Y estymacja modelu tobtowego Jeśl przyjąć zwyczajowe założene o tym, że składnk losowe w (6.12 mają rozkład normalny o średnej 0 stałej warancj σ 2, można pokazać, że wartość oczekwana E(Y X jest nelnową funkcją zmennej X. Oznacza to, że estymatory MNK ne są estymatoram zgodnym, która to własność jest kluczowa dla każdego estymatora. W zwązku z tym model tobtowy należy szacować metodą najwększej warygodnośc (MNW. Dla doceklwych podajemy postać wartośc oczekwanej E(Y X dla modelu (6.12: dla wartośc Y >0: E(Y Y >0, X = α 0 + α 1 X + σ λ(c, (6.13 α gdze c = 0 + α1x σ natomast λ(c = f ( c F( c to tzw. odwrotny loraz Mllsa: stosunek wartośc funkcj prawdopodobeństwa f oraz dystrybuanty F standardowego rozkładu normalnego oblczonych w punkce c ; dla wszystkch wartośc Y : E(Y X = F(c (α 0 + α 1 X + σ f(c. (6.14 Wzory (6.13 (6.14 ne są specjalne groźne, jeśl przypomnmy sobe, że zarówno funkcja gęstośc f jak dystrybuanta F przyjmują wartośc jedyne z przedzału (0, 1 oraz że dla konkretnej zmennej losowej jest zawsze f F. Dla modelu z wększą lczbą zmennych objaśnających we wzorach (6.13 (6.14 w mejsce α 0 + α 1 X należy wpsać odpowedne wyrażene z kolejnym zmennym X. PRZYKŁAD 6.8 (cąg dalszy Oszacowane modelu tobtowego (6.12 za pomocą MNW jest następujące: MNW Yˆ = 411,853 + 9,093 X Rozdzał 6 20

Pokazuje to następujący wydruk z programu gretl: Model INWESTYCJA: Estymacja Tobt z wykorzystanem 40 obserwacj 1-40 Zmenna zależna: nwestycja Zmenna Współczynnk Błąd stand. Statystyka t Wartość p const -411,853 181,602-2,268 0,02334 ** wek 9,09304 3,95786 2,297 0,02159 ** Sredna arytmetyczna zmennej zależnej = 107,55 Odchylene standardowe zmennej zależnej = 183,584 Cenzurowane obserwacje: 20 (50,0% Sgma (Se = 288,836 Logarytm warygodnośc = -154,248 Otrzymalśmy całkem nny rezultat nż poprzedno. Nachylene prostej regresj jest teraz wększe nż dla modelu szacowanego za pomocą MNK. Wdać to na rysunku 6.5. Różncę można wyjaśnć w ten sposób, że obserwacje Y=0 reprezentują także ujemne wartośc skłonnośc do nwestowana, których ne obserwujemy. Jeśl zatem wyobrazmy sobe stnene tych ujemnych Y*, to wynk estymacj jest akceptowalny. 6.5. JPG Rysunek 6.5. Oszacowany MNW model tobtowy zależnośc pomędzy nwestycją (Y wekem (X Pytane, jake sobe stawamy, jest take: czy można nterpretować oszacowane 9,093 jako przyrost wartośc zmennej nwestycja w zwązku z przyrostem zmennej wek o 1? Odpowedź brzm: (1 tak jeśl myślmy o zmennej Y* czyl o skłonnośc do nwestowana, (2 ne jeśl mówmy o zmennej Y czyl o kwoce faktyczne zanwestowanej. Objaśnene ponżej. Rozdzał 6 21

Efekty krańcowe w modelu tobtowym Pochodną zmennej Y względem zmennej X w modelu tobtowym (6.12 możemy wyznaczyć ze wzorów (6.13 (6.14. Mamy węc: dla wartośc Y >0: E( Y Y > 0, X = α 1 {1 λ(c [c + λ(c ]}, (6.15 X α gdze c = 0 + α1x σ dla wszystkch wartośc Y : oraz λ(c = f ( c F( c E( Y X = α 1 F(c. (6.16 X Co z tego wynka? Po perwsze, że sam parametr α 1 ne reprezentuje efektu jednostkowego przyrostu zmennej X na wartośc zmennej Y. Ten efekt jest w stoce mnejszy. Na przykład według wzoru (6.16 welkość α 1 mnożymy przez F(c, czyl lczbą mnejszą od 1 (F(c jest wartoścą dystrybuanty standardowego rozkładu normalnego oblczoną w punkce c. Można także pokazać, że w (6.15 mnożnk parametru α 1 to welkość z przedzału (0,1. Zależność mędzy ocenam MNK MNW Po druge, z (6.16 wynka zwązek mędzy ocenam MNK MNK dla modelu tobtowego. Oceny MNK są bezpośrednm oszacowanam wyrażeń E( Y X. Zatem, aby otrzy- X mać oceny MNK na podstawe ocen MNW należy te ostatne pomnożyć przez czynnk F(c, na przykład w punkce odpowadającym średnej wartośc zmennej X. Wartość czynnka F zwększa sę w marę zwększana udzału nezerowych wartośc w próbe. Według różnych badań, zależność mędzy ocenam MNK MNW dla modelu tobtowego jest następująca. Oceny MNW należy pomnożyć przez udzał nezerowych obserwacj w próbe. W wynku otrzymujemy w przyblżenu oceny MNK. To stwerdzene odnos sę do ocen parametrów przy zmennych X (poza wyrazem wolnym. Jeśl węc z jakegoś powodu ne dysponujemy programem do estymacj modelu tobtowego, to należy zastosować MNK dokonać odpowednej korekty ocen parametrów. Pamętajmy, że obecne rozważana dotyczące modelu tobtowego z jedną zmenną objaśnającą przenoszą sę analogczne na model z wększą lczbą zmennych X. Rozdzał 6 22

PRZYKŁAD 6.8 (cąg dalszy Ocena parametru α 1 otrzymana za pomocą MNK równa sę 4,309, ocena otrzymana za pomocą MNW równa sę 9,093. Perwsza z ocen ne pownna być nterpretowana (chocaż jest to w przyblżenu efekt (6.16, druga mów o tym, jak wzrasta Y* (skłonność do nwestowana przy wzrośce X (wek o jednostkę. Zależność mędzy tym ocenam jest w przyblżenu następująca: 4,309 równa sę 0,5 (udzał nezerowych obserwacj na Y razy 9,093. Efekty krańcowe: * E( Y X 1. Efekt krańcowy jest równy 9,093 (jest stały dla każdego X. X 2. Ze wzoru (6.16 wynka, ż efekt krańcowy punkce 411,853 + 9,093X σˆ E( Y X X dla średnej wartośc X czyl w równa sę 9,093 razy wartość dystrybuanty standardowego rozkładu normalnego oblczona w tym punkce. U nas X = 43,275 oraz ˆ σ = 288, 84 (por. wydruk z programu gretl powyżej. Na tej podstawe F( 0,0635 = 0,4747. Zatem E( Y X X 411,853 + 9,093X = 0,0635 oraz σˆ dla średnej wartośc X równa sę 9,093 0,4747=4,3162. Jeśl berzemy pod uwagę zarówno osoby, które ne dokonały nwestycj oraz te, które dokonały nwestycj, jednostkowy przyrost X (w okolcy średnch wartośc wszystkch zmennych objaśnających; tutaj tylko jednej wąże sę z przyrostem Y o 4,32. 3. Z kole ze wzoru (6.15 wynka, że E( Y Y > 0, X X dla średnej wartośc X równa sę 9,093 razy współczynnk równy 1 λ( 0,0635 [ 0,0635 + λ( 0,0635] = 0,3499. Zatem, jeśl berzemy pod uwagę tylko osoby, które dokonały nwestycj, to jednostkowy przyrost X (w okolcy średnej wąże sę z przyrostem Y o 3,18. PRZYKŁAD 6.9 Dla danych z badana Dagnoza społeczna 2005. Warunk jakość życa Polaków. (www.dagnoza.com oszacowano model tobtowy zależnośc pomędzy dochodem netto go- Rozdzał 6 23

spodarstwa domowego respondenta (Y w złotych czynnkam określającym ten dochód 2. Wzęto pod uwagę 882 obserwacje. Dla 94 z nch wartość Y=0. Oszacowany model tobtowy ma następującą postać: MNW Yˆ = 106,050 + 224,850 X1 + 338,320 X2 + 5,087 X3 232,226 X4 + 18,348 X5 gdze X1 to mejsce zameszkana (0= mejscowość ponżej 500 tys. meszk., =1 powyżej, X2 płeć respondenta (0=kobeta, 1=mężczyzna, X3 skala pozycj ekonomcznej zawodu ojca (od 16 do 88, X4 pozom wykształcena ojca (1=wyższe, 0=nne, X5 skala pozycj ekonomcznej zawodu respondenta (od 16 do 88. Z kole model oszacowany za pomocą MNK ma postać taką: MNK Yˆ = 23,211 + 207,510 X1 + 311,658 X2 + 4,443 X3 199,592 X4 + 16,671 X5 Zależność mędzy ocenam MNW MNK pownna wynkać z udzału wartośc nezerowych w próbe, który jest równy 788/882 czyl 0,8934. Zatem loraz: ocena MNK /ocena MNW pownen meć mnej węcej wartość 0,89 (poza oceną wyrazu wolnego. Tak właśne jest dla tego modelu, co pokazuje następujące zestawene: Parametr przy Ocena MNK (1 Ocena MNW (2 (1/(2 X1 207,510 224,850 0,923 X2 311,658 338,320 0,921 X3 4,443 5,087 0,873 X4-199,592-232,226 0,859 X5 16,671 18,348 0,907 Jeśl dze o nterpretację, to wadomo, że oceny MNW wskazują wrażlwość zmennej Y* na jednostkowy przyrost wartośc danej zmennej X. Na przykład, ocena przy X2 mów, że dochód dla mężczyzn jest wększy (ceters parbus nż dla kobet o ok. 338 zł (to stwerdzene berze pod uwagę ewentualne ujemne dochody, które występują w postac dochodów równych zero. Efekty typu (6.15 (6.16 ne są tutaj podane. Zauważmy także, ż znak oceny parametru przy zmennej X4 ne jest zgodny z ntucją. Pojęca kluczowe zmenna jakoścowa lnowy model prawdopodobeństwa loraz szans model logtowy, efekty krańcowe 2 Model został wybrany oszacowany przez studenta SGH Jakuba Ślusarczyka. Rozdzał 6 24

model probtowy, efekty krańcowe zmenna ucęta zmenna cenzurowana model tobtowy, efekty krańcowe Lteratura D.R. Cox, N. Wermuth, A comment on the coeffcent of determnaton for bnary responses, The Amercan Statstcan, Vol. 46, 1992. J.S. Cramer, Predctve performance of the bnary logt model n unbalanced samples, The Statstcan, Vol. 48, 1999. J.S. Cramer, Logt models from economcs and other felds, Cambrdge Unversty Press, 2003. P.M. Dawson, Econometrc and quanttatve methods, Unversty of Bath, 2006 (materały do zajęć. G.S. Maddala, Ekonometra, Wydawnctwo Naukowe PWN, Warszawa, 2006. M.P. Murray, Econometrcs. A modern ntroducton, Addson-Wesley Pearson, 2006. J.H. Stock, M.H. Watson, Introducton to econometrcs, wyd. 2, Pearson, 2006. J. Wooldrdge, Introductory econometrcs: a modern approach, wyd. 2, South-Western, 2003. Zadana 6.1. Przyjmując, że E(ε = 0 oraz że ε ε j ( j są neskorelowane, pokaż, że warancja zmennej losowej ε w modelu (6.1 równa sę p (1 p. Jake są konsekwencje heteroskedastycznośc w LMP? 6.2. Model logtowy wywodz sę z rozkładu logstycznego, którego funkcja gęstośc ma postać exp( Z [ 1+ exp( Z ] 2 natomast dystrybuanta wynos exp( Z. 1+ exp( Z Na wydruku wynków estymacj modelu logtowego w programe gretl pojawa sę f(beta'x dla średnch nezależnych zmennych. Chodz o wartość funkcj gęstośc oblczoną w punkce średnch arytmetycznych zmennych X w modelu. Jak należy nterpretować tę wartość w Rozdzał 6 25

przykładze 6.2? Odpowedz na to pytane wedząc, że rozkład logstyczny ma funkcję gęstośc dystrybuantę podobną do odpowednków z rozkładu normalnego. Wadomo, że wartość oczekwana zmennej losowej o rozkładze logstycznym równa sę 0, a warancja wynos π 2 /3 3,29. 6.3. Dla przykładu 6.2 wykreśl w Excelu funkcję pˆ exp( Zˆ = (=1,...,500. 1+ exp( Zˆ 6.4. (Wooldrdge 2003 W modelu dwumanowym Y jest udzałem jedynek w próbe obserwacj Y (jest to średna wartość Y. Nech ˆq 0 oznacza procent trafnych prognoz ex post wartośc Y=0 oraz ˆq 1 oznacza procent trafnych prognoz ex post wartośc Y=1. Udowodnj, że jeśl pˆ oznacza łączną trafność prognoz ex post w procentach, to pˆ jest następującą średną ważoną trafnośc ˆq 0 ˆq 1 : p ˆ = (1 Y + qˆ0 Yqˆ1 Następne oblcz łączną trafność prognoz przyjmując, że w próbe o lczebnośc 300 mamy Y = 0,70 (czyl jest 210 obserwacj z Y=1 oraz 90 obserwacj z Y=0 a procent trafnych prognoz wartośc Y=0 wynos 80 natomast procent trafnych prognoz wartośc Y=1 wynos 40. 6.5. (na podstawe Dawson 2006 W modelu logtowym oszacowanym dla zmennej vote oznaczającej udzał w wyborach (1=tak, 0=ne mamy: p Zˆ ˆ = ln = 2,020 + 0,044 age + 0,691 marry + 0,692 educ19 + 0,362 homeown + 1 pˆ + 0,132 female (n=406 obserwacj, w tym 292 dla vote=1 gdze age jest wekem respondenta, marry oznacza stan cywlny: 1=zamężna/żonaty, 0 w pozostałych przypadkach, educ19=1 jeśl w weku 19 lat respondent nadal sę uczył (=0 w pozostałych przypadkach, homeown=1 jeśl mejsce meszkana respondenta jest jego własnoścą (=0 w pozostałych przypadkach, female=1 dla kobet, =0 dla mężczyzn. a oblcz prawdopodobeństwo udzału w wyborach osoby żonatego mężczyzny z wyższym wykształcenem w weku 45 lat, mającego własne meszkane; jak zmen sę to prawdopodobeństwo za rok (age=46?, b oblcz lorazy szans dla każdej ze zmennych; o le z każdym rokem weku respondenta zwększa sę szansa wzęca udzału w wyborach? Rozdzał 6 26

c o le procent zwększa sę szansa udzału w głosowanu dla kobety w porównanu z mężczyzną? o le procent zwększa sę szansa udzału w głosowanu dla osoby zamężnej/żonatego w porównanu z nnym osobam? d jaka jest prognoza zmennej vote dla pˆ = 0,65? e zakładając, że głosować można od weku 19 lat oblcz najmnejsze prawdopodobeństwo wzęca udzału w głosowanu; oblcz też prawdopodobeństwo najwększe przyjmując, że najstarszy respondent mógł meć 80 lat. 6.6. Pomędzy parametram α w LMP modelu logtowym zachodz relacja α LMP 0,25 α logt, przy czym dla wyrazu wolnego jest α LMP 0,25 α logt + 0,5. Sprawdź te zwązk dla przykładu model meszkane_z_rodzcam oraz posadane domu (przykłady 6.1 6.3. 6.7. (według: Stock Watson 2006 Które z następujących problemów można analzować przy użycu modelu logtowego lub modelu probtowego: a student SGH decyduje sę na studowane za grancą przez jeden semestr, b płeć pracownka ma wpływ na pozom zarobków, c starający sę o kredyt ne spłacą go, d kandydat rozpoczne studa po przyjęcu go na uczelnę. 6.8. Według propozycj z podręcznka Maddal (2006 strony 381-382 dla danych z tablcy 8.4 dostępnych w formace gretl na strone nternetowej naszego podręcznka: (a Oszacuj modele: LMP, logtowy probtowy dla zmennej zerojedynkowej oznaczającej dopuszczene (lub ne kary śmerc w danym stane USA. (b Oblcz znterpretuj wrażlwość prawdopodobeństwa dopuszczena kary śmerc względem zmennej LF tj. stopy zatrudnena w stane w roku 1950: na podstawe LMP, na podstawe modelu logtowego, na podstawe modelu probtowego, dla wartośc średnch pozostałych zmennych w modelu. 6.9. Dla zboru 2820 gospodarstw domowych w Holand (dane z roku 1980 J.S. Cramer (2003 oszacował klka model logtowych opsujących zmenną Y posadane prywatnego samochodu (1=tak, 0=ne w zależnośc od następujących zmennych: lnc logarytm docho- Rozdzał 6 27

du (przelczony na osobę dorosłą w cągu roku, w guldenach, lsze logarytm welkośc gospodarstwa (w osobach dorosłych przelczenowych: perwsza osoba dorosła =1, kolejne =0,7, dzec =0,5, buscar samochód służbowy do dyspozycj (1=tak, 0=ne, age wek głowy gospodarstwa (merzony w klasach 5-letnch, urba rodzaj mejscowośc (od 1=weś do 6=duże masto. Następująca tabela pokazuje wynk estymacj pęcu model logtowych (oceny parametrów przy zmennych plus wartość logarytmu funkcj warygodnośc ln L: lnc lsze buscar age urba ln L 0,35 1831,29 1,77 2,22 1614,92 2,46 3,09 2,95 1393,74 2,36 2,83 3,00 0,12 1360,23 2,38 2,76 3,04 0,13 0,12 1351,39 a czy znak oszacowań parametrów są zgodne z ntucją? b znterpretuj parametry modelu ze zmennym lnc, lsze buscar; wykorzystaj lorazy szans; c o le procent zmnejsza sę loraz szans posadana samochodu przez rodznę wraz ze zwększanem sę mejscowośc zameszkana o jednostkę w skal zmennej urba? d o le procent zmnejsza sę loraz szans posadana prywatnego samochodu przez rodznę, w której wykorzystuje sę samochód służbowy? e dodane której zmennej do modelu najwęcej podwyższyło wartość ln L? co to oznacza? 6.10. (według: Murray 2006 Kto pal? Dla próby 1169 mężczyzn w USA oszacowano model wyjaśnający zależność palena (smoker =1 dla palaczy oraz =0 dla nepalących od następujących zmennych: educ lczba lat nauk, age wek w latach, pcgs79 cena paperosów w danym stane w roku 1979 (w centach, ageeduc zmenna nterakcyjna równa loczynow weku lczby lat nauk. Otrzymany w programe Stata stylzowany wynk estymacj modelu logtowego jest następujący: Logstc regresson No. of obs = 1169 LR ch2(5 = 52.97 Log lkelhood -767.99226 pseudo R2 = 0.0333 prob > ch2 = 0.0000 smoker Coef. Std. Err. Odds Rato Std. Err. z P> z educ -.2217901.0593568.8010835.0475498-3.74 0.000 age -.0533935.0140595.9480069.0133285-3.80 0.000 pcgs79 -.022304.0125033.9779429.0122275-1.78 0.074 ageeduc.002894.0011942 1.002898.0011977 2.42 0.015 constant 4.352163 1.060662 4.10 0.000 a oceń wynk estymacj pod względem statystycznym, Rozdzał 6 28

b czy znak parametrów przy zmennych educ, age pcgs79 są poprawne z punktu wdzena teor twoch oczekwań; odpowedź uzasadnj, c jak należałoby znterpretować znak przy zmennej ageeduc? d znterpretuj podane lorazy szans (odds rato dla każdej ze zmennych, e wadomo, że średne wartośc zmennych w próbe są następujące: 12,221 dla educ, 41,807 dla age, 60,985 dla pcgs79 oraz 498,955 dla ageeduc; oblcz jednostkowy efekt krańcowy dla zmennej pcgs79; w jak sposób można oblczyć take efekty dla zmennych educ age? 6.11. Spółk prawa handlowego mogą wypłacać udzałowcom (akcjonaruszom dywdendę z osągnętego rocznego zysku netto. Czasem to czyną, a czasem ne (np. ne wypłacają dywdendy jeśl ne ma zysku. Zaproponuj badane ekonometryczne 100 spółek gełdowych, w którym kwota wypłaconej dywdendy jest zmenną objaśnaną natomast zmennym objaśnającym są charakterystyk spółek (np. fnansowe, prawne. Jak model pownen być użyty do tego badana? 6.12. (według: Wooldrdge 2003 Ile pracują kobety? Dla próby 753 kobet oszacowano zależność mędzy lczbą godzn (zmenna hours przepracowanych w roku 1975 (dane z USA zmennym charakteryzującym kobetę oraz jej rodznę. W tej próbe 428 kobet pracowało w roku 1975 (hours>0 natomast 325 ne (hours=0. Wynk estymacj w programe gretl są następujące: Model PRACA KOBIET: Estymacja Tobt z wykorzystanem 753 obserwacj 1-753 Zmenna zależna: hours Zmenna Współczynnk Błąd stand. Statystyka t Wartość p const 965,305 449,287 2,149 0,03167 ** nwfenc -8,81424 4,41614-1,996 0,04594 ** educ 80,6456 21,6835 3,719 0,00020 *** exper 131,564 16,2839 8,079 <0,00001 *** expersq -1,86416 0,506061-3,684 0,00023 *** age -54,4050 7,80965-6,966 <0,00001 *** kdslt6-894,022 112,258-7,964 <0,00001 *** kdsge6-16,2180 38,7426-0,419 0,67550 Sredna arytmetyczna zmennej zależnej = 740,576 Odchylene standardowe zmennej zależnej = 871,314 Cenzurowane obserwacje: 325 (43,2% Sgma (Se = 1122,02 Logarytm warygodnośc = -3819,09 Rozdzał 6 29

Znaczene poszczególnych zmennych jest następujące: nwfenc dochód rodzny oprócz zarobków kobety (w tys. dolarów, educ lczba lat nauk, exper dośwadczene na rynku pracy w latach, expersq kwadrat zmennej exper, age wek kobety w latach, kdslt6 lczba dzec do 6 lat, kdsge6 lczba dzec w weku 6-18 lat. a dokonaj nterpretacj parametrów przy zmennych nwfenc, educ, age, kdslt6, kdsge6; b oblcz znterpretuj pochodną zmennej Y* (reprezentowanej dla wartośc neujemnych przez zmenną hours względem zmennej exper dla średnego pozomu exper w próbe równego 10,631 lat; c wadomo, że czynnk 1 λ(c [c + λ(c ] ze wzoru (6.15 dla wartośc średnch w próbe równa sę 0,451; oblcz efekt jednostkowego wzrostu zmennej educ na wartośc zmennej hours pod warunkem, że berzemy pod uwagę jedyne obserwacje, dla których hours>0; d czynnk F(c ze wzoru (6.16 dla wartośc średnch w próbe równa sę 0,645; oblcz efekt jednostkowego wzrostu zmennej educ na wartośc zmennej hours borąc pod uwagę wszystke obserwacje na zmennej hours; e wyjaśnj różncę mędzy wynkam w c d. Rozdzał 6 30