Opis danych znajdujących się w zbiorze
|
|
- Paweł Piasecki
- 7 lat temu
- Przeglądów:
Transkrypt
1 Ops danych znajdujących sę w zborze 1) masto welkość mejscowośc, w której meszka respondent 1 respondent meszka na ws 2 respondent meszka w meśce do 10 tyś. 3 respondent meszka w meśce od 10 tyś. do 25 tyś. 4 respondent meszka w meśce od 25 tyś. do 50 tyś. 5 respondent meszka w meśce od 50 tyś. do 100 tyś. 6 respondent meszka w meśce od 100 tyś. do 250 tyś. 7 respondent meszka w meśce od 250 tyś. do 500 tyś. 8 respondent meszka w meśce powyżej 500 tyś. 2) plec płeć respondenta Mężczyzna Kobeta 3) wlasceel - czy respondent ma własną frmę 1 respondent posada własną frmę 0 respondent ne posada własnej frmy 4) keruje czy respondent zajmuje stanowsko kerowncze 1 respondent ne zajmuje stanowska kerownczego 2 respondent keruje ne kerownkam 3 respondent keruje kerownkam 5) wykształcene wykształcene respondenta 1 podstawowe 2 średne 3 wyższe 6) wek wek respondenta w latach 7) dochod mesęczne zarobk w złotówkach 0. Przygotowane do pracy Aby unknąć problemów w czase pracy z danym zaczynamy od ustawena lośc pamęc maksymalnej welkośc macerzy (szczególne ważne przy dużych zborach):. set memory 10m /*przypsane 10m pamęc*/. set matsze 800 /*ustawene maksymalnego wymaru macerzy na 800x800*/ Następne ustalamy domyślny katalog (np. będzemy mogl wczytywać zbory danych znajdujące sę w tym katalogu bez podawana śceżk dostępu). Tworzymy na dysku C katalog o nazwe lab1, a następne defnujemy go jako katalog roboczy:. mkdr c:\lab1 /*tworzymy katalog c:\lab1*/. cd c:\lab1 /*zdefnowane katalogu domyślnego*/ Warto też na wstępe omówć sposób korzystana z pomocy w Stace. Zasadnczo służą do tego celu dwe komendy: help search. Perwsza z nch wyśwetla plk pomocy do wybranej komendy Staty (trzeba węc znać nazwę komendy Staty), druga zaś dokonuje 1
2 przeszukana dostępnych plków pomocy pod względem wystąpena podanych przez użytkownka słów kluczowych (ne trzeba węc znać nazwy komendy Staty). Ponżej składna obu komend: help nazwa_komendy search słowa_kluczowe W perwszym semestrze, na zajęcach w labach, przede wszystkm będzemy korzystać z komendy regress (estymacja model lnowych metodą najmnejszych kwadratów). help regress /*uzyskane dostępu do pomocy onlne na temat wybranej komendy Staty; w tym wypadku komenda regress*/ Gdybyśmy ne znal nazwy komendy służącej w Stace do estymacj model metodą najmnejszych kwadratów, należałoby użyć komendy search:. search least square /* least square - słowa kluczowe*/ 1. Wczytane zboru danych Zanm przejdzemy do wczytana zboru danych, warto wyróżnć używane przez Statę typy zmennych. Dzelą sę one na dwa rodzaje: numeryczne (byte, nt, long, float double) oraz cąg znaków (długość ne może przekroczyć 244 znaków).. help data types /* Dostępne w Stace typy zmennych*/ Ponżej zwęzła charakterystyka dostępnych typów danych (zaczerpnęta z pomocy Staty): Storage 0 wthout type Mnmum Maxmum beng 0 bytes byte /-1 1 nt -32,767 32,740 +/-1 2 long -2,147,483,647 2,147,483,620 +/-1 4 float *10^ *10^38 +/-10^-38 4 double *10^ *10^307 +/-10^ Precson for float s 3.795x10^-8. Precson for double s 1.414x10^-16. Strng storage Maxmum type length Bytes str1 1 1 str str Będzemy wczytywać zbory danych w dwóch formatach: Staty (rozszerzene.dta) oraz plk tekstowy (rozszerzene.txt, kolejne kolumny rozdzelone znakem tabulacj). Zbór danych o 2
3 nazwe ekonometra_dane.dta wczytamy bezpośredno ze strony natomast ekonometra_dane.txt z katalogu c:\lab1.. use clear /*wczytujemy zbór ekonometra_dane.dta; opcja clear usuwa obecne używany zbór danych (oczywśce jeśl tak jest)*/ Po wczytanu zboru danych do Staty, warto użyć komendy descrbe, która wyśwetla nformacje o wczytanym zborze danych (mędzy nnym typy danych):. descrbe Contans data from obs: 1,089 vars: 7 2 Nov :31 sze: 22,869 (97.8% of memory free) - storage dsplay value varable name type format label varable label - wlasccel byte %9.0g wek str2 %9s dochod nt %9.0g masto byte %9.0g keruje byte %9.0g wyksztalcene byte %9.0g plec str9 %9s - Sorted by: Zmenne: wlasccel, dochod, masto, keruje wyksztalcene to zmenne numeryczne, natomast wek plec są cągam znaków. O tyle to ważna kwesta, że komendy statystyczne w Stace dzałają wyłączne na zmennych numerycznych. Węc aby móc umeścć zmenne wek plec w budowanym przez nas modelu, musmy zamenć je na numeryczne. Przyjrzyjmy sę jak wyglądają wartośc zmennych wek plec (w tym celu otweramy w Stace edytor danych):. browse /*browse - otwera edytor danych, ne do edycj; edt - otwera edytor danych do edycj*/ 3
4 Po perwsze, wartośc zmennych będących cągam znaków mają kolor czerwony, natomast numerycznych czarny. Możemy sę domyślać, ż zmenna wek przez omyłkę została stworzona jako cąg znaków. Tę błąd naprawmy przy użycu komendy destrng. Ponżej jej składna: destrng lsta_zmennych, generate(lsta_nowych_zmennych) lub destrng lsta_zmennych, replace Używając powyższej komendy należy sprecyzować czy ma być tworzona nowa zmenna (perwszy sposób wywołana), czy też ma być zastąpona wyjścowa zmenna. Ponżej zastosowane komendy destrng do rozwązana naszego problemu:. destrng wek, generate(wek_1) /* Tworzona jest nowa zmenna o nazwe wek_1*/ destrng wek, replace /* Zastąpona zostaje wyjścowa zmenna*/ Oto jak teraz wygląda nasz zbór danych: Mamy węc dwe zmenne numeryczne, wek wek_1, które przyjmują dokładne take same wartośc. Pozbędzemy sę jednej z nch przy użycu komendy drop. Sposób wywołana komendy jest następujący: drop lsta_zmennych_do_usunęca drop wek_1 /*Usuwamy ze zboru danych zmenną wek_1*/ Pozostaje nam jeszcze zamana zmennej plec na zmenną numeryczną. Zmenne będące cągam znaków przyjmujące newelką, dobrze określoną lczbę pozomów będzemy 4
5 zamenać na zmenne numeryczne z etyketam. Do tego celu służy komenda encode. Ponżej składna do jej wywołana: encode nazwa_zmennej, generate(nowa_nazwa_zmennej). encode plec, generate(plec_1) /*Tworzona jest nowa zmenna o nazwe plec_1*/ I ponowne przyjrzyjmy sę jak wyglądają nasze dane: Wartośc zmennej plec_1 mają kolor nebesk zmenna ta wygląda jak cąg znaków. Czy w takm raze jest coś ne tak z komendą encode? Otóż ne, w Stace na nebesko wyśwetlane są wartośc zmennych numerycznych z etyketam. Tak naprawdę wartośc zmennej plec_1 to 1 (dla kobet) 2 (dla mężczyzn), ale zamast konkretnych wartośc lczbowych są wyśwetlane przypsane do nch etykety. Ponżej jak można to sprawdzć:. descrbe /*Ops zboru danych*/ Contans data from obs: 1,089 vars: 8 2 Nov :31 sze: 26,136 (97.5% of memory free) - storage dsplay value varable name type format label varable label - plec str9 %9s plec_1 long %9.0g plec_1 wek byte %10.0g wlasccel byte %9.0g dochod nt %9.0g masto byte %9.0g keruje byte %9.0g wyksztalcene byte %9.0g - Sorted by: Zmenna plec_1 rzeczywśce jest typu numerycznego (long), ponadto jest do nej przypsana etyketa o nazwe plec_1. Za pomocą komendy label lst sprawdzamy w jak sposób jest zakodowana ta etyketa:. label lst plec_1 /*Wyśwetlene reguły kodującej dla etykety o nazwe plec_1*/ 5
6 plec_1: 1 Kobeta 2 Mężczyzna Na konec jeszcze potwerdzene tego, co było już wcześnej powedzane zmenne będące cągam znaków ne mogą być używane w komendach statystycznych. Spróbujemy użyć komendy summarze, która wyznacza podstawowe statystyk opsowe:. summarze plec_1 Varable Obs Mean Std. Dev. Mn Max plec_ summarze plec Varable Obs Mean Std. Dev. Mn Max plec 0 Dla zmennej plec_1 (zmenna numeryczna) po kolej w wyśwetlonej tabel znajduje sę: lczba obserwacj, średna, odchylene standardowe, wartość mnmalna oraz maksymalna (oczywśce w przypadku zmennej nomnalnej średna odchylene standardowe są nenterpretowane!). Natomast dla zmennej plec (cąg znaków) wartośc statystyk opsowych ne zostały wyśwetlone. Zapamętujemy zbór danych w katalogu roboczym (c:\lab1):.. save dane_wczytane /*Zapamętujemy dane w katalogu roboczym pod nazwą dane_wczytane.dta */ Pozostaje jeszcze do zobrazowana sposób wczytywana danych w formace tekstowym. Do tego celu służy komenda nsheet:. nsheet usng dane.txt, clear /*wczytujemy zbór dane.txt*/ 2. Etykety Zaczynamy od wczytana plku z danym o nazwe dane_wczytane.dta (dane w formace Staty, rozszerzene.dta, wczytujemy przy użycu komendy use):. use dane_wczytane.dta, clear /*Wczytane plku dane_wczytane.dta z katalogu roboczego*/ W Stace wyróżna sę dwa rodzaje etyket dla zmennych: value label varable label. Perwszy typ etyket (dalej nazywany etyketą dla wartośc) już poznalśmy przy okazj tworzena zmennej plec_1. Etyketa o nazwe plec_1 przypsana do wartośc tej zmennej jest właśne etyketą wartośc. Drug typ etyket (dalej nazywany etyketam dla zmennych), to cąg znaków przypsany do danej zmennej. Najczęścej take przypsane ma wyjaśnać co oznacza dana zmenna. Najperw stworzymy etykety dla poszczególnych zmennych znajdujących sę w zborze danych. Do tego celu w Stace służy komenda label varable: 6
7 label varable nazwa_zmennej etyketa nadane zmennej etykety. label varable plec_1 "płeć respondenta" /*nadaje zmennej plec etyketę "płeć respondenta"; na wszelkego rodzaju "wydrukach Staty" zamast nazwy zmennej będze pojawać sę właśne ta etyketa*/. label varable wlasccel "czy respondent ma własną frmę". label varable wek "wek w latach". label varable dochod "mesęczne zarobk w złotówkach". label varable masto "mejsce zameszkana". label varable keruje "czy respondent zajmuje stanowsko kerowncze". label varable wyksztalcene "wykształcene - podstawowe, średne lub wyższe" Etykety dla wartośc tworzy sę w dwóch krokach. Najperw musmy zdefnować etyketę dla wartośc (label defne), a następne przypsać ją do danej zmennej (label values). Składna obu poleceń ponżej: label defne nazwa_etykety # tekst # tekst... defnuje etykety dla konkretnych wartośc lczbowych; # - lczby label values nazwa_zmennej nazwa_etykety łączy daną zmenną z etyketą wartośc. label defne właśccel 0 "ne" 1 "tak" /*Tworzymy etyketę o nazwe właśccel; 0 ne, 1 - tak*/. label values wlasccel właśccel /*Przypsujemy etyketę właśccel do zmennej wlasccel*/. label defne masto 1 "weś" 2 "masto do 10tyś" 3 "masto od 10tyś do 25tyś" 4 "masto od 25tyś do 50tyś" 5 "masto od 50tyś do 100tyś" 6 "masto od 100tyś do 250tyś" 7 "masto od 250tyś do 500tyś" 8 "masto powyżej 500tyś". label values masto masto. label defne keruje 1 "ne keruje" 2 "keruje ne kerownkam" 3 "keruje kerownkam". label values keruje keruje. label defne wyksztalcene 1 "podstawowe" 2 "średne" 3 "wyższe". label values wyksztalcene wyksztalcene Dla zmennej plec_1 ne musmy tworzyć etykety dla wartośc, gdyż w trakce tworzena tej zmennej (za pomocą komendy encode) zostało to już zrobone. Parę słów wyjaśnena po co używamy etyket. Umożlwają one zawarce całej nformacj o zmennych w samym zborze danych. Na wydruku zamast wartośc lczbowych będą pojawały sę przypsane m etykety. Oto przykład:. tabulate plec_1 /*tabela częstośc dla zmennej płeć*/ 7
8 płeć respondenta Freq. Percent Cum kobeta mężczyzna Total 1, Proszę zwrócć uwagę na fakt, ż zamast nazwy zmennej mamy płeć respondenta, a w mejsce wartośc 1 2 pojawły sę odpowedno etykety kobeta mężczyzna. Utworzone etykety możemy obejrzeć za pomocą polecena:. label lst /*wyśwetla wszystke etykety dla wartośc*/ wyksztalcene: 1 podstawowe 2 średne 3 wyższe keruje: 1 ne keruje 2 keruje ne kerownkam 3 keruje kerownkam masto: 1 weś 2 masto do 10tyś 3 masto od 10tyś do 25tyś 4 masto od 25tyś do 50tyś 5 masto od 50tyś do 100tyś 6 masto od 100tyś do 250tyś 7 masto od 250tyś do 500tyś 8 masto powyżej 500tyś właśccel: 0 ne 1 tak plec_1: 1 Kobeta 2 Mężczyzna Za pomocą komendy descrbe można sprawdzć do których zmennych przypsane są poszczególne etykety:. descrbe Contans data from dane_do_analzy.dta obs: 1,089 vars: 7 3 Nov :09 sze: 13,068 (99.9% of memory free) - storage dsplay value varable name type format label varable label - plec_1 byte %9.0g plec_1 płeć respondenta wek byte %10.0g wek w latach wlasccel byte %9.0g właśccel czy respondent ma własną frmę dochod nt %9.0g mesęczne zarobk w złotówkach masto byte %26.0g masto mejsce zameszkana keruje byte %24.0g keruje czy respondent zajmuje stanowsko kerowncze wyksztalcene byte %10.0g wyksztalcene wykształcene - podstawowe, 8
9 średne lub wyższe - Sorted by: Możemy jeszcze zmenć nazwę zmennej plec_1 na plec (komenda rename):. rename plec_1 plec Zanm przejdzemy do dalszej analzy, warto zapamętać nasz zbór danych:. save dane_do_analzy /*zapsujemy nasz zbór danych pod nazwą dane_do_analzy w katalogu domyślnym, czyl na dysku C w katalogu lab1*/ 3. Wstępna analza danych Polecene, od którego należy zacząć analzę zboru danych (przynajmnej mom zdanem), to:. codebook, all /*wyśwetla nformacje o zborze oraz zmennych w nm zawartych, pozwala wykryć na wstępnym pozome analzy czy są jakeś błędy w kodowanu zmennych, czy są brak danych.*/ Oto wynk (częścowy) dzałana powyższej komendy: wyksztalcene wykształcene - podstawowe, średne lub wyższe type: numerc (byte) label: wyksztalcene, but 1 nonmssng value s not labeled range: [0,3] unts: 1 unque values: 4 mssng.: 0/1089 tabulaton: Freq. Numerc Label podstawowe średne wyższe Dla każdej zmennej zostaje wyśwetlona jej etyketa ( wykształcene - podstawowe, średne lub wyższe ), typ zmennej ( numerc zmenna numeryczna), nazwa etykety wartośc przypsanej do danej zmennej, zakres wartośc ([0, 3]), lczbę przyjmowanych pozomów przez zmenną (4), lczbę braków danych (oznaczanych jako. ) w stosunku do całkowtej lczby obserwacj (0/1089) oraz tablcę częstośc. Nasz nepokój budzą zaznaczone na czerwono fragmenty. Na ch podstawe stwerdzamy, że w zborze danych są dwe obserwacje dla których wartość zmennej wyksztalcene wynos 0. A my wemy, że zmenna ta może tylko przyjmować wartośc 1, 2 lub 3. Wyjścowa zmenna oznaczająca wykształcene musała być źle zakodowana. Usunemy błędne obserwacje z analzy. Aby to móc zrobć najperw musmy zapoznać sę z operatoram logcznym występującym w Stace:. help operators /*Info o operatorach w Stace*/ 9
10 Relatonal Arthmetc Logcal (numerc and strng) addton & and > greater than - subtracton or < less than * multplcaton! not >= > or equal / dvson ~ not <= < or equal ^ power == equal - negaton!= not equal + strng concatenaton ~= not equal A double equal sgn (==) s used for equalty testng. The order of evaluaton (from frst to last) of all operators s! (or ~), ^, - (negaton), /, *, - (subtracton), +,!= (or \=), >, <, <=, >=, ==, &, and Warto podkreślć, że = = oznacza porównane, natomast = przypsane. Do usunęca błędnych obserwacj użyjemy komendy drop:. drop f wyksztalcene == 0 /*Z próby usuwane są obserwacje dla których spełnony jest warunek występujący po "f", czyl obserwacje dla których wartość zmennej wyksztalcene wynos 0 */ W przypadku zmennej, która przyjmuje węcej pozomów otrzymujemy: dochod mesęczne zarobk w złotówkach type: numerc (nt) range: [50,20000] unts: 1 unque values: 115 mssng.: 0/1089 mean: std. dev: percentles: 10% 25% 50% 75% 90% Zmenna dochod przyjmuje 115 pozomów z przedzału [50, 20000]. Średna wynos 810,32 zł, natomast odchylene standardowe 829,13 zł. Równeż na wydruku znajdują sę kwantyle, np. medana dochodu wynos 650 zł (połowa osób ma dochodu mnejsze nż 650 zł), a perwszy decyl to 350 zł (10 % respondentów ma dochody nższe od 350 zł). Celem naszej analzy będze wyznaczene determnantów dochodu (zmenna zależna w regresj). Przyjrzyjmy sę węc tej zmennej bardzej szczegółowo.. summarze dochod, detal /*podstawowe statystyk dla zmennej cągłej, trochę bardzej szczegółowe nż w przypadku codebook*/ 10
11 mesęczne zarobk w złotówkach Percentles Smallest 1% % % Obs % Sum of Wgt % 650 Mean Largest Std. Dev % % Varance % Skewness % Kurtoss % Kurtoss Medana jest mnejsza od średnej, czyl w próbe przeważają osoby o dochodach nższych nż średna (asymetra lewostronna, ujemna). To samo wdać na hstograme:. hstogram dochod, bn(40) /*bn(40) - lczba słupków*/ Densty 0 2.0e e e e Hstogram dochodu mesęczne zarobk w złotówkach Przyjrzyjmy sę jak wpływ na dochód mają poszczególne zmenne. plec Sprawdzmy, kto ma wększe średne zarobk, kobety czy mężczyźn?. bys plec: summarze dochod /*prefx bys powoduje posortowane obserwacj po wartoścach zmennej plec, statystyk opsowe będą wyznaczone dla każdej kategor zmennej plec*/ 11
12 > plec = kobeta Varable Obs Mean Std. Dev. Mn Max dochod > plec = mężczyzna Varable Obs Mean Std. Dev. Mn Max dochod Kobety mają średne zarobk nższe nż mężczyźn. Możemy spróbować potwerdzć te spostrzeżene za pomocą formalnego testu na równość średnch:. ttest dochod, by(plec) /*test na równość średnego dochodu w podpróbach wyodrębnonych za pomocą zmennej plec; standardowy test na równość średnch w dwóch populacjach omawany na statystyce matematycznej*/ Two-sample t test wth equal varances Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] kobeta mężczyzn combned dff dff = mean(kobeta) - mean(mężczyzn) t = Ho: dff = 0 degrees of freedom = 1081 Ha: dff < 0 Ha: dff!= 0 Ha: dff > 0 Pr(T < t) = Pr( T > t ) = Pr(T > t) = Hpoteza zerowa w tym teśce jest następująca: H : 0 0 µ µ = (na wydruku kobety mężczyźn fragment zaznaczony na czerwono). Hpoteza alternatywna jest zdefnowana na trzy sposoby (fragment zaznaczony na nebesko). Nas nteresuje lewa hpoteza alternatywna: H : 0 1 µ kobety µ mężczyźn <. P-value testu równe nakazuje odrzucć hpotezę zerową zakładającą równość średnch kobety zarabają mnej. Powyżej zaprezentowany test opera sę na dwóch założenach: odchylena standardowe dochodu w obu próbach są take same (a w rzeczywstośc w próbe mężczyzn jest trzykrotne wyższe!) oraz dochód pownen meć rozkład normalny w obu próbach. Narysujemy hstogramy dochodu w obu próbach z nałożoną krzywą gęstośc rozkładu normalnego:. hstogram dochod, by(plec) bn(50) /*hstogram dochodu dla każdej kategor zmennej plec*/ 12
13 Densty 0 5.0e Kobeta Mężczyzna mesęczne zarobk w złotówkach Graphs by płeć respondenta Densty normal dochod Wykresy wskazują, ż ne mamy do czynena z rozkładem normalnym (slna asymetra, wększa kurtoza nż w rozkładze normalnym, występowane obserwacj netypowych). Występowane obserwacj netypowych jeszcze lepej wdać na wykrese pudełkowym:. graph box dochod, over(plec) /*Wykres pudełkowy dla dochodu po zmennej grupującej plec*/ mesęczne zarobk w złotówkach 0 5,000 10,000 15,000 20,000 Kobeta Mężczyzna Możemy jeszcze to sprawdzć za pomocą formalnego testu.. swlk dochod f plec==0 /* testujemy normalność zmennej dochod na podpróbe kobet*/ Shapro-Wlk W test for normal data Varable Obs W V z Prob>z dochod swlk dochod f plec==1 /* testujemy normalność zmennej dochod na podpróbe mężczyzn*/ 13
14 Shapro-Wlk W test for normal data Varable Obs W V z Prob>z dochod W obu przypadkach p-value = , czyl odrzucamy hpotezę zerową zakładającą normalność rozkładu. W takm raze do testowana równośc średnch dochodów dla kobet mężczyzn ne pownnśmy stosować standardowego testu opartego na statystyce t. Użyjemy do tego celu neparametrycznego testu Wlcoxona:. ranksum dochod, by(plec) /*test Wlcoxona na równość średnego dochodu w podpróbach wyodrębnonych za pomocą zmennej plec*/ Two-sample Wlcoxon rank-sum (Mann-Whtney) test plec obs rank sum expected kobeta mężczyzna combned unadjusted varance adjustment for tes adjusted varance Ho: dochod(plec==kobeta) = dochod(plec==mężczyzna) z = Prob > z = Wynk tak sam jak poprzedno: p-value = , czyl odrzucamy hpotezę zerową zakładającą równość średnch. Podobną analzę można przeprowadzć dla zmennej wlasccel (też tylko dwa pozomy) masto Zmenna masto przyjmuje aż 8 pozomów. Porównajmy średne dochody osób meszkających w mastach o różnej welkośc:. bys masto: sum dochod > masto = weś Varable Obs Mean Std. Dev. Mn Max dochod > masto = masto do 10tyś Varable Obs Mean Std. Dev. Mn Max dochod > masto = masto od 10tyś do 25tyś Varable Obs Mean Std. Dev. Mn Max dochod
15 > masto = masto od 25tyś do 50tyś Varable Obs Mean Std. Dev. Mn Max dochod > masto = masto od 50tyś do 100tyś Varable Obs Mean Std. Dev. Mn Max dochod > masto = masto od 100tyś do 250tyś Varable Obs Mean Std. Dev. Mn Max dochod > masto = masto od 250tyś do 500tyś Varable Obs Mean Std. Dev. Mn Max dochod > masto = masto powyżej 500tyś Varable Obs Mean Std. Dev. Mn Max dochod Masta od 25tyś do 50tyś meszkańców, gdze przecętne zarobk są najwększe, zaburzają trend wzrostu zarobków wraz ze wzrostem mejsca zameszkana. Wprowadzając tę zmenną do modelu, należy ją rozkodować na 8 zmennych zero-jedynkowych. Możemy spróbować zredukować lczbę pozomów zmennej masto poprzez próbę połączena nektórych wyjścowych pozomów. Utworzymy zmenną o nazwe masto_1, która będze przyjmowała następujące pozomy: 1 respondent meszka na ws 2 respondent meszka w meśce do 25 tyś. 3 respondent meszka w meśce od 25 tyś. do 250 tyś. 4 respondent meszka w meśce powyżej 250 tyś.. generate masto_1 = masto /*tworzymy nową zmenną o nazwe masto_1, te same wartośc co masto*/. recode masto_1 3=2 4/6 = 3 7 8= 4 /*rekodujemy zmenną masto_1; 3 przechodz na 2; 4, 5 6 na 3; 7 8 na 4*/ Dla nowo utworzonej zmennej tworzymy etykety:. label defne masto_1 1 wes 2 "masto do 25tyś" 3 "masto od 25tyś do 250tyś" 4 "masto powyżej 250tyś". label values masto_1 masto_1 Wyznaczamy średne dochody dla poszczególnych kategor zmennej masto_1:. bys masto_1: sum dochod 15
16 > masto_1 = wes Varable Obs Mean Std. Dev. Mn Max dochod > masto_1 = masto do 25tyś Varable Obs Mean Std. Dev. Mn Max dochod > masto_1 = masto od 25tyś do 250tyś Varable Obs Mean Std. Dev. Mn Max dochod > masto_1 = masto powyżej 250tyś Varable Obs Mean Std. Dev. Mn Max dochod Średne dochody rosną wraz z welkoścą masta, w którym sę meszka. Budując model rozważymy dwe regresje: perwsza będze zawerać zmenną masto, druga zaś masto_1. Wyberzemy tę regresję, która ma lepsze własnośc. Podobną analzę ewentualną próbę redukcj lczby pozomów można przeprowadzć w przypadku pozostałych zmennych dyskretnych. Kolejna sprawa, to jak wpływ na dochód ma wek? Zacznjmy od prostej analzy korelacj.. pwcorr dochod wek, star(0.05) /*wyznaczana jest wsp. korelacj Pearsona, jeśl korelacja jest stotna na pozome stotnośc 0,05 to zostane zaznaczona przy pomocy gwazdk*/ dochod wek dochod wek Współczynnk korelacj wynos zaledwe 0,0519 jest nestotny na pozome 0,05 (bo ne został zaznaczony przy pomocy *). Gdy mamy do czynena ze zmennym nemającym rozkładów normalnych lepej użyć współczynnk korelacj Spearmana:. spearman dochod wek, star(0.05) matrx (obs=1083) dochod wek dochod wek * Współczynnk korelacj tym razem jest stotny, ale jego welkość tak pozostaje bardzo mała. Czy z tego wynka, ż wek w newelkm stopnu wpływa na dochód? Otóż ne! Należy pamętać, ż korelacja jest marą lnowych zależnośc mędzy zmennym. Zgodne z teorą ekonom, nasz dochód rośne szybko, gdy jesteśmy młodz, m jesteśmy stars to przyrosty 16
17 naszych płac są coraz nższe. Od pewnego momentu nasze zarobk zaczynają maleć! Zobaczmy, czy tę postulowaną zależność uda nam sę wychwycć za pomocą wykresu:. scatter dochod wek /*wykres rozproszena*/ Osoby o najwyższych zarobkach znajdują sę w środkowej częśc próby. Aby potwerdzć nasze przypuszczena narysujemy wykres rozproszena, gdze na os x będze odznaczony wek, natomast na os y średn pozom dochodu dla osób będących w danym weku: Średn pozom dochodu w zależnośc od weku (mean) dochod wek w latach Powyższy wykres sugeruje, ż zależność mędzy średnm pozomem dochodu a wekem jest raczej kwadratowa nż lnowa! Jeżel chodz o zależność kwadratową, to może nam sę ne podobać fakt, że wykres ne jest symetryczny względem werzchołka (około 45 lat). Być może lepsze dopasowane zapewną dwe funkcje lnowe sklejone w 45. Budując model ekonometryczny wnklwej przeanalzujemy ten problem. 17
18 4. Tworzene zmennych zero-jedynkowych Szacując regresję zmennej dochod na pozostałe zmenne znajdujące sę w zborze danych, musmy pamętać, o rozkodowanu zmennych masto, masto_1, wyksztalcene oraz keruje na zmenne zero-jedynkowe. Można to uczynć na dwa sposoby (omówmy to na przykładze zmennej masto): I ) tworzymy zmenne zero-jedynkowe na pechotę : /*8-krotne powtórzona będze komenda w {} */ /*wygenerowane 8 zmennych 0-1 odpowadających pozomom zmennej masto*/. forvalues = 1(1)8 { generate mejsce_zam`' = (masto==`') /*generuje zmenną o nazwe mejsce_zam`' */ /*wartość 0 jeśl warunek masto==`' ne jest spełnony, 1 jeśl jest spełnony*/ } Poprawność tworzena zmennych zero-jedynkowych możemy sprawdzć za pomocą tablcy kontyngencj:. forvalues = 1(1)8 { tab masto mejsce_zam`' /*tablca kontyngencj dla masto mejsce_zam`'*/ } Częścowy wydruk: mejsce_zam1 mejsce zameszkana 0 1 Total weś masto do 10tyś masto od 10tyś do masto od 25tyś do masto od 50tyś do masto od 100tyś do masto od 250tyś do masto powyżej 500tyś Total ,083 Zmenna mejsce_zam1 przyjmuje wartość 1 dla osób meszkających na ws (323 obserwacje) oraz 0 we wszystkch pozostałych przypadkach (760 obserwacj). II) za pomocą komendy tabulate /*tablca częstośc; zostają dodatkowo utworzone zmenne 0-1 odpowadające kolejnym pozomom zmennej masto*/. tab masto, gen(zm) 5. Oszacowane klku prostych regresj, nterpretacja oszacować parametrów Zacznemy od oszacowana metodą najmnejszych kwadratów następującego modelu: dochod = β0 + βwekwek + ε Najperw zastanowmy sę w jak sposób będzemy nterpretować oszacowana parametrów: E( dochod ) = β0 + βwekwek + E( ε ) = β0 + βwekwek 0 18
19 E ( dochod ) wek = β wek Oszacowane parametru przy zmennej wek oznacza zatem o le wzrośce średno dochód, jeżel wek wzrośne o 1 rok. Do szacowana model lnowych przy użycu metody najmnejszych kwadratów w Stace używamy komendy regress. Ponżej jej składna: regress zmenna_zależna lsta_zmennych_nezależnych. regress dochod wek /*dochod - zmenna zależna, wek - zmenna nezależna */ Source SS df MS Number of obs = F( 1, 1081) = 2.92 Model Prob > F = Resdual R-squared = Adj R-squared = Total Root MSE = dochod Coef. Std. Err. t P> t [95% Conf. Interval] wek _cons Oszacowana parametrów na wydruku są zaznaczone na nebesko. Możemy węc zapsać oszacowany model: dochod ˆ = 646, , 29wek Wzrost weku o jeden rok przekłada sę na wzrost zarobków zaledwe o 4.29 zł. TSS (Total), ESS (Model) RSS (Resdual) są zaznaczone w tabel na czerwono, natomast 2 2 R (R-square) R (Adj R-square) na zelono. Spróbujemy trochę rozbudować nasz model, dodajemy zmenną oznaczającą płeć: 0 dla mężczyzn plec = 1 dla kobet E( dochod ) = β0 + βwekwek + β plec plec + E( ε ) = β0 + βwekwek + β plec plec 0 Interpretacja parametru przy zmennej wek ne zmen sę, ale w jak sposób znterpretować oszacowane parametru przy zmennej plec? β0 + βwek wek dla mężczyzn E( dochod ) = β0 + βwekwek + β plec plec = β0 + βwek wek + β plec dla kobet A węc oszacowane parametru przy zmennej plec będze pokazywało o le średno węcej lub mnej będą zarabały kobety w porównanu z mężczyznam, przy założenu weku na tym samym pozome. Ponżej oszacowana modelu:. regress dochod wek plec /*dochod - zmenna zależna, wek, plec - zmenne nezależne */ 19
20 Source SS df MS Number of obs = F( 2, 1080) = Model Prob > F = Resdual R-squared = Adj R-squared = Total Root MSE = dochod Coef. Std. Err. t P> t [95% Conf. Interval] wek plec _cons Oszacowany model możemy zapsać: dochod ˆ = 768, 21+ 5,3wek 332,15 plec Wzrost weku o jeden rok przekłada sę średno na wzrost dochodu o 5,3 zł, kobety zarabają średno o zł mnej nż mężczyźn (obe nterpretacje przy założenu pozostałych zmennych na tym samym pozome). W następnym kroku dodajemy do modelu zmenną oznaczającą wykształcene. Wykształcene przyjmuje tylko trzy pozomy (1 - podstawowe, 2 - średne, 3 - wyższe). Jeżel w takej postac wprowadzmy tę zmenną do modelu, to nterpretacja oszacowana parametru przy tej zmennej będze analogczna jak przy zmennej wek. Przejśce z wykształcena podstawowego na średne ze średnego na wyższe będze mało taką samą premę. W rzeczywstośc pewne tak ne jest, prema za uzyskane wykształcena wyższego jest wyższa nż za średnego. Ponżej porównane średnch pozomów dochodu w podpróbach wyodrębnonych ze względu na wykształcene:. bys wyksztalcene: summarze dochod > wyksztalcene = podstawowe Varable Obs Mean Std. Dev. Mn Max dochod > wyksztalcene = średne Varable Obs Mean Std. Dev. Mn Max dochod > wyksztalcene = wyższe Varable Obs Mean Std. Dev. Mn Max dochod Różnca mędzy średnm pozomem dochodu osób ze średnm a podstawowym wykształcenem wynos około 200 zł, natomast mędzy wyższym a średnm około 500 zł. Założene, że dochód rośne w sposób lnowy wraz z pozomem wykształcena jest węc neprawdzwa. Dlatego rozkodujemy zmenną wykształcene na trzy zmenne zerojedynkowe: 20
21 1 dla osób z wyksztacenem podstawowym podstawowe = 0 w. p. p 1 dla osób z wyksztacenem srednm sredne = 0 w. p. p 1 dla osób z wyksztacenem wyższym wyzsze = 0 w. p. p Jednakże do modelu wprowadzmy tylko dwe spośród tych zmennych. Jeżel wprowadzlbyśmy trzy oraz pozostawlbyśmy w modelu stałą, to ne dałoby sę odwrócć macerzy X X. E( dochod ) = β + β wek + β plec + β sredne + β wyzsze = 0 wek plec sredn wyższe β0 + βwek wek + β plec plec dla wyksztalcena podstawowego = β0 + βwek wek + β plec plec + βsredne dla wyksztalcena srednego β0 + βwek wek + β plec plec + βwyższe dla wyksztalcena wyższego Czyl oszacowane parametru przy zmennej sredne można nterpretować jako różncę w średnch zarobkach osób z wykształcenem średnm podstawowym. Podobne z oszacowanem parametru przy zmennej wyzsze różnca w średnch zarobkach osób z wykształcenem wyższym podstawowym (obe nterpretacje przy założenu, że pozostałe zmenne na tym samym pozome).. regress dochod wek plec sredne wyzsze /*dochod - zmenna zależna, wek, plec, sredne, wyzsze - zmenne nezależne */ Source SS df MS Number of obs = F( 4, 1078) = Model Prob > F = Resdual R-squared = Adj R-squared = Total Root MSE = dochod Coef. Std. Err. t P> t [95% Conf. Interval] wek plec sredne wyzsze _cons Oszacowany model możemy zapsać: dochod ˆ = 521,99 + 5, 07wek 336,59 plec + 220β + 720,35β sredne wyzsze Wzrost weku o jeden rok przekłada sę średno na wzrost dochodu o 5,07 zł, kobety zarabają średno o zł mnej nż mężczyźn, osoby z wykształcenem średnm oraz wyższym zarabają odpowedno o 220 zł 720,35 zł węcej nż te z podstawowym (nterpretacje przy założenu pozostałych zmennych na tym samym pozome). Spróbujemy uwzględnć w naszym modelu nelnową zależność mędzy wekem a dochodem. Najprostsze wyjśce to podnesene weku do kwadratu.. generate wek_2 = wek^2 /*wek_2 - wek podnesony do kwadratu*/. regress dochod wek wek_2 plec sredne wyzsze /*dochod - zmenna zależna, wek, wek_2, plec, sredne, wyzsze - zmenne nezależne */ 21
22 Source SS df MS Number of obs = F( 5, 1077) = Model Prob > F = Resdual R-squared = Adj R-squared = Total Root MSE = dochod Coef. Std. Err. t P> t [95% Conf. Interval] wek wek_ plec sredne wyzsze _cons Ze względu na fakt, że: = β + 2β E ( dochod ) wek wek wek wek _ 2 ne da sę w tak prosty sposób znterpretować oszacowań parametrów przy zmennych dotyczących weku. Zależność mędzy wartoścą oczekwaną dochodu a wekem ne jest już lnowa! Możemy oblczyć werzchołek parabol: βwek xw = = 2*( ) β wek _ 2 Ponadto ramona parabol są skerowane do dołu (bo β wek _ 2 < 0 ), węc w punkce jest przyjmowane maksmum. Czyl dochody osób ponżej 45 roku życa rosną, ale coraz wolnej, powyżej 45 lat dochód zaczyna spadać. Możemy wyznaczyć na podstawe oszacowań modelu pozom dochodu dla osób o wybranych charakterystykach: wek płeć wykształcene dochód 25 mężczyzna wyższe 1333,24 45 mężczyzna wyższe 1494,63 60 mężczyzna wyższe 1405,73 (Np. dochód dla dwudzestopęcoletnego mężczyzn z wykształcenem wyższym: 2-26, ,06131*25-0, * , ). Ponżej jeszcze wykres przedstawający zależność średnego pozomu od weku z nałożoną 2 parabolą o równanu y = -26, ,06131wek - 0, wek. Średn pozom dochodu w zależnośc od weku
23 (Kod Staty, który posłużył do wygenerowana tego wykresu omówmy na ćwczenach). Teraz spróbujemy uwzględnć nelnową zależność mędzy dochodem a wekem za pomocą dwóch funkcj lnowych sklejonych w punkce 45 (werzchołek parabol wyznaczony w poprzednm punkce). Zależność mędzy wartoścą oczekwaną dochodu a wekem możemy zapsać w następujący sposób: δ 0 + δ1wek dla weku < 45 E( dochod ) = δ 2 + δ3wek dla weku 45 Następne defnujemy zmenną zerojedynkową: 0 dla weku < 45 d = 1 dla weku 45 Wówczas postać modelu możemy zapsać jako: β 1 + β 2 wek dla weku < 45 δ0 δ1 E( dochod ) = β1 + β2wek + β3d + β4dwek = ( β1 + β3) + ( β2 + β4) wek dla weku 45 δ2 δ3 Pozostaje narzucć ogranczena na parametry β1,..., β 4, aby zapewnć sobe cągłość w punkce 45. Mus zachodzć: β + β *45 = ( β + β ) + ( β + β )*45 β = 45β Wstawamy uzyskane ogranczene do naszego równana: E( dochod ) = β1 + β2wek 45 β4d + β4dwek = β1 + β2wek + β4 d( wek 45) = β + β wek + β wek _ wek _ 45 Łatwo zauważyć, że jeśl prawdzwa jest hpoteza H0 : β 4 = 0, to model redukuje sę do standardowego modelu lnowego (dochód zależy wówczas w sposób lnowy od weku). Już ne długo nauczymy sę testować take hpotezy. Aby móc oszacować model ze sklejanym funkcjam lnowym, musmy zdefnować nową zmenną: 0 dla weku < 45 wek _ 45 = d( wek 45) = wek 45 dla weku 45. generate wek_45 = 0 /*Tworzymy zmenną o nazwe wek_45; na raze zmenna przyjmuje tylko wartość 0*/. replace wek_45 = wek - 45 f wek >= 45 /*Zamenamy wartość zmennej wek na (wek - 45) dla osób, które mają przynajmnej 45 lat*/. regress dochod wek wek_45 plec sredne wyzsze /*dochod - zmenna zależna, wek, wek_45, plec, sredne, wyzsze - zmenne nezależne */ 23
24 Source SS df MS Number of obs = F( 5, 1077) = Model Prob > F = Resdual R-squared = Adj R-squared = Total Root MSE = dochod Coef. Std. Err. t P> t [95% Conf. Interval] wek wek_ plec sredne wyzsze _cons Na podstawe oszacowanych parametrów, zależność mędzy dochodem a wekem możemy zapsać: ˆ b1 + b2wek dla weku < 45 dochod = = ( b1 45 b4 ) + ( b2 + b4 ) wek dla weku , ,892845wek dla weku < 45 = (376, *(-19,06609)) + (9, ,06609) wek dla weku , ,892845wek dla weku < 45 = 1234,4492 9,173245wek dla weku 45 Jak można znterpretować uzyskane wynk? Dla osób ponżej 45 roku dochód rośne średno o 9,89 zł przy wzrośce weku o jeden rok, natomast dla osób powyżej 45 roku maleje w tempe 9,17 zł na rok. Interpretacja oszacowań przy pozostałych zmennych analogczna do wcześnej oszacowanych model. I znów wykres przedstawający zależność średnego pozomu od weku, tym razem z nałożonym dwoma funkcjam lnowym sklejonym w punkce 45. Średn pozom dochodu w zależnośc od weku Przyjrzyjmy sę jeszcze raz wykresow, który prezentuje zależność mędzy średnm pozomem dochodu a wekem. 24
25 Średn pozom dochodu w zależnośc od weku (mean) dochod wek w latach Może zamast dwóch sklejonych funkcj lnowych, lepej użyć trzech? Zależność mędzy wartoścą oczekwaną dochodu a wekem możemy zapsać w następujący sposób: δ 0 + δ1wek dla weku < 30 E( dochod ) = δ 2 + δ3wek dla weku 30 weku < 45 δ 4 + δ5wek dla weku 45 Następne defnujemy dwe zmenne zero-jedynkowe: 0 dla weku < 30 d1 = 1 dla weku 30 0 dla weku < 45 d2 = 1 dla weku 45 Wówczas postać modelu możemy zapsać jako: E( dochod ) = β + β wek + β d + β d wek + β d + β d wek = β 1 β 2 wek dla weku 30 + < δ0 δ1 = ( β1 + β3) + ( β2 + β4) wek dla weku 30 weku < 45 δ2 δ3 ( β1 + β3 + β5) + ( β2 + β4 + β6) wek dla weku 45 δ4 δ5 25
26 Pozostaje narzucć ogranczena na parametry β1,..., β 6, aby zapewnć sobe cągłość w punktach Warunek na cągłość w 30: β1 + β2 *30 = ( β1 + β3) + ( β2 + β4)*30 β3 = 30β4 Warunek na cągłość w 45: β1 + β3 + ( β2 + β4)*45 = ( β1 + β3 + β5) + ( β2 + β4 + β6)*45 β5 = 45β6 Wstawamy uzyskane ogranczene do naszego równana: E( dochod ) = β + β wek 30β d + β d wek 45β d + β d wek = = β1 + β2wek + β4 d1( wek 30) + β6 d2( wek 45) = wek _ 30 wek _ 45 = β + β wek + β wek _ 30 + β wek _ Łatwo zauważyć, że jeśl prawdzwa jest hpoteza H0 : β4 = β6 = 0, to model redukuje sę do standardowego modelu lnowego (dochód zależy wówczas w sposób lnowy od weku). Aby móc oszacować model ze sklejanym funkcjam lnowym, musmy zdefnować nowe zmenne: 0 dla weku < 30 wek _ 30 = d1( wek 30) = wek 30 dla weku 30 0 dla weku < 45 wek _ 45 = d2( wek 45) = (Tą zmenną stworzylśmy już wek 45 dla weku 45 przy estymacj poprzednego modelu.). generate wek_30 = 0 /*Tworzymy zmenną o nazwe wek_30; na raze zmenna przyjmuje tylko wartość 0*/. replace wek_30 = wek - 30 f wek >= 30 /*Zamenamy wartość zmennej wek na (wek - 30) dla osób, które mają przynajmnej 30 lat*/. regress dochod wek wek_30 wek_45 plec sredne wyzsze /*dochod - zmenna zależna, wek, wek_30, wek_45, plec, sredne, wyzsze - zmenne nezależne */ Source SS df MS Number of obs = F( 6, 1076) = Model Prob > F = Resdual R-squared = Adj R-squared = Total Root MSE = dochod Coef. Std. Err. t P> t [95% Conf. Interval] wek wek_ wek_ plec sredne wyzsze _cons Na podstawe oszacowanych parametrów zależność mędzy dochodem a wekem możemy zapsać: 26
27 b1 + b2wek dla weku < 30 ˆ dochod = ( b1 30 b4 ) + ( b2 + b4 ) wek dla weku [30, 45) = ( b1 30b4 45 b6 ) + ( b2 + b4 + b6 ) wek dla weku 325, ,89292wek dla weku < 30 = (325, *( 2,877238)) + (11, ,877238) wek dla weku [30, 45) ( *( 2,877238) 45*( 17,72131))+(11, , ,72131) wek dla weku , ,89292wek dla weku < 30 = 411, , wek dla weku [30, 45) 1209,3577 8,705628wek dla weku 45 Interpretacja wynków: dla osób ponżej 30 roku dochód rośne średno o 11,89 zł przy wzrośce weku o jeden rok, natomast dla osób w przedzale wekowym [30, 45) w tempe 9,02 zł na rok. Dla osób powyżej 45 roku dochód maleje o 8,71 zł przy wzrośce weku o 1 rok. Na konec wykres: Średn pozom dochodu w zależnośc od weku Można równeż założyć, że zależność mędzy dochodem a wekem wśród osób ponżej 45 roku życa jest kwadratowa, natomast dla osób powyżej 45 roku życa lnowa. Średn pozom dochodu w zależnośc od weku (mean) dochod wek w latach 27
28 Zależność mędzy wartoścą oczekwaną dochodu a wekem zapsujemy w następujący sposób: 2 δ 0 + δ1wek + δ2wek dla weku < 45 E( dochod ) = δ3 + δ4wek dla weku 45 Następne defnujemy zmenną zerojedynkową: 1 dla weku < 45 d = 0 dla weku 45 Wówczas postać modelu możemy zapsać jako: E( dochod ) = β + β wek + β d + β dwek + β dwek = β1 + β3 + ( β2 + β4) wek + β 5 wek dla weku < 45 δ δ 0 δ1 2 = β 1 + β 2 wek dla weku 45 δ3 δ4 Pozostaje narzucć ogranczena na parametry β1,..., β 5, aby zapewnć sobe cągłość w punkce 45. Mus zachodzć: ( β + β ) + ( β + β )*45 + β 45 = β + β *45 β = 45β 45 β Wstawamy uzyskane ogranczene do naszego równana: 2 2 E( dochod ) = β + β wek + ( 45β 45 β ) d + β dwek + β dwek = = β1 + β2wek + β4 d( wek 45) + β5 d( wek 45 ) = wek _ 45 wek _ 2 _ 45 β + β wek + β wek _ 45 + β wek _ 2 _ Łatwo zauważyć, że jeśl prawdzwa jest hpoteza H0 : β4 = β5 = 0, to model redukuje sę do standardowego modelu lnowego (dochód zależy wówczas w sposób lnowy od weku). Aby móc oszacować model ze sklejanym funkcjam lnowym, musmy zdefnować nowe zmenne: wek 45 dla weku < 45 wek _ 45 = d( wek 45) = 0 dla weku wek 45 dla weku < 45 wek _ 2 _ 45 = d( wek 45 ) = 0 dla weku 45. drop wek_45 /*usunęce z pamęc Staty zmennej wek_45*/. generate wek_45 = 0 /*Tworzymy zmenną o nazwe wek_45; na raze zmenna przyjmuje tylko wartość 0*/. replace wek_45 = wek - 45 f wek < 45 /*Zamenamy wartość zmennej wek_45 na (wek - 45) dla osób ponżej 45 lat*/. generate wek_2_45 = 0 /*Tworzymy zmenną o nazwe wek_2_45; na raze zmenna przyjmuje tylko wartość 0*/ 28
29 . replace wek_2_45 = wek^2-45^2 f wek < 45 /*Zamenamy wartość zmennej wek_2_45 na (wek^2-45^2) dla osób ponżej 45 lat*/. regress dochod wek wek_45 wek_2_45 plec sredne wyzsze /*dochod - zmenna zależna, wek, wek_45, wek_2_45, plec, sredne, wyzsze - zmenne nezależne */ Source SS df MS Number of obs = F( 6, 1076) = Model Prob > F = Resdual R-squared = Adj R-squared = Total Root MSE = dochod Coef. Std. Err. t P> t [95% Conf. Interval] wek wek_ wek_2_ plec sredne wyzsze _cons Na podstawe oszacowanych parametrów zależność mędzy dochodem a wekem możemy zapsać: 2 2 ˆ ( b1 45b4 45 b5 ) + ( b2 + b4 ) wek + b5wek dla weku < 45 dochod = = b1 + b2wek dla weku 45 = 1166,541 7,909101wek 2 2 (1166,541 45*29, *( 0, )) + ( 7, ,35264) wek 0, wek dla weku < 45 dla weku 45 + < = 1166,541 7,909101wek dla weku , ,443539wek 0, wek dla weku 45 (*) Narysujemy jeszcze wykres zależnośc średnego pozomu dochodu w zależnośc od weku z nałożoną krzywą (*). Średn pozom dochodu w zależnośc od weku Przejdzemy do analzy wpływu wykształcena płc na dochód. W analzowanych do tej pory przez nas modelach zakładalśmy, że wpływ tych zmennych na dochód był addytywny. Postaramy sę sprawdzć, czy wpływ wykształcena na dochód ne zależy od płc (może mężczyźn z wyższym wykształcenem dostają wyższą premę nż kobety?). W tym celu do modelu wprowadzmy loczyny zmennych płeć wykształcene: E( dochod ) = β1 + β2plec + β3sredne + β4wyzsze + β5plec * sredne + β6plec* wyzsze Zakładamy, że zmenna plec zakodowana jest w następujący sposób: 29
30 0 dla mężczyzn plec = 1 dla kobet Możemy węc wartość oczekwaną dochodu zapsać w następujący sposób: E( dochod ) = β1 dla mężczyzn z wykształcenem podstawowym E( dochod ) = β1 + β2 dla kobet z wykształcenem podstawowym E( dochod ) = β1 + β3 dla mężczyzn z wykształcenem średnm E( dochod ) = β1 + β2 + β3 + β5 dla kobet z wykształcenem średnm E( dochod ) = β1 + β4 dla mężczyzn z wykształcenem wyższym E( dochod ) = β1 + β2 + β4 + β6 dla kobet z wykształcenem wyższym A z tego bezpośredno wynka nterpretacja parametrów, np: β 2 - o le mnej lub węcej zarabają kobety z wykształcenem podstawowym w porównanu z mężczyznam z wykształcenem podstawowym. β2 + β5 - o le mnej lub węcej zarabają kobety z wykształcenem średnm w porównanu z mężczyznam z wykształcenem średnm. β - prema dla mężczyzn za uzyskane wykształcena średnego. 3 β + β - prema dla kobety za uzyskane wykształcena średnego. 3 5 β 5 - różnca w prem mędzy kobetam a mężczyznam za uzyskane wykształcena średnego.. x: regress dochod wek wek_2.plec*.wyksztalcene /*dochod - zmenna zależna, wek, wek_2 oraz nterakcje medzy wykształcenem płcą - zmenne nezależne; prefx x: służy do rozkodowywana zmennych dyskretnych na zero-jedynkowe oraz wprowadzana do modelu nterakcj.plec _Iplec_0-1 (naturally coded; _Iplec_0 omtted).wyksztalcene _Iwyksztalc_1-3 (naturally coded; _Iwyksztalc_1 omtted).plec*.wyks~e _IpleXwyk_#_# (coded as above) Source SS df MS Number of obs = F( 7, 1075) = Model Prob > F = Resdual R-squared = Adj R-squared = Total Root MSE = dochod Coef. Std. Err. t P> t [95% Conf. Interval] wek wek_ _Iplec_ _Iwyksztal~ _Iwyksztal~ _IpleXwyk_~ _IpleXwyk_~ _cons Ops oznaczeń Staty: _Iplec_1 płeć _Iwyksztal~2 wykształcene średne _Iwyksztal~3 wykształcene wyższe _IpleXwyk_~2 płeć x (wykształcene średne) _IpleXwyk_~3 - płeć x (wykształcene wyższe) 30
0. Oszacowanie kilku prostych regresji, interpretacja oszacować parametrów
0. Oszacowane klku prostych regresj, nterpretacja oszacować parametrów Zacznemy od oszacowana metodą najmnejszych kwadratów następującego modelu: dochod = β0 + βwekwek + ε Najperw zastanowmy sę w jak sposób
Stanisław Cichocki. Natalia Nehrebecka. Wykład 7
Stansław Cchock Natala Nehrebecka Wykład 7 . Zmenne dyskretne Kontrasty: efekty progowe, kontrasty w odchylenach Interakcje. Przyblżane model nelnowych Stosowane do zmennych dyskretnych o uporządkowanych
Ntli Natalia Nehrebecka. Dariusz Szymański. Zajęcia 4
Ntl Natala Nehrebecka Darusz Szymańsk Zajęca 4 1 1. Zmenne dyskretne 3. Modele z nterakcjam 2. Przyblżane model dlnelnowych 2 Zmenne dyskretne Zmenne nomnalne Zmenne uporządkowane 3 Neco bardzej skomplkowana
Natalia Nehrebecka. Zajęcia 4
St ł Cchock Stansław C h k Natala Nehrebecka Zajęca 4 1. Interpretacja parametrów przy zmennych zerojedynkowych Zmenne 0 1 Interpretacja przy zmennej 0 1 w modelu lnowym względem zmennych objaśnających
Stanisław Cichocki. Natalia Nehrebecka. Wykład 6
Stansław Cchock Natala Nehrebecka Wykład 6 1 1. Interpretacja parametrów przy zmennych objaśnających cągłych Semelastyczność 2. Zastosowane modelu potęgowego Model potęgowy 3. Zmenne cągłe za zmenne dyskretne
Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4
Stansław Cchock Natala Nehrebecka Zajęca 4 1. Interpretacja parametrów przy zmennych zerojedynkowych Zmenne 0-1 Interpretacja przy zmennej 0 1 w modelu lnowym względem zmennych objaśnających Interpretacja
Stanisław Cichocki. Natalia Nehrebecka. Wykład 7
Stansław Cchock Natala Nehrebecka Wykład 7 1 1. Interakcje 2. Przyblżane model nelnowych 3. Założena KMRL 1. Interakcje 2. Przyblżane model nelnowych 3. Założena KMRL W standardowym modelu lnowym zakładamy,
Stanisław Cichocki. Natalia Nehrebecka. Wykład 6
Stansław Cchock Natala Nehrebecka Wykład 6 1 1. Zastosowane modelu potęgowego Przekształcene Boxa-Coxa 2. Zmenne cągłe za zmenne dyskretne 3. Interpretacja parametrów przy zmennych dyskretnych 1. Zastosowane
Stanisław Cichocki. Natalia Nehrebecka. Wykład 7
Stansław Cchock Natala Nehrebecka Wykład 7 1 1. Zmenne cągłe a zmenne dyskretne 2. Interpretacja parametrów przy zmennych dyskretnych 1. Zmenne cągłe a zmenne dyskretne 2. Interpretacja parametrów przy
IID = 2. i i i i. x nx nx nx
Zadane Analzujemy model z jedną zmenną objaśnającą bez wyrazu wolnego: y = β x + ε, ε ~ (0, σ ), gdze x jest nelosowe.. Wyznacz estymator MNK parametru β oraz oblcz jego warancję. (4 pkt) y. Zaproponowano
Natalia Nehrebecka Stanisław Cichocki. Wykład 10
Natala Nehrebecka Stansław Cchock Wykład 10 1 1. Testy dagnostyczne 2. Testowane prawdłowośc formy funkcyjnej modelu 3. Testowane normalnośc składnków losowych 4. Testowane stablnośc parametrów 5. Testowane
Natalia Nehrebecka Stanisław Cichocki. Wykład 6
Natalia Nehrebecka Stanisław Cichocki Wykład 6 1 1. Zmienne dyskretne Zmienne zero-jedynkowe 2. Modele z interakcjami 2 Zmienne dyskretne Zmienne nominalne Zmienne uporządkowane 3 4 1 podstawowe i 0 podstawowe
Natalia Nehrebecka. Zajęcia 3
St ł Cchock Stansław C h k Natala Nehrebecka Zajęca 3 1. Dobroć dopasowana równana regresj. Współczynnk determnacj R Dk Dekompozycja warancj zmennej zależnej ż Współczynnk determnacj R. Zmenne cągłe a
W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.
Wykład 7 Uwaga: W praktyce często zdarza sę, że wynk obu prób możemy traktować jako wynk pomarów na tym samym elemence populacj np. wynk x przed wynk y po operacj dla tego samego osobnka. Należy wówczas
Stanisław Cichocki. Natalia Nehrebecka. Wykład 6
Stansław Cchock Natala Nehrebecka Wykład 6 1 1. Zastosowane modelu potęgowego Model potęgowy Przekształcene Boxa-Coxa 2. Zmenne cągłe za zmenne dyskretne 3. Interpretacja parametrów przy zmennych dyskretnych
Stanisław Cichocki. Natalia Nehrebecka. Wykład 11
Stansław Cchock Natala Nehrebecka Wykład 11 1 1. Testowane hpotez łącznych 2. Testy dagnostyczne Testowane prawdłowośc formy funkcyjnej: test RESET Testowane normalnośc składnków losowych: test Jarque-Berra
65120/ / / /200
. W celu zbadana zależnośc pomędzy płcą klentów ch preferencjam, wylosowano kobet mężczyzn zadano m pytane: uważasz za lepszy produkt frmy A czy B? Wynk były następujące: Odpowedź Kobety Mężczyźn Wolę
STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH
STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH 1 Test zgodnośc χ 2 Hpoteza zerowa H 0 ( Cecha X populacj ma rozkład o dystrybuance F). Hpoteza alternatywna H1( Cecha X populacj
Zmienne sztuczne i jakościowe
Zmienne o ograniczonym zbiorze wartości Przykład 1. zarobki = β 0 + β 1 liczba godzin pracy + β 2 wykształcenie + ε Przykład 2. zarobki = β 0 + β 1 liczba godzin pracy + β 2 klm + ε zarobki = β 0 + β 1
Weryfikacja hipotez dla wielu populacji
Weryfkacja hpotez dla welu populacj Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Intelgencj Metod Matematycznych Wydzał Informatyk Poltechnk Szczecńskej 5. Parametryczne testy stotnośc w
) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4
Zadane. Nech ( X, Y ),( X, Y ), K,( X, Y n n ) będą nezależnym zmennym losowym o tym samym rozkładze normalnym z następującym parametram: neznaną wartoścą oczekwaną EX = EY = m, warancją VarX = VarY =
Stanisław Cichocki. Natalia Nehrebecka. Wykład 9
Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności
Natalia Nehrebecka. Wykład 2
Natala Nehrebecka Wykład . Model lnowy Postad modelu lnowego Zaps macerzowy modelu lnowego. Estymacja modelu Wartośd teoretyczna (dopasowana) Reszty 3. MNK przypadek jednej zmennej . Model lnowy Postad
Metoda najmniejszych kwadratów
Własności algebraiczne Model liniowy Zapis modelu zarobki = β 0 + β 1 plec + β 2 wiek + ε Oszacowania wartości współczynników zarobki = b 0 + b 1 plec + b 2 wiek + e Model liniowy Tabela: Oszacowania współczynników
Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej
Badane współzależnośc dwóch cech loścowych X Y. Analza korelacj prostej Kody znaków: żółte wyróżnene nowe pojęce czerwony uwaga kursywa komentarz 1 Zagadnena 1. Zwązek determnstyczny (funkcyjny) a korelacyjny.
KURS STATYSTYKA. Lekcja 1 Statystyka opisowa ZADANIE DOMOWE. www.etrapez.pl Strona 1
KURS STATYSTYKA Lekcja 1 Statystyka opsowa ZADANIE DOMOWE www.etrapez.pl Strona 1 Część 1: TEST Zaznacz poprawną odpowedź (tylko jedna jest prawdzwa). Pytane 1 W statystyce opsowej mamy pełne nformacje
Plan wykładu: Typowe dane. Jednoczynnikowa Analiza wariancji. Zasada: porównać zmienność pomiędzy i wewnątrz grup
Jednoczynnkowa Analza Waranc (ANOVA) Wykład 11 Przypomnene: wykłady zadana kursu były zaczerpnęte z podręcznków: Statystyka dla studentów kerunków techncznych przyrodnczych, J. Koronack, J. Melnczuk, WNT
Analiza danych. Analiza danych wielowymiarowych. Regresja liniowa. Dyskryminacja liniowa. PARA ZMIENNYCH LOSOWYCH
Analza danych Analza danych welowymarowych. Regresja lnowa. Dyskrymnacja lnowa. Jakub Wróblewsk jakubw@pjwstk.edu.pl http://zajeca.jakubw.pl/ PARA ZMIENNYCH LOSOWYCH Parę zmennych losowych X, Y możemy
0 0,2 0, p 0,1 0,2 0,5 0, p 0,3 0,1 0,2 0,4
Zad. 1. Dana jest unkcja prawdopodobeństwa zmennej losowej X -5-1 3 8 p 1 1 c 1 Wyznaczyć: a. stałą c b. wykres unkcj prawdopodobeństwa jej hstogram c. dystrybuantę jej wykres d. prawdopodobeństwa: P (
Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE
Inormatyka Podstawy Programowana 06/07 Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE 6. Równana algebraczne. Poszukujemy rozwązana, czyl chcemy określć perwastk rzeczywste równana:
Testowanie hipotez statystycznych
Część 2 Hipoteza złożona Testowanie hipotez łącznych Zapis matematyczny Rozkład statystyki testowej Hipoteza łączna H 0 : Rβ = q Hipoteza złożona Testowanie hipotez łącznych Zapis matematyczny Rozkład
Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu
Część 1 Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy małej próby Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy małej próby Testy
Zaawansowane metody numeryczne Komputerowa analiza zagadnień różniczkowych 1. Układy równań liniowych
Zaawansowane metody numeryczne Komputerowa analza zagadneń różnczkowych 1. Układy równań lnowych P. F. Góra http://th-www.f.uj.edu.pl/zfs/gora/ semestr letn 2006/07 Podstawowe fakty Równane Ax = b, x,
Egzamin ze statystyki/ Studia Licencjackie Stacjonarne/ Termin I /czerwiec 2010
Egzamn ze statystyk/ Studa Lcencjacke Stacjonarne/ Termn /czerwec 2010 Uwaga: Przy rozwązywanu zadań, jeśl to koneczne, naleŝy przyjąć pozom stotnośc 0,01 współczynnk ufnośc 0,99 Zadane 1 PonŜsze zestawene
Badania sondażowe. Braki danych Konstrukcja wag. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa
Badana sondażowe Brak danych Konstrukcja wag Agneszka Zęba Zakład Badań Marketngowych Instytut Statystyk Demograf Szkoła Główna Handlowa 1 Błędy braku odpowedz Całkowty brak odpowedz (UNIT nonresponse)
Egzamin z ekonometrii wersja IiE, MSEMAT
Egzamin z ekonometrii wersja IiE, MSEMAT 04-02-2016 Pytania teoretyczne 1. Za pomocą jakiego testu weryfikowana jest normalność składnika losowego? Jakiemu założeniu KMRL odpowiada w tym teście? Jakie
KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. www.etrapez.pl Strona 1
KURS STATYSTYKA Lekcja 6 Regresja lne regresj ZADANIE DOMOWE www.etrapez.pl Strona 1 Część 1: TEST Zaznacz poprawną odpowedź (tylko jedna jest prawdzwa). Pytane 1 Funkcja regresj I rodzaju cechy Y zależnej
ANALIZA KORELACJI WYDATKÓW NA KULTURĘ Z BUDŻETU GMIN ORAZ WYKSZTAŁCENIA RADNYCH
Potr Mchalsk Węzeł Centralny OŻK-SB 25.12.2013 rok ANALIZA KORELACJI WYDATKÓW NA KULTURĘ Z BUDŻETU GMIN ORAZ WYKSZTAŁCENIA RADNYCH Celem ponższej analzy jest odpowedź na pytane: czy wykształcene radnych
BADANIA OPERACYJNE. Podejmowanie decyzji w warunkach niepewności. dr Adam Sojda
BADANIA OPERACYJNE Podejmowane decyzj w warunkach nepewnośc dr Adam Sojda Teora podejmowana decyzj gry z naturą Wynk dzałana zależy ne tylko od tego, jaką podejmujemy decyzję, ale równeż od tego, jak wystąp
Dobór zmiennych objaśniających
Dobór zmennych objaśnających Metoda grafowa: Należy tak rozpąć graf na werzchołkach opsujących poszczególne zmenne, aby występowały w nm wyłączne łuk symbolzujące stotne korelacje pomędzy zmennym opsującym.
Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński
Mkroekonometra 5 Mkołaj Czajkowsk Wktor Budzńsk Uogólnone modele lnowe Uogólnone modele lnowe (ang. Generalzed Lnear Models GLM) Różną sę od standardowego MNK na dwa sposoby: Rozkład zmennej objaśnanej
Problemy jednoczesnego testowania wielu hipotez statystycznych i ich zastosowania w analizie mikromacierzy DNA
Problemy jednoczesnego testowana welu hpotez statystycznych ch zastosowana w analze mkromacerzy DNA Konrad Furmańczyk Katedra Zastosowań Matematyk SGGW Plan referatu Testowane w analze mkromacerzy DNA
Natalia Nehrebecka. Wykład 1
Natalia Nehrebecka Wykład 1 1 1. Sprawy organizacyjne Zasady zaliczenia Dwiczenia Literatura 2. Czym zajmuje się ekonometria? 3. Formy danych statystycznych 4. Model ekonometryczny 2 1. Sprawy organizacyjne
Natalia Nehrebecka Stanisław Cichocki. Wykład 10
Natalia Nehrebecka Stanisław Cichocki Wykład 10 1 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X
Prawdopodobeństwo statystyka.. r. Zadane. Zakładamy, że,,,,, 5 są nezależnym zmennym losowym o rozkładach normalnych, przy czym E = μ Var = σ dla =,,, oraz E = μ Var = 3σ dla =,, 5. Parametry μ, μ σ są
Analiza struktury zbiorowości statystycznej
Analza struktury zborowośc statystycznej.analza tendencj centralnej. Średne klasyczne Średna arytmetyczna jest parametrem abstrakcyjnym. Wyraża przecętny pozom badanej zmennej (cechy) w populacj generalnej:
Analiza danych OGÓLNY SCHEMAT. http://zajecia.jakubw.pl/ Dane treningowe (znana decyzja) Klasyfikator. Dane testowe (znana decyzja)
Analza danych Dane trenngowe testowe. Algorytm k najblższych sąsadów. Jakub Wróblewsk jakubw@pjwstk.edu.pl http://zajeca.jakubw.pl/ OGÓLNY SCHEMAT Mamy dany zbór danych podzelony na klasy decyzyjne, oraz
Parametry zmiennej losowej
Eonometra Ćwczena Powtórzene wadomośc ze statysty SS EK Defncja Zmenną losową X nazywamy funcję odwzorowującą przestrzeń zdarzeń elementarnych w zbór lczb rzeczywstych, taą że przecwobraz dowolnego zboru
Trzecie laboratoria komputerowe ze Staty Testy
Trzece laboratora komputerowe ze Staty Testy Korzystać będzemy z danych dane_3.dta. Chcemy (jak zwykle ) oszacować model zarobków. Tym razem nteresująca nas postać modelu to: p0 = β + β pd0 + β pl08 +
Ekonometria ćwiczenia Kolokwium 1 semestr 20/12/08. / 5 pkt. / 5 pkt. / 5 pkt. / 5 pkt. /20 pkt. Regulamin i informacje dodatkowe
Ekonometra IE Kolokwum 0/1/08 mę, nazwsko, nr ndeksu: Ekonometra ćwczena Kolokwum 1 semestr 0/1/08 Zadane 1 Zadane Zadane 3 Zadane 4 Razem / 5 pkt / 5 pkt / 5 pkt / 5 pkt /0 pkt Skala ocen: do 8,00 punktów
, a reszta dla pominiętej obserwacji wynosi 0, RSS jest stałe, T SS rośnie, więc zarówno R 2 jak i R2 rosną. R 2 = 1 n 1 n. rosnie. n 2 (1 R2 ) = 1 59
Zadanie 1. Ekonometryk szacując funkcję konsumpcji przeprowadził estymację osobno dla tzw. Polski A oraz Polski B. Dla Polski A posiadał n 1 = 40 obserwacji i uzyskał współczynnik dopasowania RA 2 = 0.4,
dy dx stąd w przybliżeniu: y
Przykłady do funkcj nelnowych funkcj Törnqusta Proszę sprawdzć uzasadnć, które z podanych zdań są prawdzwe, a które fałszywe: Przykład 1. Mesęczne wydatk na warzywa (y, w jednostkach penężnych, jp) w zależnośc
Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński
Mkroekonometra 13 Mkołaj Czajkowsk Wktor Budzńsk Symulacje Analogczne jak w przypadku cągłej zmennej zależnej można wykorzystać metody Monte Carlo do analzy różnego rodzaju problemów w modelach gdze zmenna
Rozwiązywanie zadań optymalizacji w środowisku programu MATLAB
Rozwązywane zadań optymalzacj w środowsku programu MATLAB Zagadnene optymalzacj polega na znajdowanu najlepszego, względem ustalonego kryterum, rozwązana należącego do zboru rozwązań dopuszczalnych. Standardowe
Stanisław Cichocki. Natalia Nehrebecka. Wykład 14
Stanisław Cichocki Natalia Nehrebecka Wykład 14 1 1.Problemy z danymi Współliniowość 2. Heteroskedastyczność i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji Metody radzenia sobie z heteroskedastycznością
Proces narodzin i śmierci
Proces narodzn śmerc Jeżel w ewnej oulacj nowe osobnk ojawają sę w sosób losowy, rzy czym gęstość zdarzeń na jednostkę czasu jest stała w czase wynos λ, oraz lczba osobnków n, które ojawły sę od chwl do
I. Elementy analizy matematycznej
WSTAWKA MATEMATYCZNA I. Elementy analzy matematycznej Pochodna funkcj f(x) Pochodna funkcj podaje nam prędkość zman funkcj: df f (x + x) f (x) f '(x) = = lm x 0 (1) dx x Pochodna funkcj podaje nam zarazem
Statystyka Opisowa 2014 część 2. Katarzyna Lubnauer
Statystyka Opsowa 2014 część 2 Katarzyna Lubnauer Lteratura: 1. Statystyka w Zarządzanu Admr D. Aczel 2. Statystyka Opsowa od Podstaw Ewa Waslewska 3. Statystyka, Lucjan Kowalsk. 4. Statystyka opsowa,
Zadane 1: Wyznacz średne ruchome 3-okresowe z następujących danych obrazujących zużyce energ elektrycznej [kwh] w pewnym zakładze w mesącach styczeń - lpec 1998 r.: 400; 410; 430; 40; 400; 380; 370. Zadane
Funkcje i charakterystyki zmiennych losowych
Funkcje charakterystyk zmennych losowych Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Intelgencj Metod Matematycznych Wydzał Informatyk Poltechnk Szczecńskej 5. Funkcje zmennych losowych
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA. Wkład wstępn. Teora prawdopodobeństwa element kombnatork. Zmenne losowe ch rozkład 3. Populacje prób danch, estmacja parametrów 4. Testowane hpotez statstcznch 5. Test parametrczne
Stanisław Cichocki. Natalia Nehrebecka. Wykład 14
Stanisław Cichocki Natalia Nehrebecka Wykład 14 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne Obserwacje nietypowe i błędne Współliniowość - Mamy 2 modele: y X u 1 1 (1) y X X 1 1 2 2 (2)
Ekonometria dla IiE i MSEMat Z7
Ekonometria dla IiE i MSEMat Z7 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 21-11-2016 Na podstawie zbioru danych cps_small.dat z książki Principles of Econometrics oszacowany
Egzamin z ekonometrii wersja IiE, MSEMAT
Pytania teoretyczne Egzamin z ekonometrii wersja IiE, MSEMAT 08-02-2017 1. W jaki sposób przeprowadzamy test Chowa? 2. Pokazać, że jest nieobciążonym estymatorem. 3. Udowodnić, że w modelu ze stałą TSSESS+RSS.
Ekonometria Ćwiczenia 19/01/05
Oszacowano regresję stopy bezrobocia (unemp) na wzroście realnego PKB (pkb) i stopie inflacji (cpi) oraz na zmiennych zero-jedynkowych związanymi z kwartałami (season). Regresję przeprowadzono na danych
Egzamin z ekonometrii wersja ogólna Pytania teoretyczne
Egzamin z ekonometrii wersja ogólna 31-01-2014 Pytania teoretyczne 1. Podać postać przekształcenia Boxa-Coxa i wyjaśnić, do czego jest stosowane w ekonometrii. 2. Porównaj zastosowania znanych ci kontrastów
Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu
Część 2 Test Durbina-Watsona Test Durbina-Watsona Weryfikowana hipoteza H 0 : cov(ε t, ε t 1 ) = 0 H 1 : cov(ε t, ε t 1 ) 0 Test Durbina-Watsona Weryfikowana hipoteza H 0 : cov(ε t, ε t 1 ) = 0 H 1 : cov(ε
Statystyka Inżynierska
Statystyka Inżynerska dr hab. nż. Jacek Tarasuk AGH, WFIS 013 Wykład DYSKRETNE I CIĄGŁE ROZKŁADY JEDNOWYMIAROWE Zmenna losowa, Funkcja rozkładu, Funkcja gęstośc, Dystrybuanta, Charakterystyk zmennej, Funkcje
SYSTEMY UCZĄCE SIĘ WYKŁAD 7. KLASYFIKATORY BAYESA. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 7. KLASYFIKATORY BAYESA Częstochowa 4 Dr hab. nż. Grzegorz Dudek Wydzał Elektryczny Poltechnka Częstochowska TWIERDZENIE BAYESA Wedza pozyskwana przez metody probablstyczne ma
Statystyka. Zmienne losowe
Statystyka Zmenne losowe Zmenna losowa Zmenna losowa jest funkcją, w której każdej wartośc R odpowada pewen podzbór zboru będący zdarzenem losowym. Zmenna losowa powstaje poprzez przyporządkowane każdemu
Stanisław Cichocki. Natalia Nehrebecka. Wykład 12
Stanisław Cichocki Natalia Nehrebecka Wykład 1 1 1. Testy diagnostyczne Testowanie stabilności parametrów modelu: test Chowa. Heteroskedastyczność Konsekwencje Testowanie heteroskedastyczności 1. Testy
Egzamin z ekonometrii - wersja ogólna
Egzamin z ekonometrii - wersja ogólna 06-02-2019 Regulamin egzaminu 1. Egzamin trwa 90 min. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.
Badanie współzaleŝności dwóch cech ilościowych X i Y. Analiza korelacji prostej. Badanie zaleŝności dwóch cech ilościowych. Analiza regresji prostej
Badane współzaleŝnośc dwóch cech loścowych X Y. Analza korelacj prostej Badane zaleŝnośc dwóch cech loścowych. Analza regresj prostej Kody znaków: Ŝółte wyróŝnene nowe pojęce czerwony uwaga kursywa komentarz
Zmienne Binarne w Pakiecie Stata
Karol Kuhl Zbiór (hipotetyczny) dummy.dta zawiera dane, na podstawie których prowadzono analizy opisane poniżej. Nazwy zmiennych oznaczają: doch dochód w jednostkach pieniężnych; plec płeć: kobieta (0),
Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne
Egzamin z ekonometrii wersja IiE, MSEMat 31-01-2014 Pytania teoretyczne 1. Podać postać przekształcenia Boxa-Coxa i wyjaśnić, do czego jest stosowane w ekonometrii. 2. Wyjaśnić, jakie korzyści i niebezpieczeństwa
Klasyfkator lnowy Wstęp Klasyfkator lnowy jest najprostszym możlwym klasyfkatorem. Zakłada on lnową separację lnowy podzał dwóch klas mędzy sobą. Przedstawa to ponższy rysunek: 5 4 3 1 0-1 - -3-4 -5-5
Nieparametryczne Testy Istotności
Neparametryczne Testy Istotnośc Wzory Neparametryczne testy stotnośc schemat postępowana punkt po punkce Formułujemy hpotezę główną odnoszącą sę do: zgodnośc populacj generalnej z jakmś rozkładem, lub:
Stanisław Cichocki. Natalia Nehrebecka. Wykład 12
Stanisław Cichocki Natalia Nehrebecka Wykład 12 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne 2. Autokorelacja o Testowanie autokorelacji 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne
Egzamin z ekonometrii wersja ogolna
Egzamin z ekonometrii wersja ogolna 04-02-2016 Pytania teoretyczne 1. Wymienić założenia Klasycznego Modelu Regresji Liniowej (KMRL). 2. Wyprowadzić estymator MNK dla modelu z wieloma zmiennymi objaśniającymi.
Stanisław Cichocki. Natalia Nehrebecka. Wykład 10
Stanisław Cichoci Natalia Nehrebeca Wyład 10 1 1. Testowanie hipotez prostych Rozład estymatora b Testowanie hipotez prostych przy użyciu statystyi t Przedziały ufności Badamy czy hipotezy teoretyczne
Stanisław Cichocki. Natalia Nehrebecka. Wykład 10
Stanisław Cichocki Natalia Nehrebecka Wykład 10 1 1. Testy diagnostyczne Testowanie prawidłowości formy funkcyjnej: test RESET Testowanie normalności składników losowych: test Jarque-Berra Testowanie stabilności
Stanisław Cichocki. Natalia Nehrebecka. Wykład 13
Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Testowanie autokorelacji 2. Heteroskedastyczność i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji 3.Problemy z danymi Zmienne pominięte
Zaawansowane metody numeryczne
Wykład 9. jej modyfkacje. Oznaczena Będzemy rozpatrywać zagadnene rozwązana następującego układu n równań lnowych z n newadomym x 1... x n : a 11 x 1 + a 12 x 2 +... + a 1n x n = b 1 a 21 x 1 + a 22 x
Egzamin z ekonometrii wersja ogólna Pytania teoretyczne
Egzamin z ekonometrii wersja ogólna 08-02-2017 Pytania teoretyczne 1. Za pomocą którego testu testujemy stabilność parametrów? Jakiemu założeniu KMRL odpowiada H0 w tym teście? Jaka jest hipoteza alternatywna
Analiza rodzajów skutków i krytyczności uszkodzeń FMECA/FMEA według MIL STD - 1629A
Analza rodzajów skutków krytycznośc uszkodzeń FMECA/FMEA według MIL STD - 629A Celem analzy krytycznośc jest szeregowane potencjalnych rodzajów uszkodzeń zdentyfkowanych zgodne z zasadam FMEA na podstawe
Diagnostyka układów kombinacyjnych
Dagnostyka układów kombnacyjnych 1. Wprowadzene Dagnostyka obejmuje: stwerdzene stanu układu, systemu lub ogólne sec logcznej. Jest to tzw. kontrola stanu wykrywająca czy dzałane sec ne jest zakłócane
Hipotezy o istotności oszacowao parametrów zmiennych objaśniających ˆ ) ˆ
WERYFIKACJA HIPOTEZY O ISTOTNOŚCI OCEN PARAMETRÓW STRUKTURALNYCH MODELU Hpoezy o sonośc oszacowao paramerów zmennych objaśnających Tesowane sonośc paramerów zmennych objaśnających sprowadza sę do nasępującego
Prawdopodobieństwo i statystyka r.
Prawdopodobeństwo statystya.05.00 r. Zadane Zmenna losowa X ma rozład wyładnczy o wartośc oczewanej, a zmenna losowa Y rozład wyładnczy o wartośc oczewanej. Obe zmenne są nezależne. Oblcz E( Y X + Y =
Problem równoczesności w MNK
Problem równoczesności w MNK O problemie równoczesności mówimy, gdy występuje korelacja między wartościa oczekiwana ε i i równoczesnym x i Model liniowy y = Xβ + ε, E (u) = 0 Powiedzmy, że występuje w
5. Pochodna funkcji. lim. x c x c. (x c) = lim. g(c + h) g(c) = lim
5. Pocodna funkcj Defncja 5.1 Nec f: (a, b) R nec c (a, b). Jeśl stneje granca lm x c x c to nazywamy ją pocodną funkcj f w punkce c oznaczamy symbolem f (c) Twerdzene 5.1 Jeśl funkcja f: (a, b) R ma pocodną
METODA UNITARYZACJI ZEROWANEJ Porównanie obiektów przy ocenie wielokryterialnej. Ranking obiektów.
Opracowane: Dorota Mszczyńska METODA UNITARYZACJI ZEROWANEJ Porównane obektów przy ocene welokryteralnej. Rankng obektów. Porównane wybranych obektów (warantów decyzyjnych) ze względu na różne cechy (krytera)
1 Modele ADL - interpretacja współczynników
1 Modele ADL - interpretacja współczynników ZADANIE 1.1 Dany jest proces DL następującej postaci: y t = µ + β 0 x t + β 1 x t 1 + ε t. 1. Wyjaśnić, jaka jest intepretacja współczynników β 0 i β 1. 2. Pokazać
Budowa modelu i testowanie hipotez
Problemy metodologiczne Gdzie jest problem? Obciążenie Lovella Dysponujemy oszacowaniami parametrów następującego modelu y t = β 0 + β 1 x 1 +... + β k x k + ε t Gdzie jest problem? Obciążenie Lovella
Diagonalizacja macierzy kwadratowej
Dagonalzacja macerzy kwadratowej Dana jest macerz A nân. Jej wartośc własne wektory własne spełnają równane Ax x dla,..., n Każde z równań własnych osobno można zapsać w postac: a a an x x a a an x x an
EKONOMETRIA I Spotkanie 1, dn. 05.10.2010
EKONOMETRIA I Spotkane, dn. 5..2 Dr Katarzyna Beń Program ramowy: http://www.sgh.waw.pl/nstytuty/e/oferta_dydaktyczna/ekonometra_stacjonarne_nest acjonarne/ Zadana, dane do zadań, ważne nformacje: http://www.e-sgh.pl/ben/ekonometra
Statystyka Opisowa 2014 część 1. Katarzyna Lubnauer
Statystyka Opsowa 2014 część 1 Katarzyna Lubnauer Lteratura: 1. Statystyka w Zarządzanu Admr D. Aczel 2. Statystyka Opsowa od Podstaw Ewa Waslewska 3. Statystyka, Lucjan Kowalsk. 4. Statystyka opsowa,
WikiWS For Business Sharks
WkWS For Busness Sharks Ops zadana konkursowego Zadane Opracowane algorytmu automatyczne przetwarzającego zdjęce odręczne narysowanego dagramu na tablcy lub kartce do postac wektorowej zapsanej w formace
brak podstaw do odrzucenia hipotezy zerowej.
Paca domowa 9. W pewnym bowaze zanstalowano dwa automaty do napełnana butelek. Ilość pwa nalewana pzez pewszy est zmenną losową o ozkładze N( m,, a lość pwa dozowana pzez dug automat est zmenną losową
Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.
imię, nazwisko, nr indeksu: Ekonometria egzamin 0/0/0. Egzamin trwa 90 minut.. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu. Złamanie
Natalia Nehrebecka. Dariusz Szymański
Natala Nehrebecka Darusz Szymańsk . Sprawy organzacyjne Zasady zalczena Ćwczena Lteratura. Czym zajmuje sę ekonometra? Model ekonometryczny 3. Model lnowy Postać modelu lnowego Zaps macerzowy modelu dl