Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski
Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje: PIĄTEK 13.15-14.50 (P) PONIEDZIAŁEK 16.30-18.00 (N) + dodatkowe
Literatura obowiązkowa Aczel A. (2011), Statystyka w zarządzaniu. Pełny wykład, WN PWN, Warszawa. Maddala G.S. (2008), Ekonometria, WN PWN, Warszawa. Uzupełnieniem wykładów będzie samodzielna praca i lektura fragmentów ww. książek. Lektura jest obowiązkowa (zajęcia to ok. 30% ECTS)
Zaliczenie Kolokwium z całości materiału (70%) Mini-badanie z użyciem metod poznanych na zajęciach + obrona (30%) Szczegóły nieco później Bardziej praktyczne zastosowania i intuicja niż sucha teoria (ale pewnych elementów teorii nie unikniemy) Aktywność = dodatkowe punkty (do 10%)
Po co metody ilościowe? Coraz łatwiejszy dostęp do danych, łatwa obróbka przy pomocy komputera Analizy bardziej obiektywne niż sam opis Możliwość formalnego testowania (dziś ) Możliwość określenia ile oczywiście również mają ograniczenia i wady!
Przykłady Jak dźwignia finansowa wpływa na zysk (analiza korelacji i regresji) Czy spółki giełdowe mają lepsze wyniki finansowe niż pozostałe? (test równości średnich) Czy występuje efekt stycznia? (test istotności) Kto nie spłaci kredytu? Ile wynosi p-stwo default? (regresja logistyczna) Ile wyniesie dług publiczny w 2014? (prognozowanie, analiza trendu)
Część I Aczel: s. 186-198, 265-274, 340, 353-358 + przypomnienie r. 3 i r. 4 TESTY STATYSTYCZNE PRZYPOMNIENIE I INTUICJA
CZY ŚREDNIA JEST RÓWNA 15? Wartość oczekiwana (populacja generalne) I próbka Czy 10 może być (statystycznie) równe 12? 15? 11? 3?
Estymacja Szacowanie nieznanego parametry na podstawie próby; szacujemy - czyli zawsze popełnimy błąd [nieunikniony ] Ile wynosi średnia z losowo wybranej próby jeśli wiemy, że średnia z populacji wynosi 10? (dodatkowo np. znamy odchylenie standardowe, ale to mniej istotne )
5,05 5,32 5,59 5,86 6,13 6,4 6,67 6,94 7,21 7,48 7,75 8,02 8,29 8,56 8,83 9,1 9,37 9,64 9,98 10,17 10,45 10,72 10,99 11,26 11,53 11,8 12,07 12,34 12,61 12,88 13,15 13,42 13,69 13,96 14,23 14,5 14,77 15,04 Średnia z próby rozkład (normalny lub t-studenta) 0,5 0,4 0,3 0,2 0,1 0
Testowanie hipotez H0: wartość oczekiwana z populacji A = 10 (w skrócie: μ A = 10) H1: wartość oczekiwana z populacji A 10 (ewentualnie: > albo <)
Wartość krytyczna, błąd I i II rodzaju SĘDZIA Anna Maria Wesołowska Przestępca Sędzia NIEWINNY WINNY NIEWINNY Błąd II rodz. WINNY Błąd I rodz. Jak ustalić granicę skazania? (czyli: wartość krytyczną)
To samo dla hipotez Takie same błędy popełniamy podczas weryfikacji (testowania) hipotez Błąd I rodzaju = poziom istotności (wielkość tego błędu zakładamy) Prawdziwy świat Test statystyczny H0 H1 H0 Błąd II rodz. H1 Błąd I rodz.
Testowanie hipotez (2) H0: wartość oczekiwana z populacji A = wartość oczekiwana z populacji B (w skrócie: μ A = μ B ) H1: wartość oczekiwana z populacji A wartość oczekiwana z populacji B (ewentualnie: > albo <)
Część II Maddala, rozdz. 3.1, 3.2, 3.4, 3.9 LINIOWA REGRESJA
Wydatki a dochody 3500 3000 2500 2000 1500 1000 500 0 0 1000 2000 3000 4000 5000 6000
Specyfikacja Liniowa postać zależności [TYPOWE] Wyraz wolny [TYPOWE] Dochody wpływają na wydatki (a nie odwrotnie) Zależność statystyczna [TYPOWE] y i = α 0 + α 1 x i + ε i Zmienna endogeniczna, egzogeniczna, skł.los
Składnik losowy Wahania czysto losowe Pominięte zmienne - wszystko co wpływa na y, a nie da się opisać za pomocą x Błędy pomiaru zmiennej y Założenia dot. składnika losowego
Składnik losowy - założenia Maddala (2008, s. 100): 1) Wartość oczekiwana = 0 2) Jednakowa wariancja 3) Niezależność po obserwacjach 4) Niezależność składnika los. i zmiennej ezgo- 5) Normalność
Jak poprowadzić prostą? 3500 3000 2500 2000 1500 1000 500 0 0 1000 2000 3000 4000 5000 6000
Metod najmniejszych kwadratów y i = α 0 + α 1 x i + ε i Szukamy takich a0 i a1 (oszacowania): i (y i a 0 a 1 x i ) 2 min
Jak poprowadzić prostą? 3500 3000 2500 2000 1500 1000 500 0 0 1000 2000 3000 4000 5000 6000
Wzór macierzowy a 0 a 1 = X T X 1 X T y NIE UCZCIE SIĘ NIEPOTRZEBNYCH WZORÓW!!!
Interpretacja y i = a 0 + a 1 x i Jeśli x wzrośnie o 1 jedn., to y wzrośnie o a1 jednostek (ceteris paribus)
Regresja c.d. Ilość stopni swobody np. regresja dla 1 obserwacji, 2 obserwacji Zależność nieliniowa, ale liniowa względem parametrów y i = α 0 + α 1 x i + ε i y i = f y i x i = g(x i )
N=1 K=2 2,5 2 1,5 1 0,5 0 0 500 1000 1500 2000 2500
N=2 K=2 2,5 2 1,5 1 0,5 0 0 500 1000 1500 2000 2500
Funkcja wykładnicza zamiast prostej 4500 4000 3500 3000 2500 2000 1500 1000 500 0 0 1000 2000 3000 4000 5000 6000
Dopasowanie, test istotności Czy dochody istotnie wpływają na wydatki? (czyli: czy parametr α 1 = 0???) test t-studenta Jak dobrze dopasowane jest równanie? R 2 R 2 skorygowany SE
Dziękuję za uwagę