Statystyka, Ekonometria Wykład dla Geodezji i Kartografii 11 kwietnia 2011 () Statystyka, Ekonometria 11 kwietnia 2011 1 / 31
LITERATURA J. Hozer, S.Kokot, W. Kuźmiński metody analizy statystycznej w wycenie nieruchomości, Warszawa 2002 B. Ney Metody statystyczne w geodezji,. Wyd. AGH, Kraków 1976 M. Gruszczyński, T. Kuszewski, M. Podgórska, Ekonometria i badania operacyjne, PWN Warszawa 2009, A. Barańska, Criteria of Database Quality Appraisement and Choice Stochastic Models in Prediction of Real Estate Market Value, FIG Working Week 2004, Athens, Greece M. Chumek; A. Iwaszkiewicz, Statystyka matematyczna w wycenie nieruchomości, Nieruchomości nr 9 [73] wrzesień 2004. () Statystyka, Ekonometria 11 kwietnia 2011 2 / 31
Metody statystyczne powinny znajdować zastosowanie do analizy rynku nieruchomości (...), a wyniki takich analiz powinny być wykorzystane do wyceny nieruchomości w ramach podejścia porównawczego i podejścia dochodowego. Zastosowanie metod statystycznych do identyfikacji zjawisk zachodzących na rynku nieruchomości obiektywizuje wnioski płynące z ich obserwacji. ("UŻYTECZNOŚĆ MODELI EKONOMETRYCZNYCH W WYCENIE NIERUCHOMOŚCI POLSKIE I ZAGRANICZNE OPINIE", R. Pawlukowicz, AE Wrocław) () Statystyka, Ekonometria 11 kwietnia 2011 3 / 31
Część I Zmienne losowe () Statystyka, Ekonometria 11 kwietnia 2011 4 / 31
Populacja jest zbiorem, który badamy. Jeśli niemożliwe jest zbadanie go w całości, pobieramy próbę i badamy ją. Statystyka zajmuje się wnioskowaniem o populacji na podstawie próby przy pomocy metod rachunku prawdopodobieństwa. Ekonometria to dział statystyki obejmujacy badania nieeksperymentalne, badajacy zależności występujace w procesach ekonomicznych. Definicja Zmienna losowa X nazywamy funkcję przyporzadkowuj ac a zdarzeniu elementarnemu liczbę, tzn. X(ω) R. Example wynik egzaminu (ocena, punkty), wynik pomiaru długości działki, liczba transakcji nieruchomościami na terenie gminy, cena nieruchomości (np. 1m 2 działki lub mieszkania), średnia cena. () Statystyka, Ekonometria 11 kwietnia 2011 5 / 31
Populacja jest zbiorem, który badamy. Jeśli niemożliwe jest zbadanie go w całości, pobieramy próbę i badamy ją. Statystyka zajmuje się wnioskowaniem o populacji na podstawie próby przy pomocy metod rachunku prawdopodobieństwa. Ekonometria to dział statystyki obejmujacy badania nieeksperymentalne, badajacy zależności występujace w procesach ekonomicznych. Definicja Zmienna losowa X nazywamy funkcję przyporzadkowuj ac a zdarzeniu elementarnemu liczbę, tzn. X(ω) R. Example wynik egzaminu (ocena, punkty), wynik pomiaru długości działki, liczba transakcji nieruchomościami na terenie gminy, cena nieruchomości (np. 1m 2 działki lub mieszkania), średnia cena. () Statystyka, Ekonometria 11 kwietnia 2011 5 / 31
Populacja jest zbiorem, który badamy. Jeśli niemożliwe jest zbadanie go w całości, pobieramy próbę i badamy ją. Statystyka zajmuje się wnioskowaniem o populacji na podstawie próby przy pomocy metod rachunku prawdopodobieństwa. Ekonometria to dział statystyki obejmujacy badania nieeksperymentalne, badajacy zależności występujace w procesach ekonomicznych. Definicja Zmienna losowa X nazywamy funkcję przyporzadkowuj ac a zdarzeniu elementarnemu liczbę, tzn. X(ω) R. Example wynik egzaminu (ocena, punkty), wynik pomiaru długości działki, liczba transakcji nieruchomościami na terenie gminy, cena nieruchomości (np. 1m 2 działki lub mieszkania), średnia cena. () Statystyka, Ekonometria 11 kwietnia 2011 5 / 31
Populacja jest zbiorem, który badamy. Jeśli niemożliwe jest zbadanie go w całości, pobieramy próbę i badamy ją. Statystyka zajmuje się wnioskowaniem o populacji na podstawie próby przy pomocy metod rachunku prawdopodobieństwa. Ekonometria to dział statystyki obejmujacy badania nieeksperymentalne, badajacy zależności występujace w procesach ekonomicznych. Definicja Zmienna losowa X nazywamy funkcję przyporzadkowuj ac a zdarzeniu elementarnemu liczbę, tzn. X(ω) R. Example wynik egzaminu (ocena, punkty), wynik pomiaru długości działki, liczba transakcji nieruchomościami na terenie gminy, cena nieruchomości (np. 1m 2 działki lub mieszkania), średnia cena. () Statystyka, Ekonometria 11 kwietnia 2011 5 / 31
Populacja jest zbiorem, który badamy. Jeśli niemożliwe jest zbadanie go w całości, pobieramy próbę i badamy ją. Statystyka zajmuje się wnioskowaniem o populacji na podstawie próby przy pomocy metod rachunku prawdopodobieństwa. Ekonometria to dział statystyki obejmujacy badania nieeksperymentalne, badajacy zależności występujace w procesach ekonomicznych. Definicja Zmienna losowa X nazywamy funkcję przyporzadkowuj ac a zdarzeniu elementarnemu liczbę, tzn. X(ω) R. Example wynik egzaminu (ocena, punkty), wynik pomiaru długości działki, liczba transakcji nieruchomościami na terenie gminy, cena nieruchomości (np. 1m 2 działki lub mieszkania), średnia cena. () Statystyka, Ekonometria 11 kwietnia 2011 5 / 31
Populacja jest zbiorem, który badamy. Jeśli niemożliwe jest zbadanie go w całości, pobieramy próbę i badamy ją. Statystyka zajmuje się wnioskowaniem o populacji na podstawie próby przy pomocy metod rachunku prawdopodobieństwa. Ekonometria to dział statystyki obejmujacy badania nieeksperymentalne, badajacy zależności występujace w procesach ekonomicznych. Definicja Zmienna losowa X nazywamy funkcję przyporzadkowuj ac a zdarzeniu elementarnemu liczbę, tzn. X(ω) R. Example wynik egzaminu (ocena, punkty), wynik pomiaru długości działki, liczba transakcji nieruchomościami na terenie gminy, cena nieruchomości (np. 1m 2 działki lub mieszkania), średnia cena. () Statystyka, Ekonometria 11 kwietnia 2011 5 / 31
Populacja jest zbiorem, który badamy. Jeśli niemożliwe jest zbadanie go w całości, pobieramy próbę i badamy ją. Statystyka zajmuje się wnioskowaniem o populacji na podstawie próby przy pomocy metod rachunku prawdopodobieństwa. Ekonometria to dział statystyki obejmujacy badania nieeksperymentalne, badajacy zależności występujace w procesach ekonomicznych. Definicja Zmienna losowa X nazywamy funkcję przyporzadkowuj ac a zdarzeniu elementarnemu liczbę, tzn. X(ω) R. Example wynik egzaminu (ocena, punkty), wynik pomiaru długości działki, liczba transakcji nieruchomościami na terenie gminy, cena nieruchomości (np. 1m 2 działki lub mieszkania), średnia cena. () Statystyka, Ekonometria 11 kwietnia 2011 5 / 31
Populacja jest zbiorem, który badamy. Jeśli niemożliwe jest zbadanie go w całości, pobieramy próbę i badamy ją. Statystyka zajmuje się wnioskowaniem o populacji na podstawie próby przy pomocy metod rachunku prawdopodobieństwa. Ekonometria to dział statystyki obejmujacy badania nieeksperymentalne, badajacy zależności występujace w procesach ekonomicznych. Definicja Zmienna losowa X nazywamy funkcję przyporzadkowuj ac a zdarzeniu elementarnemu liczbę, tzn. X(ω) R. Example wynik egzaminu (ocena, punkty), wynik pomiaru długości działki, liczba transakcji nieruchomościami na terenie gminy, cena nieruchomości (np. 1m 2 działki lub mieszkania), średnia cena. () Statystyka, Ekonometria 11 kwietnia 2011 5 / 31
Typy zmiennych losowych: skokowe (dyskretne). Mogą przyjąć skończoną lub przeliczalną liczbę wartości z pewnego W. np. liczba współwłaścicieli nieruchomości, liczba drzew na działce budowlanej, liczba pomieszczeń w mieszkaniu. ciągłe. Mogą przyjąć wszystkie wartości z pewnego przedziału [a, b]. np. pole pow. działki, cena 1 m 2, odległość od centrum miasta Często wyróżnia się także tzw. zmienne jakościowe, np. jakość wyrobu, jakość gleby. Nie są to zm. losowe według powyższej definicji, ale statystyka dysponuje także metodami ich badania. () Statystyka, Ekonometria 11 kwietnia 2011 6 / 31
Typy zmiennych losowych: skokowe (dyskretne). Mogą przyjąć skończoną lub przeliczalną liczbę wartości z pewnego W. np. liczba współwłaścicieli nieruchomości, liczba drzew na działce budowlanej, liczba pomieszczeń w mieszkaniu. ciągłe. Mogą przyjąć wszystkie wartości z pewnego przedziału [a, b]. np. pole pow. działki, cena 1 m 2, odległość od centrum miasta Często wyróżnia się także tzw. zmienne jakościowe, np. jakość wyrobu, jakość gleby. Nie są to zm. losowe według powyższej definicji, ale statystyka dysponuje także metodami ich badania. () Statystyka, Ekonometria 11 kwietnia 2011 6 / 31
Typy zmiennych losowych: skokowe (dyskretne). Mogą przyjąć skończoną lub przeliczalną liczbę wartości z pewnego W. np. liczba współwłaścicieli nieruchomości, liczba drzew na działce budowlanej, liczba pomieszczeń w mieszkaniu. ciągłe. Mogą przyjąć wszystkie wartości z pewnego przedziału [a, b]. np. pole pow. działki, cena 1 m 2, odległość od centrum miasta Często wyróżnia się także tzw. zmienne jakościowe, np. jakość wyrobu, jakość gleby. Nie są to zm. losowe według powyższej definicji, ale statystyka dysponuje także metodami ich badania. () Statystyka, Ekonometria 11 kwietnia 2011 6 / 31
Typy zmiennych losowych: skokowe (dyskretne). Mogą przyjąć skończoną lub przeliczalną liczbę wartości z pewnego W. np. liczba współwłaścicieli nieruchomości, liczba drzew na działce budowlanej, liczba pomieszczeń w mieszkaniu. ciągłe. Mogą przyjąć wszystkie wartości z pewnego przedziału [a, b]. np. pole pow. działki, cena 1 m 2, odległość od centrum miasta Często wyróżnia się także tzw. zmienne jakościowe, np. jakość wyrobu, jakość gleby. Nie są to zm. losowe według powyższej definicji, ale statystyka dysponuje także metodami ich badania. () Statystyka, Ekonometria 11 kwietnia 2011 6 / 31
Typy zmiennych losowych: skokowe (dyskretne). Mogą przyjąć skończoną lub przeliczalną liczbę wartości z pewnego W. np. liczba współwłaścicieli nieruchomości, liczba drzew na działce budowlanej, liczba pomieszczeń w mieszkaniu. ciągłe. Mogą przyjąć wszystkie wartości z pewnego przedziału [a, b]. np. pole pow. działki, cena 1 m 2, odległość od centrum miasta Często wyróżnia się także tzw. zmienne jakościowe, np. jakość wyrobu, jakość gleby. Nie są to zm. losowe według powyższej definicji, ale statystyka dysponuje także metodami ich badania. () Statystyka, Ekonometria 11 kwietnia 2011 6 / 31
Typy zmiennych losowych: skokowe (dyskretne). Mogą przyjąć skończoną lub przeliczalną liczbę wartości z pewnego W. np. liczba współwłaścicieli nieruchomości, liczba drzew na działce budowlanej, liczba pomieszczeń w mieszkaniu. ciągłe. Mogą przyjąć wszystkie wartości z pewnego przedziału [a, b]. np. pole pow. działki, cena 1 m 2, odległość od centrum miasta Często wyróżnia się także tzw. zmienne jakościowe, np. jakość wyrobu, jakość gleby. Nie są to zm. losowe według powyższej definicji, ale statystyka dysponuje także metodami ich badania. () Statystyka, Ekonometria 11 kwietnia 2011 6 / 31
Definicja Dystrybuanta zmiennej X nazywamy funkcję F : R R taka, że tzn. F(x) = P({ω : X(ω) < x}). F(x) = P(X < x), Dystrybuanta jest funkcją, która zawiera pełną informację o zmiennej losowej, tzn. w całości ją charakteryzuje. Poza tym zmienna losowa dyskretna jest scharakteryzowana przez swój rozkład p dany najczęściej w postaci x i x 1 x 2... p i = p(x i ) p 1 p 2... Zmienna ciągła jest scharakteryzowana przez funkcję gęstości prawdopodobieństwa f (x). () Statystyka, Ekonometria 11 kwietnia 2011 7 / 31
Definicja Dystrybuanta zmiennej X nazywamy funkcję F : R R taka, że tzn. F(x) = P({ω : X(ω) < x}). F(x) = P(X < x), Dystrybuanta jest funkcją, która zawiera pełną informację o zmiennej losowej, tzn. w całości ją charakteryzuje. Poza tym zmienna losowa dyskretna jest scharakteryzowana przez swój rozkład p dany najczęściej w postaci x i x 1 x 2... p i = p(x i ) p 1 p 2... Zmienna ciągła jest scharakteryzowana przez funkcję gęstości prawdopodobieństwa f (x). () Statystyka, Ekonometria 11 kwietnia 2011 7 / 31
Definicja Dystrybuanta zmiennej X nazywamy funkcję F : R R taka, że tzn. F(x) = P({ω : X(ω) < x}). F(x) = P(X < x), Dystrybuanta jest funkcją, która zawiera pełną informację o zmiennej losowej, tzn. w całości ją charakteryzuje. Poza tym zmienna losowa dyskretna jest scharakteryzowana przez swój rozkład p dany najczęściej w postaci x i x 1 x 2... p i = p(x i ) p 1 p 2... Zmienna ciągła jest scharakteryzowana przez funkcję gęstości prawdopodobieństwa f (x). () Statystyka, Ekonometria 11 kwietnia 2011 7 / 31
Definicja Dystrybuanta zmiennej X nazywamy funkcję F : R R taka, że tzn. F(x) = P({ω : X(ω) < x}). F(x) = P(X < x), Dystrybuanta jest funkcją, która zawiera pełną informację o zmiennej losowej, tzn. w całości ją charakteryzuje. Poza tym zmienna losowa dyskretna jest scharakteryzowana przez swój rozkład p dany najczęściej w postaci x i x 1 x 2... p i = p(x i ) p 1 p 2... Zmienna ciągła jest scharakteryzowana przez funkcję gęstości prawdopodobieństwa f (x). () Statystyka, Ekonometria 11 kwietnia 2011 7 / 31
Definicja Dystrybuanta zmiennej X nazywamy funkcję F : R R taka, że tzn. F(x) = P({ω : X(ω) < x}). F(x) = P(X < x), Dystrybuanta jest funkcją, która zawiera pełną informację o zmiennej losowej, tzn. w całości ją charakteryzuje. Poza tym zmienna losowa dyskretna jest scharakteryzowana przez swój rozkład p dany najczęściej w postaci x i x 1 x 2... p i = p(x i ) p 1 p 2... Zmienna ciągła jest scharakteryzowana przez funkcję gęstości prawdopodobieństwa f (x). () Statystyka, Ekonometria 11 kwietnia 2011 7 / 31
Własności F oraz p i f : p i = 1 x i W f (x)dx = 1 R F(x) = F(x) = p i x i <x x f (t)dt oraz f (x) = F (x) (jeśli F istnieje) () Statystyka, Ekonometria 11 kwietnia 2011 8 / 31
Własności F oraz p i f : p i = 1 x i W f (x)dx = 1 R F(x) = F(x) = p i x i <x x f (t)dt oraz f (x) = F (x) (jeśli F istnieje) () Statystyka, Ekonometria 11 kwietnia 2011 8 / 31
Własności F oraz p i f : p i = 1 x i W f (x)dx = 1 R F(x) = F(x) = p i x i <x x f (t)dt oraz f (x) = F (x) (jeśli F istnieje) () Statystyka, Ekonometria 11 kwietnia 2011 8 / 31
Własności F oraz p i f : p i = 1 x i W f (x)dx = 1 R F(x) = F(x) = p i x i <x x f (t)dt oraz f (x) = F (x) (jeśli F istnieje) () Statystyka, Ekonometria 11 kwietnia 2011 8 / 31
Własności F oraz p i f : p i = 1 x i W f (x)dx = 1 R F(x) = F(x) = p i x i <x x f (t)dt oraz f (x) = F (x) (jeśli F istnieje) () Statystyka, Ekonometria 11 kwietnia 2011 8 / 31
Charakterystyki (parametry) zmiennych losowych: charakterystyka zmienna dyskretna zmienna ciągła średnia x i p i x f (x) dx (w. oczekiwana) EX = m wariancja D 2 X = σ 2 odch. standardowe DX = σ x i W Inne: mediana x med : F(x med ) = 1 2. momenty (centralne) wyższych rzędów (x i m) 2 p i (x m) 2 f (x) dx x i W R = xi 2 p i E 2 X = x 2 f (x) dx E 2 X x i W R D 2 X jak dla dyskr. R () Statystyka, Ekonometria 11 kwietnia 2011 9 / 31
Charakterystyki (parametry) zmiennych losowych: charakterystyka zmienna dyskretna zmienna ciągła średnia x i p i x f (x) dx (w. oczekiwana) EX = m wariancja D 2 X = σ 2 odch. standardowe DX = σ x i W Inne: mediana x med : F(x med ) = 1 2. momenty (centralne) wyższych rzędów (x i m) 2 p i (x m) 2 f (x) dx x i W R = xi 2 p i E 2 X = x 2 f (x) dx E 2 X x i W R D 2 X jak dla dyskr. R () Statystyka, Ekonometria 11 kwietnia 2011 9 / 31
Charakterystyki (parametry) zmiennych losowych: charakterystyka zmienna dyskretna zmienna ciągła średnia x i p i x f (x) dx (w. oczekiwana) EX = m wariancja D 2 X = σ 2 odch. standardowe DX = σ x i W Inne: mediana x med : F(x med ) = 1 2. momenty (centralne) wyższych rzędów (x i m) 2 p i (x m) 2 f (x) dx x i W R = xi 2 p i E 2 X = x 2 f (x) dx E 2 X x i W R D 2 X jak dla dyskr. R () Statystyka, Ekonometria 11 kwietnia 2011 9 / 31
Niektóre, często występujące rozkłady zmiennych losowych dyskretnych 1 rozkład Bernoulli ego 2 rozkład Poissona, W = {0, 1,...} Występuje w zjawiskach losowych: liczba zgłoszeń do węzła sieci np. BSC, RNC liczba transakcji przeprowadzonych w ciągu roku na pewnym obszarze. () Statystyka, Ekonometria 11 kwietnia 2011 10 / 31
Niektóre, często występujące rozkłady zmiennych losowych dyskretnych 1 rozkład Bernoulli ego 2 rozkład Poissona, W = {0, 1,...} Występuje w zjawiskach losowych: liczba zgłoszeń do węzła sieci np. BSC, RNC liczba transakcji przeprowadzonych w ciągu roku na pewnym obszarze. () Statystyka, Ekonometria 11 kwietnia 2011 10 / 31
Niektóre, często występujące rozkłady zmiennych losowych dyskretnych 1 rozkład Bernoulli ego 2 rozkład Poissona, W = {0, 1,...} Występuje w zjawiskach losowych: liczba zgłoszeń do węzła sieci np. BSC, RNC liczba transakcji przeprowadzonych w ciągu roku na pewnym obszarze. () Statystyka, Ekonometria 11 kwietnia 2011 10 / 31
Niektóre, często występujące rozkłady zmiennych losowych dyskretnych 1 rozkład Bernoulli ego 2 rozkład Poissona, W = {0, 1,...} Występuje w zjawiskach losowych: liczba zgłoszeń do węzła sieci np. BSC, RNC liczba transakcji przeprowadzonych w ciągu roku na pewnym obszarze. () Statystyka, Ekonometria 11 kwietnia 2011 10 / 31
Niektóre, często występujące rozkłady zmiennych losowych ciągłych { 1 1 rozkład jednostajny: f (x) = b a dla x [a, b], 0 dla x / [a, b]. { λe λx dla x > 0, 2 rozkład wykładniczy f (x) = 0 dla x < 0. Np. X czas oczekiwania do wystąpienia pierwszego zdarzenia w rozkładzie Poissona 3 rozkład normalny (Gaussa) X N(m, σ) f (x) = 1 e (x m)2 2σ 2 2πσ reguła 3σ : P( X m < 3σ) 0, 997, 4 rozkład lognormalny: Y ma rozkład lognormalny, gdy X = ln Y ma rozkład normalny. 5 rozkład Pareto, stosowany np. w ubezpieczeniach f (x) = k x k+1. () Statystyka, Ekonometria 11 kwietnia 2011 11 / 31
Niektóre, często występujące rozkłady zmiennych losowych ciągłych { 1 1 rozkład jednostajny: f (x) = b a dla x [a, b], 0 dla x / [a, b]. { λe λx dla x > 0, 2 rozkład wykładniczy f (x) = 0 dla x < 0. Np. X czas oczekiwania do wystąpienia pierwszego zdarzenia w rozkładzie Poissona 3 rozkład normalny (Gaussa) X N(m, σ) f (x) = 1 e (x m)2 2σ 2 2πσ reguła 3σ : P( X m < 3σ) 0, 997, 4 rozkład lognormalny: Y ma rozkład lognormalny, gdy X = ln Y ma rozkład normalny. 5 rozkład Pareto, stosowany np. w ubezpieczeniach f (x) = k x k+1. () Statystyka, Ekonometria 11 kwietnia 2011 11 / 31
Niektóre, często występujące rozkłady zmiennych losowych ciągłych { 1 1 rozkład jednostajny: f (x) = b a dla x [a, b], 0 dla x / [a, b]. { λe λx dla x > 0, 2 rozkład wykładniczy f (x) = 0 dla x < 0. Np. X czas oczekiwania do wystąpienia pierwszego zdarzenia w rozkładzie Poissona 3 rozkład normalny (Gaussa) X N(m, σ) f (x) = 1 e (x m)2 2σ 2 2πσ reguła 3σ : P( X m < 3σ) 0, 997, 4 rozkład lognormalny: Y ma rozkład lognormalny, gdy X = ln Y ma rozkład normalny. 5 rozkład Pareto, stosowany np. w ubezpieczeniach f (x) = k x k+1. () Statystyka, Ekonometria 11 kwietnia 2011 11 / 31
Niektóre, często występujące rozkłady zmiennych losowych ciągłych { 1 1 rozkład jednostajny: f (x) = b a dla x [a, b], 0 dla x / [a, b]. { λe λx dla x > 0, 2 rozkład wykładniczy f (x) = 0 dla x < 0. Np. X czas oczekiwania do wystąpienia pierwszego zdarzenia w rozkładzie Poissona 3 rozkład normalny (Gaussa) X N(m, σ) f (x) = 1 e (x m)2 2σ 2 2πσ reguła 3σ : P( X m < 3σ) 0, 997, 4 rozkład lognormalny: Y ma rozkład lognormalny, gdy X = ln Y ma rozkład normalny. 5 rozkład Pareto, stosowany np. w ubezpieczeniach f (x) = k x k+1. () Statystyka, Ekonometria 11 kwietnia 2011 11 / 31
Niektóre, często występujące rozkłady zmiennych losowych ciągłych { 1 1 rozkład jednostajny: f (x) = b a dla x [a, b], 0 dla x / [a, b]. { λe λx dla x > 0, 2 rozkład wykładniczy f (x) = 0 dla x < 0. Np. X czas oczekiwania do wystąpienia pierwszego zdarzenia w rozkładzie Poissona 3 rozkład normalny (Gaussa) X N(m, σ) f (x) = 1 e (x m)2 2σ 2 2πσ reguła 3σ : P( X m < 3σ) 0, 997, 4 rozkład lognormalny: Y ma rozkład lognormalny, gdy X = ln Y ma rozkład normalny. 5 rozkład Pareto, stosowany np. w ubezpieczeniach f (x) = k x k+1. () Statystyka, Ekonometria 11 kwietnia 2011 11 / 31
Niektóre, często występujące rozkłady zmiennych losowych ciągłych { 1 1 rozkład jednostajny: f (x) = b a dla x [a, b], 0 dla x / [a, b]. { λe λx dla x > 0, 2 rozkład wykładniczy f (x) = 0 dla x < 0. Np. X czas oczekiwania do wystąpienia pierwszego zdarzenia w rozkładzie Poissona 3 rozkład normalny (Gaussa) X N(m, σ) f (x) = 1 e (x m)2 2σ 2 2πσ reguła 3σ : P( X m < 3σ) 0, 997, 4 rozkład lognormalny: Y ma rozkład lognormalny, gdy X = ln Y ma rozkład normalny. 5 rozkład Pareto, stosowany np. w ubezpieczeniach f (x) = k x k+1. () Statystyka, Ekonometria 11 kwietnia 2011 11 / 31
Niektóre, często występujące rozkłady zmiennych losowych ciągłych { 1 1 rozkład jednostajny: f (x) = b a dla x [a, b], 0 dla x / [a, b]. { λe λx dla x > 0, 2 rozkład wykładniczy f (x) = 0 dla x < 0. Np. X czas oczekiwania do wystąpienia pierwszego zdarzenia w rozkładzie Poissona 3 rozkład normalny (Gaussa) X N(m, σ) f (x) = 1 e (x m)2 2σ 2 2πσ reguła 3σ : P( X m < 3σ) 0, 997, 4 rozkład lognormalny: Y ma rozkład lognormalny, gdy X = ln Y ma rozkład normalny. 5 rozkład Pareto, stosowany np. w ubezpieczeniach f (x) = k x k+1. () Statystyka, Ekonometria 11 kwietnia 2011 11 / 31
Niektóre, często występujące rozkłady zmiennych losowych ciągłych { 1 1 rozkład jednostajny: f (x) = b a dla x [a, b], 0 dla x / [a, b]. { λe λx dla x > 0, 2 rozkład wykładniczy f (x) = 0 dla x < 0. Np. X czas oczekiwania do wystąpienia pierwszego zdarzenia w rozkładzie Poissona 3 rozkład normalny (Gaussa) X N(m, σ) f (x) = 1 e (x m)2 2σ 2 2πσ reguła 3σ : P( X m < 3σ) 0, 997, 4 rozkład lognormalny: Y ma rozkład lognormalny, gdy X = ln Y ma rozkład normalny. 5 rozkład Pareto, stosowany np. w ubezpieczeniach f (x) = k x k+1. () Statystyka, Ekonometria 11 kwietnia 2011 11 / 31
Niektóre, często występujące rozkłady zmiennych losowych ciągłych { 1 1 rozkład jednostajny: f (x) = b a dla x [a, b], 0 dla x / [a, b]. { λe λx dla x > 0, 2 rozkład wykładniczy f (x) = 0 dla x < 0. Np. X czas oczekiwania do wystąpienia pierwszego zdarzenia w rozkładzie Poissona 3 rozkład normalny (Gaussa) X N(m, σ) f (x) = 1 e (x m)2 2σ 2 2πσ reguła 3σ : P( X m < 3σ) 0, 997, 4 rozkład lognormalny: Y ma rozkład lognormalny, gdy X = ln Y ma rozkład normalny. 5 rozkład Pareto, stosowany np. w ubezpieczeniach f (x) = k x k+1. () Statystyka, Ekonometria 11 kwietnia 2011 11 / 31
Badanie zależności między zmiennymi losowymi współczynnik korelacji liniowej Pearsona zmiennych X, Y ρ = E(X EX) E(Y EY) σ X σ Y współczynnik korelacji rang Spearmana ρ S, współczynnik korelacji rang Kendalla ρ K. Twierdzenie X, Y - zmienne losowe. 1 1 ρ 1, 2 ρ = 1 P(Y = a + bx) = 1, 3 X i Y niezależne ρ = 0. () Statystyka, Ekonometria 11 kwietnia 2011 12 / 31
Badanie zależności między zmiennymi losowymi współczynnik korelacji liniowej Pearsona zmiennych X, Y ρ = E(X EX) E(Y EY) σ X σ Y współczynnik korelacji rang Spearmana ρ S, współczynnik korelacji rang Kendalla ρ K. Twierdzenie X, Y - zmienne losowe. 1 1 ρ 1, 2 ρ = 1 P(Y = a + bx) = 1, 3 X i Y niezależne ρ = 0. () Statystyka, Ekonometria 11 kwietnia 2011 12 / 31
Badanie zależności między zmiennymi losowymi współczynnik korelacji liniowej Pearsona zmiennych X, Y ρ = E(X EX) E(Y EY) σ X σ Y współczynnik korelacji rang Spearmana ρ S, współczynnik korelacji rang Kendalla ρ K. Twierdzenie X, Y - zmienne losowe. 1 1 ρ 1, 2 ρ = 1 P(Y = a + bx) = 1, 3 X i Y niezależne ρ = 0. () Statystyka, Ekonometria 11 kwietnia 2011 12 / 31
Badanie zależności między zmiennymi losowymi współczynnik korelacji liniowej Pearsona zmiennych X, Y ρ = E(X EX) E(Y EY) σ X σ Y współczynnik korelacji rang Spearmana ρ S, współczynnik korelacji rang Kendalla ρ K. Twierdzenie X, Y - zmienne losowe. 1 1 ρ 1, 2 ρ = 1 P(Y = a + bx) = 1, 3 X i Y niezależne ρ = 0. () Statystyka, Ekonometria 11 kwietnia 2011 12 / 31
Badanie zależności między zmiennymi losowymi współczynnik korelacji liniowej Pearsona zmiennych X, Y ρ = E(X EX) E(Y EY) σ X σ Y współczynnik korelacji rang Spearmana ρ S, współczynnik korelacji rang Kendalla ρ K. Twierdzenie X, Y - zmienne losowe. 1 1 ρ 1, 2 ρ = 1 P(Y = a + bx) = 1, 3 X i Y niezależne ρ = 0. () Statystyka, Ekonometria 11 kwietnia 2011 12 / 31
Regresja liniowa Próba: (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ). Metoda najmniejszych kwadratów: szukamy prostej y = ax + b tak, by wielkość J(a, b) = n (y i (ax i + b)) 2 osiągała minimum. J a = 0, J b = 0 a = n (x i x)(y i y) n (x i x) 2 b = y ax () Statystyka, Ekonometria 11 kwietnia 2011 13 / 31
Regresja liniowa Próba: (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ). Metoda najmniejszych kwadratów: szukamy prostej y = ax + b tak, by wielkość J(a, b) = n (y i (ax i + b)) 2 osiągała minimum. J a = 0, J b = 0 a = n (x i x)(y i y) n (x i x) 2 b = y ax () Statystyka, Ekonometria 11 kwietnia 2011 13 / 31
Regresja liniowa Próba: (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ). Metoda najmniejszych kwadratów: szukamy prostej y = ax + b tak, by wielkość J(a, b) = n (y i (ax i + b)) 2 osiągała minimum. J a = 0, J b = 0 a = n (x i x)(y i y) n (x i x) 2 b = y ax () Statystyka, Ekonometria 11 kwietnia 2011 13 / 31
Najczęściej występujące modele ekonometryczne: modele dynamiczne, oparte na szeregach czasowych gdy t T, dla jednej zmiennej są postaci: Y t = f (t) + g(t) + ɛ t, gdzie f (t) przedstawia trend np. liniowy, potęgowy itp., g(t) składnik cykliczny, a ɛ t składnik losowy. Zmienne ɛ t tworzą ciąg parami nieskorelowanych zmiennych losowych o rozkładzie N(0, σ) (zwany białym szumem). Dla wielu zmiennych: Y t = H(X 1t, X 2t,..., X mt ) + ɛ t, gdzie H może być liniowa, potęgowa, wykładnicza, logarytmiczna itd. ze względu na każdą zmienną. modele statyczne, oparte na danych przekrojowych liniowy model addytywny: model multiplikatywny: Y = a 0 + a 1 X 1 + a 2 X 2 +... + a m X m Y = a 0 a X 1 1 ax 2 2... axm m (można go przedstawić w postaci addytywnej) Y jest zmienną objaśnianą, a X i zmiennymi objaśniającymi. () Statystyka, Ekonometria 11 kwietnia 2011 14 / 31
Najczęściej występujące modele ekonometryczne: modele dynamiczne, oparte na szeregach czasowych gdy t T, dla jednej zmiennej są postaci: Y t = f (t) + g(t) + ɛ t, gdzie f (t) przedstawia trend np. liniowy, potęgowy itp., g(t) składnik cykliczny, a ɛ t składnik losowy. Zmienne ɛ t tworzą ciąg parami nieskorelowanych zmiennych losowych o rozkładzie N(0, σ) (zwany białym szumem). Dla wielu zmiennych: Y t = H(X 1t, X 2t,..., X mt ) + ɛ t, gdzie H może być liniowa, potęgowa, wykładnicza, logarytmiczna itd. ze względu na każdą zmienną. modele statyczne, oparte na danych przekrojowych liniowy model addytywny: model multiplikatywny: Y = a 0 + a 1 X 1 + a 2 X 2 +... + a m X m Y = a 0 a X 1 1 ax 2 2... axm m (można go przedstawić w postaci addytywnej) Y jest zmienną objaśnianą, a X i zmiennymi objaśniającymi. () Statystyka, Ekonometria 11 kwietnia 2011 14 / 31
Najczęściej występujące modele ekonometryczne: modele dynamiczne, oparte na szeregach czasowych gdy t T, dla jednej zmiennej są postaci: Y t = f (t) + g(t) + ɛ t, gdzie f (t) przedstawia trend np. liniowy, potęgowy itp., g(t) składnik cykliczny, a ɛ t składnik losowy. Zmienne ɛ t tworzą ciąg parami nieskorelowanych zmiennych losowych o rozkładzie N(0, σ) (zwany białym szumem). Dla wielu zmiennych: Y t = H(X 1t, X 2t,..., X mt ) + ɛ t, gdzie H może być liniowa, potęgowa, wykładnicza, logarytmiczna itd. ze względu na każdą zmienną. modele statyczne, oparte na danych przekrojowych liniowy model addytywny: model multiplikatywny: Y = a 0 + a 1 X 1 + a 2 X 2 +... + a m X m Y = a 0 a X 1 1 ax 2 2... axm m (można go przedstawić w postaci addytywnej) Y jest zmienną objaśnianą, a X i zmiennymi objaśniającymi. () Statystyka, Ekonometria 11 kwietnia 2011 14 / 31
Najczęściej występujące modele ekonometryczne: modele dynamiczne, oparte na szeregach czasowych gdy t T, dla jednej zmiennej są postaci: Y t = f (t) + g(t) + ɛ t, gdzie f (t) przedstawia trend np. liniowy, potęgowy itp., g(t) składnik cykliczny, a ɛ t składnik losowy. Zmienne ɛ t tworzą ciąg parami nieskorelowanych zmiennych losowych o rozkładzie N(0, σ) (zwany białym szumem). Dla wielu zmiennych: Y t = H(X 1t, X 2t,..., X mt ) + ɛ t, gdzie H może być liniowa, potęgowa, wykładnicza, logarytmiczna itd. ze względu na każdą zmienną. modele statyczne, oparte na danych przekrojowych liniowy model addytywny: model multiplikatywny: Y = a 0 + a 1 X 1 + a 2 X 2 +... + a m X m Y = a 0 a X 1 1 ax 2 2... axm m (można go przedstawić w postaci addytywnej) Y jest zmienną objaśnianą, a X i zmiennymi objaśniającymi. () Statystyka, Ekonometria 11 kwietnia 2011 14 / 31
Najczęściej występujące modele ekonometryczne: modele dynamiczne, oparte na szeregach czasowych gdy t T, dla jednej zmiennej są postaci: Y t = f (t) + g(t) + ɛ t, gdzie f (t) przedstawia trend np. liniowy, potęgowy itp., g(t) składnik cykliczny, a ɛ t składnik losowy. Zmienne ɛ t tworzą ciąg parami nieskorelowanych zmiennych losowych o rozkładzie N(0, σ) (zwany białym szumem). Dla wielu zmiennych: Y t = H(X 1t, X 2t,..., X mt ) + ɛ t, gdzie H może być liniowa, potęgowa, wykładnicza, logarytmiczna itd. ze względu na każdą zmienną. modele statyczne, oparte na danych przekrojowych liniowy model addytywny: model multiplikatywny: Y = a 0 + a 1 X 1 + a 2 X 2 +... + a m X m Y = a 0 a X 1 1 ax 2 2... axm m (można go przedstawić w postaci addytywnej) Y jest zmienną objaśnianą, a X i zmiennymi objaśniającymi. () Statystyka, Ekonometria 11 kwietnia 2011 14 / 31
Najczęściej występujące modele ekonometryczne: modele dynamiczne, oparte na szeregach czasowych gdy t T, dla jednej zmiennej są postaci: Y t = f (t) + g(t) + ɛ t, gdzie f (t) przedstawia trend np. liniowy, potęgowy itp., g(t) składnik cykliczny, a ɛ t składnik losowy. Zmienne ɛ t tworzą ciąg parami nieskorelowanych zmiennych losowych o rozkładzie N(0, σ) (zwany białym szumem). Dla wielu zmiennych: Y t = H(X 1t, X 2t,..., X mt ) + ɛ t, gdzie H może być liniowa, potęgowa, wykładnicza, logarytmiczna itd. ze względu na każdą zmienną. modele statyczne, oparte na danych przekrojowych liniowy model addytywny: model multiplikatywny: Y = a 0 + a 1 X 1 + a 2 X 2 +... + a m X m Y = a 0 a X 1 1 ax 2 2... axm m (można go przedstawić w postaci addytywnej) Y jest zmienną objaśnianą, a X i zmiennymi objaśniającymi. () Statystyka, Ekonometria 11 kwietnia 2011 14 / 31
Najczęściej występujące modele ekonometryczne: modele dynamiczne, oparte na szeregach czasowych gdy t T, dla jednej zmiennej są postaci: Y t = f (t) + g(t) + ɛ t, gdzie f (t) przedstawia trend np. liniowy, potęgowy itp., g(t) składnik cykliczny, a ɛ t składnik losowy. Zmienne ɛ t tworzą ciąg parami nieskorelowanych zmiennych losowych o rozkładzie N(0, σ) (zwany białym szumem). Dla wielu zmiennych: Y t = H(X 1t, X 2t,..., X mt ) + ɛ t, gdzie H może być liniowa, potęgowa, wykładnicza, logarytmiczna itd. ze względu na każdą zmienną. modele statyczne, oparte na danych przekrojowych liniowy model addytywny: model multiplikatywny: Y = a 0 + a 1 X 1 + a 2 X 2 +... + a m X m Y = a 0 a X 1 1 ax 2 2... axm m (można go przedstawić w postaci addytywnej) Y jest zmienną objaśnianą, a X i zmiennymi objaśniającymi. () Statystyka, Ekonometria 11 kwietnia 2011 14 / 31
Najczęściej występujące modele ekonometryczne: modele dynamiczne, oparte na szeregach czasowych gdy t T, dla jednej zmiennej są postaci: Y t = f (t) + g(t) + ɛ t, gdzie f (t) przedstawia trend np. liniowy, potęgowy itp., g(t) składnik cykliczny, a ɛ t składnik losowy. Zmienne ɛ t tworzą ciąg parami nieskorelowanych zmiennych losowych o rozkładzie N(0, σ) (zwany białym szumem). Dla wielu zmiennych: Y t = H(X 1t, X 2t,..., X mt ) + ɛ t, gdzie H może być liniowa, potęgowa, wykładnicza, logarytmiczna itd. ze względu na każdą zmienną. modele statyczne, oparte na danych przekrojowych liniowy model addytywny: model multiplikatywny: Y = a 0 + a 1 X 1 + a 2 X 2 +... + a m X m Y = a 0 a X 1 1 ax 2 2... axm m (można go przedstawić w postaci addytywnej) Y jest zmienną objaśnianą, a X i zmiennymi objaśniającymi. () Statystyka, Ekonometria 11 kwietnia 2011 14 / 31
Najczęściej występujące modele ekonometryczne: modele dynamiczne, oparte na szeregach czasowych gdy t T, dla jednej zmiennej są postaci: Y t = f (t) + g(t) + ɛ t, gdzie f (t) przedstawia trend np. liniowy, potęgowy itp., g(t) składnik cykliczny, a ɛ t składnik losowy. Zmienne ɛ t tworzą ciąg parami nieskorelowanych zmiennych losowych o rozkładzie N(0, σ) (zwany białym szumem). Dla wielu zmiennych: Y t = H(X 1t, X 2t,..., X mt ) + ɛ t, gdzie H może być liniowa, potęgowa, wykładnicza, logarytmiczna itd. ze względu na każdą zmienną. modele statyczne, oparte na danych przekrojowych liniowy model addytywny: model multiplikatywny: Y = a 0 + a 1 X 1 + a 2 X 2 +... + a m X m Y = a 0 a X 1 1 ax 2 2... axm m (można go przedstawić w postaci addytywnej) Y jest zmienną objaśnianą, a X i zmiennymi objaśniającymi. () Statystyka, Ekonometria 11 kwietnia 2011 14 / 31
Można budować także statyczne modele nieliniowe. Przykłady zależności: logarytmiczna Y = a ln X + b, potęgowa Y = ax k, k < 1 (zależność jest słabsza od liniowej) wykładnicza Y = ae X + b, potęgowa Y = ax k, k > 1 (zależność jest silniejsza od liniowej) Estymacja parametrów modelu przeprowadzana jest metodą najmniejszych kwadratów (MNK, częściej) lub metodą największej wiarogodności (MNW rzadziej). () Statystyka, Ekonometria 11 kwietnia 2011 15 / 31
Można budować także statyczne modele nieliniowe. Przykłady zależności: logarytmiczna Y = a ln X + b, potęgowa Y = ax k, k < 1 (zależność jest słabsza od liniowej) wykładnicza Y = ae X + b, potęgowa Y = ax k, k > 1 (zależność jest silniejsza od liniowej) Estymacja parametrów modelu przeprowadzana jest metodą najmniejszych kwadratów (MNK, częściej) lub metodą największej wiarogodności (MNW rzadziej). () Statystyka, Ekonometria 11 kwietnia 2011 15 / 31
Można budować także statyczne modele nieliniowe. Przykłady zależności: logarytmiczna Y = a ln X + b, potęgowa Y = ax k, k < 1 (zależność jest słabsza od liniowej) wykładnicza Y = ae X + b, potęgowa Y = ax k, k > 1 (zależność jest silniejsza od liniowej) Estymacja parametrów modelu przeprowadzana jest metodą najmniejszych kwadratów (MNK, częściej) lub metodą największej wiarogodności (MNW rzadziej). () Statystyka, Ekonometria 11 kwietnia 2011 15 / 31
Część II Próba, statystyka opisowa () Statystyka, Ekonometria 11 kwietnia 2011 16 / 31
Próba jest podzbiorem populacji. Cechuje ją rozkład (w próbie) oraz m.in. charakterystyki, które są tzw. estymatorami parametrów populacji: n k 1 średnia x = 1 n x i, średnia ważona x = 1 n x i n i, jest estymatorem parametru m 2 wariancja s 2 = 1 n n (x i x) 2, jest estymatorem σ 2 3 odch. stand. (średni błąd kwadratowy) s, estymator σ 4 mediana (wartość środkowa), estymator x med, 5 moda 6 estymator ρ : 1 n n (x i x)(y i y) r =, s X s Y 7 estymatory parametrów a, b: n (x i x)(y i y) â = n (x i x) 2, ˆb = y âx () Statystyka, Ekonometria 11 kwietnia 2011 17 / 31
Próba jest podzbiorem populacji. Cechuje ją rozkład (w próbie) oraz m.in. charakterystyki, które są tzw. estymatorami parametrów populacji: n k 1 średnia x = 1 n x i, średnia ważona x = 1 n x i n i, jest estymatorem parametru m 2 wariancja s 2 = 1 n n (x i x) 2, jest estymatorem σ 2 3 odch. stand. (średni błąd kwadratowy) s, estymator σ 4 mediana (wartość środkowa), estymator x med, 5 moda 6 estymator ρ : 1 n n (x i x)(y i y) r =, s X s Y 7 estymatory parametrów a, b: n (x i x)(y i y) â = n (x i x) 2, ˆb = y âx () Statystyka, Ekonometria 11 kwietnia 2011 17 / 31
Próba jest podzbiorem populacji. Cechuje ją rozkład (w próbie) oraz m.in. charakterystyki, które są tzw. estymatorami parametrów populacji: n k 1 średnia x = 1 n x i, średnia ważona x = 1 n x i n i, jest estymatorem parametru m 2 wariancja s 2 = 1 n n (x i x) 2, jest estymatorem σ 2 3 odch. stand. (średni błąd kwadratowy) s, estymator σ 4 mediana (wartość środkowa), estymator x med, 5 moda 6 estymator ρ : 1 n n (x i x)(y i y) r =, s X s Y 7 estymatory parametrów a, b: n (x i x)(y i y) â = n (x i x) 2, ˆb = y âx () Statystyka, Ekonometria 11 kwietnia 2011 17 / 31
Próba jest podzbiorem populacji. Cechuje ją rozkład (w próbie) oraz m.in. charakterystyki, które są tzw. estymatorami parametrów populacji: n k 1 średnia x = 1 n x i, średnia ważona x = 1 n x i n i, jest estymatorem parametru m 2 wariancja s 2 = 1 n n (x i x) 2, jest estymatorem σ 2 3 odch. stand. (średni błąd kwadratowy) s, estymator σ 4 mediana (wartość środkowa), estymator x med, 5 moda 6 estymator ρ : 1 n n (x i x)(y i y) r =, s X s Y 7 estymatory parametrów a, b: n (x i x)(y i y) â = n (x i x) 2, ˆb = y âx () Statystyka, Ekonometria 11 kwietnia 2011 17 / 31
Próba jest podzbiorem populacji. Cechuje ją rozkład (w próbie) oraz m.in. charakterystyki, które są tzw. estymatorami parametrów populacji: n k 1 średnia x = 1 n x i, średnia ważona x = 1 n x i n i, jest estymatorem parametru m 2 wariancja s 2 = 1 n n (x i x) 2, jest estymatorem σ 2 3 odch. stand. (średni błąd kwadratowy) s, estymator σ 4 mediana (wartość środkowa), estymator x med, 5 moda 6 estymator ρ : 1 n n (x i x)(y i y) r =, s X s Y 7 estymatory parametrów a, b: n (x i x)(y i y) â = n (x i x) 2, ˆb = y âx () Statystyka, Ekonometria 11 kwietnia 2011 17 / 31
Próba jest podzbiorem populacji. Cechuje ją rozkład (w próbie) oraz m.in. charakterystyki, które są tzw. estymatorami parametrów populacji: n k 1 średnia x = 1 n x i, średnia ważona x = 1 n x i n i, jest estymatorem parametru m 2 wariancja s 2 = 1 n n (x i x) 2, jest estymatorem σ 2 3 odch. stand. (średni błąd kwadratowy) s, estymator σ 4 mediana (wartość środkowa), estymator x med, 5 moda 6 estymator ρ : 1 n n (x i x)(y i y) r =, s X s Y 7 estymatory parametrów a, b: n (x i x)(y i y) â = n (x i x) 2, ˆb = y âx () Statystyka, Ekonometria 11 kwietnia 2011 17 / 31
Próba jest podzbiorem populacji. Cechuje ją rozkład (w próbie) oraz m.in. charakterystyki, które są tzw. estymatorami parametrów populacji: n k 1 średnia x = 1 n x i, średnia ważona x = 1 n x i n i, jest estymatorem parametru m 2 wariancja s 2 = 1 n n (x i x) 2, jest estymatorem σ 2 3 odch. stand. (średni błąd kwadratowy) s, estymator σ 4 mediana (wartość środkowa), estymator x med, 5 moda 6 estymator ρ : 1 n n (x i x)(y i y) r =, s X s Y 7 estymatory parametrów a, b: n (x i x)(y i y) â = n (x i x) 2, ˆb = y âx () Statystyka, Ekonometria 11 kwietnia 2011 17 / 31
Próba jest podzbiorem populacji. Cechuje ją rozkład (w próbie) oraz m.in. charakterystyki, które są tzw. estymatorami parametrów populacji: n k 1 średnia x = 1 n x i, średnia ważona x = 1 n x i n i, jest estymatorem parametru m 2 wariancja s 2 = 1 n n (x i x) 2, jest estymatorem σ 2 3 odch. stand. (średni błąd kwadratowy) s, estymator σ 4 mediana (wartość środkowa), estymator x med, 5 moda 6 estymator ρ : 1 n n (x i x)(y i y) r =, s X s Y 7 estymatory parametrów a, b: n (x i x)(y i y) â = n (x i x) 2, ˆb = y âx () Statystyka, Ekonometria 11 kwietnia 2011 17 / 31
Szereg rozdzielczy: tabela z wartościami próby (n = 87) i odpowiadającymi im częstościami Przykład cena 1 m 2 (tys. zł) częstość n i (3, 4] 7 (4, 5] 11 (5, 6] 17 (6, 7] 19 (7, 8] 17 (8, 9] 10 (9, 10] 6 () Statystyka, Ekonometria 11 kwietnia 2011 18 / 31
() Statystyka, Ekonometria 11 kwietnia 2011 19 / 31
Dla szeregów rozdzielczych prawdziwe są wzory na charakterystyki próby poprawione przez wagi n i. () Statystyka, Ekonometria 11 kwietnia 2011 20 / 31
Część III Wnioskowanie statystyczne () Statystyka, Ekonometria 11 kwietnia 2011 21 / 31
Hipoteza statystyczna to każde przypuszczenie dotyczące nieznanej cechy populacji np. rozkładu lub wartości parametru rozkładu. Równocześnie z hipotezą H formułowana jest hipoteza alternatywna H A. Definicja Test statystyczny to metoda postępowania, która możliwym realizacjom próby losowej x 1,...x n przypisuje decyzję odrzucenia, badź nie odrzucenia weryfikowanej hipotezy. Decyzja jest podejmowana na podstawie stwierdzenia, czy statystyka testowa (czyli pewna funkcja próby) leży w obszarze krytycznym K. Definicja Poziom istotności α jest to prawdopodobieństwo, że prawdziwa jest hipoteza H pod warunkiem, że przyjęta została hipoteza H A. Ustalany jest on z góry, najczęściej α = 0, 1, α = 0, 05 lub α = 0, 01. Poziom istotności jednoznacznie wyznacza obszar krytyczny K danego testu. () Statystyka, Ekonometria 11 kwietnia 2011 22 / 31
Hipoteza statystyczna to każde przypuszczenie dotyczące nieznanej cechy populacji np. rozkładu lub wartości parametru rozkładu. Równocześnie z hipotezą H formułowana jest hipoteza alternatywna H A. Definicja Test statystyczny to metoda postępowania, która możliwym realizacjom próby losowej x 1,...x n przypisuje decyzję odrzucenia, badź nie odrzucenia weryfikowanej hipotezy. Decyzja jest podejmowana na podstawie stwierdzenia, czy statystyka testowa (czyli pewna funkcja próby) leży w obszarze krytycznym K. Definicja Poziom istotności α jest to prawdopodobieństwo, że prawdziwa jest hipoteza H pod warunkiem, że przyjęta została hipoteza H A. Ustalany jest on z góry, najczęściej α = 0, 1, α = 0, 05 lub α = 0, 01. Poziom istotności jednoznacznie wyznacza obszar krytyczny K danego testu. () Statystyka, Ekonometria 11 kwietnia 2011 22 / 31
Hipoteza statystyczna to każde przypuszczenie dotyczące nieznanej cechy populacji np. rozkładu lub wartości parametru rozkładu. Równocześnie z hipotezą H formułowana jest hipoteza alternatywna H A. Definicja Test statystyczny to metoda postępowania, która możliwym realizacjom próby losowej x 1,...x n przypisuje decyzję odrzucenia, badź nie odrzucenia weryfikowanej hipotezy. Decyzja jest podejmowana na podstawie stwierdzenia, czy statystyka testowa (czyli pewna funkcja próby) leży w obszarze krytycznym K. Definicja Poziom istotności α jest to prawdopodobieństwo, że prawdziwa jest hipoteza H pod warunkiem, że przyjęta została hipoteza H A. Ustalany jest on z góry, najczęściej α = 0, 1, α = 0, 05 lub α = 0, 01. Poziom istotności jednoznacznie wyznacza obszar krytyczny K danego testu. () Statystyka, Ekonometria 11 kwietnia 2011 22 / 31
Hipoteza statystyczna to każde przypuszczenie dotyczące nieznanej cechy populacji np. rozkładu lub wartości parametru rozkładu. Równocześnie z hipotezą H formułowana jest hipoteza alternatywna H A. Definicja Test statystyczny to metoda postępowania, która możliwym realizacjom próby losowej x 1,...x n przypisuje decyzję odrzucenia, badź nie odrzucenia weryfikowanej hipotezy. Decyzja jest podejmowana na podstawie stwierdzenia, czy statystyka testowa (czyli pewna funkcja próby) leży w obszarze krytycznym K. Definicja Poziom istotności α jest to prawdopodobieństwo, że prawdziwa jest hipoteza H pod warunkiem, że przyjęta została hipoteza H A. Ustalany jest on z góry, najczęściej α = 0, 1, α = 0, 05 lub α = 0, 01. Poziom istotności jednoznacznie wyznacza obszar krytyczny K danego testu. () Statystyka, Ekonometria 11 kwietnia 2011 22 / 31
Zasada: Jeśli statystyka testowa należy do K, to odrzucamy H na korzyść H A, stwierdzamy, że H A jest prawdziwa z prawdopodobieństwem 1 α. Jeśli stat. test. nie należy do W, to nie ma podstaw do odrzucenia H, ale nie jest to równoważne ze stwierdzeniem jej prawdziwości. () Statystyka, Ekonometria 11 kwietnia 2011 23 / 31
Zasada: Jeśli statystyka testowa należy do K, to odrzucamy H na korzyść H A, stwierdzamy, że H A jest prawdziwa z prawdopodobieństwem 1 α. Jeśli stat. test. nie należy do W, to nie ma podstaw do odrzucenia H, ale nie jest to równoważne ze stwierdzeniem jej prawdziwości. () Statystyka, Ekonometria 11 kwietnia 2011 23 / 31
Przykłady rozkład powierzchni działek jest normalny (lognormalny), rozkład ceny 1 a działki bud jest wykładniczy, średnia cena 1 a działki w Małopolsce wynosiła w 2010 roku 9 tys zł, między ceną mieszkania a jego wiekiem istnieje dodatnia korelacja. () Statystyka, Ekonometria 11 kwietnia 2011 24 / 31
Przykłady rozkład powierzchni działek jest normalny (lognormalny), rozkład ceny 1 a działki bud jest wykładniczy, średnia cena 1 a działki w Małopolsce wynosiła w 2010 roku 9 tys zł, między ceną mieszkania a jego wiekiem istnieje dodatnia korelacja. () Statystyka, Ekonometria 11 kwietnia 2011 24 / 31
Przykłady rozkład powierzchni działek jest normalny (lognormalny), rozkład ceny 1 a działki bud jest wykładniczy, średnia cena 1 a działki w Małopolsce wynosiła w 2010 roku 9 tys zł, między ceną mieszkania a jego wiekiem istnieje dodatnia korelacja. () Statystyka, Ekonometria 11 kwietnia 2011 24 / 31
Przykłady rozkład powierzchni działek jest normalny (lognormalny), rozkład ceny 1 a działki bud jest wykładniczy, średnia cena 1 a działki w Małopolsce wynosiła w 2010 roku 9 tys zł, między ceną mieszkania a jego wiekiem istnieje dodatnia korelacja. () Statystyka, Ekonometria 11 kwietnia 2011 24 / 31
Przykłady rozkład powierzchni działek jest normalny (lognormalny), rozkład ceny 1 a działki bud jest wykładniczy, średnia cena 1 a działki w Małopolsce wynosiła w 2010 roku 9 tys zł, między ceną mieszkania a jego wiekiem istnieje dodatnia korelacja. () Statystyka, Ekonometria 11 kwietnia 2011 24 / 31
Testy na normalność test Shapiro-Wilka test χ 2 test λ Kołmogorowa (z poprawką Lillieforce a) () Statystyka, Ekonometria 11 kwietnia 2011 25 / 31
Testy na normalność test Shapiro-Wilka test χ 2 test λ Kołmogorowa (z poprawką Lillieforce a) () Statystyka, Ekonometria 11 kwietnia 2011 25 / 31
Testy na normalność test Shapiro-Wilka test χ 2 test λ Kołmogorowa (z poprawką Lillieforce a) () Statystyka, Ekonometria 11 kwietnia 2011 25 / 31
Testy na normalność test Shapiro-Wilka test χ 2 test λ Kołmogorowa (z poprawką Lillieforce a) () Statystyka, Ekonometria 11 kwietnia 2011 25 / 31
Test t na istotność współczynnika korelacji ρ { H : ρ = 0 H A : ρ 0 (ew. ρ > 0, ρ < 0) lub w wersji { H : ρ = ρ 0 H A : ρ ρ 0 (>, <) () Statystyka, Ekonometria 11 kwietnia 2011 26 / 31
Test t na istotność współczynnika korelacji ρ { H : ρ = 0 H A : ρ 0 (ew. ρ > 0, ρ < 0) lub w wersji { H : ρ = ρ 0 H A : ρ ρ 0 (>, <) () Statystyka, Ekonometria 11 kwietnia 2011 26 / 31
Testy na istotność współczynników prostej regresji y = ax + b test t-studenta dla współczynnika kierunkowego a, { H : a = 0 H A : a 0 (ew.a > 0 lub a < 0) test t-studenta dla wyrazu wolnego b, { H : b = 0 H A : b 0 (ew.b > 0 lub b < 0) W powyższych hipotezach mogą zamiast 0 występować inne wartości, np. H : a = 2, 3. () Statystyka, Ekonometria 11 kwietnia 2011 27 / 31
Testy na istotność współczynników prostej regresji y = ax + b test t-studenta dla współczynnika kierunkowego a, { H : a = 0 H A : a 0 (ew.a > 0 lub a < 0) test t-studenta dla wyrazu wolnego b, { H : b = 0 H A : b 0 (ew.b > 0 lub b < 0) W powyższych hipotezach mogą zamiast 0 występować inne wartości, np. H : a = 2, 3. () Statystyka, Ekonometria 11 kwietnia 2011 27 / 31
Testy na istotność współczynników prostej regresji y = ax + b test t-studenta dla współczynnika kierunkowego a, { H : a = 0 H A : a 0 (ew.a > 0 lub a < 0) test t-studenta dla wyrazu wolnego b, { H : b = 0 H A : b 0 (ew.b > 0 lub b < 0) W powyższych hipotezach mogą zamiast 0 występować inne wartości, np. H : a = 2, 3. () Statystyka, Ekonometria 11 kwietnia 2011 27 / 31
Testy na istotność współczynników prostej regresji y = ax + b test t-studenta dla współczynnika kierunkowego a, { H : a = 0 H A : a 0 (ew.a > 0 lub a < 0) test t-studenta dla wyrazu wolnego b, { H : b = 0 H A : b 0 (ew.b > 0 lub b < 0) W powyższych hipotezach mogą zamiast 0 występować inne wartości, np. H : a = 2, 3. () Statystyka, Ekonometria 11 kwietnia 2011 27 / 31
Weryfikacja modelu ekonometrycznego Y = a 0 + a 1 X 1 + a 2 X 2 +... + a m X m. weryfikacja istotności układu współczynników a 0,..., a m, test Fishera-Snedecora m H : a 2 j = 0 H A : j=0 m a 2 j 0 weryfikacja istotności poszczególnych współczynników regresji w oparciu o statystykę t Studenta j=0 H : a j = 0 H A : a j 0 badanie reszt modelu. Powinny być parami nieskorel, o rozkł. N(0, σ), obliczenie współczynnika determinacji R 2 = n (ŷ i ȳ) 2 n (y i ȳ) 2, gdzie ŷ i są obliczone na podstawie modelu. () Statystyka, Ekonometria 11 kwietnia 2011 28 / 31
Weryfikacja modelu ekonometrycznego Y = a 0 + a 1 X 1 + a 2 X 2 +... + a m X m. weryfikacja istotności układu współczynników a 0,..., a m, test Fishera-Snedecora m H : a 2 j = 0 H A : j=0 m a 2 j 0 weryfikacja istotności poszczególnych współczynników regresji w oparciu o statystykę t Studenta j=0 H : a j = 0 H A : a j 0 badanie reszt modelu. Powinny być parami nieskorel, o rozkł. N(0, σ), obliczenie współczynnika determinacji R 2 = n (ŷ i ȳ) 2 n (y i ȳ) 2, gdzie ŷ i są obliczone na podstawie modelu. () Statystyka, Ekonometria 11 kwietnia 2011 28 / 31
Weryfikacja modelu ekonometrycznego Y = a 0 + a 1 X 1 + a 2 X 2 +... + a m X m. weryfikacja istotności układu współczynników a 0,..., a m, test Fishera-Snedecora m H : a 2 j = 0 H A : j=0 m a 2 j 0 weryfikacja istotności poszczególnych współczynników regresji w oparciu o statystykę t Studenta j=0 H : a j = 0 H A : a j 0 badanie reszt modelu. Powinny być parami nieskorel, o rozkł. N(0, σ), obliczenie współczynnika determinacji R 2 = n (ŷ i ȳ) 2 n (y i ȳ) 2, gdzie ŷ i są obliczone na podstawie modelu. () Statystyka, Ekonometria 11 kwietnia 2011 28 / 31
Weryfikacja modelu ekonometrycznego Y = a 0 + a 1 X 1 + a 2 X 2 +... + a m X m. weryfikacja istotności układu współczynników a 0,..., a m, test Fishera-Snedecora m H : a 2 j = 0 H A : j=0 m a 2 j 0 weryfikacja istotności poszczególnych współczynników regresji w oparciu o statystykę t Studenta j=0 H : a j = 0 H A : a j 0 badanie reszt modelu. Powinny być parami nieskorel, o rozkł. N(0, σ), obliczenie współczynnika determinacji R 2 = n (ŷ i ȳ) 2 n (y i ȳ) 2, gdzie ŷ i są obliczone na podstawie modelu. () Statystyka, Ekonometria 11 kwietnia 2011 28 / 31
Weryfikacja modelu ekonometrycznego Y = a 0 + a 1 X 1 + a 2 X 2 +... + a m X m. weryfikacja istotności układu współczynników a 0,..., a m, test Fishera-Snedecora m H : a 2 j = 0 H A : j=0 m a 2 j 0 weryfikacja istotności poszczególnych współczynników regresji w oparciu o statystykę t Studenta j=0 H : a j = 0 H A : a j 0 badanie reszt modelu. Powinny być parami nieskorel, o rozkł. N(0, σ), obliczenie współczynnika determinacji R 2 = n (ŷ i ȳ) 2 n (y i ȳ) 2, gdzie ŷ i są obliczone na podstawie modelu. () Statystyka, Ekonometria 11 kwietnia 2011 28 / 31
Weryfikacja modelu ekonometrycznego Y = a 0 + a 1 X 1 + a 2 X 2 +... + a m X m. weryfikacja istotności układu współczynników a 0,..., a m, test Fishera-Snedecora m H : a 2 j = 0 H A : j=0 m a 2 j 0 weryfikacja istotności poszczególnych współczynników regresji w oparciu o statystykę t Studenta j=0 H : a j = 0 H A : a j 0 badanie reszt modelu. Powinny być parami nieskorel, o rozkł. N(0, σ), obliczenie współczynnika determinacji R 2 = n (ŷ i ȳ) 2 n (y i ȳ) 2, gdzie ŷ i są obliczone na podstawie modelu. () Statystyka, Ekonometria 11 kwietnia 2011 28 / 31