Metodologia budowy modelu

Wielkość: px
Rozpocząć pokaz od strony:

Download "Metodologia budowy modelu"

Transkrypt

1 Rozdział 1 Metodologia budowy modelu W tym rozdziale omówimy problem metodologicznie poprawnego testowania hipotez i wyboru prawidłowej liczby zmiennych do modelu. Prawidłowy metodologicznie sposób ma kluczowe znaczenie przy ustalaniu zbioru zmiennych, które wpływają na zmienną zależną oraz przy narzucaniu dodatkowych ograniczeń na model. 1.1 Obciażenie Lovella Zaczniemy nasze rozważania od przypadeku testowania hipotezy złożonej o nieistotności wszystkich K zmiennych w modelu. Hipotezę tę można zapisać jako H 0 : β 1 =... = β K = 0 i przetestować jako hipotezę łączną przy poziomie istotności α. Wydawałoby się jednak, że prościej jest przetestować analizowaną hipotezę złożoną testując K hipotez prostych H 1 0 : β 1 = 0;... ; H K 0 : β K = 0, przy czym hipotezę o łącznej nieistotności wszytkich zmiennych odrzucimy, gdy odrzucona zostaje choć jedna z tych hipotez prostych. Okazuje się jednak, że testowanie kilku hipotez prostych nie jest równoważne testowi łącznemu dla wszystkich tych hipotez. Powodem tego jest różnica między założonym a rzeczywistym poziomu istotności w przypadku oddzielnego testowania kilku hipotez prostych. Załóżmy, że statystyki testowe dla każdej z hipotez prostych są od siebie niezależne. Poziomu istotności jest on równy prawdopodobieństwu błędu I rodzaju. Błąd I rodzaju popełniamy odrzucając prawdziwą H 0. W przypadku testowania hipotezy złożonej za pomocą testowania hipotez prostych popełnimy błąd I rodzaju, jeśli odrzucimy H 0 dla jakiejkolwiek z hipotez prostych, ponieważ odrzucimy wtedy także hipotezę złożoną o tym, że wszystkie zmienne są nieistotne. Prawdopodobieństwo, że nie popełnimy błędu I rodzaju jest więc równe prawdopodobieństwu, że żadna z prawdziwych hipotez nie zostanie odrzucona. Dla przypadku niezależnych statystyk testowych prawdopodobieństwo to jest równe (1 α) K. W konsekwencji prawdopodobieństwo popełnienia błędu pierwszego rodzaju jest równe: α = 1 (1 α) K Copyright c 2008 by Jerzy Mycielski 5

2 6 ROZDZIAŁ 1. METODOLOGIA BUDOWY MODELU Różnicę między założonym poziomem istotności α i prawdopodobieństwem α nazywamy obciążeniem Lovella. Zauważmy teraz, że lim K α = 1. Oznacza to, że dla dużej liczby testowanych hipotez prostych prawdopodobieństwo popełnienia błędu pierwszego rodzaju zbliża się do 1. Problem obciążenia Lovella związany jest z tak zwanym przekopywaniem danych (data mining). Przekopywanie danych służy znajdowaniu tych zmiennych, które są istotne przy wyjaśnianiu zmienności zmiennej zależnej. Z przeporwadzonych powyżej rozważań wynika, że jeśli wyjdziemy od wystarczająco dużego zbioru zmiennych wyjściowych i badać będziemy kolejno istotność zmiennych, to prawie zawsze znajdziemy pewne zmienne o istotnych statystykach t, nawet wtedy, gdy wszystkie zmienne w danym zbiorze są w rzeczywistości nieistotne. PRZYKŁAD 1.1 Grupa socjologów postanowiła przetestować hipotezę, że fakt urodzenia się pod konkretnym znakiem Zodiaku ma wpływ na losy respondentów. Do tego celu przeanalizowano bazę danych zawierającą datę urodzenia respondenta i jego prestiż jego zawodu w skali Treimana. Data urodzenia posłużyła do stworzenia 12 zmiennych zerojedynkowych determinujących znak Zodiaku, pod którym urodził się respondent. Zmienną zależną był prestiż wykonywanego zawodu, które stanowić miały miarę sukcesu życiowego. Uzyskano następujące wyniki estymacji: TABELA 1.1: Regresja prestiżu zawodu na znaku zodiaku Współczynnik Bład Std. t Pr ( t > t ) zodiak zodiak zodiak zodiak zodiak zodiak zodiak zodiak zodiak zodiak zodiak stała Na poziomie istotności α = 0, 05 stwierdzono, że znaki Zodiaku mają istotny w wpływ na kariery zawodowe respondentów, ponieważ istotna okazała się zmienna zerojedynkowa związana z 8 znakiem zodiaku. Uzyskany wynik jest najprawdopodobniej rezultatem błędnej procedury testowania. Prawdziwy poziom istotności (przy założeniu niezależności wielkości statystyk testowych) wynosi α = 1 (0.9) 11 0, 44. Oznacza to, że dla prawdziwej hipotezy zerowej o nieistotności wszystkich współczynników w 44% przypadków uzyskujemy co najmniej jedną statystycznie istotną statystykę t. Prawidłowa procedura testowania istotności zbioru zmiennych polega na przetestowaniu, łącznej hipotezy o nieistotności wszystkich zmiennych zerojedynkowych. Wartość statystyki testowej dla tej hipotezy wynosi F (11, 2106) = 1.08, a policzony poziom istotności Przy prawidłowym sposobie testowania hipotezy zero-

3 1.2. UPRASZCZANIE MODELU 7 wej, że nie ma podstaw do odrzucenia H 0, że znaki zodiaku nie wpływają istotnie na karierę zawodową. Testowanie hipotez prostych zamiast testowania hipotezy łącznej nie zawsze musi prowadzić do wyższego prawdopodobieństwa odrzucenia hipotezy zerowej. Dobrym przykładem jest tu model, w którym występuje współliniowość między x 1 i x 2. W takim przypadku statystyki t dla x 1 i x 2 mogą być niskie ponieważ wariancje estymatorów b 1 i b 2 są wysokie. Jednak spadek sumy kwadratów reszt w przypadku usunięcia zmiennych x 1 i x 2 może być duży pod warunkiem, że obie te zmienne są silnie skorelowane z y. W takim przypadku może się zdarzyć, że nie będzie podstaw do odrzucenia odrzucenia H 1 0 : β 1 = 0 i H 2 0 : β 2 = 0 na poziomie istotności α, ale odrzucimy, na tym samym poziomie istotności, hipotezę H 0 : β 1 = β 2 = 0. Podsumowując, przy testowaniu hipotez łącznych należy unikać wielokrotnego testowania hipotez prostych zamiast testowania hipotez złożonych. Przekonamy się jednak, że wielokrotnego testowania hipotez jest w praktyce trudno uniknąć. Można jednak te testy przeprowadzić tak, by przy zastosowany poziom istotności był bliski rzeczywistemu. PYTANIA: 1. Wyjaśnić co rozumiemy przez obciążenie Lovella. 1.2 Upraszczanie modelu Standardowo, gdy zaczynamy badanie ekonometryczne, dysponujemy pewnym zbiorem zmiennych, które potencjalnie mogą się okazać istotne dla wyjaśnienia zmiennej zależnej. Pojawia się pytanie w jaki sposób powinniśmy ustalić listę istotnych zmiennych. Poza hipotezą H 0 : β 1 =... = β K = 0 interesują nas więc też hipotezy dotyczące poszczególnych współczynników H 1 0 : β 1 = 0;... ; H K 0 : β K = 0. Jest więc dla nas ważne nie tylko to, czy którakolwiek zmienne w modelu jest istotna ale także to, które z nich są istotne. PRZYKŁAD 1.2 Rozważmy następujący model dynamiczny dla funkcji konsumpcji: kons t = µ + β 0 pkb t + β 1 pkb t β p pkb t p + ε t W modelu tym obecna konsumpcja zależy nie tylko od dochodu w obecnym okresie, ale także od dochodu z poprzednich okresów. Problemem przy specyfikacji tego modelu jest nie tylko to, że nieznane są wielkości parametrów α 1,..., α p ale nieznana jest także liczba opóźnień p, które powinniśmy umieścić w modelu. Szukanie prawidłowej specyfikacji modelu można rozumieć jako szukanie takiej specyfikacji, która przy możliwe małej liczbie parametrów dobrze opisuje analizowany zbiór danych. Obecnie uważa się, że właściwą metodą szukania specyfikacji modelu jest metoda od ogólnego do szczegółowego (general to specific). Wybór prawidłowego modelu w ramach tej metody można dokonać za pomocą klasycznych statystyk testowych, ale także za pomocą tak zwanych kryteriów informacyjnych.

4 8 ROZDZIAŁ 1. METODOLOGIA BUDOWY MODELU 1.3 Metoda od ogólnego do szczegółowego Nieusystematyzowane przeszukiwanie przeszukiwanie zbioru danych w celu znalezienia istotnych zmiennych niezależnych może nas doprowadzić do uznania przypadkowych zmiennych za zmienne istotne. Szczególnie łatwo może się tak stać w przypadku, gdy liczba obserwacji jest stosunkowo niewielka. Kluczowe dla osiągnięcia sukcesu przy przekopywaniu danych jest właściwe ustrukturyzowanie poszukiwań. Popularnym rozwiązaniem problemu szukania prawidłowej specyfikacji jest metodologia od ogólnego do szczegółowego. Polega ona na stopniowym upraszczaniu możliwie najogólniejszego modelu początkowego poprzez narzucanie na niego coraz bardziej rozbudowanych ograniczeń. Modele, które powstają po narzuceniu tych ograniczeń są zagnieżdżone w modelu ogólnym w tym sensie, że stanowią szczególne przypadki tego modelu. Ograniczenia narzucane na model definiowane są przez hipotezy, których prawdziwość testujemy. O hipotezach tych mówimy, że są w sobie zagnieżdżone, jeśli można je uszeregować tak, że H0 K zawiera najwięcej ograniczeń (daje najprostszy model), H0 K 1 podzbiór ograniczeń zawartych w H0 K i tak dalej aż do H0 1 zawierającej najmniej ograniczeń. Sytuację taką zapisujemy jako HK 0 H0 K 1... H0 1. PRZYKŁAD 1.3 Rozpatrzmy następujące modele y i = x 1i β 1 + x i2 β 2 + x 3i β 3 + ε i (1.1) y i = x 1i β 1 + x i2 β 2 + ε i (1.2) y i = x 1i β 1 + ε i (1.3) y i = x i2 β 2 + ε i (1.4) Model ogólnym jest w tym przypadku model (1.1). Model (1.2) jest szczególnym przypadkiem modelu ogólnego (jest w nim zagnieżdżony), który zachodzi, gdy prawdziwa jest hipoteza H 1 0 : β 3 = 0. Model (1.3) jest szczególnym przypadkiem modelu (1.1) przy H 2 0 : β 2 = β 3 = 0 a także w modelu (1.2). Wynika z tego, że H 2 0 H 1 0. Zauważmy jednak, że model (1.4) jest szczególnym przypadkiem modelu (1.1) dla hipotezy H 3 0 : β 1 = β 3 = 0, ale nie jest szczególnym przypadkiem modelu (1.2), a więc H 3 0 nie jest zagnieżdżona w H 1 0. Metoda od ogólnego do szczegółowego polega na sekwencyjnym testowaniu hipotez od H0 1 aż do momentu, kiedy hipoteza Hi 0 zostanie odrzucona. Przy testowaniu kolejnych hipotez zerowych hipotezą alternatywną jest zawsze model ogólny. PRZYKŁAD 1.4 c.d. 1.2 Przypuśćmy, że modelujemy poziom dochodu gospodarstwa domowego na podstawie następujących charakterystyk demograficzno-społecznych: miejsce zamieszkania (miasto, wieś, płeć głowy gospodarstwa (mężczyzna, kobieta) oraz poziomu wykształcenia głowy (podstawowe, średnie, wyższe). Łącznie w takim modelu będziemy mieć 4 zmiennych zerojedynkowych. Załóżmy, że interesują nas następujące hipotezy: H 1 0 : dla poziomu dochodu gospodarstwa nie ma znaczenia płeć głowy gospodarstwa. H 2 0 : dla poziomu dochodu gospodarstwa nie ma znaczenia płeć głowy gospodarstwa i miejsce zamieszkania. H 3 0 : dla poziomu dochodu gospodarstwa nie mają znaczenia żadna z charakterystyk. W modelu tym H 1 0 H 2 0 H 3 0. Stosując metodologię od ogólnego do szczegółowego powinniśmy najpierw przetestować hipotezę łączną, że zmienna zero-jedynkowe związana

5 1.4. MODELE NIEZAGNIEŻDŻONE - TESTY OBEJMOWANIA 9 z płcią są nieistotne. W przypadku braku podstaw do odrzucenia tej hipotezy testujemy hipotezę łączną, że 2 zmienne zero-jedynkowe związane z miejscem zamieszkania i płcią są nieistotne. Jeśli nie ma podstaw do odrzucenia tej hipotezy, to powinniśmy przetestować hipotezę o łącznej nieistotności wszystkich zmiennych. PRZYKŁAD 1.5 Ustalamy postać funkcji konsumpcji dla Polski na podstawie danych kwartalnych z lat do Testujemy najpierw szereg hipotez zagnieżdżonych związanych z istotnością opóźnień. Dodatkowo do przetestowanych hipotez dołączamy hipotezę o nieistotności nieopóźnionej wielkości dochodu w modelu oraz o nieistotności stałej. Uwzględnimy więc w modelu maksymalnie 5 opóźnień. Model jest na zmiennych zlogarytmowanych. Pierwsza specyfikacja daje nam następujące oszacowania: kons t = pkb t pkb t pkb t pkb t 3 (0.331) (0.145 (0.137) (0.040) (0.042) pkb t pkb t 5 (0.152) (0.137) Test dla hipotezy, że parametr przy pkb t 5 jest równy zeru daje policzony poziom istotności α = Test hipotezy, że parametry przy pkb t 5 i pkb t 4 są równe zeru daje α = Test dla hipotezy, że parametry przy pkb t 5, pkb t 4 i pkb t 3 są równe zeru daje α = Wynika z tego, że powinniśmy w modelu uwzględnić 3 opóźnienia. Z kolei test hipotezy, że parametry przy pkb t, pkb t 4, pkb t 5 są równe zeru daje α = Test hipotezy łącznej, że stała oraz współczynniki przy pkb t, pkb t 4 i pkb t 5 są równe zeru daje α = Ostateczna forma modelu, jest więc następująca: kons t = (0.039) pkb t (0.038) pkb t (0.041) pkb t 3 Gdy przekopujemy duże ilości zmiennych, przebadanie łącznej łącznej istotności wszystkich zmiennych jest niemożliwe z powodu zbyt małej ilości stopni swobody. Należy więc zaczynać od zbioru danych, których ewentualna przydatność w objaśnianiu danego zjawiska da się teoretycznie lub intuicyjnie uzasadnić. Sposób uszeregowania hipotez zagnieżdżonych może także mieć istotny wpływ na wynik testowania. Uszeregowanie hipotez powinno więc mieć jakieś uzasadnienie teoretyczne. PYTANIA: 1. Opisać procedurę od ogólnego do szczegółowego na przykładzie doboru liczby opóźnień w modelu. 1.4 Modele niezagnieżdżone - testy obejmowania W badaniach ekonometrycznych często stykamy się z przypadkami, kiedy konkurencyjne modele nie są w sobie zagnieżdżone. W tych przypadkach do wyboru modelu posługujemy się tak zwanymi testami obejmowania. O modelu A mówimy, że jest obejmuje (encompasses) model B, jeśli to, co można wyjaśnić za pomocą modelu B, może być także wyjaśnione za pomocą modelu A ale są elementy, które można wyjaśnić za pomocą modelu A, których nie da się wyjaśnić za pomocą modelu B. Pojęcie obejmowania można najłatwiej wyjaśnić na przykładzie.

6 10 ROZDZIAŁ 1. METODOLOGIA BUDOWY MODELU PRZYKŁAD 1.6 Zastanówmy się nad wzajemną relacją między mechaniką klasyczną i mechaniką relatywistyczną. Mechanika klasyczna nie jest szczególnym przypadkiem mechaniki relatywistycznej, jednak można powiedzieć, że mechanika relatywistyczna obejmuje mechanikę klasyczną w tym sensie, że wszystkie obserwacje, które można wyjaśnić za pomocą mechaniki klasycznej, można także wyjaśnić za pomocą mechaniki relatywistycznej. Są też jednak pewne obserwacje (takie jak wynik klasycznego eksperymentu Michelsona-Morley a dotyczącego pomiaru szybkości światła, czy istnienie czarnych dziur), które można wyjaśnić za pomocą mechaniki relatywistycznej ale nie dadzą się wyjaśnić za pomocą mechaniki klasycznej. Analizę obejmowania rozpoczniemy przykładem porównywania dwóch modeli o różnych zbiorach zmiennych objaśniających. H 0 : y = X A β B +ε 1 H 1 : y = X A β B +ε 1 (A) (B) Załóżmy, że zbiór zmiennych objaśniających z modelu A nie zawiera się w zbiorze zmiennych dla modelu B (X A X B ), oraz zbiór zmiennych dla modelu B nie zawiera się w zbiorze zmiennych dla modelu A (X B X A ). Przy takich założeniach ani model A nie jest zagnieżdżony w modelu B ani model B nie jest zagnieżdżony w modelu A. Pierwszy możliwy sposób testowania polega na znalezieniu modelu ogólnego, którego szczególnymi przypadkami są modele A i B. Model ten można zapisać w sposób następujący: y = X A β A + X B β B +W δ + ε gdzie X A jest macierzą zmiennych, które należą do X A, ale nie należą do X B, X B jest macierzą zmiennych, które należą do X B, ale nie należą do X A a W jest macierzą zmiennych, które należą do X A i X B. Model A może obejmować model B jedynie wtedy, gdy β B = 0. Gdyby β B 0, to za pomocą X B można by wyjaśnić zmienność y, której nie da się wyjaśnić za pomocą zmiennych zawartych w modelu A. Hipotezę o obejmowaniu przez model A modelu B, można zweryfikować testując hipotezę H 0 : β B = 0. Niestety nie wyczerpuje to całości zagadnienia. Zauważmy, że definicja obejmowania składa się z dwóch członów: po pierwsze model A ma wyjaśniać wszystko to co wyjaśnia model B, z drugiej strony powinny istnieć elementy, które wyjaśnia model A, a nie da się ich wyjaśnić za pomocą modelu B. Powinniśmy więc także pokazać, że istnieją zmienność y, którą można wyjaśnić wyłącznie za pomocą zmiennych pojawiających się w modelu A. Będzie to prawdą jeśli β A 0. Hipotezę o obejmowaniu B przez model A weryfikujemy testując dwie hipotezy : H0 : β B = 0 oraz H0 : β A = 0. Jeśli H0 nie zostanie odrzucona, a H 0 zostanie odrzucona, to model A obejmuje model B. Ponieważ przeprowadzamy dwa testy, więc możliwe są w sumie cztery przypadki. Poza omówionym przypadkiem, gdy model A obejmuje B, możemy uzyskać wynik, że B obejmuje A (H0 odrzucona, H 0 nie odrzucona), żaden model nie obejmuje drugiego (odrzucone H0 i H 0 ) oraz przypadek,

7 1.5. KRYTERIA INFORMACYJNE (SELEKCJA MODELU) 11 gdy nie da się ustalić, który model obejmuje który (nie odrzucone H 0 i H 0 ). Poza omówioną powyżej procedurą testowania istnieje jeszcze inny sposób testowania obejmowania, który omówimy poniżej Test J Test J oparty jest o inny sposób sformułowania ogólnego modelu, którego szczególnymi przypadkami są modele A i B. Model ten formułujemy w następujący sposób: y = (1 λ) X A β A + λx B β B +ε Łatwo się przekonać, że jeśli prawdziwa jest hipoteza o tym, że model A obejmuje model B, to prawdziwa musi być hipoteza H0 : λ = 0. Podobnie, jeśli model model B obejmuje model A, to prawdziwa musi być hipoteza H0 : λ = 1. Niestety sformułowanego powyżej modelu nie da się oszacować za pomocą zwykłym MNK, ponieważ jest to model nieliniowy. Można go jednak oszacować w dwóch krokach: 1. przeprowadzamy regresję y na X B uzyskujemy wartości dopasowane ŷ B = X B b B 2. przeprowadzamy regresję y na X A i ŷ B Test obejmowania przeprowadzamy testując istotność współczynnika przy ŷ B. Intuicyjnie, opisana procedura testowania opiera się na następującym przybliżeniu: y = (1 λ) X A β A + λx B β B +ε a (1 λ) X A β A + λx B b B + ε = (1 λ) X A β A + λŷ B + ε W przypadku testu J, podobnie jak w przypadku procedury opisanej wcześniej, może się okazać, że żaden model nie obejmuje drugiego (odrzucana zarówno hipoteza H0 jak i H 0 ) lub, że nie jesteśmy w stanie powiedzieć, który model obejmuje który (nie ma podstaw do odrzucenia H0 jak i H 0 ). PYTANIA: 1. Wyjaśnić, co to znaczy, że model A obejmuje model B. W jaki sposób testujemy obejmowanie? 1.5 Kryteria informacyjne (selekcja modelu) W poprzednim rozdziale pokazaliśmy w jaki sposób metoda od ogólnego do szczegółowego może być wykorzystana do znalezienia właściwej specyfikacji modelu przy użyciu klasycznych testów statystycznych. Metody tej często używa się stosując zamiast klasycznych testów statystycznych, tak zwane kryteria informacyjne.

8 12 ROZDZIAŁ 1. METODOLOGIA BUDOWY MODELU W trakcie omawiania MNK zdefiniowaliśmy R 2, która pozwalają porównać jakość modeli opisujących zmienność danej zmiennej zależnej. Niestety miarę tę można zdefiniować jedynie w kontekście M N K. W przypadku ogólniejszej klasy modeli szacowanych za pomocą Metody Największej Wiarygodności (M N W ) definiujemy tak zwane kryteria informacyjne, które podobnie jak R 2, pozwalają nam porównywać różne modele dla tej samej zmiennej zależnej. W przeciwieństwie do R 2, w przypadku kryteriów informacyjnych przyjęta została konwencja, że najlepszym modelem jest model, dla którego wartość kryterium informacyjnego jest najniższa. Najpopularniejszymi kryteriami informacyjnymi jest kryterium informacyjne Akaike AIC (Akaike Information Criterion) oraz Bayesowskie kryterium informacyjne Schwartza BIC (Bayes Information Criterion) 1. Wzory na te kryteria można sformułować ogólnie w kategoriach logarytmu funkcji wiarogodności, lub też dla przypadku MNK w kategoriach sumy kwadratów reszt e e. Odpowiednie wzory są następujące: 2l ( θ BIC = N 2l ( θ AIC = N ) ) ( K log (N) e ) e K log (N) + = log + N 2 N + 2K ( e ) N = log e + 2K 2 N ) gdzie l ( θ jest logarytmem funkcji wiarygodności dla oszacowanego M N W wektora parametrów, a K jest liczbą parametrów modelu a N liczbą obserwacji. Spróbujmy przeanalizować wzory na kryteria informacyjne pod kątem ogólnych zasad, które powinny obowiązywać przy wyborze modeli. Dobry model powinien spełniać dwa podstawowe warunki: powinien być dobrze dopasowany i możliwie jak najprostszy. Prostotę modelu można mierzyć za pomocą liczby parametrów, które się w nim pojawiają. Jeśli przeanalizujemy teraz kryteria informacyjne w wersji dla M N K, to przekonamy ( się, że ) rosną one wraz z pogarszaniem się jakości dopasowania mierzoną przez log e e 2 oraz wraz ze wzrostem liczby parametrów. Różnica między kryterium AIC i BIC polega na innym ważeniu jakości dopasowania i prostoty modelu. Drugi element sumy we wzorach na kryteria informacyjne mierzy prostotę modelu. W obu przypadkach element ten rośnie wraz ze wzrostem liczby parametrów i wzrost ten jest tym większy im mniejsza jest liczba obserwacji. Takie zdefiniowanie kryterium informacyjnych związane jest z faktem, że prostota modelu jest szczególnie ważna w przypadku modeli szacowanych na małych próbach. Jakkolwiek asymptotycznie oba kryteria wybierać będą prawidłowy model, to jednak w małych próbach ich wskazania mogą się znacząco różnić. W literaturze sugeruje się, że kryterium AIC ma tendencję do wybierania modelu o zbyt dużej liczbie parametrów. Należy także pamiętać o tym, że kryteriami informacyjnymi można się posługi- 1 W przypadku Bayesowskieo kryterium informacyjnego Szwartza spotyka się też skróty SC, SBC, SIC

9 1.5. KRYTERIA INFORMACYJNE (SELEKCJA MODELU) 13 TABELA 1.2: Kryteria informacyjne w modelu konsumpcji model AIC BIC pełen model H 0 : β 5 = H 0 : β 5 = β 4 = H 0 : β 5 = β 4 = β 3 = H 0 : β 5 = β 4 = β 1 = H 0 : β 5 = β 4 = β 1 = µ = wać tylko w przypadku, gdy konkurencyjne modele zostały oszacowane na tej samej próbie. PRZYKŁAD 1.7 c.d. 1.5 W modelu dla funkcji konsumpcji model najlepszy można znaleźć na postawie wielkości kryteriów informacyjnych dla różnych specyfikacji: Na podstawie kryterium informacyjnego Akaike wybieramy jako najlepszy model ze wszystkimi zmiennymi objaśniającymi a na podstawie kryterium Bayesowskiego, model ze stałą i 4 opóźnieniami. Tak jak już wspomniano, AIC wybiera z reguły większe modele. Obie wybrane specyfikacje różnią się od tych które zostały wybrane na podstawie wyników testów istotności. PYTANIA: 1. Wymienić kryteria informacyjne i opisać w jaki sposób używa się ich do wyboru najlepszego modelu.

Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18

Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18 Ekonometria Metodologia budowy modelu Jerzy Mycielski WNE, UW Luty, 2011 Jerzy Mycielski (WNE, UW) Ekonometria Luty, 2011 1 / 18 Sprawy organizacyjne Dyżur: środa godz. 14-15 w sali 302. Strona internetowa

Bardziej szczegółowo

Budowa modelu i testowanie hipotez

Budowa modelu i testowanie hipotez Problemy metodologiczne Gdzie jest problem? Obciążenie Lovella Dysponujemy oszacowaniami parametrów następującego modelu y t = β 0 + β 1 x 1 +... + β k x k + ε t Gdzie jest problem? Obciążenie Lovella

Bardziej szczegółowo

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13 Stanisław Cichocki Natalia Neherbecka Zajęcia 13 1 1. Kryteria informacyjne 2. Testowanie autokorelacji 3. Modele dynamiczne: modele o rozłożonych opóźnieniach (DL) modele autoregresyjne o rozłożonych

Bardziej szczegółowo

Stanisław Cichocki Natalia Neherbecka

Stanisław Cichocki Natalia Neherbecka Stanisław Cichocki Natalia Neherbecka 13 marca 2010 1 1. Kryteria informacyjne 2. Modele dynamiczne: modele o rozłożonych opóźnieniach (DL) modele autoregresyjne o rozłożonych opóźnieniach (ADL) 3. Analiza

Bardziej szczegółowo

Stanisław Cihcocki. Natalia Nehrebecka

Stanisław Cihcocki. Natalia Nehrebecka Stanisław Cihcocki Natalia Nehrebecka 1 1. Kryteria informacyjne 2. Testowanie autokorelacji w modelu 3. Modele dynamiczne: modele o rozłożonych opóźnieniach (DL) modele autoregresyjne o rozłożonych opóźnieniach

Bardziej szczegółowo

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9 Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności

Bardziej szczegółowo

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Wykład 1

Stanisław Cichocki Natalia Nehrebecka. Wykład 1 Stanisław Cichocki Natalia Nehrebecka Wykład 1 1 1. Sprawy organizacyjne Zasady zaliczenia Ćwiczenia Literatura 2. Obciążenie Lovella 3. Metoda od ogólnego do szczególnego 4. Kryteria informacyjne 2 1.

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Egzamin z ekonometrii wersja IiE, MSEMAT

Egzamin z ekonometrii wersja IiE, MSEMAT Egzamin z ekonometrii wersja IiE, MSEMAT 04-02-2016 Pytania teoretyczne 1. Za pomocą jakiego testu weryfikowana jest normalność składnika losowego? Jakiemu założeniu KMRL odpowiada w tym teście? Jakie

Bardziej szczegółowo

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2. Zadanie 1 Niech y t ma rozkład logarytmiczno normalny o funkcji gęstości postaci [ ] 1 f (y t ) = y exp (ln y t β ln x t ) 2 t 2πσ 2 2σ 2 Zakładamy, że x t jest nielosowe a y t są nieskorelowane w czasie.

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

1 Modele ADL - interpretacja współczynników

1 Modele ADL - interpretacja współczynników 1 Modele ADL - interpretacja współczynników ZADANIE 1.1 Dany jest proces DL następującej postaci: y t = µ + β 0 x t + β 1 x t 1 + ε t. 1. Wyjaśnić, jaka jest intepretacja współczynników β 0 i β 1. 2. Pokazać

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych 9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Stanisław Cichocki Natalia Nehrebecka. Wykład 7 Stanisław Cichocki Natalia Nehrebecka Wykład 7 1 1. Metoda Największej Wiarygodności MNW 2. Założenia MNW 3. Własności estymatorów MNW 4. Testowanie hipotez w MNW 2 1. Metoda Największej Wiarygodności

Bardziej szczegółowo

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16 Stanisław Cichocki Natalia Nehrebecka Zajęcia 15-16 1 1. Sezonowość 2. Zmienne stacjonarne 3. Zmienne zintegrowane 4. Test Dickey-Fullera 5. Rozszerzony test Dickey-Fullera 6. Test KPSS 7. Regresja pozorna

Bardziej szczegółowo

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie

Bardziej szczegółowo

Metoda największej wiarogodności

Metoda największej wiarogodności Wprowadzenie Założenia Logarytm funkcji wiarogodności Metoda Największej Wiarogodności (MNW) jest bardziej uniwersalną niż MNK metodą szacowania wartości nieznanych parametrów Wprowadzenie Założenia Logarytm

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Testowanie hipotez statystycznych Wyk lad 9 Natalia Nehrebecka Stanis law Cichocki 28 listopada 2018 Plan zaj eć 1 Rozk lad estymatora b 2 3 dla parametrów 4 Hipotezy l aczne - test F 5 Dodatkowe za lożenie

Bardziej szczegółowo

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i statystyka Wykład XI: Testowanie hipotez statystycznych 12 stycznia 2015 Przykład Motywacja X 1, X 2,..., X N N (µ, σ 2 ), Y 1, Y 2,..., Y M N (ν, δ 2 ). Chcemy sprawdzić, czy µ = ν i σ 2 = δ 2, czyli że w obu populacjach

Bardziej szczegółowo

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Testowanie hipotez statystycznych Wyk lad 8 Natalia Nehrebecka Stanis law Cichocki 29 listopada 2015 Plan zajeć 1 Rozk lad estymatora b Rozk lad sumy kwadratów reszt 2 Hipotezy proste - test t Badanie

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12 Stanisław Cichocki Natalia Nehrebecka Zajęcia 11-12 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość - Mamy 2 modele: y X u 1 1 (1) y X X 1 1 2 2 (2) - Potencjalnie

Bardziej szczegółowo

Ekonometria Ćwiczenia 19/01/05

Ekonometria Ćwiczenia 19/01/05 Oszacowano regresję stopy bezrobocia (unemp) na wzroście realnego PKB (pkb) i stopie inflacji (cpi) oraz na zmiennych zero-jedynkowych związanymi z kwartałami (season). Regresję przeprowadzono na danych

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych round Testowanie hipotez statystycznych Wyk lad 9 Natalia Nehrebecka Stanis law Cichocki 13 grudnia 2014 Plan zajeć 1 Rozk lad estymatora b Rozk lad sumy kwadratów reszt 2 Hipotezy proste - test t Badanie

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy

Bardziej szczegółowo

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4. Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12 Stanisław Cichocki Natalia Nehrebecka Wykład 12 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne 2. Autokorelacja o Testowanie autokorelacji 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne

Bardziej szczegółowo

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej Ekonometria Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 4 Prognozowanie, stabilność 1 / 17 Agenda

Bardziej szczegółowo

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne.

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8 Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16

Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16 Value at Risk (VaR) Jerzy Mycielski WNE 2018 Jerzy Mycielski (Institute) Value at Risk (VaR) 2018 1 / 16 Warunkowa heteroskedastyczność O warunkowej autoregresyjnej heteroskedastyczności mówimy, gdy σ

Bardziej szczegółowo

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe? 2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali

Bardziej szczegółowo

Własności statystyczne regresji liniowej. Wykład 4

Własności statystyczne regresji liniowej. Wykład 4 Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności

Bardziej szczegółowo

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka Statystyka opisowa. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Prosta regresji cechy Y względem cech X 1,..., X k. 2 3 Wyznaczamy zależność cechy Y od cech X 1, X 2,..., X k postaci Y = α 0 +

Bardziej szczegółowo

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 0/0/0. Egzamin trwa 90 minut.. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu. Złamanie

Bardziej szczegółowo

Natalia Nehrebecka Stanisław Cichocki. Wykład 13

Natalia Nehrebecka Stanisław Cichocki. Wykład 13 Natalia Nehrebecka Stanisław Cichocki Wykład 13 1 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość 2 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje

Bardziej szczegółowo

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1 Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie

Bardziej szczegółowo

Zmienne zależne i niezależne

Zmienne zależne i niezależne Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }

Bardziej szczegółowo

Proces modelowania zjawiska handlu zagranicznego towarami

Proces modelowania zjawiska handlu zagranicznego towarami Załącznik nr 1 do raportu końcowego z wykonania pracy badawczej pt. Handel zagraniczny w województwach (NTS2) realizowanej przez Centrum Badań i Edukacji Statystycznej z siedzibą w Jachrance na podstawie

Bardziej szczegółowo

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 02/02/2011 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

Zawansowane modele wyborów dyskretnych

Zawansowane modele wyborów dyskretnych Zawansowane modele wyborów dyskretnych Jerzy Mycielski Uniwersytet Warszawski grudzien 2013 Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 1 / 16 Model efektów

Bardziej szczegółowo

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Ze względu na jakość uzyskiwanych ocen parametrów strukturalnych modelu oraz weryfikację modelu, metoda najmniejszych

Bardziej szczegółowo

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde

Bardziej szczegółowo

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012

Bardziej szczegółowo

Egzamin z ekonometrii - wersja ogólna

Egzamin z ekonometrii - wersja ogólna Egzamin z ekonometrii - wersja ogólna 06-02-2019 Regulamin egzaminu 1. Egzamin trwa 90 min. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka - adres mailowy: scichocki@o2.pl - strona internetowa: www.wne.uw.edu.pl/scichocki - dyżur: po zajęciach lub po umówieniu mailowo - 80% oceny: egzaminy - 20% oceny:

Bardziej szczegółowo

Natalia Neherbecka. 11 czerwca 2010

Natalia Neherbecka. 11 czerwca 2010 Natalia Neherbecka 11 czerwca 2010 1 1. Konsekwencje heteroskedastyczności i autokorelacji 2. Uogólniona MNK 3. Stosowalna Uogólniona MNK 4. Odporne macierze wariancji i kowariancji b 2 1. Konsekwencje

Bardziej szczegółowo

Prawdopodobieństwo i rozkład normalny cd.

Prawdopodobieństwo i rozkład normalny cd. # # Prawdopodobieństwo i rozkład normalny cd. Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów

Bardziej szczegółowo

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28 Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych

Bardziej szczegółowo

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1. Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w

Bardziej szczegółowo

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności. TEST STATYSTYCZNY Testem statystycznym nazywamy regułę postępowania rozstrzygająca, przy jakich wynikach z próby hipotezę sprawdzaną H 0 należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.

Bardziej szczegółowo

EKONOMETRIA. Prof. dr hab. Eugeniusz Gatnar.

EKONOMETRIA. Prof. dr hab. Eugeniusz Gatnar. EKONOMETRIA Prof. dr hab. Eugeniusz Gatnar egatnar@mail.wz.uw.edu.pl Sprawy organizacyjne Wykłady - prezentacja zagadnień dotyczących: budowy i weryfikacji modelu ekonometrycznego, doboru zmiennych, estymacji

Bardziej szczegółowo

Metoda najmniejszych kwadratów

Metoda najmniejszych kwadratów Model ekonometryczny Wykształcenie a zarobki Hipoteza badawcza: Istnieje zależność między poziomem wykształcenia a wysokością zarobków Wykształcenie a zarobki Hipoteza badawcza: Istnieje zależność między

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wprowadzenie

Testowanie hipotez statystycznych. Wprowadzenie Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,

Bardziej szczegółowo

Hipotezy statystyczne

Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej próbki losowej. Hipotezy

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Hipotezy statystyczne

Hipotezy statystyczne Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej

Bardziej szczegółowo

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

Statystyka Matematyczna Anna Janicka

Statystyka Matematyczna Anna Janicka Statystyka Matematyczna Anna Janicka wykład X, 9.05.206 TESTOWANIE HIPOTEZ STATYSTYCZNYCH II: PORÓWNYWANIE TESTÓW Plan na dzisiaj 0. Przypomnienie potrzebnych definicji. Porównywanie testów 2. Test jednostajnie

Bardziej szczegółowo

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów 5. Testowanie

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Przykład (wstępny). Producent twierdzi, że wadliwość produkcji wynosi 5%. My podejrzewamy, że rzeczywista wadliwość produkcji wynosi 15%. Pobieramy próbę stuelementową

Bardziej szczegółowo

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe

Bardziej szczegółowo

Analizowane modele. Dwa modele: y = X 1 β 1 + u (1) y = X 1 β 1 + X 2 β 2 + ε (2) Będziemy analizować dwie sytuacje:

Analizowane modele. Dwa modele: y = X 1 β 1 + u (1) y = X 1 β 1 + X 2 β 2 + ε (2) Będziemy analizować dwie sytuacje: Analizowane modele Dwa modele: y = X 1 β 1 + u (1) Będziemy analizować dwie sytuacje: y = X 1 β 1 + X 2 β 2 + ε (2) zmienne pominięte: estymujemy model (1) a w rzeczywistości β 2 0 zmienne nieistotne:

Bardziej szczegółowo

Regresja liniowa wprowadzenie

Regresja liniowa wprowadzenie Regresja liniowa wprowadzenie a) Model regresji liniowej ma postać: gdzie jest zmienną objaśnianą (zależną); są zmiennymi objaśniającymi (niezależnymi); natomiast są parametrami modelu. jest składnikiem

Bardziej szczegółowo

Ekonometria. Zajęcia

Ekonometria. Zajęcia Ekonometria Zajęcia 16.05.2018 Wstęp hipoteza itp. Model gęstości zaludnienia ( model gradientu gęstości ) zakłada, że gęstość zaludnienia zależy od odległości od okręgu centralnego: y t = Ae βx t (1)

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Egzamin z ekonometrii wersja ogolna

Egzamin z ekonometrii wersja ogolna Egzamin z ekonometrii wersja ogolna 04-02-2016 Pytania teoretyczne 1. Wymienić założenia Klasycznego Modelu Regresji Liniowej (KMRL). 2. Wyprowadzić estymator MNK dla modelu z wieloma zmiennymi objaśniającymi.

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej

Bardziej szczegółowo

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Statystyka Matematyczna Anna Janicka

Statystyka Matematyczna Anna Janicka Statystyka Matematyczna Anna Janicka wykład IX, 25.04.2016 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Plan na dzisiaj 1. Hipoteza statystyczna 2. Test statystyczny 3. Błędy I-go i II-go rodzaju 4. Poziom istotności,

Bardziej szczegółowo

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Wykład 4: Wnioskowanie statystyczne Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Idea wnioskowania statystycznego Celem analizy statystycznej nie jest zwykle tylko

Bardziej szczegółowo

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

TESTOWANIE HIPOTEZ STATYSTYCZNYCH TETOWANIE HIPOTEZ TATYTYCZNYCH HIPOTEZA TATYTYCZNA przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na

Bardziej szczegółowo