Ocena dopasowania modelu do danych empirycznych

Podobne dokumenty
Modele tendencji rozwojowej STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 18 listopada 2017

qwertyuiopasdfghjklzxcvbnmqwerty uiopasdfghjklzxcvbnmqwertyuiopasd fghjklzxcvbnmqwertyuiopasdfghjklzx cvbnmqwertyuiopasdfghjklzxcvbnmq

Parametryczne Testy Istotności

Porównanie dwu populacji

3. Regresja liniowa Założenia dotyczące modelu regresji liniowej

1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

STATYSTYKA I ANALIZA DANYCH

Rozkład normalny (Gaussa)

Wnioskowanie statystyczne dla korelacji i regresji.

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

Rozkład normalny (Gaussa)

Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

TESTY LOSOWOŚCI. Badanie losowości próby - test serii.

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

Przedziały ufności i testy parametrów. Przedziały ufności dla średniej odpowiedzi. Interwały prognoz (dla przyszłych obserwacji)

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,

Michał Gruca ZASADY OPRACOWANIA WYNIKÓW POMIARÓW

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

Miary położenia (tendencji centralnej) to tzw. miary przeciętne charakteryzujące średni lub typowy poziom wartości cechy.

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

Ćwiczenia rachunkowe TEST ZGODNOŚCI χ 2 PEARSONA ROZKŁAD GAUSSA

Badanie zależności cech

Wykład 11 ( ). Przedziały ufności dla średniej

ANALIZA DANYCH DYSKRETNYCH

COLLEGIUM MAZOVIA INNOWACYJNA SZKOŁA WYŻSZA WYDZIAŁ NAUK STOSOWANYCH. Kierunek: Finanse i rachunkowość. Robert Bąkowski Nr albumu: 9871

KADD Metoda najmniejszych kwadratów

Estymacja przedziałowa

Ekonometria Mirosław Wójciak

Uwarunkowania rozwojowe województw w Polsce analiza statystyczno-ekonometryczna

Estymacja parametrów populacji

Przykładowe zadania dla poziomu rozszerzonego

Miary rozproszenia. Miary położenia. Wariancja. Średnia. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

Ćwiczenia nr 5. TEMATYKA: Regresja liniowa dla prostej i płaszczyzny

Wykład 4 Testy zgodności. dystrybuanta rozkładu populacji dystrybuanty rozkładów dwóch populacji rodzaj rozkładu wartości parametrów.

Statystyka Wzory I. Analiza struktury

Miary położenia. Miary rozproszenia. Średnia. Wariancja. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

STATYSTYKA MATEMATYCZNA

PROGNOZOWANIE. mgr Żaneta Pruska. Katedra Systemów Logistycznych.

POLITECHNIKA OPOLSKA

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

STATYSTYKA OPISOWA PODSTAWOWE WZORY

Statystyka. Katarzyna Chudy Laskowska

SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY

Statystyka matematyczna dla leśników

Materiały dydaktyczne. Matematyka. Semestr III. Ćwiczenia

Ćwiczenie 5 ITERACYJNY ALGORYTM LS. IDENTYFIKACJA OBIEKTÓW NIESTACJONARNYCH ALGORYTM Z WYKŁADNICZYM ZAPOMINANIEM.

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

Metoda łączona. Wykład 7 Dwie niezależne próby. Standardowy błąd dla różnicy dwóch średnich. Metoda zwykła (niełączona) n2 2

PROGNOZY I SYMULACJE

STATYSTYKA OPISOWA WYKŁAD 1 i 2

ANALIZA KORELACJI IREGRESJILINIOWEJ

Wersja najbardziej zaawansowana. Zestaw nr 1: Ciągi liczbowe własności i granica

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

Statystyka opisowa. () Statystyka opisowa 24 maja / 8

Zadania domowe z Analizy Matematycznej III - czȩść 2 (funkcje wielu zmiennych)

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

STATYSTYKA OPISOWA PODSTAWOWE WZORY

Lista 6. Estymacja punktowa

16 Przedziały ufności

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

Wprowadzenie do laboratorium 1

Estymacja przedziałowa - przedziały ufności

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

Ekonometria. Zajęcia

L.Kowalski zadania ze statystyki matematycznej-zestaw 3 ZADANIA - ZESTAW 3

Metody badania zbieżności/rozbieżności ciągów liczbowych

Zeszyty naukowe nr 9

Całkowanie przez podstawianie i dwa zadania

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

BADANIA DOCHODU I RYZYKA INWESTYCJI

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

STATYSTYKA MATEMATYCZNA

Definicja interpolacji

Testowanie hipotez statystycznych

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyczny opis danych - parametry

Podstawowe pojęcia. Próba losowa. Badanie próby losowej

ZDARZENIE ELEMENTARNE to możliwy wynik doświadczenia losowego. Wszystkie takie możliwe wyniki tworzą zbiór zdarzeń elementarnych.

Testowanie hipotez statystycznych

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

PROGNOZOWANIE. mgr Żaneta Pruska. Katedra Systemów Logistycznych.

Metody obliczeniowe - Budownictwo semestr 4 - wykład nr 3. Metody obliczeniowe. wykład nr 3. interpolacja i aproksymacja funkcji model regresji

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

d wymiarowy wektor losowy Niech (Ω, S, P) przestrzeń probabilistyczna Definicja Odwzorowanie X: Ω R nazywamy 1-wymiarowym wektorem

Prawdopodobieństwo i statystyka r.

Metoda analizy hierarchii Saaty ego Ważnym problemem podejmowania decyzji optymalizowanej jest często występująca hierarchiczność zagadnień.

III. LICZBY ZESPOLONE

MACIERZE STOCHASTYCZNE

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Estymacja przedziałowa:

opisać wielowymiarową funkcją rozkładu gęstości prawdopodobieństwa f(x 1 , x xn

Transkrypt:

Ocea dopasowaia modelu do dach empirczch

Po oszacowaiu parametrów modelu ależ zbadać, cz zbudowa model dobrze opisuje badae zależości. Jeśli okaże się, że rozbieżość międz otrzmam modelem a dami empirczmi lub międz otrzmam modelem a wiedzą ekoomiczą o badach zależościach jest duża, wówczas ależ go skorgować oraz poprawić. Przcz powodujące złą jakość modelu ekoometrczego mogą się pojawić już w początkowch etapach badaia ekoometrczego. Nigd ie ma pewości, cz został dobrae odpowiedie zmiee objaśiające. Wątpliwości może budzić także dobór postaci aalitczej modelu. W samm procesie estmacji mogła też bć zastosowaa iewłaściwa metoda szacowaia parametrów. Wszstko to powoduje potrzebę przeprowadzaia werfikacji zbudowaego modelu przed jego wkorzstaiem do wioskowaia o badach zależościach.

Werfikacja modelu sprowadza się do zbadaia trzech własości: Badaie dokładości szacuku modelu Badaie stopia dopasowaia modelu do dach empirczch Badaie statstczej istotości estmatorów parametrów wstępującch w modelu Werfikacja hipotez dotczącch odchleń losowch Badaie zasadości przjętej postaci aalitczej modelu

Ocea dopasowaia modelu do dach empirczch ma a celu sprawdzeie, cz model te w wstarczająco dużm stopiu wjaśia kształtowaie się zmieej objaśiaej. Do tego celu służą róże miar zgodości modelu z dami empirczmi. Jedą z podstawowch miar jakości dopasowaia modelu do dach empirczch jest współczik determiacji. Ma o postać: R i1 i1 Współczik te przjmuje wartości z przedziału [0;1]. Iformuje o, jaką część całkowitej zmieości zmieej objaśiaej staowi zmieość wartości teoretczch tej zmieej, tj. część zdetermiowaa przez zmiee objaśiające. Dopasowaie modelu do dach jest tm lepsze, im współczik determiacji jest bliższ jedości. ˆ t t.

Miarą uzupełiającą miarę R jest współczik zbieżości. Ma o postać: i1 i1 t t ˆ i1 T T kse Xa. T Widać stąd, że φ =0 jedie wówczas, gd wszstkie reszt modelu są rówe zeru (odpowiada to dokłademu dopasowaiu modelu do dach empirczch). Z drugiej stro, jeśli reszt modelu wkazują taką samą zmieość (w sesie wariacji) jak obserwacje dotczące zmieej objaśiaej, to współczik zbieżości przjmuje wartość 1. Stuacja ta ozacza brak dopasowaia modelu do dach empirczch. Moża wkazać, że R =1-φ. Dlatego też wartość miar R iterpretujem jako frakcję zmieości zmieej objaśiaej wjaśiaą przez model, a wartość miar φ odpowiada frakcji zmieości, której model ie wjaśia. Z praktczego puktu widzeia pożądae jest, ab R bło bliskie 1. t

Kolejm elemetem parametrów struktur stochastczej jest współczik korelacji wielorakiej. Jest o miarą sił związku liiowego zmieej objaśiaej Y ze zmiemi objaśiającmi X 1, X,, X k. Zdefiiowa jest astępująco: R gdzie: det(r) wzaczik macierz R współczików korelacji zmiech objaśiającch X 1, X,, X k łączoch parami; det(w) wzaczik macierz: T 1 R 0 W R0 R Współczik korelacji wielorakiej jest uormowa w przedziale [0;1]. Przjmuje tm większe wartości, im związek zmieej objaśiaej ze zmiemi objaśiającmi jest siliejsz. Współczik korelacji wielorakiej może bć krterium wboru ajlepszej kombiacji zmiech objaśiającch spośród jedakowo liczch kombiacji. Wartość R moża wzaczć rówież z astępującej zależości: R det W 1 detr, 1 R.

W oceie stopia dopasowaia modelu do dach empirczch przdate jest wzaczeie współczika zmieości losowej. Współczik te iformuje, ile procet wartości średiej artmetczej zmieej objaśiaej staowi odchleie stadardowe składika losowego. Wzacza się go zatem z astępującej zależości: V 100%. Przjmuje się, że ie powiie o przekraczać 10%. S e W procesie werfikacji oprócz aaliz zdroworozsądkowej, mającej a celu wkluczeie wików iezgodch bądź z teorią ekoomii, bądź z długo obserwowami wikami doświadczeń, szerokie zastosowaie zajdują istrumet z zakresu statstki matematczej. Chodzi tu przede wszstkim o teorię hipotez statstczch.

Kolejm etapem werfikacji modelu ekoometrczego jest sprawdzeie statstczej istotości parametrów strukturalch, tj. ocea, cz parametr różią się statstczie istotie od zera. Służ temu test istotości t-studeta. Hipotez tego testu są astępujące: H 0 : α i = 0 H 1 : α i 0 Hipoteza zerowa H 0 ozacza, że parametr jest statstczie ieistot, atomiast hipoteza H 0 alteratwa ozacza, że parametr jest istot. Sprawdziaem testu jest statstka t-studeta, liczoa według astępującego wzoru: gdzie: a S i a, a i ocea i-tego parametru strukturalego, ta i S(a i ) błąd średi szacuku parametru strukturalego α i. i

Po obliczeiu statstki t-studeta porówujem jej wartość bezwzględą z wartością krtczą t α,-1 odcztaą z tablic kwatli rozkładu t-studeta dla przjętego poziomu istotości α (ajczęściej przjmuje się, że α=0,05) i df=-k stopi swobod ( jest to liczba obserwacji, k jest liczbą szacowach parametrów). Jeżeli moduł obliczoej statstki t a i z prób jest większ od krtczej wartości statstki t α,-1, ozacza to, że hipotezę zerową mówiącą o braku istotości parametru strukturalego ależ odrzucić a rzecz hipotez alteratwej mówiącej, że parametr jest statstczie istot. W przeciwm wpadku ie mam podstaw, ab da parametr uzać za istot.

Współczik determiacji prz dodatkowm założeiu o ormalości rozkładu wektora składika losowego może bć zbada z puktu widzeia rozkładu użteczego do budow testu dotczącego istotości parametrów. W tm przpadku hipoteza zerowa ma postać: przeciwko H 0 : α 1 =α = =α m = 0 H 1 : α 1 + α + + α m 0 W razie odrzuceia hipotez zerowej wioskujem, że przajmiej jede z parametrów strukturalch rozpatrwaego modelu jest róż od zera. W razie braku podstaw do odrzuceia hipotez zerowej ależ uzać, że wszstkie m zmiech objaśiającch ależałob z modelu usuąć, wobec czego procedurę budow modelu trzeba rozpocząć od owa. Akceptacja H 0 ozacza bowiem, że wartości zmieej objaśiaej powi bć wjaśiae przez jej wartość przeciętą z prób (z pomiięciem wpłwu składika losowego).

Moża wkazać, że prz prawdziwości hipotez zerowej statstka F a T X T u T u 1 ma rozkład F-Fishera-Sedecora k-1 oraz -k stopiami swobod. Procedura testowaia jest więc astępująca: 1. Na podstawie prób obliczam wartość empirczą statstki F (co wmaga zajomości współczika determiacji). T. Dla zadaego poziomu istotości α zajdujem wartość krtczą F*. Odcztu dokoujem dla k-1 i -k stopi swobod. k R 1 1 R 3. Jeżeli F>F*, to hipotezę H 0 odrzucam. W przeciwm razie stwierdzam brak podstaw do odrzuceia H 0. k k k, 1