Metoda największej wiarogodności

Podobne dokumenty
Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Własności statystyczne regresji liniowej. Wykład 4

Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

STATYSTYKA

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Uogólniona Metoda Momentów

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Testowanie hipotez statystycznych.

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka Matematyczna Anna Janicka

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Wykład 6 Estymatory efektywne. Własności asymptotyczne estym. estymatorów

Metoda najmniejszych kwadratów

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska

METODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Metody probabilistyczne

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez statystycznych.

Statystyka. Wykład 2. Krzysztof Topolski. Wrocław, 11 października 2012

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Zawansowane modele wyborów dyskretnych

Stanisław Cichocki. Natalia Nehrebecka

Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16

Modele zapisane w przestrzeni stanów

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Weryfikacja hipotez statystycznych

Uogolnione modele liniowe

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Losowe zmienne objaśniające. Rozszerzenia KMRL. Rozszerzenia KMRL

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych

Kolokwium ze statystyki matematycznej

Rozkłady statystyk z próby

Natalia Neherbecka. 11 czerwca 2010

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

Prawdopodobieństwo i statystyka

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Stanisław Cichocki. Natalia Nehrebecka

Ważne rozkłady i twierdzenia c.d.

Ekonometria egzamin 07/03/2018

Ekonometria. Zajęcia

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Statystyka Matematyczna Anna Janicka

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

Egzamin z ekonometrii wersja IiE, MSEMAT

Stanisław Cichocki. Natalia Nehrebecka

Estymacja parametrów w modelu normalnym

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Metoda Monte Carlo. Jerzy Mycielski. grudzien Jerzy Mycielski () Metoda Monte Carlo grudzien / 10

1.8 Diagnostyka modelu

Metoda największej wiarygodności

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka

Weryfikacja hipotez statystycznych

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Prawdopodobieństwo i statystyka r.

Wykład 3 Momenty zmiennych losowych.

Wykład 3 Momenty zmiennych losowych.

Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej

Testowanie hipotez statystycznych

Estymacja parametrów rozkładu cechy

STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Centralne twierdzenie graniczne

Testowanie hipotez statystycznych

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

Testowanie hipotez statystycznych.

Statystyka w przykładach

1.1 Klasyczny Model Regresji Liniowej

1.1 Statystyka matematyczna Literatura Model statystyczny Preliminaria... 3

Oznacza to, że chcemy znaleźć minimum, a właściwie wartość najmniejszą funkcji

Prawdopodobieństwo i statystyka r.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Metody systemowe i decyzyjne w informatyce

SPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Wnioskowanie statystyczne. Statystyka w 5

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Testowanie hipotez statystycznych

Transkrypt:

Wprowadzenie Założenia Logarytm funkcji wiarogodności Metoda Największej Wiarogodności (MNW) jest bardziej uniwersalną niż MNK metodą szacowania wartości nieznanych parametrów

Wprowadzenie Założenia Logarytm funkcji wiarogodności Metoda Największej Wiarogodności (MNW) jest bardziej uniwersalną niż MNK metodą szacowania wartości nieznanych parametrów Wymaga spełnienia założeń, które są mniej restrykcyjne niż założenia MNK

Wprowadzenie Założenia Logarytm funkcji wiarogodności Metoda Największej Wiarogodności (MNW) jest bardziej uniwersalną niż MNK metodą szacowania wartości nieznanych parametrów Wymaga spełnienia założeń, które są mniej restrykcyjne niż założenia MNK Dzięki temu MNW może być wykorzystywana do estymacji szerszej klasy modeli ekonometrycznych

Wprowadzenie Założenia Logarytm funkcji wiarogodności Wiarogodność Wiarogodność jest to funkcja Θ R: L(θ) = f (θ, x 1,..., x n ) = f θ (x 1,..., x n )

Wprowadzenie Założenia Logarytm funkcji wiarogodności Wiarogodność Wiarogodność jest to funkcja Θ R: L(θ) = f (θ, x 1,..., x n ) = f θ (x 1,..., x n ) W praktyce będziemy dysponowali próbą n obserwacji. Kluczowym założeniem jest znajomość postaci funkcji f ( )

Wprowadzenie Założenia Logarytm funkcji wiarogodności Estymator Metody Największej Wiarogodności Estymatorem Metody Największej Wiarogodności (MNW) dla wektora nieznanych parametrów θ, szacowanym na podstawie wartości zmiennej zależnej y i wartości zmiennych niezależnych X, nazywamy ˆθ = argmax f θ (y, X ) θ Θ

Wprowadzenie Założenia Logarytm funkcji wiarogodności Estymator Metody Największej Wiarogodności Estymatorem Metody Największej Wiarogodności (MNW) dla wektora nieznanych parametrów θ, szacowanym na podstawie wartości zmiennej zależnej y i wartości zmiennych niezależnych X, nazywamy ˆθ = argmax f θ (y, X ) θ Θ f ( ) nazywamy łączną funkcją gęstości prawdopodobieństwa lub funkcją wiarogodności

Wprowadzenie Założenia Logarytm funkcji wiarogodności Estymator Metody Największej Wiarogodności Estymatorem Metody Największej Wiarogodności (MNW) dla wektora nieznanych parametrów θ, szacowanym na podstawie wartości zmiennej zależnej y i wartości zmiennych niezależnych X, nazywamy ˆθ = argmax f θ (y, X ) θ Θ f ( ) nazywamy łączną funkcją gęstości prawdopodobieństwa lub funkcją wiarogodności Metoda polega na wybraniu takiej wartości parametru θ, który maksymalizuje f ( ) dla zaobserwowanych wartości y oraz X

Wprowadzenie Założenia Logarytm funkcji wiarogodności 1 Niezależność obserwacji (losowość próby)

Wprowadzenie Założenia Logarytm funkcji wiarogodności 1 Niezależność obserwacji (losowość próby) 2 Identyfikowalność parametrów

Wprowadzenie Założenia Logarytm funkcji wiarogodności 1 Niezależność obserwacji (losowość próby) 2 Identyfikowalność parametrów 3 Słaba egzogeniczność

Wprowadzenie Założenia Logarytm funkcji wiarogodności 1 Niezależność obserwacji (losowość próby) 2 Identyfikowalność parametrów 3 Słaba egzogeniczność 4 Znajomość postaci funkcji wiarodogności

Niezależność obserwacji Wprowadzenie Założenia Logarytm funkcji wiarogodności W przypadku danych przekrojowych jest równoważna losowości próby

Niezależność obserwacji Wprowadzenie Założenia Logarytm funkcji wiarogodności W przypadku danych przekrojowych jest równoważna losowości próby Jeżeli próba przekrojowa nie jest losowa wymagane są dodatkowe założenia

Niezależność obserwacji Wprowadzenie Założenia Logarytm funkcji wiarogodności W przypadku danych przekrojowych jest równoważna losowości próby Jeżeli próba przekrojowa nie jest losowa wymagane są dodatkowe założenia W przypadku danych czasowych zazwyczaj nie da się utrzymać założenia o losowości próby

Niezależność obserwacji Wprowadzenie Założenia Logarytm funkcji wiarogodności W przypadku danych przekrojowych jest równoważna losowości próby Jeżeli próba przekrojowa nie jest losowa wymagane są dodatkowe założenia W przypadku danych czasowych zazwyczaj nie da się utrzymać założenia o losowości próby Jednak, w praktyce, założenie o niezależności komplikuje jedynie dowody własności estymatorów

Niezależność obserwacji Wprowadzenie Założenia Logarytm funkcji wiarogodności Przy spełnionym założeniu o niezależności funkcję wiarogodności można zapisać jako L θ (y X ) = f θ (y X ) = f θ (y X 1,..., X n ) = n f θ (y i X i ) i=1

Niezależność obserwacji Wprowadzenie Założenia Logarytm funkcji wiarogodności Przy spełnionym założeniu o niezależności funkcję wiarogodności można zapisać jako L θ (y X ) = f θ (y X ) = f θ (y X 1,..., X n ) = n f θ (y i X i ) Zatem łączna funkcja gęstości jest iloczynem funkcji gęstości dla pojedynczych obserwacji i=1

Identyfikowalność parametrów Wprowadzenie Założenia Logarytm funkcji wiarogodności Każdy z parametrów modelu powinien w odmienny sposób wpływać na prawdopodobieństwo zaobserwowania próby

Identyfikowalność parametrów Wprowadzenie Założenia Logarytm funkcji wiarogodności Każdy z parametrów modelu powinien w odmienny sposób wpływać na prawdopodobieństwo zaobserwowania próby Dzięki tej własności można uzyskać oddzielne oszacowanie dla każdego nieznanego parametru

Identyfikowalność parametrów Wprowadzenie Założenia Logarytm funkcji wiarogodności Każdy z parametrów modelu powinien w odmienny sposób wpływać na prawdopodobieństwo zaobserwowania próby Dzięki tej własności można uzyskać oddzielne oszacowanie dla każdego nieznanego parametru Identyfikowalność Niech θ 0 będzie prawdziwą wielkością wektora parametrów θ. Wówczas istnieje taki zbiór danych, że (y, X ) θ θ 0 : L θ0 (X, y) L θ (X, y)

Identyfikowalność parametrów Wprowadzenie Założenia Logarytm funkcji wiarogodności W otoczeniu punktu θ 0 funkcja wiarogodności nie może być lokalnie płaska

Identyfikowalność parametrów Wprowadzenie Założenia Logarytm funkcji wiarogodności W otoczeniu punktu θ 0 funkcja wiarogodności nie może być lokalnie płaska Prawdopodobieństwo zaobserwowania próby (X,y) dla wektora parametrów θ 0 i dla wektora parametrów θ powinno być różne

Identyfikowalność parametrów Wprowadzenie Założenia Logarytm funkcji wiarogodności W otoczeniu punktu θ 0 funkcja wiarogodności nie może być lokalnie płaska Prawdopodobieństwo zaobserwowania próby (X,y) dla wektora parametrów θ 0 i dla wektora parametrów θ powinno być różne Inaczej mówiąc maksimum funkcji wiarogodności powinno być jednoznacznie określone

Wprowadzenie Założenia Logarytm funkcji wiarogodności Identyfikowalność parametrów - przykład Przypuśćmy, że obserwujemy zmienną losową { yi = 0 y y i = i < 0 y i = 1 > 0,gdzie y i N (µ, σ 2 ) y i

Wprowadzenie Założenia Logarytm funkcji wiarogodności Identyfikowalność parametrów - przykład Przypuśćmy, że obserwujemy zmienną losową { yi = 0 y y i = i < 0 y i = 1 > 0,gdzie y i N (µ, σ 2 ) y i Zmienną nieobserwowaną y i nazywamy zmienną ukrytą

Wprowadzenie Założenia Logarytm funkcji wiarogodności Identyfikowalność parametrów - przykład Przypuśćmy, że obserwujemy zmienną losową { yi = 0 y y i = i < 0 y i = 1 > 0,gdzie y i N (µ, σ 2 ) y i Zmienną nieobserwowaną yi nazywamy zmienną ukrytą Celem jest oszacowanie wartości parametrów rozkładu zmiennej ukrytej

Wprowadzenie Założenia Logarytm funkcji wiarogodności Identyfikowalność parametrów - przykład Przypuśćmy, że obserwujemy zmienną losową { yi = 0 y y i = i < 0 y i = 1 > 0,gdzie y i N (µ, σ 2 ) y i Zmienną nieobserwowaną yi nazywamy zmienną ukrytą Celem jest oszacowanie wartości parametrów rozkładu zmiennej ukrytej Wiemy, że Pr(y i = 0) = Pr(y i Pr(y i = 1) = Pr(y i ( µ ) < 0) = Φ σ ( µ ) > 0) = 1 Φ σ

Wprowadzenie Założenia Logarytm funkcji wiarogodności Identyfikowalność parametrów - przykład Niech w próbie jest n 0 obserwacji dla których y i = 0, oraz n 1 obserwacji dla których y i = 1

Wprowadzenie Założenia Logarytm funkcji wiarogodności Identyfikowalność parametrów - przykład Niech w próbie jest n 0 obserwacji dla których y i = 0, oraz n 1 obserwacji dla których y i = 1 Wówczas funkcja wiarogodności ma postać [ ( )] µ0 n0[ ( )] n1 µ0 L(µ 0, σ 0 ) = Φ 1 Φ σ 0 σ 0

Wprowadzenie Założenia Logarytm funkcji wiarogodności Identyfikowalność parametrów - przykład Niech w próbie jest n 0 obserwacji dla których y i = 0, oraz n 1 obserwacji dla których y i = 1 Wówczas funkcja wiarogodności ma postać [ ( )] µ0 n0[ ( )] n1 µ0 L(µ 0, σ 0 ) = Φ 1 Φ σ 0 σ 0 Ale połóżmy µ = αµ 0 oraz σ = ασ 0 dla dowolnego α > 0. Wówczas [ ( )] L(µ, σ αµ0 n0[ ( )] n1 αµ0 ) = Φ 1 Φ = L(µ, σ) ασ 0 ασ 0

Wprowadzenie Założenia Logarytm funkcji wiarogodności Identyfikowalność parametrów - przykład Niech w próbie jest n 0 obserwacji dla których y i = 0, oraz n 1 obserwacji dla których y i = 1 Wówczas funkcja wiarogodności ma postać [ ( )] µ0 n0[ ( )] n1 µ0 L(µ 0, σ 0 ) = Φ 1 Φ σ 0 σ 0 Ale połóżmy µ = αµ 0 oraz σ = ασ 0 dla dowolnego α > 0. Wówczas [ ( )] L(µ, σ αµ0 n0[ ( )] n1 αµ0 ) = Φ 1 Φ = L(µ, σ) ασ 0 ασ 0 Zatem funkcja nie posiada jednoznacznie wyznaczonego maksimum

Słaba egzogeniczność Wprowadzenie Założenia Logarytm funkcji wiarogodności Słaba egzogeniczność w MNK utożsamialiśmy z nieskorelowaniem obserwacji z równoczesnym błędem losowym

Słaba egzogeniczność Wprowadzenie Założenia Logarytm funkcji wiarogodności Słaba egzogeniczność w MNK utożsamialiśmy z nieskorelowaniem obserwacji z równoczesnym błędem losowym Załóżmy, że wektor parametrów θ można separować na dwie części θ = (Φ, Ψ)

Słaba egzogeniczność Wprowadzenie Założenia Logarytm funkcji wiarogodności Słaba egzogeniczność w MNK utożsamialiśmy z nieskorelowaniem obserwacji z równoczesnym błędem losowym Załóżmy, że wektor parametrów θ można separować na dwie części θ = (Φ, Ψ) Załóżmy, że te części są niepowiązane, czyli φ Φ, ψ Ψ to θ Φ Ψ

Słaba egzogeniczność Wprowadzenie Założenia Logarytm funkcji wiarogodności Słaba egzogeniczność w MNK utożsamialiśmy z nieskorelowaniem obserwacji z równoczesnym błędem losowym Załóżmy, że wektor parametrów θ można separować na dwie części θ = (Φ, Ψ) Załóżmy, że te części są niepowiązane, czyli φ Φ, ψ Ψ to θ Φ Ψ Słaba egzogeniczność Mówimy, że X jest słabo egzogeniczne względem wektora parametrów Ψ jeżeli łączną funkcje gęstości można następująco dekomponować f θ (y, X ) = f Φ (y, X )f Ψ (X )

Słaba egzogeniczność Wprowadzenie Założenia Logarytm funkcji wiarogodności Funkcja f Ψ (X ) opisuje prawdopodobieństwo zaobserwowania wartości zmiennych egzogenicznych i nie ma wpływu na prawdopodobieństwo zaobserwowania konkretnych wartości parametrów modelu

Słaba egzogeniczność Wprowadzenie Założenia Logarytm funkcji wiarogodności Funkcja f Ψ (X ) opisuje prawdopodobieństwo zaobserwowania wartości zmiennych egzogenicznych i nie ma wpływu na prawdopodobieństwo zaobserwowania konkretnych wartości parametrów modelu Zatem max θ f θ (y, X ) = max Φ (y, X ) + max (X ) Ψ

Słaba egzogeniczność Wprowadzenie Założenia Logarytm funkcji wiarogodności Funkcja f Ψ (X ) opisuje prawdopodobieństwo zaobserwowania wartości zmiennych egzogenicznych i nie ma wpływu na prawdopodobieństwo zaobserwowania konkretnych wartości parametrów modelu Zatem max θ f θ (y, X ) = max Φ (y, X ) + max (X ) Ψ Więc estymator MNW można obliczyć jako sumę dwóch oszacowań

Słaba egzogeniczność Wprowadzenie Założenia Logarytm funkcji wiarogodności Funkcja f Ψ (X ) opisuje prawdopodobieństwo zaobserwowania wartości zmiennych egzogenicznych i nie ma wpływu na prawdopodobieństwo zaobserwowania konkretnych wartości parametrów modelu Zatem max θ f θ (y, X ) = max Φ (y, X ) + max (X ) Ψ Więc estymator MNW można obliczyć jako sumę dwóch oszacowań Wniosek: Wartość parametru φ można oszacować na podstawie warunkowej funkcji gęstości f Φ (y X )

Wprowadzenie Założenia Logarytm funkcji wiarogodności W praktyce zamiast funkcji wiarogodności L(θ) posługujemy się logarytmem funkcji wiarogodnoćci l(θ)

Wprowadzenie Założenia Logarytm funkcji wiarogodności W praktyce zamiast funkcji wiarogodności L(θ) posługujemy się logarytmem funkcji wiarogodnoćci l(θ) Jest to uprawnione, ponieważ nie interesuje nas wartość funkcji, a wielkość oszacowań nieznanych parametrów

Wprowadzenie Założenia Logarytm funkcji wiarogodności W praktyce zamiast funkcji wiarogodności L(θ) posługujemy się logarytmem funkcji wiarogodnoćci l(θ) Jest to uprawnione, ponieważ nie interesuje nas wartość funkcji, a wielkość oszacowań nieznanych parametrów Logarytm jako monotoniczna transformacja zachowuje ekstrema

Wprowadzenie Założenia Logarytm funkcji wiarogodności W praktyce zamiast funkcji wiarogodności L(θ) posługujemy się logarytmem funkcji wiarogodnoćci l(θ) Jest to uprawnione, ponieważ nie interesuje nas wartość funkcji, a wielkość oszacowań nieznanych parametrów Logarytm jako monotoniczna transformacja zachowuje ekstrema Jeżeli obserwacje są niezależne to logarytm funkcji wiarogodności dany jest przez l θ (y X ) = ln f θ (y i x i ) = N ln f θ (y i x i ) = i=1 N ln l(y X i θ) i=1

Wprowadzenie Założenia Logarytm funkcji wiarogodności W praktyce zamiast funkcji wiarogodności L(θ) posługujemy się logarytmem funkcji wiarogodnoćci l(θ) Jest to uprawnione, ponieważ nie interesuje nas wartość funkcji, a wielkość oszacowań nieznanych parametrów Logarytm jako monotoniczna transformacja zachowuje ekstrema Jeżeli obserwacje są niezależne to logarytm funkcji wiarogodności dany jest przez l θ (y X ) = ln f θ (y i x i ) = N ln f θ (y i x i ) = i=1 N ln l(y X i θ) i=1 Logarytm funkcji gęstości jest sumą logarytmów warunkowych gęstości dla poszczególnych obserwacji

Wyznaczanie estymatorów MNW Własności estymatorów MNW wyznacza się maksymalizując funkcję wiarogodności korzystając z warunków pierwszego i drugiego rzędu na istnienie ekstremum funkcji

Wyznaczanie estymatorów MNW Własności estymatorów MNW wyznacza się maksymalizując funkcję wiarogodności korzystając z warunków pierwszego i drugiego rzędu na istnienie ekstremum funkcji Pewien problem może stanowić brak rozwiązań analitycznych

Wyznaczanie estymatorów MNW Własności estymatorów MNW wyznacza się maksymalizując funkcję wiarogodności korzystając z warunków pierwszego i drugiego rzędu na istnienie ekstremum funkcji Pewien problem może stanowić brak rozwiązań analitycznych Dla programów komputerowych nie stanowi to problemu, gdyż one znajdują pochodne w sposób numeryczny

Przykład Podstawy Wyznaczanie estymatorów MNW Własności estymatorów MNW Znajdź estymatory MNW dla parametrów KMRL y i = X i β + ε i ε i N (0, σ 2 )

Przykład Podstawy Wyznaczanie estymatorów MNW Własności estymatorów MNW Znajdź estymatory MNW dla parametrów KMRL y i = X i β + ε i ε i N (0, σ 2 ) Z założeń modelu wynika, że y i x i N (x i β, σ 2 )

Przykład Podstawy Wyznaczanie estymatorów MNW Własności estymatorów MNW Znajdź estymatory MNW dla parametrów KMRL Z założeń modelu wynika, że y i = X i β + ε i ε i N (0, σ 2 ) y i x i N (x i β, σ 2 ) Więc funkcja gęstości dla pojedynczej obserwacji jest dana przez 1 ( f β,σ 2(y i x i ) = exp (y X iβ) 2 ) 2Πσ 2 2σ 2

Przykład Podstawy Wyznaczanie estymatorów MNW Własności estymatorów MNW Znajdź estymatory MNW dla parametrów KMRL Z założeń modelu wynika, że y i = X i β + ε i ε i N (0, σ 2 ) y i x i N (x i β, σ 2 ) Więc funkcja gęstości dla pojedynczej obserwacji jest dana przez 1 ( f β,σ 2(y i x i ) = exp (y X iβ) 2 ) 2Πσ 2 2σ 2 Zatem funkcja wiarogodności ma postać [ L(β, σ 2 1 ] n ( ) = exp 1 ) 2Πσ 2 2σ 2 (y X iβ) (y X i β)

Przykład - cd Podstawy Wyznaczanie estymatorów MNW Własności estymatorów MNW A logarytm funkcji wiarogodności l(β, σ 2 ) = n 2 ln(2π) n 2 ln(σ2 ) 1 2σ 2 (y X iβ) (y X i β)

Przykład - cd Podstawy Wyznaczanie estymatorów MNW Własności estymatorów MNW A logarytm funkcji wiarogodności l(β, σ 2 ) = n 2 ln(2π) n 2 ln(σ2 ) 1 2σ 2 (y X iβ) (y X i β) Zatem warunki pierwszego rzędu dane są przez l(β, σ 2 ) β = 1 2σ 2 (2X X β 2X y) = 0 l(β, σ 2 ) σ 2 = n 1 2 σ 2 1 2σ 4 (y X iβ) (y X i β) = 0

Przykład - cd Podstawy Wyznaczanie estymatorów MNW Własności estymatorów MNW A logarytm funkcji wiarogodności l(β, σ 2 ) = n 2 ln(2π) n 2 ln(σ2 ) 1 2σ 2 (y X iβ) (y X i β) Zatem warunki pierwszego rzędu dane są przez l(β, σ 2 ) β = 1 2σ 2 (2X X β 2X y) = 0 l(β, σ 2 ) σ 2 = n 1 2 σ 2 1 2σ 4 (y X iβ) (y X i β) = 0 Uwaga: warunki drugiego rzędu wyprowadzimy później

Przykład - cd Podstawy Wyznaczanie estymatorów MNW Własności estymatorów MNW A logarytm funkcji wiarogodności l(β, σ 2 ) = n 2 ln(2π) n 2 ln(σ2 ) 1 2σ 2 (y X iβ) (y X i β) Zatem warunki pierwszego rzędu dane są przez l(β, σ 2 ) β = 1 2σ 2 (2X X β 2X y) = 0 l(β, σ 2 ) σ 2 = n 1 2 σ 2 1 2σ 4 (y X iβ) (y X i β) = 0 Uwaga: warunki drugiego rzędu wyprowadzimy później Wynika z tego, że β = (X X ) 1 X y σ 2 = 1 n (y X iβ) (y X i β) = e e n

Przykład - cd Podstawy Wyznaczanie estymatorów MNW Własności estymatorów MNW WNIOSEK: estymator MNW dla parametru β ma taką samą postać jak estymator MNK; estymatory dla wariancji różnią się

Przykład - cd Podstawy Wyznaczanie estymatorów MNW Własności estymatorów MNW WNIOSEK: estymator MNW dla parametru β ma taką samą postać jak estymator MNK; estymatory dla wariancji różnią się Obliczmy wartość oczekiwaną estymatora MNW dla wariancji E( σ 2 ) = E( e e n ) = n k n E(s2 ) = n k n σ2 n σ 2

Przykład - cd Podstawy Wyznaczanie estymatorów MNW Własności estymatorów MNW WNIOSEK: estymator MNW dla parametru β ma taką samą postać jak estymator MNK; estymatory dla wariancji różnią się Obliczmy wartość oczekiwaną estymatora MNW dla wariancji E( σ 2 ) = E( e e n ) = n k n E(s2 ) = n k n σ2 n σ 2 Zatem estymator MWN dla wariancji jest zgodny, ale obciążony w małych próbach

Wyznaczanie estymatorów MNW Własności estymatorów MNW 1 Zgodność

Wyznaczanie estymatorów MNW Własności estymatorów MNW 1 Zgodność 2 Asymptotyczna normalność

Wyznaczanie estymatorów MNW Własności estymatorów MNW 1 Zgodność 2 Asymptotyczna normalność 3 Asymptotyczna efektywność

Wyznaczanie estymatorów MNW Własności estymatorów MNW Zgodność Zgodność Estymator nazywamy zgodnym, gdy δ > 0 lim n Pr( ˆθ θ < δ) = 1

Wyznaczanie estymatorów MNW Własności estymatorów MNW Zgodność Zgodność Estymator nazywamy zgodnym, gdy δ > 0 lim n Pr( ˆθ θ < δ) = 1 Inaczej mówiąc estymator dąży według prawdopodobieństwa do prawdziwej wartości parametru, co zapisujemy ˆθ p θ plim ˆθ = θ

Wyznaczanie estymatorów MNW Własności estymatorów MNW Zgodność Zgodność Estymator nazywamy zgodnym, gdy δ > 0 lim n Pr( ˆθ θ < δ) = 1 Inaczej mówiąc estymator dąży według prawdopodobieństwa do prawdziwej wartości parametru, co zapisujemy ˆθ p θ plim ˆθ = θ Estymator nazywamy zgodnym, gdy wartość oszacowania parametru zbiega do prawdziwej wartości estymatora

Wyznaczanie estymatorów MNW Własności estymatorów MNW Zgodność Zgodność Estymator nazywamy zgodnym, gdy δ > 0 lim n Pr( ˆθ θ < δ) = 1 Inaczej mówiąc estymator dąży według prawdopodobieństwa do prawdziwej wartości parametru, co zapisujemy ˆθ p θ plim ˆθ = θ Estymator nazywamy zgodnym, gdy wartość oszacowania parametru zbiega do prawdziwej wartości estymatora Bardzie potocznym językiem: jeżeli liczebność próby rośnie to różnica między wartością estymatora a prawdziwą wartością parametru jest nieskończenie bliska 0

Asymptotyczna normalność Wyznaczanie estymatorów MNW Własności estymatorów MNW Graniczny (asymptotyczny) rozkład estymatora to rozkład normalny n(ˆθ θ) D N (0, I 1 (θ)) gdzie [ 1 ] [ l(θ) ] i(θ) = lim N N I(θ) oraz I(θ) = var θ jest macierzą informacyjną Fishera [ 2 l(θ) ] = E θ θ

Asymptotyczna normalność Wyznaczanie estymatorów MNW Własności estymatorów MNW Macierz informacyjna jest równa wariancji gradientu logarytmu funkcji wiarogodności

Asymptotyczna normalność Wyznaczanie estymatorów MNW Własności estymatorów MNW Macierz informacyjna jest równa wariancji gradientu logarytmu funkcji wiarogodności lub minus wartości oczekiwanej jej Hessianu

Wyznaczanie estymatorów MNW Własności estymatorów MNW Asymptotyczna normalność - przykład Znajdziemy gradient i Hessian dla KMRL

Wyznaczanie estymatorów MNW Własności estymatorów MNW Asymptotyczna normalność - przykład Znajdziemy gradient i Hessian dla KMRL Gradient jest równy l(β, σ 2 ) β l(β, σ 2 ) σ 2 = n 2 = 1 2σ 2 (2X X β 2X y) = 1 σ 2 X ε 1 σ 2 1 2σ 4 (y X iβ) (y X i β) = n 2 1 σ 2 + 1 2σ 2 ε ε

Wyznaczanie estymatorów MNW Własności estymatorów MNW Asymptotyczna normalność - przykład Wariancja wektora pochodnych względem β wynosi ( l(β, σ 2 ) ) var = 1 β σ 2 X var(ε)x = 1 σ 2 X X

Wyznaczanie estymatorów MNW Własności estymatorów MNW Asymptotyczna normalność - przykład Wariancja wektora pochodnych względem β wynosi ( l(β, σ 2 ) ) var = 1 β σ 2 X var(ε)x = 1 σ 2 X X Wariancja wektora pochodnych względem σ 2 wynosi ( l(β, σ 2 ) ) ( var σ 2 = var n 2 1 σ 2 + 1 ) 2σ 2 ε ε = 1 4σ 8 N2σ4 = N 2σ 4

Wyznaczanie estymatorów MNW Własności estymatorów MNW Asymptotyczna normalność - przykład Wariancja wektora pochodnych względem β wynosi ( l(β, σ 2 ) ) var = 1 β σ 2 X var(ε)x = 1 σ 2 X X Wariancja wektora pochodnych względem σ 2 wynosi ( l(β, σ 2 ) ) ( var σ 2 = var n 2 1 σ 2 + 1 ) 2σ 2 ε ε = 1 4σ 8 N2σ4 = Ponieważ E ( 1 σ 2 X ε ) = 0, więc kowiariancja między pochodnymi wynosi zero N 2σ 4

Wyznaczanie estymatorów MNW Własności estymatorów MNW Asymptotyczna normalność - przykład Zatem Hessian jest równy I(β, σ 2 ) = [ 1 σ 2 X X 0 0 N 2σ 4 ]

Wyznaczanie estymatorów MNW Własności estymatorów MNW Asymptotyczna normalność - przykład Te same wyniki uzyskamy obliczając wartości oczekiwane elementów Hessianu l(β, σ 2 ) β β = 1 2σ 4 X X l(β, σ 2 ) β σ 2 = 1 σ 4 X ε l(β, σ 2 ) σ 2 σ 2 = N 1 2 σ 4 1 σ 6 ε ε

Asymptotyczna efektywność Wyznaczanie estymatorów MNW Własności estymatorów MNW Twierdzenie Rao-Cramera Jeżeli estymator ˆθ jest zgodny to jego asymptotyczna wariancja jest nie mniejsza niż dolne ograniczenie Rao-Cramera lim var[ n( θ θ) ] i 1 (θ) = lim N N 1 N I(θ)

Asymptotyczna efektywność Wyznaczanie estymatorów MNW Własności estymatorów MNW Twierdzenie Rao-Cramera Jeżeli estymator ˆθ jest zgodny to jego asymptotyczna wariancja jest nie mniejsza niż dolne ograniczenie Rao-Cramera lim var[ n( θ θ) ] i 1 (θ) = lim N N 1 N I(θ) są asymptotycznie efektywne ponieważ ich wariancja zbiega do dolnego ograniczenia Rao-Cremera

Asymptotyczna efektywność Wyznaczanie estymatorów MNW Własności estymatorów MNW Twierdzenie Rao-Cramera Jeżeli estymator ˆθ jest zgodny to jego asymptotyczna wariancja jest nie mniejsza niż dolne ograniczenie Rao-Cramera lim var[ n( θ θ) ] i 1 (θ) = lim N N 1 N I(θ) są asymptotycznie efektywne ponieważ ich wariancja zbiega do dolnego ograniczenia Rao-Cremera Zatem estymatory MNW są estymatorami zgodnymi o minimalnej wariancji

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania Na podstawie własności estymatorów MNW można wyprowadzić rozkłady statystyk testowych dla ogólnych hipotez

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania Na podstawie własności estymatorów MNW można wyprowadzić rozkłady statystyk testowych dla ogólnych hipotez Zakładamy, że hipoteza ma postać (nie)liniowego układu równań h 1 (θ) = 0 H 0 :. h q (θ) = 0

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania Na podstawie własności estymatorów MNW można wyprowadzić rozkłady statystyk testowych dla ogólnych hipotez Zakładamy, że hipoteza ma postać (nie)liniowego układu równań h 1 (θ) = 0 H 0 :. h q (θ) = 0 Przyjmując h(θ) = (h 1 (θ),..., h q (θ)) zapisujemy układ H 0 : h(θ) = 0

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania Na podstawie własności estymatorów MNW można wyprowadzić rozkłady statystyk testowych dla ogólnych hipotez Zakładamy, że hipoteza ma postać (nie)liniowego układu równań h 1 (θ) = 0 H 0 :. h q (θ) = 0 Przyjmując h(θ) = (h 1 (θ),..., h q (θ)) zapisujemy układ H 0 : h(θ) = 0 Hipotezy należy sformułować w taki sposób, aby macierz pierwszych pochodnych h (θ) = h(θ) θ miała pełen rząd

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania Jest to w praktyce najłatwiejszy do przeprowadzenia test

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania Jest to w praktyce najłatwiejszy do przeprowadzenia test Ale wymaga oszacowania dwóch modeli

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania Jest to w praktyce najłatwiejszy do przeprowadzenia test Ale wymaga oszacowania dwóch modeli Weryfikowane jest J ograniczeń LR = 2(l( θ) l( θ R )) D χ 2 J l( θ) jest logarytmem funkcji wiarogodności dla modelu bez ograniczeń l( θ R ) jest logarytmem funkcji wiarogodności dla modelu ze spełnionymi ograniczeniami

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania Idea testu bazuje na spostrzeżeniu, iż łatwiej jest zmaksymalizować funkcję bez ograniczeń, niż z narzuconymi na parametry restrykcjami

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania Idea testu bazuje na spostrzeżeniu, iż łatwiej jest zmaksymalizować funkcję bez ograniczeń, niż z narzuconymi na parametry restrykcjami Nazwa testu wywodzi się z faktu, że statystykę testową można zapisać jako ( L( θ) ) LR = 2 ln L( θ R )

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania Idea testu bazuje na spostrzeżeniu, iż łatwiej jest zmaksymalizować funkcję bez ograniczeń, niż z narzuconymi na parametry restrykcjami Nazwa testu wywodzi się z faktu, że statystykę testową można zapisać jako ( L( θ) ) LR = 2 ln L( θ R ) Wadą testu jest konieczność oszacowania dwóch modeli

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania Do obliczenia wartości statystyki Walda wystarczająca jest znajomość oszacowań modelu bez narzuconych ograniczeń W = h (θ) [ H(θ)I 1 (θ)h (θ) ] 1 h(θ) D χ 2 J

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania Do obliczenia wartości statystyki Walda wystarczająca jest znajomość oszacowań modelu bez narzuconych ograniczeń W = h (θ) [ H(θ)I 1 (θ)h (θ) ] 1 h(θ) D χ 2 J Macierz w nawiasach kwadratowych jako macierz wariancji jest dodatnio określona

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania Do obliczenia wartości statystyki Walda wystarczająca jest znajomość oszacowań modelu bez narzuconych ograniczeń W = h (θ) [ H(θ)I 1 (θ)h (θ) ] 1 h(θ) D χ 2 J Macierz w nawiasach kwadratowych jako macierz wariancji jest dodatnio określona Zatem statystyka W = 0, gdy ograniczenia narzucone na parametry są spełnione

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania Do obliczenia wartości statystyki Walda wystarczająca jest znajomość oszacowań modelu bez narzuconych ograniczeń W = h (θ) [ H(θ)I 1 (θ)h (θ) ] 1 h(θ) D χ 2 J Macierz w nawiasach kwadratowych jako macierz wariancji jest dodatnio określona Zatem statystyka W = 0, gdy ograniczenia narzucone na parametry są spełnione Statystyka Walda nie jest niezmiennicza ze względu na sposób zapisania hipotezy zerowej

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania Statystyka mnożników Lagrangea wymaga znajomości estymatora dla modelu z narzuconymi ograniczeniami LM = l(θ) θ I 1 (θ R ) l(θ) θ=θr θ θ=θr D χ 2 J

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania Statystyka mnożników Lagrangea wymaga znajomości estymatora dla modelu z narzuconymi ograniczeniami LM = l(θ) θ I 1 (θ R ) l(θ) θ=θr θ θ=θr D χ 2 J Dla maksimum bez ograniczeń wartość gradientu wynosi zero

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania Statystyka mnożników Lagrangea wymaga znajomości estymatora dla modelu z narzuconymi ograniczeniami LM = l(θ) θ I 1 (θ R ) l(θ) θ=θr θ θ=θr D χ 2 J Dla maksimum bez ograniczeń wartość gradientu wynosi zero Zatem wartość gradientu niesie informację o spełnieniu ograniczeń przez parametry modelu

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania W modelach szacowanych MNW nie są szacowane sumy kwadratów

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania W modelach szacowanych MNW nie są szacowane sumy kwadratów Miary dopasowania są przybliżonymi statystykami określanymi jako pseudo-r 2

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania W modelach szacowanych MNW nie są szacowane sumy kwadratów Miary dopasowania są przybliżonymi statystykami określanymi jako pseudo-r 2 Najczęściej stosowaną miarą jest R 2 Mc-Faddena R 2 McFadden = 1 l(θ) l(θ 0 )

Test Ilorazu Wiarogodności Test Walda Test Mnożników Lagrangea Miary dopasowania W modelach szacowanych MNW nie są szacowane sumy kwadratów Miary dopasowania są przybliżonymi statystykami określanymi jako pseudo-r 2 Najczęściej stosowaną miarą jest R 2 Mc-Faddena Podobnie jak adj R 2 istnieje R 2 McFadden = 1 l(θ) l(θ 0 ) R 2 McFadden = 1 l(θ) K l(θ 0 ) gdzie L 0 to logarytm funkcji wiarogodności modelu ze stałą jako jedyną zmienną objasniajacą