Estymacja w regresji nieparametrycznej

Podobne dokumenty
Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Metoda najmniejszych kwadratów

Wprowadzenie. { 1, jeżeli ˆr(x) > 0, pozatym. Regresja liniowa Regresja logistyczne Jądrowe estymatory gęstości. Metody regresyjne

Regresja nieparametryczna series estimator

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

1 Pochodne wyższych rzędów

Prawdopodobieństwo i statystyka

Układy równań i równania wyższych rzędów

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Estymacja gęstości prawdopodobieństwa metodą selekcji modelu

Wykład 14 i 15. Równania różniczkowe. Równanie o zmiennych rozdzielonych. Definicja 1. Równaniem różniczkowym zwyczajnym rzędu n nazywamy równanie

Równanie przewodnictwa cieplnego (II)

Systemy Wspomagania Decyzji

Uogólniona Metoda Momentów

Wykład 3 Równania rózniczkowe cd

jest ciągiem elementów z przestrzeni B(R, R)

Regresja i Korelacja

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy

2. Definicja pochodnej w R n

VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa.

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Estymacja parametrów w modelu normalnym

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska

Kryptografia - zastosowanie krzywych eliptycznych

Metoda największej wiarygodności

METODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie

granicą ciągu funkcyjnego (f n ) n N W symbolicznym zapicie fakt, że f jest granicą ciągu funkcyjnego (f n ) n N możemy wyrazić następująco: ε>0 N N

Matematyka I. Bezpieczeństwo jądrowe i ochrona radiologiczna Semestr zimowy 2018/2019 Wykład 9

Równania różniczkowe liniowe rzędu pierwszego

Zaawansowane metody numeryczne

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Metoda momentów i kwantyli próbkowych. Wrocław, 7 listopada 2014

IX. Rachunek różniczkowy funkcji wielu zmiennych. 1. Funkcja dwóch i trzech zmiennych - pojęcia podstawowe. - funkcja dwóch zmiennych,

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

WYKŁAD 8 ANALIZA REGRESJI

STATYSTYKA

Notatki z Analizy Matematycznej 2. Jacek M. Jędrzejewski

1.1 Klasyczny Model Regresji Liniowej

Metoda najmniejszych kwadratów

Dystrybucje, wiadomości wstępne (I)

Wykład 12 i 13 Macierz w postaci kanonicznej Jordana , 0 A 2

Własności statystyczne regresji liniowej. Wykład 4

Statystyka i Analiza Danych

Spis treści 3 SPIS TREŚCI

Metoda największej wiarogodności

Tydzień nr 9-10 (16 maja - 29 maja), Równania różniczkowe, wartości własne, funkcja wykładnicza od operatora - Matematyka II 2010/2011L

Szeregi funkcyjne. Szeregi potęgowe i trygonometryczne. Katedra Matematyki Wydział Informatyki Politechnika Białostocka

Stosowana Analiza Regresji

2. Kombinacja liniowa rozwiązań zeruje się w pewnym punkcie wtedy i tylko wtedy, gdy zeruje się w każdym punkcie.

II. FUNKCJE WIELU ZMIENNYCH

1 Wartości własne oraz wektory własne macierzy

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.

ANALIZA MATEMATYCZNA Z ELEMENTAMI STATYSTYKI MATEMATYCZNEJ

Wykład Matematyka A, I rok, egzamin ustny w sem. letnim r. ak. 2002/2003. Każdy zdający losuje jedno pytanie teoretyczne i jedno praktyczne.

1 Relacje i odwzorowania

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Równania różniczkowe liniowe wyższych rzędów o stałych współcz

2. ZASTOSOWANIA POCHODNYCH. (a) f(x) = ln 3 x ln x, (b) f(x) = e2x x 2 2.

Metody numeryczne. Sformułowanie zagadnienia interpolacji

STATYSTYKA MATEMATYCZNA

27. RÓWNANIA RÓŻNICZKOWE CZĄSTKOWE

Stanisław Cichocki. Natalia Nehrebecka

Funkcje wielu zmiennych

Ćwiczenie 5 PROGNOZOWANIE

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Rachunek różniczkowy i całkowy w przestrzeniach R n

RÓWNANIA RÓŻNICZKOWE WYKŁAD 2

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

Matematyka 2. Równania różniczkowe zwyczajne rzędu drugiego

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

5. Równania różniczkowe zwyczajne pierwszego rzędu

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Wykład 7: Szeregi liczbowe i potęgowe. S 1 = a 1 S 2 = a 1 + a 2 S 3 = a 1 + a 2 + a 3. a k

VIII. Zastosowanie rachunku różniczkowego do badania funkcji. 1. Twierdzenia o wartości średniej. Monotoniczność funkcji.

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

RÓWNANIA RÓŻNICZKOWE ZWYCZAJNE. Marta Zelmańska

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Układy równań liniowych

VI. Równania różniczkowe liniowe wyższych rzędów

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Ważną rolę odgrywają tzw. funkcje harmoniczne. Przyjmujemy następującą definicję. u = 0, (6.1) jest operatorem Laplace a. (x,y)

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

Testowanie hipotez statystycznych.

EGZAMIN MAGISTERSKI, Biomatematyka

166 Wstęp do statystyki matematycznej

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

5 Równania różniczkowe zwyczajne rzędu drugiego

Metody numeryczne I Równania nieliniowe

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

3. Funkcje wielu zmiennych

Wykład z równań różnicowych

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Transkrypt:

Estymacja w regresji nieparametrycznej Jakub Kolecki Politechnika Gdańska 28 listopada 2011

1 Wstęp Co to jest regresja? Przykład regresji 2 Regresja nieparametryczna Założenia modelu Estymacja i jej charakterystyki 3 Estymacja liniowa Podstawowe informacje Estymator jądrowy Nadaraya-Watsona Wygładzający estymator jądrowy 4 Przykłady i program R

Metoda statystyczna pozwalająca na badanie związku pomiędzy wielkościami danych i przewidywanie na tej podstawie nieznanych wartości jednych wielkości na podstawie znanych wartości innych. Wikipedia

Metoda pozwalająca na badanie zależności funkcyjnej pomiędzy zmiennymi. Równanie Y = f(x ) + ε opisuje wpływ zmiennej objaśniającej X na zmienną objaśnianą Y. ε odpowiada błędowi losowemu i ma rozkład N (0, σ 2 ). Funkcja regresji jest warunkową wartością oczekiwaną Y pod warunkiem X.

Modele regresji Parametryczne Metoda: Estymowanie parametrów znanej funkcji. np. Szukanie współczynników wielomianu. Nieparametryczne Metoda: Estymowanie funkcji regresji f jako krzywej, czyli przedstawienie jej w postaci wykresu.

Chcemy, by zbiór n par obserwacji {(x 1, y 1 ),..., (x n, y n )} spełniał zależność y i = f(x i ) + ε i, gdzie ε i są błędami losowymi o rozkładzie N (0, σ 2 ). Założenia dotyczące f: supp(f) = (0, 1) f należy do klasy gładkości Höldera (f Θ(β, L, L 1 )) istnieje pochodna f rzędu β 1 f (β 1) (x 2 ) f (β 1) (x 1 ) L x 2 x 1, x 1, x 2 [0, 1] max 0 x 1 f(x) L 1

Niech ˆf n oznacza nieparametryczny estymator funkcji regresji f. Ponieważ ˆf n zależy od naszych danych ostatecznie przyjmie on postać: ˆf n (x) = ˆf n (x; (x 1, y 1 ),..., (x n, y n )), 0 x 1. Przyjmujemy dwie miary bliskości estymatora ˆf n i funkcji f: kwadratowa funkcja straty wyliczana w ustalnoym punkcie x 0 : λ = ( ˆf n (x 0 ) f(x 0 )) 2 funkcja straty w normie supremum: w( ˆf n f) = ˆf n f = sup ˆf n (x) f(x) 0 x 1 Funkcja ryzyka związana z modelem przyjmuje nastepującą postać: ] R n (f, ˆf n ) = E f [w( ˆf n f)

Definicja Estymator ˆf n nazywamy estymatorem liniowym funkcji f jeżeli dla dowolnego x [0, 1] istnieją takie wagi v n,i (x) (mogą być zależne również od danych z eksperymentu), i = 1,..., n, że ˆf n = n v n,i (x)y i. i=1 Wagi v n,i (x) opisują wpływ obserwacji y i na model w punkcie x.

Definicja Estymator liniowy nazywamy globalnym jeżeli zależy od wszystkich danych. Definicja Estymator liniowy nazywamy lokalnym jeżeli zależy (wagi v n,i róznią się od zera) tylko od danych, które znajdują się w sąsiedztwie x, to znaczy x i x h n, gdzie h n nazywamy rozpiętością okna. O h n zakłada się, że h n > 0, h n 0 oraz nh n, przy n

Estymator jądrowy Nadaraya-Watsona Rozważmy gładką albo kawałkami gładką funkcję K = K(u), u R. Załóżmy ponadto, że supp(k) = [ 1, 1] oraz K całkuje się do jedynki. Funkcję tej postaci nazywamy jądrem. Oto przykłady stosowanych jąder: jednostajne, K(U) = 1 2 1 [ 1,1](u) trójkątne, K(U) = (1 u )1 [ 1,1] (u) podwójnie kwadratowe, K(U) = 15 16 (1 u2 ) 2 1 [ 1,1] (u) Epanechnikowa, K(U) = 3 4 (1 u2 )1 [ 1,1] (u)

Estymator jądrowy Nadaraya-Watsona jest lokalnym estyamtoram liniowym. Dla określonej wartości parametru okna definiujemy wagi v n,i (x) wykorzystywane przy konstrukcji estyamtora liniowego jako ( xi x v n,i (x) = K h n ) / n ( ) xj x K po podstawieniu do wzoru na estymator liniowy otrzymujemy ˆf n = n ( xi x y i K i=1 h n ) / j=1 h n n ( ) xj x K j=1 h n

Przyklad Weźmy jądro jednostajne. Niech N(x, h n ) oznacza liczbę punktów z próby mieszczących się h n -sąsedztwie x. Wtedy wagi przyjmują postać: 1 v n,i (x) = N(x, h n ) 1 (x h n,x+h n)(x i ), natomiast estymator będzie wyglądał następująco: ˆf n = 1 N(x, h n ) n y i 1 (x hn,x+hn)(x i ). i=1

Wygładzający estymator jądrowy Twierdzenie Dla dowolnej funkcji f Θ(β, L, L 1 ) zachodzi rozwinięcie w szereg Taylora: f(x i ) = β 1 m=0 f (m) (x) (x i x) m + ρ(x i, x), 0 x i, x 1, m! gdzie f (m) oznacza m-tą pochodną funkcji f. Ponadto, dla x i oraz x spełniających x i x h n, wyraz ρ(x i, x) spełnia nierówność: ρ(x i, x) Lhβ n (β 1)!.

Definicja Wygładzający estymator jądrowy ˆf n stopnia β 1 dany jest wzorem ˆf n = 1 nh n n ( xi x y i K i=1 h n ), 0 < x < 1, gdzie wygładzające jądro K = k(u), u < 1, jest ograniczone, kawałkami gładkie i spełnia poniższe warunki normalizacji i ortogonalności 1 1 K(u)du = 1 oraz 1 1 u m K(u)du = 0, dla m = 1,..., β 1.