Własności estymatorów regresji porządkowej z karą LASSO

Podobne dokumenty
Estymatory regresji rangowej oparte na metodzie LASSO

Maszyny wektorów podpierajacych w regresji rangowej

Jądrowe klasyfikatory liniowe

Metoda momentów i kwantyli próbkowych. Wrocław, 7 listopada 2014

Zrównoleglona optymalizacja stochastyczna na dużych zbiorach danych

Zastosowanie uogólnionych modeli liniowych i uogólnionych mieszanych modeli liniowych do analizy danych dotyczacych występowania zębiniaków

Stosowana Analiza Regresji

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

Estymacja gęstości prawdopodobieństwa metodą selekcji modelu

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

Wykład 6 Estymatory efektywne. Własności asymptotyczne estym. estymatorów

5. Analiza dyskryminacyjna: FLD, LDA, QDA

Monte Carlo, bootstrap, jacknife

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Prawdopodobieństwo i statystyka r.

O zgodności procedur jednoczesnego testowania zastosowanych do problemu selekcji zmiennych w modelu liniowym

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka

2. Empiryczna wersja klasyfikatora bayesowskiego

WYKŁAD 2. Problem regresji - modele liniowe

WYKŁAD 4. Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie. autor: Maciej Zięba. Politechnika Wrocławska

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Metoda najmniejszych kwadratów

Ekonometryczne modele nieliniowe

7. Maszyny wektorów podpierajacych SVMs

METODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie

Prawdopodobieństwo i statystyka

Selekcja modelu liniowego i predykcja metodami losowych podprzestrzeni

Konferencja Statystyka Matematyczna Wisła 2013

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Metody systemowe i decyzyjne w informatyce

Ważne rozkłady i twierdzenia c.d.

Testowanie hipotez statystycznych

WYKŁAD 2 i 3. Podstawowe pojęcia związane z prawdopodobieństwem. Podstawy teoretyczne. autor: Maciej Zięba. Politechnika Wrocławska

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Estymacja parametru rozkładu Rayleigha i logistycznego w terminach k-tych wartości rekordowych

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Kryteria selekcji modelu w eksperymentalnym rozpoznawaniu sygnałów zdekomponowanych w bazach falkowych

Porównanie modeli regresji. klasycznymi modelami regresji liniowej i logistycznej

Wykład 10 Skalowanie wielowymiarowe

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

O testach wielowymiarowej normalności opartych na statystyce Shapiro-Wilka

Matematyka ubezpieczeń majątkowych r.

Metody systemowe i decyzyjne w informatyce

x x 1. Przedmiot identyfikacji System x (1) x (2) : x (s) a 1 a 2 : a s mierzone, a = zestaw współczynników konkretyzujacych F ()

Statystyka i eksploracja danych

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH

Własności porządkowe w modelu proporcjonalnych szans

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

Statystyczna analiza danych (molekularnych) estymacja bayesowska i MLE

Metody eksploracji danych 2. Metody regresji. Piotr Szwed Katedra Informatyki Stosowanej AGH 2017

Składki zaufania z zastosowaniem niesymetrycznych funkcji strat

Metoda największej wiarogodności

Algorytmy MCMC i ich zastosowania statystyczne

STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie

Opisy przedmiotów do wyboru

WYKŁAD 3. Klasyfikacja: modele probabilistyczne

Estymacja parametrów rozkładu cechy

Generowanie liczb o zadanym rozkładzie. ln(1 F (y) λ

Redukcja wariancji w metodach Monte-Carlo

Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Rozpoznawanie obrazów

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Rynek, opcje i równania SDE

Modelowanie danych hodowlanych

Metody systemowe i decyzyjne w informatyce







Uogolnione modele liniowe

Rozpoznawanie obrazów

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

Matematyka ubezpieczeń majątkowych r.

Metody Ekonometryczne

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 689 FINANSE, RYNKI FINANSOWE, UBEZPIECZENIA NR ANALIZA WŁASNOŚCI OPCJI SUPERSHARE

6. Identyfikacja wielowymiarowych systemów statycznych metodanajmniejszychkwadratów

Granica i ciągłość funkcji. 1 Granica funkcji rzeczywistej jednej zmiennej rzeczywsitej

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

Metody klasyfikacji dla nielicznej próbki wektorów o wielkim wymiarze

Estymatory nieobciążone

Zdalny dostęp do Statystycznych Baz Danych a bezpieczeństwo danych jednostkowych.

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

L.Kowalski zadania z rachunku prawdopodobieństwa-zestaw 4 ZADANIA - ZESTAW 4

Zawansowane modele wyborów dyskretnych

Podstawowe modele probabilistyczne

Uogólniona Metoda Momentów

Numeryczne metody optymalizacji Optymalizacja w kierunku. informacje dodatkowe

Wprowadzenie do uczenia maszynowego. Jakub Tomczak

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Estymacja w regresji nieparametrycznej

Agata Boratyńska Statystyka aktuarialna... 1

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Statystyka. Wykład 2. Krzysztof Topolski. Wrocław, 11 października 2012

Transkrypt:

Własności estymatorów regresji porządkowej z karą LASSO Uniwersytet Mikołaja Kopernika w Toruniu Uniwersytet Warszawski Badania sfinansowane ze środków Narodowego Centrum Nauki przyznanych w ramach finansowania stażu po uzyskaniu stopnia naukowego doktora, DEC-2014/12/S/ST1/00344.

Z = (X, Y ), Z = (X, Y ) - niezależne wektory losowe o tym samym rozkładzie P X, X X, Y, Y Y R

Z = (X, Y ), Z = (X, Y ) - niezależne wektory losowe o tym samym rozkładzie P X, X X, Y, Y Y R X, X - obserwowane wektory cech Y, Y - nieznane zmienne losowe

z jest lepszy niż z, jeśli y > y

z jest lepszy niż z, jeśli y > y Reguła rangująca f : X X R

z jest lepszy niż z, jeśli y > y Reguła rangująca f : X X R jeśli f (x, x ) > 0, to przewidujemy y > y

z jest lepszy niż z, jeśli y > y Reguła rangująca f : X X R jeśli f (x, x ) > 0, to przewidujemy y > y Minimalizacja ryzyka Q(f ) = E φ [ sign(y Y ) f (X, X ) ]

z jest lepszy niż z, jeśli y > y Reguła rangująca f : X X R jeśli f (x, x ) > 0, to przewidujemy y > y Minimalizacja ryzyka Q(f ) = E φ [ sign(y Y ) f (X, X ) ] φ : R R - funkcja straty

z jest lepszy niż z, jeśli y > y Reguła rangująca f : X X R jeśli f (x, x ) > 0, to przewidujemy y > y Minimalizacja ryzyka Q(f ) = E φ [ sign(y Y ) f (X, X ) ] φ : R R - funkcja straty f = arg min f F Q(f )

Z 1 = (X 1, Y 1 ),..., Z n = (X n, Y n ) - niezależne kopie Z

Z 1 = (X 1, Y 1 ),..., Z n = (X n, Y n ) - niezależne kopie Z Minimalizacja ryzyka empirycznego Q n (f ) = 1 n(n 1) 1 i j n φ [ sign(y i Y j ) f (X i, X j )]

Z 1 = (X 1, Y 1 ),..., Z n = (X n, Y n ) - niezależne kopie Z Minimalizacja ryzyka empirycznego Q n (f ) = 1 n(n 1) 1 i j n φ [ sign(y i Y j ) f (X i, X j )] arg min f F Q n(f ), F F

Kara LASSO ψ 1,..., ψ m : X X R - funkcje bazowe

Kara LASSO ψ 1,..., ψ m : X X R - funkcje bazowe { } m F = f θ (x, x ) = θ k ψ k (x, x ) : θ Θ R m k=1

Kara LASSO ψ 1,..., ψ m : X X R - funkcje bazowe F = { f θ (x, x ) = } m θ k ψ k (x, x ) : θ Θ R m k=1 X = R m ψ k (x, x ) = x k x k

Kara LASSO ψ 1,..., ψ m : X X R - funkcje bazowe F = { f θ (x, x ) = } m θ k ψ k (x, x ) : θ Θ R m k=1 X = R m ψ k (x, x ) = x k x k f θ (x, x ) = θ T (x x )

Kara LASSO Q n (f θ ) = 1 n(n 1) φ [sign(y i Y j ) f θ (X i, X j )] i j

Kara LASSO Q n (f θ ) = 1 n(n 1) φ [sign(y i Y j ) f θ (X i, X j )] i j fˆθ = arg min θ Q n (f θ ) + λ n m θ k k=1

Kara LASSO Q n (f θ ) = 1 n(n 1) φ [sign(y i Y j ) f θ (X i, X j )] i j fˆθ = arg min θ Q n (f θ ) + λ n m θ k k=1 Tarigan, van de Geer (2006), van de Geer (2008), Bickel, Ritov, Tsybakov (2009)

Założenia 1 funkcja straty φ jest wypukła

Założenia 1 funkcja straty φ jest wypukła 2 1 k m x,x n ψ k (x, x ) log m

Założenia 1 funkcja straty φ jest wypukła 2 1 k m x,x n ψ k (x, x ) log m 3 (F, )

Założenia 1 funkcja straty φ jest wypukła 2 1 k m x,x n ψ k (x, x ) log m 3 (F, ) B>0 fθ F f θ f 2 B [ ] Q(f θ ) Q( f )

Założenia - warunek zgodności (WZ) S {1,..., m} oraz S = {1,..., m}\s

Założenia - warunek zgodności (WZ) S {1,..., m} oraz S = {1,..., m}\s θ S : (θ S ) k = θ k I(k S), k = 1,..., m

Założenia - warunek zgodności (WZ) S {1,..., m} oraz S = {1,..., m}\s θ S : (θ S ) k = θ k I(k S), k = 1,..., m θ = θ S + θ S

Założenia - warunek zgodności (WZ) S {1,..., m} oraz S = {1,..., m}\s θ S : (θ S ) k = θ k I(k S), k = 1,..., m θ = θ S + θ S Zbiór S spełnia warunek zgodności, o ile istnieje stała A(S) > 0 taka, że θ S 2 1 f θ 2 S A(S) dla wszystkich θ R m spełniających θ S 1 3 θ S 1.

Założenia - warunek zgodności (WZ) ψ(x, x ) = [ψ 1 (x, x ),..., ψ m (x, x )] T

Założenia - warunek zgodności (WZ) ψ(x, x ) = [ψ 1 (x, x ),..., ψ m (x, x )] T Σ = E ψ(x, X )ψ T (X, X )

Założenia - warunek zgodności (WZ) ψ(x, x ) = [ψ 1 (x, x ),..., ψ m (x, x )] T Σ = E ψ(x, X )ψ T (X, X ) f θ 2 := Ef 2 θ (X, X ) = θ T Σθ

Założenia - warunek zgodności (WZ) ψ(x, x ) = [ψ 1 (x, x ),..., ψ m (x, x )] T Σ = E ψ(x, X )ψ T (X, X ) f θ 2 := Ef 2 θ (X, X ) = θ T Σθ Najmniejsza wartość własna ρ jest dodatnia

Założenia - warunek zgodności (WZ) ψ(x, x ) = [ψ 1 (x, x ),..., ψ m (x, x )] T Σ = E ψ(x, X )ψ T (X, X ) f θ 2 := Ef 2 θ (X, X ) = θ T Σθ Najmniejsza wartość własna ρ jest dodatnia θ R m θ 2 2 f θ 2 ρ

Wyrocznia S θ = {1 k m : θ k 0}

Wyrocznia S θ = {1 k m : θ k 0} Θ 1 = {θ Θ : S θ spełnia (WZ)}

Wyrocznia S θ = {1 k m : θ k 0} Θ 1 = {θ Θ : S θ spełnia (WZ)} θ = arg min θ Θ 1 { Q(f θ ) Q( f ) + λ2 n S θ A 2 (θ) }

Z prawdopodobieństwem 1 1 m 2 Q(fˆθ ) Q( f ) C 1 [ ] Q(f θ ) Q( f ) + λ2 n S θ A 2 (θ )

Z prawdopodobieństwem 1 1 m 2 Q(fˆθ ) Q( f ) C 1 [ ] Q(f θ ) Q( f ) + λ2 n S θ A 2 (θ ) λ n = C 2 log m n

Z prawdopodobieństwem 1 1 m 2 Q(fˆθ ) Q( f ) C 1 [ m n d dla d 1 ] Q(f θ ) Q( f ) + λ2 n S θ A 2 (θ ) λ n = C 2 log m n

Z prawdopodobieństwem 1 1 m 2 [ ] ˆθ θ 1 C 1 Q(f θ ) Q( f ) + λ2 n S θ A 2 (θ )

Z prawdopodobieństwem 1 1 m 2 [ ] ˆθ θ 1 C 1 Q(f θ ) Q( f ) + λ2 n S θ A 2 (θ ) ˆθ θ 1 log m n

Bickel, P. J., Ritov, Y., Tsybakov, A., B. (2009). Simultaneous analysis of Lasso and Dantzig selector. Annals of Statistics 37, 1705 1732. Bühlmann, P., van de Geer, S. (2011). Statistics for high-dimensional data: methods, theory and applications. Springer. Tarigan, B., van de Geer, S. (2006). Classifiers of support vector machine type with l 1 penalty. Bernoulli 12, 1045 1076. Tibshirani, R. (1996). Regression shrinkage and selection via the lasso. Journal of the Royal Statistical Society: Series B 58, 267 288. van de Geer, S. (2008). High-dimensional generalized linear models and the Lasso. Annals of Statistics 36, 614 645.