Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH

Podobne dokumenty
WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

Wstęp. Regresja logistyczna. Spis treści. Hipoteza. powrót

Agata Boratyńska Statystyka aktuarialna... 1

Matematyka ubezpieczeń majątkowych r.

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Statystyka i Analiza Danych

Regresja liniowa wprowadzenie

Uogolnione modele liniowe

Statystyka I. Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy)

Wprowadzenie. { 1, jeżeli ˆr(x) > 0, pozatym. Regresja liniowa Regresja logistyczne Jądrowe estymatory gęstości. Metody regresyjne

Uogólniony model liniowy

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Matematyka ubezpieczeń majątkowych r.

dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.

Wykorzystanie informacji kredytowej w procesie oceny ryzyka ubezpieczeniowego w ubezpieczeniach komunikacyjnych

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka

N ma rozkład Poissona z wartością oczekiwaną równą 100 M, M M mają ten sam rozkład dwupunktowy o prawdopodobieństwach:

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Zadanie 1. Zmienne losowe X 1, X 2 są niezależne i mają taki sam rozkład z atomami:

Stanisław Cichocki. Natalia Nehrebecka

Matematyka ubezpieczeń majątkowych r.

Matematyka ubezpieczeń majątkowych r.

Zawansowane modele wyborów dyskretnych

MODELE LINIOWE. Dr Wioleta Drobik

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

LIII Egzamin dla Aktuariuszy z 31 maja 2010 r. Część III

Zadanie 1. Ilość szkód N ma rozkład o prawdopodobieństwach spełniających zależność rekurencyjną:

Zadanie 1. O rozkładzie pewnego ryzyka X posiadamy następujące informacje: znamy oczekiwaną wartość nadwyżki ponad 20:

Własności statystyczne regresji liniowej. Wykład 4

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Metoda najmniejszych kwadratów

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

gdzie. Dla funkcja ma własności:

01. dla x 0; 1 2 wynosi:

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Quick Launch Manual:

Matematyka ubezpieczeń majątkowych r.

Mikroekonometria 14. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

Wprowadzenie do analizy korelacji i regresji

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Modele selekcji próby

Matematyka ubezpieczeń majątkowych r.

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

Matematyka ubezpieczeń majątkowych r.

WYCHODZĄC POZA PROSTĄ REGRESJĘ MODELOWANIE STATYSTYCZNE W OBSZARZE UBEZPIECZEŃ

Regresja nieparametryczna series estimator

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Ćwiczenie 5 PROGNOZOWANIE

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12

3. Modele tendencji czasowej w prognozowaniu

(LMP-Liniowy model prawdopodobieństwa)

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

Model 1: Estymacja KMNK z wykorzystaniem 4877 obserwacji Zmienna zależna: y

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Matematyka ubezpieczeń majątkowych r.

Egzamin z ekonometrii wersja IiE, MSEMAT

ANALIZA REGRESJI WIELOKROTNEJ. Zastosowanie statystyki w bioinżynierii Ćwiczenia 8

Ekonometria. Zajęcia

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Wprowadzenie do technik analitycznych Metoda najmniejszych kwadratów

Natalia Nehrebecka Stanisław Cichocki. Wykład 13

Stanisław Cichocki. Natalia Neherebecka. Zajęcia 15-17

Matematyka ubezpieczeń majątkowych r.

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Stanisław Cichocki. Natalia Nehrebecka

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Matematyka ubezpieczeń majątkowych r.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

PRZEWODNIK PO PRZEDMIOCIE

Zadanie 1. są niezależne i mają rozkład z atomami: ( ),

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

ZNACZENIE WYMIANY DANYCH MIĘDZY BIK i UFG DLA BEZPIECZEŃSTWA TRANSAKCJI UBEZPIECZENIOWO-BANKOWYCH. dr Mariusz Cholewa Prezes Zarządu BIK S.A.

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

UBEZPIECZ SIĘ, NAJLEPIEJ U MATEMATYKA

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Techniki Optymalizacji: Stochastyczny spadek wzdłuż gradientu I

z przedziału 0,1 liczb dodatnich. Rozważmy dwie zmienne losowe:... ma złożony rozkład dwumianowy o parametrach 1,q i, gdzie X, wszystkie składniki X

LIV Egzamin dla Aktuariuszy z 4 października 2010 r. Część III

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

Spis treści 3 SPIS TREŚCI

Mikroekonometria 2. Mikołaj Czajkowski Wiktor Budziński

Zastosowanie uogólnionych modeli liniowych i uogólnionych mieszanych modeli liniowych do analizy danych dotyczacych występowania zębiniaków

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY

Mikroekonometria 2. Mikołaj Czajkowski Wiktor Budziński

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Modele długości trwania

Matematyka ubezpieczeń majątkowych r.

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Metoda największej wiarogodności

Prawdopodobieństwo i statystyka r.

ANALIZA REGRESJI SPSS

Transkrypt:

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego Łukasz Kończyk WMS AGH

Plan prezentacji Model regresji liniowej Uogólniony model liniowy (GLM) Ryzyko ubezpieczeniowe Przykład zastosowania w ubezpieczeniach

Model regresji liniowej Y- wektor obserwacji zmiennej zależnej (objaśnianej) wymiaru n X- macierz zmiennych niezależnych (objaśniających) wymiaru n (k+1) - wektor nieznanych parametrów wymiaru (k+1) - wektor błędów losowych wymiaru n Dla pojedynczej obserwacji i-ty błąd losowy i-ta obserwacja Obserwacje zmiennych niezależnych Wyraz wolny Współczynniki modelu

Model regresji liniowej Założenia modelu: Elementy macierzy X są ustalonymi liczbami rzeczywistymi. Zmienne objaśniające nie są współliniowe. Liczba obserwacji jest większa od liczby parametrów modelu, czyli r(x)=k+1<n. Błędy losowe i dla 1 i n są niezależnymi zmiennymi losowymi o rozkładzie normalnym N(0, 2 ). Wniosek: y i mają rozkład normalny N( 0 + 1 x 1i + + k x ki + i, 2 )

Dlaczego uogólniamy model? 1. Zmienna objaśniana nie musi mieć rozkładu normalnego. 2. Zmienna nie musi być określona na całej prostej rzeczywistej. Może również przyjmować wartości dyskretne. Również zmienne objaśniane mogą być dyskretne. 3. Związek wartości oczekiwanej zmiennej objaśnianej i zmiennych objaśnianych nie musi być liniowy.

Uogólniony model liniowy g( ) - funkcja wiążąca, y i i-ta wartość zmiennej zależnej, 1 i n j współczynniki modelu, 0 j k, x ji zaobserwowane wartości zmiennych niezależnych dla i-tej obserwacji.

Założenia modelu GLM Funkcja wiążąca g( ) jest monotoniczna i gładka. Rozkład zmiennej y i powinien należeć do rodziny wykładniczej, tj. gęstość ma postać:

Funkcja wiążąca Jeśli funkcja wiążąca jest identycznością, to mamy model liniowy. Jeśli funkcja wiążąca ma postać to mówimy, że jest to kanoniczna funkcja wiążąca.

Przykłady modeli GLM y i ma rozkład B(1,p), funkcję wiążącą nazywamy funkcją logitową. wartość oczekiwaną, czyli p, możemy wyznaczyć jako Dla tego samego modelu możemy użyć innej funkcji wiążącej, mianowicie. Jest to model probitowy, a prawdopodobieństwo p szacujemy przez

Przykłady modeli GLM y i ma rozkład Poiss( ),, model ten nazywamy modelem log-liniowym, a parametr rozkładu estymujemy przez y i ma rozkład Exp( ),, parametr rozkładu estymujemy przez

Szczegóły techniczne ;) Współczynniki modelu GLM j otrzymujemy metodą największej wiarogodności. W modelu liniowym wykorzystuje się metodę najmniejszych kwadratów. Równania wiarogodności najczęściej mają mało przyjemną postać, stosujemy więc metody iteracyjne rozwiązywania równań nieliniowych, np. metodę scoringu Fishera

Dopasowanie modelu Do badania dopasowania modelu do danych może posłużyć kryterium Akaike AIC=-2(L-k) L- zmaksymalizowany logarytm funkcji wiarogodności k- liczba parametrów w modelu

Regresja logistyczna Stosujemy ją, gdy chcemy oszacować prawdopodobieństwo zajścia zdarzenia, czyli modelujemy prawdopodobieństwo p w w rozkładzie Bernoulliego z jedną próbą (oczywiście wartość oczekiwana rozkładu wynosi p). Funkcja wiążąca

Zastosowanie Najczęściej stosowany model GLM Biologia: szacowanie prawdopodobieństwa zachorowania na chorobę i wyszczególnienie czynników wpływających na prawdopodobieństwo. Farmakologia: prawdopodobieństwo zadziałania metody leczenia i czynniki wpływające na jej powodzenie. Bankowość: metoda scoringu kredytowego, jest to ocena wiarygodności podmiotu starającego się o kredyt. Przedstawiany w postaci punktowej.

Zastosowanie w ubezpieczeniach Narzędzie stosowane przez aktuariuszy do oceny ryzyka ubezpieczeniowego. Szacowanie prawdopodobieństwa zgonu lub przeżycia w ubezpieczeniach na życie w zależności od cech demograficznych. Model czasem wykorzystywany jest w celu wykrycia wyłudzeń ubezpieczenia (np. ubezpieczenia komunikacyjne).

Ryzyko ubezpieczeniowe Ryzykiem ubezpieczeniowym nazywamy możliwość wystąpienia określonego zdarzenia losowego, wypadku lub szkody. Ocena ryzyka ubezpieczeniowego polega na zbadaniu określonego wniosku ubezpieczeniowego (wraz z załącznikami) i ustaleniu czy nie występuje ponadprzeciętne zagrożenie. Na podstawie badania następuje zakwalifikowanie wniosku i ustalenie wielkości składek lub jego odrzucenie.

Model ryzyka łącznego Zmienna określająca liczbę szkód, które nastąpiły w wyniku zdarzenia, ma rozkład dyskretny Zmienne wyrażające wartość pojedynczej szkody, zmienne niezależne Zmienna oznaczająca łączną wartość szkód

Przykład Zbiór danych autocar z biblioteki insurancedata programu R (oryginalne źródło: de Jong P., Heller G.Z., Generelized Linear Models for Insurance Data, Cambrigde University Press). Dane zawierają 67856 polis na ubezpieczenia pojazdów. Dane pochodzą z Australii z lat 2004-05.

Opis zmiennych veh_value wartość pojazdu podana w 10 000$ exposure- ekspozycja na ryzyko ubezpieczonego (od 0 do 1) szkoda- zmienna binarna oznaczająca zaistniałą szkodę liczszk- liczba zaistniałych szkód wieksam- grupa wiekowa samochodu wiekkier- grupa wiekowa kierowcy claimcst0- wartość zaistniałych szkód veh_body- typ pojazdu gender- płeć kierowcy area- region, w którym zarejestrowany jest samochód

Koniec! Dziękuję za uwagę ;)