Cenzurowanie danych w bankowości

Podobne dokumenty
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

ZASTOSOWANIE ROZKŁADÓW UCIĘTYCH I CENZUROWANYCH W KWANTYFIKACJI RYZYKA OPERACYJNEGO. BADANIA SYMULACYJNE

Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16

Spis treści 3 SPIS TREŚCI

Ekonometria. Zajęcia

Ekonometria. Model nieliniowe i funkcja produkcji. Jakub Mućk. Katedra Ekonomii Ilościowej. Modele nieliniowe Funkcja produkcji

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

Metody oceny ryzyka operacyjnego

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.

Ekonometria. Model nieliniowe i funkcja produkcji. Jakub Mućk. Katedra Ekonomii Ilościowej

Matematyka ubezpieczeń majątkowych r.

N ma rozkład Poissona z wartością oczekiwaną równą 100 M, M M mają ten sam rozkład dwupunktowy o prawdopodobieństwach:

Testowanie hipotez statystycznych.

Zadanie 1. Ilość szkód N ma rozkład o prawdopodobieństwach spełniających zależność rekurencyjną:

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

STATYSTYKA MATEMATYCZNA

Parametr Λ w populacji ubezpieczonych ma rozkład dany na półosi dodatniej gęstością: 3 f

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Statystyka Matematyczna Anna Janicka

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Matematyka ubezpieczeń majątkowych r.

Excel: niektóre rozkłady ciągłe (1)

Modelowanie rynków finansowych

Ryzyko operacyjne metoda zaawansowana. Wyzwania

Matematyka ubezpieczeń majątkowych r.

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

W3 - Niezawodność elementu nienaprawialnego

METODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie

Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Statystyka w przykładach

Matematyka ubezpieczeń majątkowych r.

Matematyka ubezpieczeń majątkowych r.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Statystyka aktuarialna i teoria ryzyka, rozkłady szkód

Weryfikacja hipotez statystycznych

Agata Boratyńska Statystyka aktuarialna... 1

Własności statystyczne regresji liniowej. Wykład 4

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Statystyka matematyczna dla leśników

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

STATYSTYKA MATEMATYCZNA

Statystyka matematyczna i ekonometria

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

STATYSTYKA MATEMATYCZNA

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Prawdopodobieństwo i statystyka r.

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Modele długości trwania

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Uogolnione modele liniowe

Wydział Matematyki. Testy zgodności. Wykład 03

Na podstawie dokonanych obserwacji:

Kolokwium ze statystyki matematycznej

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

Rekomendacja M dotycząca zarządzania ryzykiem operacyjnym w bankach

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Literatura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.

Matematyka ubezpieczeń majątkowych r.

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

Statystyka Matematyczna Anna Janicka

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

WYKŁAD 8 ANALIZA REGRESJI

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

O ŚREDNIEJ STATYSTYCZNEJ

Robert M.Korona. Dr Robert M. Korona 1

Testowanie hipotez statystycznych.

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Biostatystyka, # 3 /Weterynaria I/

EGZAMIN MAGISTERSKI, Biomatematyka

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Spis treści Wstęp 1. Ryzyko a pojęcie cykliczności, procykliczności i antycykliczności zjawisk sfery realnej i systemu finansowego gospodarki

przedmiot podstawowy obowiązkowy polski drugi

W4 Eksperyment niezawodnościowy

1 Modele ADL - interpretacja współczynników

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

Badania eksperymentalne

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Prawdopodobieństwo i statystyka r.

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Polityka Informacyjna dotycząca adekwatności kapitałowej w Banku Spółdzielczym w Miliczu

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska

Analiza przeżycia. Czym zajmuje się analiza przeżycia? Jest to analiza czasu trwania, zaprojektowana do analizy tzw.

Transkrypt:

Cenzurowanie danych w bankowości Ryzyko operacyjne Tomasz Szkutnik Uniwersytet Ekonomiczny w Katowicach Katedra Statystyki, Ekonometrii i Matematyki 2017

Cenzurowanie danych w bankowości Plan wystąpienia Cenzurowanie danych- powszechne obszary zastosowań. Wpływ cenzurowania na wartości niektórych charakterystyk rozkładu. Cenzurowanie strat operacyjnych w banku w kontekście rozwiązań regulacyjnych. Wnioski instytucji finansowych z kilku lat rozwijania metod AMA. Metoda LDA w przypadku cenzurowania informacji. Przykład symulacyjny. Podsumowanie.

Cenzurowanie danych Kilka przykładów cenzurowania Obszary zastosowań, w których powszechnie wykorzystuje się cenzurowanie danych, to: analiza przeżycia, teoria niezawodności statystyka medyczna, badania biologiczne i chemiczne badania środowiskowe badania społeczne przemysł Podstawowe obszary w których cenzurowanie danych może wpływać na wyniki analiz i interpretację wyników: statystyka opisowa testowanie hipotez korelacja i regresja

Cenzurowanie danych Typy cenzurowania danych Cenzurowanie informacji występuje w przypadku, gdy zachodzące zdarzenia nie mogą być w pełnie zarejestrowane. Rejestrowany jest tylko fakt zajścia zdarzeń, bez ich ilościowego charakteru. Typy cenzurowania danych cenzurowanie lewostronne, prawostronne, przedziałowe. pojedyncze lub wielokrotne. Jeden lub różne poziomy cenzurowania cenzurowanie typu I lub typu II. Liczba obserwacji jest zmienną losową lub jest znana z góry. np. Lewostronne jednokrotne cenzurowanie Typu I. Dane są w pełni rejestrowanie powyżej określonego progu. Poniżej progu raportowania/ detekcji wystąpienie jest zmienną losową.

Cenzurowanie danych Przykłady Przykład 1. Cenzurowanie lewostronne Czas do wystąpienia pewnego zdarzenia dla obserwowanej jednostki jest lewostronnie cenzurowany jeśli zdarzenie to wystąpiło przed objęciem tej jednostki badaniem. badania ankietowe dotyczące kontaktu z używkami. testy psychologiczne badające zdolności do wykonania określonych zadań (czynności).

Cenzurowanie danych Przykłady Przykład 2. Cenzurowanie Prawostronne Badania, w których czas zajścia zdarzenia obserwowany jest tylko, gdy wystąpi przed określonym momentem cenzurowania. Moment ten może być różny dla różnych jednostek. Ze względu na czas trwania lub koszty badanie jest przerywane. Wszystkie cenzurowane obserwacje mają taki sam czas trwania (przeżycia). Badania niezawodności testujące wytrzymałość, długość pracy. Badania toksykologiczne.

Cenzurowanie danych Badania oparte na danych cenzurowanych muszą uwzględniać odpowiednią postać funkcji wiarygodności. Postać funkcji wiarygodności L = f (x i ) S(C r ) (1 S(C l )) [S(L i ) S(R i )] (1) i D i R i L i I Dla obserwacji prawostronnie cenzurowanych informacja ta wyrażona jest przez funkcję przeżycia. Analogicznie obserwacje lewostronnie cenzurowane związana jest z wartością dystrybuanty.

Ocena wpływu cenzurowania informacji Przykład. Rozkład logarytmiczno-normalny Trzy warianty procesu generującego dane: Pełny. x i R + Ucięty. x i > c. Cenzurowany. Wariant ucięty + wartości poniżej progu c są zliczane. Próg c cenzurowania i ucinania obserwacji przyjęty jest jako wartość kwantyla z wyjściowego rozkładu. Takie warunki dla procesu cenzurowania reprezentują hipotetyczną skalę utraty informacji.

Ocena wpływu cenzurowania informacji Warianty danych i estymacji Przyjęto cztery warianty estymacji: Bazowy. Pełny zakres danych Cenzurowany. Dane cenzurowane- uwzględniony proces cenzurowania Ucięty 1. Dane ucięte- dołączone wartości ucięte zamienione na wartość progu ucinania Ucięty 2. Dane ucięte- wartości niepomniejszone o próg ucinania Ucięty 3. Dane ucięte- wartości pomniejszone o próg ucinania

Ocena wpływu cenzurowania informacji Oddziaływanie na parametry rozkładu Oddziaływanie na parametr µ µ 12.0 12.5 13.0 13.5 14.0 14.5 15.0 BASE.1 CENS.1 TRUN_v1.1 TRUN_v2.1 TRUN_v3.1 0 0.1 0.2 0.3 0.4 0.5

Ocena wpływu cenzurowania informacji Oddziaływanie na parametr σ 2.5 3.0 3.5 4.0 σ 0 0.1 0.2 0.3 0.4 0.5

Ocena wpływu cenzurowania informacji Oddziaływanie na wartość VaR 0.95 Oddziaływanie na wartość Value-at-Risk VaR 0.95 VaR 0.95 5.0e+07 1.5e+08 2.5e+08 0 0.1 0.2 0.3 0.4 0.5

Ocena wpływu cenzurowania informacji Oddziaływanie na wartość VaR 0.99 Oddziaływanie na wartość Value-at-Risk VaR 0.99 VaR 0.99 5.0e+08 1.0e+09 1.5e+09 2.0e+09 0 0.1 0.2 0.3 0.4 0.5

Wykorzystanie informacji cenzurowanej w bankowości Cenzurowanie informacji w ryzyku operacyjnym Historia rozwiązań Bazylejskim dla ryzyka operacyjnego. Metoda LDA- doświadczenia praktyki bankowej. Cenzurowanie strat operacyjnych. Przykłady symulacyjne.

Ryzyko operacyjne w bankowości Historia wdrażania rozwiązań Bazylejskich Rok 2003 Bazylea II. Trzy metody pomiaru: 1. Podstawowa (BIA) 2. Standardowa (TSA) 3. Zaawansowana (AMA)- punkt docelowy dla instytucji finansowych. Rok 2014 październik. Projekt nowej metody standardowej Komitet Bazylejski proponuje nowe rozwiązanie w zamian za BIA oraz TSA. Rok 2016 marzec. Zrewidowane podejście z 2014 roku. Metoda SMA jako jedyna forma wyliczania kapitału regulacyjnego.

Ryzyko operacyjne w bankowości Historia wdrażania rozwiązań Bazylejskich Rok 2003 Bazylea II. Trzy metody pomiaru: 1. Podstawowa (BIA) 2. Standardowa (TSA) 3. Zaawansowana (AMA)- punkt docelowy dla instytucji finansowych. Rok 2014 październik. Projekt nowej metody standardowej Komitet Bazylejski proponuje nowe rozwiązanie w zamian za BIA oraz TSA. Rok 2016 marzec. Zrewidowane podejście z 2014 roku. Metoda SMA jako jedyna forma wyliczania kapitału regulacyjnego.

Ryzyko operacyjne w bankowości Historia wdrażania rozwiązań Bazylejskich Rok 2003 Bazylea II. Trzy metody pomiaru: 1. Podstawowa (BIA) 2. Standardowa (TSA) 3. Zaawansowana (AMA)- punkt docelowy dla instytucji finansowych. Rok 2014 październik. Projekt nowej metody standardowej Komitet Bazylejski proponuje nowe rozwiązanie w zamian za BIA oraz TSA. Rok 2016 marzec. Zrewidowane podejście z 2014 roku. Metoda SMA jako jedyna forma wyliczania kapitału regulacyjnego.

Ryzyko operacyjne w bankowości Metoda AMA Od podejścia AMA oczekiwało się: poprawy zarządzania ryzykiem operacyjnym niższego poziomu kapitału regulacyjnego Komitet Bazylejski dla metod AMA formułuje wskazówki na wysokim szczeblu ogólność.

Ryzyko operacyjne w bankowości Metoda rozkładu strat LDA Metoda LDA Standardowo wielkości VaR(0.999) wyznaczana jest ze zagregowanego rozkładu, na którego składają się dwa procesy cząstkowe: proces częstości występowania strat proces dotkliwości strat Ograniczenia wskazywane przez instytucje finansowe: LDA ma retrospektywny charakter Ekstremalna strata lub straty mogą trwale zmienić wielkość kapitału regulacyjnego Konieczność skalowania i korekty strat po zaniknięciu przyczyn i wdrożeniu działań naprawczych.

Ryzyko operacyjne w bankowości Kilka lat doświadczeń w rozwoju metod zaawansowanych Doświadczenia instytucji finansowych i Komitetu Bazylejskiego z procesu wdrażania metod AMA: ograniczenia w łączeniu i wykorzystaniu wewnętrznych i zewnętrznych źródeł informacji, konieczność poniesienia dużych nakładów początkowych, tworzenie baz danych, tworzenie polityki w zakresie ryzyka operacyjnego, wyższy poziom skomplikowania niż pierwotnie zakładano, niedostosowanie rozwiązań AMA do prawdziwego profilu ryzyka instytucji, brak możliwości porównania wyników pomiędzy bankami.

Ryzyko operacyjne w bankowości Sceptycyzm w odniesieniu do wyników metod AMA Nadzór bankowy hamuje zbytni optymizm negując wiele z ulg kapitałowych wypracowanych przez AMA Instytucje finansowe oczekują powiązania wyników modelu z potrzebami zarządzania. Instytucje częściowo powstrzymują się od bezpośredniego wykorzystania modeli.

Dane o stratach banku Wpływ ucinania informacji Proces ucinania informacji w przypadku RO: Nie istnieje jeden ogólnie przyjęty próg ucinania informacji Może być różny w odniesieniu do instytucji, procesu jakiego dotyczy, wykorzystanej bazy danych Może wpływać na szacunki ryzyka Może uniemożliwić porównywalność modeli RO.

Ocena wpływu cenzurowania informacji Założenia badania symulacyjnego VaR(0.999) dla zagregowanego rozkładu strat Proces bazowy: hipotetyczny okres 4 lat: Proces częstości. Rozkład Poissona z λ = 50 Proces dotkliwości. Rozkład Weibulla z parametrem kształtu τ 0.5, 0.75,,..., 3 i parametrem skali θ = 4, gdzie: Rozkład gruboogonowy dla τ < 1

Ocena wpływu cenzurowania informacji Warianty danych i estymacji Trzy warianty procesu generującego dane: Pełny. Straty operacyjne x i R + Ucięty. Straty operacyjne x i > c. Cenzurowany. Wariant ucięty + straty poniżej progu c są zliczane. Przyjęto cztery warianty estymacji: Bazowy. Pełny zakres danych Naiwny. Dane ucięte- nieuwzględniony proces ucinania Ucięty. Dane ucięte- uwzględniony proces ucinania Cenzurowany. Dane cenzurowane- uwzględniony proces cenzurowania

Ocena wpływu cenzurowania informacji Wyniki badania Wpływ utraty informacji na stabilność parametrów. Wariant Naiwny w porównaniu do wariantu bazowego 80 250 60 Deviations % 40 20 200 Deviations % 150 100 50 0 0 0.5 0.4 0.3 quantile 0.2 0.1 0.0 2.0 1.5 1.0 shape parameter 0.5 0.5 0.4 0.3 quantile 0.2 0.1 0.0 2.0 1.5 1.0 shape parameter 0.5

Ocena wpływu cenzurowania informacji Wyniki badania Wpływ utraty informacji na stabilność parametrów. Wariant Ucięty w porównaniu do wariantu bazowego 30 10 Deviations % 5 Deviations % 20 10 0.5 0.4 0.3 quantile 0.2 0.1 0.0 2.0 1.5 1.0 shape parameter 0.5 0.5 0.4 0.3 quantile 0.2 0.1 0.0 2.0 1.5 1.0 shape parameter 0.5

Ocena wpływu cenzurowania informacji Wyniki badania Wpływ utraty informacji na stabilność parametrów. Wariant Cenzurowany w porównaniu do wariantu bazowego 3 4 Deviations % 2 1 3 Deviations % 2 1 0 0.5 0.4 0.3 quantile 0.2 0.1 0.0 2.0 1.5 1.0 shape parameter 0.5 0 0.5 0.4 0.3 quantile 0.2 0.1 0.0 2.0 1.5 1.0 shape parameter 0.5

Ocena wpływu cenzurowania informacji Wyniki badania Różnice w wielkościach miary VaR. Wariant Naiwny do Wariantu Bazowego 20 15 Deviations % 10 5 0 0.5 0.4 0.3 quantile 0.2 0.1 0.0 2.0 1.5 1.0 shape parameter 0.5

Wykorzystanie informacji cenzurowanej w bankowości Funkcja gęstości i dystrybuanta rozkładu Burra: f (x) = α βx α 1( 1 + x α) β 1 ; F (x) = ( 1 + x α ) β (2) Funkcji wiarygodności w przypadku lewostronnie cenzurowanym: L (α, β) = ( 1 + C α ) rβ l (αβ) n r n i=r+1 ( x α 1 (i) 1 + x α (i) ) β 1 (3) lub odpowiednio logarytm z funkcji wiarygodności: l (α, β) = rβ ln ( 1 + C α ) l + (n r) lnαβ+ (α + 1) n ln ( ) n ( ) x (i) (β + 1) ln 1 + x α (i) (4) i=r+1 i=r+1

Wykorzystanie informacji cenzurowanej w bankowości Ucinanie obserwacji Cenzurowanie obserwacji Iloraz VaR B /VaR U. (q/α) Iloraz VaR B /VaR C. (q/α) Iloraz VaR B /VaR U. (q/β) Iloraz VaR B /VaR C. (q/β) (α/β) Iloraz VaR B /VaR U. (α/β) Iloraz VaR B /VaR C.

Wnioski Rozważane warianty danych i estymacji Wpływ przyjętego scenariusza na własności rozkładu dotkliwości strat: Wariant Naiwny nie pozwala na ocenę właściwego stopnia narażenia na ryzyko operacyjne. Wariant Ucięty zapewnia znaczną poprawę względem rozwiązania naiwnego Wariant Cenzurowany zapewnia najmniejszą skalę utraty informacji co przekłada się bezpośrednio na bardziej zbliżone szacunki parametrów względem rozwiązania bazowego niż poprzednie scenariusze.

Wnioski Cenzurowanie danych Uwzględnienie cenzurowania danych: Daje możliwość łączenia danych pochodzących z różnych źródeł i o różny progach raportowania. Upraszcza sposób rejestracji danych poniżej c na potrzeby kwantyfikacji i zarządzania ryzykiem operacyjnym. Daje możliwość kontroli częstości występowania strat pełnej dziedziny danych. Cenzurowanie może zapewnić lepszą porównywalność danych Brak jest ryzyka zmiany progu raportowania w celu uzyskania satysfakcjonującego wyniku Cenzurowanie może stanowić wyzwanie przy testowaniu dopasowania rozkładów.