Reject inference - analiza wniosków odrzuconych 18 listopada 14
Agenda Pytania badawcze Dlaczego analizujemy wnioski odrzucone? 1 Dlaczego analizujemy wnioski odrzucone? 2 3
Dlaczego analizujemy wnioski odrzucone? Trzy słowa o obciażeniu próby Model skoringowy uczony jest na próbie, która nie odpowiada całej populacji.
Dlaczego analizujemy wnioski odrzucone? Trzy słowa o obciażeniu próby Model skoringowy uczony jest na próbie, która nie odpowiada całej populacji. Konsekwencje: Wyniki modelu nie moga zostać uogólnione na cała populację Z każda iteracja modelu zmniejsza się baza klientów, do których ma on zastosowanie Konieczność analizy wniosków odrzuconych
Techniki reject inference Ważenie danych Cel: odzwierciedlenie populacji apikujacych przez zważenie próby zaakceptowanych klientów 1. Model A/R 2. Grupowanie i wyznaczenie wag [ A R ] = Score Liczba Liczba Waga Zaakceptowanych Odrzuconych Przedziału (w) -149 A 1 R 1 A 1 +R 1 A 1 15-179 A 2 R 2 A 2 +R 2 A 2 1-199 A 3 R 3 A 3 +R 3 A 3 + A 4 R 4 A 4 +R 4 A 4 3. Model na przeważonych danych = [ A w ]
Techniki reject inference Ekstrapolacja - parceling Cel: dołaczenie wniosków odrzuconych do próby, na której budowany jest model 1. Ocena aplikacji odrzuconych na bazie populacji zaakceptowanych 2. Klasyfikacja spłata/default = [ ] A [ ] = R (Zaakceptowani) Score Procent Odrzuceni Odrzuceni Złych Źli -149 3% 15 45 15-179 25% 3 75 1-199 1% 1 18 + 4% 16 = 3. Model na powiększonej próbie [ A R ]
Techniki reject inference Ekstrapolacja - fuzzy augmentation Cel: dołaczenie wniosków odrzuconych do próby, na której budowany jest model 1. Ocena aplikacji odrzuconych na bazie populacji zaakceptowanych [ ] [ ] R p A = [ ] R 1 p = 2. Modelowanie na rozszerzonych i przeważonych danych A 1 R p R 1 p
Opis badania Metodologia Symulacja obciażenia próby Porównanie modeli wykorzystujace reject inference z modelami zbudowanymi na pełnej oraz na obciażonej próbie Kryteria porównawcze - default rate w grupach pd, prognozowana strata finansowa
Opis badania Metodologia Symulacja obciażenia próby Porównanie modeli wykorzystujace reject inference z modelami zbudowanymi na pełnej oraz na obciażonej próbie Kryteria porównawcze - default rate w grupach pd, prognozowana strata finansowa Zbiór danych Dane losowe - por. Przanowski (13) Parametry Liczba profili klienta: 1, 2 Poziom akceptacji: %, 5%, % Parametry poszczególnych technik
Default w grupach pd Jeden profil klienta Poziom akceptacji - % Poziom akceptacji - 5% Poziom akceptacji - % Benchmark Augmentation Brak RI Fuzzy Parceling
Default w grupach pd Jeden profil klienta Poziom akceptacji - % Poziom akceptacji - 5% Poziom akceptacji - % Benchmark Augmentation Brak RI Fuzzy Parceling Obciażenie próby niezauważalne Parceling najbardziej konserwatywna technika Pozostałe techniki RI nie doszacowuja ryzyka
Default w grupach pd Dwa profile klienta Poziom akceptacji - % Poziom akceptacji - 5% Poziom akceptacji - % Obciażenie próby istotne szczególnie przy niskim progu akceptacji Techniki RI błędnie szacuja ryzyko Benchmark Augmentation Brak RI Fuzzy Parceling
Prognozowana strata finansowa Prognozowana strata (mln) Jeden profil klienta Dwa profile klienta ar ar5 ar Poziom akceptacji Prognozowana strata (mln) ar ar5 ar Poziom akceptacji Brak RI Augmentation Fuzzy Parceling Obciażenie próby widoczne dopiero przy dwóch profilach klientów RI przydatny przy niskim poziomie akceptacji Parceling najbardziej konserwatywna technika
Wnioski Dlaczego analizujemy wnioski odrzucone? Obciażenie próby i sens analizy wniosków odrzuconych zależy od konkretnego zbioru danych Metody RI nie zawsze sa lepsze od metody naiwnej Zastosowanie konkretnej techniki RI może istotnie wpłynać na ocenę ryzyka i zyskowność portfela kredytowego