PRAKTYCZNY SKORING - NIE TYLKO KREDYTOWY
|
|
- Bernard Ksawery Głowacki
- 10 lat temu
- Przeglądów:
Transkrypt
1 PRAKTYCZNY SKORING - NIE TYLKO KREDYTOWY Piotr Wójtowicz, Grzegorz Migut StatSoft Polska Jakie są różnice pomiędzy osobami prawidłowo regulującymi swoje zobowiązania a niechętnie spłacającymi swoje długi, czy też pomiędzy klientami lojalnymi a skłonnymi odejść do konkurencji? Znajomość odpowiedzi na te i podobne pytania pozwala kształtować skuteczniejszą strategię działania instytucji finansowych oraz lepiej wykorzystać dostępne zasoby i potencjał rynku. Odpowiedzi na te pytania najlepiej jest szukać wewnątrz własnej organizacji, ukryte są one w olbrzymich ilościach informacji zgromadzonych w systemach informatycznych. Najlepszym sposobem ich wydobycia jest wykorzystanie metod statystycznych oraz data mining. Jednym z najpopularniejszych rodzajów modeli statystycznych wykorzystywanych w bankowości są modele skoringowe. Parametry modeli skoringowych po oszacowaniu na historycznym zbiorze obserwacji możemy wykorzystywać do klasyfikowania nowych i obecnych klientów. Modele te wykorzystywane są jako narzędzia wspierające proces kredytowy, oceniają wiarygodność kredytową klientów, bądź skłonność do nadużyć. Warto zauważyć, że modele skoringowe wykorzystywane są nie tylko w obszarze zarządzania ryzykiem, ale np. również w procesie utrzymania klienta, gdzie wskazują osoby najbardziej zagrożone odejściem. Kolejny obszar to wsparcie procesu sprzedaży - za ich pomocą można optymalizować ofertę sprzedaży dla konkretnej grupy klientów. Model skoringowy potrafi wskazać osoby, które z największym prawdopodobieństwem odpowiedzą na ofertę poszczególnych produktów. Krótko mówiąc, skoring sprawdza się, kiedy chcemy podzielić naszych klientów na dwie kategorie: spłaci kredyt/nie spłaci, odpowie na ofertę/nie odpowie, przyniesie zysk/nie będzie dochodowy, zagrożony odejściem/pozostanie klientem. Ogólnie mówiąc, na podstawie cech klienta, np. demograficznych, behawioralnych itp., budujemy model skoringowy, który przewiduje prawdopodobieństwo przynależności do pożądanej przez nas kategorii. Zazwyczaj, zwłaszcza w skoringu kredytowym, model taki należy zamienić na kartę skoringową, w której dla każdej z cech analizowana osoba otrzymuje punkty, które są sumowane w jedną syntetyczną ocenę. Do niedawna najczęściej stosowana metoda typowo ekspercka oznaczała z reguły zakup kart od zewnętrznego dostawcy. Od pewnego czasu, ze względu na coraz lepszą dostępność dobrej jakości danych w poszczególnych instytucjach finansowych, jakość uzyskiwanych przewidywań oraz koszty, stosowana jest przede wszystkim metoda statystyczno-ekspercka punktacja uzyskiwana jest w wyniku działania 3
2 metod statystycznych pod nadzorem specjalistów branżowych z wykorzystaniem własnych danych. Modele skoringowe można budować przy użyciu szeregu mniej lub bardziej zaawansowanych metod statystycznych i data mining. Do najpopularniejszych należy zaliczyć regresję logistyczną, drzewa klasyfikacyjne oraz różne odmiany drzew drzewa wzmacniane (boosting trees) czy losowy las (random forest). Wykorzystywać można również sieci neuronowe, metodę wektorów nośnych (suport vector machines) czy k- najbliższych sąsiadów i szereg innych. Dla wielu osób już same nazwy tych procedur analitycznych brzmią dziwnie i egzotycznie, jak zatem zastosować je w praktyce? Na szczęście są odpowiednie narzędzia, które pozwolą nawet mniej doświadczonym analitykom szybko i efektywnie budować, oceniać i wdrażać modele i karty skoringowe. Prześledźmy najważniejsze etapy budowy karty skoringowej z wykorzystaniem popularnego w polskich instytucjach finansowych Zestawu Skoringowego STATISTICA. Oczywiście w pierwszej kolejności musimy się zatroszczyć o dane historyczne potrzebne do budowy modelu. Z reguły dane o wcześniejszych kredytach, czy o zachowaniach klientów są dostępne w różnych bazach danych, bądź przechowywane w postaci plików Excela. Bez problemu można je więc wczytać do naszej aplikacji. Należy tylko zadbać, aby docelowy zbiór danych miał postać tabeli, w której w wierszach znajdą się poszczególni klienci (w analizie danych często wiersze nazywa się przypadkami), a w kolumnach poszczególne cechy naszych klientów (nazywane zmiennymi), np. wiek, przeznaczenie kredytu, produkty z jakich korzysta, liczba kontaktów z call center i inne w zależności od celu analizy. To jeszcze nie koniec przygotowania danych, kolejnym krokiem jest odpowiednie przekodowanie danych (oczywiście mamy pod ręką wygodne narzędzia do tego), aby modelowana zmienna miała dwie wartości (kupił/nie kupił, spłacił/nie spłacił itp.). Oczywiście należy podjąć odpowiednie decyzje biznesowe co oznaczają odpowiednie kategorie, np. po jakim czasie należy uznać, że klient nie kupił produktu, albo nie spłacił kredytu. Po przekodowaniu danych i ich wyczyszczeniu (w STATISTICA dostępnych jest szereg narzędzi do tego celu) możemy przeprowadzić wstępną selekcję cech klienta, jakie uwzględnimy na karcie skoringowej za pomocą modułu Wybór predyktorów. Budujemy w nim ranking zmiennych i wybieramy jedynie te zmienne, które są w sposób istotny powiązane z modelowanym zjawiskiem. Jeśli budowany model wykorzystuje cechy opisujące zachowanie klientów (skoring behawioralny), bardzo często mamy do czynienia z grupami podobnych do siebie zmiennych. Ponieważ nadmiarowość informacji jest często równie niebezpieczna, jak jej brak, to w takiej sytuacji wybieramy reprezentantów grup skorelowanych zmiennych ilościowych za pomocą analizy głównych składowych. Na szczęście nie musimy wiedzieć, co to są te składowe główne STATISTICA wykona analizę automatycznie. 4
3 Przykładowy ranking predyktorów Kolejnym etapem przygotowania danych, szczególnie jeśli w wyniku analizy chcemy otrzymać klasyczną kartę skoringową, jest dyskretyzacja zmiennych, która pozwala podzielić wybrane zmienne na przedziały. Przedziały te będą odpowiadały później poszczególnym kategoriom na karcie skoringowej. Wstępny podział zostanie zrobiony automatycznie (np. algorytmem CHAID), ale w tym momencie wymagana jest także praca analityka. W STATISTICA podczas podziału zmiennych na przedziały można jednocześnie uwzględnić wiedzę ekspercką oraz statystyczną, a także uwarunkowania biznesowe, a zatem poprawiamy automat, dopasowując granice przedziałów karty skoringowej do bieżących potrzeb. Moduł dyskretyzacji zmiennych pozwala również na obsługę braków danych, które traktujemy, jako osobną kategorię uwzględniając możliwość istotnego wpływu braku danych na badane zjawisko. Pamiętajmy więc brak danych to też informacja. W tym momencie mamy za sobą najbardziej pracochłonny etap, czyli przygotowanie danych, i możemy przejść do kolejnego etapu budowy modeli analitycznych. Najpopularniejszą metodą budowy modeli jest zdecydowanie regresja logistyczna. Popularność ta wynika zarówno z przyczyn historycznych, jak i praktycznych - postać modelu jest czytelna i łatwa do interpretacji. Zwykle model regresji po oszacowaniu parametrów przekształca się do tablicy skoringowej, w której poszczególnym poziomom (zdefiniowanym na etapie dyskretyzacji przedziałom czy atrybutom) każdej z analizowanych cech klienta przypisywana jest odpowiednia liczba punktów, określająca wpływ danej kategorii na szanse wystąpienia danego zjawiska. 5
4 Regresja logistyczna zaczyna to brzmieć trochę groźnie. Ale nie ma obawy. Zestaw Skoringowy STATISTICA ma ustawione wszystkie parametry na odpowiednie wartości domyślne i każdy jest w stanie wykonać regresję logistyczną. Oczywiście zaawansowany analityk może sam modyfikować poszczególne opcje budowy modelu, zatem zachęcamy do pogłębiania swojej wiedzy w tym obszarze i podjęcia własnych prób. Zbudowany model można następnie przekształcić do karty (tablicy) skoringowej, którą można zachować, np. w postaci dokumentu tekstowego lub arkusza Excel. Tak przygotowaną kartę skoringową można uruchomić wewnątrz systemu albo zintegrować lub przenieść do systemu obsługi wniosków. Przykładowo karta skoringowa może wyglądać w następujący sposób (fragment): Fragment przykładowej karty skoringowej Wiek Punkty Do Od 35 do Pow Okres bycia klientem Punkty Do 1 roku 10 Od 1 roku do 3 lat 12 Powyżej 3 lat 15 Liczba produktów Punkty Powyżej 4 10 Doświadczeni analitycy mogą ocenić jakość modelu regresji logistycznej na podstawie różnych dostępnych wskaźników statystycznych. Jednak dla większości osób wygodniejsze i bardziej czytelne będą miary dostępne w module Ocena modeli, który umożliwia ocenę i porównanie zbudowanych modeli skoringowych. W skoringu wykorzystuje się szereg miar pozwalających ocenić jakość modelu. Należą do nich: wskaźnik IV (Information Value), KS współczynnik Kołmogorowa-Smirnowa, wskaźnik Gini, dywergencja, wskaźnik Hosmera-Lemeshowa, AUC - pole powierzchni pod krzywą ROC oraz Lift. Nie będziemy tu opisywali szczegółowo poszczególnych wskaźników - dla każdego tworzony jest szczegółowy raport z prezentacją graficzną, więc łatwo można ocenić uzyskane modele/karty skoringowe. 6
5 Przykładowa ocena modelu To jeszcze nie koniec pracy. Mając zbudowany model skoringowy, możemy przystąpić do oceny poszczególnych klientów pod kątem prawdopodobieństwa przynależności do pożądanej przez nas grupy. Dla każdego klienta sumujemy punkty uzyskane za przynależność do poszczególnych kategorii, ale gdzie się kończą dobrzy klienci, a zaczynają źli? Musimy wskazać graniczną wartość, tzw. punkt odcięcia. I znowu doświadczenie i wiedzę analityka można wesprzeć metodami statystycznymi, a to wszystko oczywiście z uwzględnieniem strategii banku. Można zastosować wybór punktu odcięcia na podstawie analizy ROC dla zadanych kosztów błędnych klasyfikacji lub wskazanej frakcji złych kredytów. 7
6 Przykładowy raport zależności od punktów odcięcia Po ustaleniu odpowiedniego punktu odcięcia w końcu możemy zacząć stosować uzyskany model. Należy jednak mieć świadomość, że nawet najlepszy model zdezaktualizuje się z czasem. Dlatego należy regularnie korzystać z raportów oceniających stabilność populacji i cech. Z czasem, gdy klienci się zmienią, należy przebudować model raport stabilności pozwoli uchwycić odpowiedni moment. Na potrzeby skoringu kredytowego opisaną powyżej ścieżkę budowy modeli można jeszcze uzupełnić o dostępną w STATISTICA analizę wniosków odrzuconych, pozwalającą na analizę wniosków odrzuconych przez bank i uwzględnienie ich przy budowie tablicy skoringowej. W tym celu należy uzupełnić brakującą informację o typie kredytu: dobry/zły z wykorzystaniem dostępnych metod probabilistycznych. Podsumowując, warto zwrócić uwagę, że taki proces budowy modeli skoringowych można przeprowadzić w dowolnej instytucji finansowej, zarówno w dużym banku (np. PKO BP), jak i w znacznie mniejszych instytucjach (np. SKOK) przykłady na Co więcej, jest to metoda uniwersalna, łatwa do wdrożenia i relatywnie niedroga. Do najważniejszych zalet karty skoringowej należą: czytelna i zrozumiała dla każdego postać modelu, sprawdzony i uznany standard, obiektywna, porównywalna ocena, szybkość oceny. Zachęcamy do korzystania z tego efektywnego narzędzia, jakim jest karta skoringowa, nie tylko do zarządzania ryzykiem, ale także w obszarze CRM analitycznego i wszędzie tam, gdzie należy rozdzielić klientów na dwie grupy w zależności od ich oczekiwanego zachowania. 8
PROSTY PRZEPIS NA SKORING - STATISTICA ZESTAW SKORINGOWY
PROSTY PRZEPIS NA SKORING - STATISTICA ZESTAW SKORINGOWY Piotr Wójtowicz, StatSoft Polska Sp. z o.o. Modele skoringowe są obecnie jednym z najpopularniejszych rodzajów modeli statystycznych wykorzystywanych
Scoring kredytowy w pigułce
Analiza danych Data mining Sterowanie jakością Analityka przez Internet Scoring kredytowy w pigułce Mariola Kapla Biuro Informacji Kredytowej S.A. StatSoft Polska Sp. z o.o. ul. Kraszewskiego 36 30-110
StatSoft profesjonalny partner w zakresie analizy danych
Analiza danych Data mining Sterowanie jakością Analityka przez Internet StatSoft profesjonalny partner w zakresie analizy danych StatSoft Polska Sp. z o.o. StatSoft Polska Sp. z o.o. ul. Kraszewskiego
SKORING JAKO NARZĘDZIE WSPIERAJĄCE SPÓŁDZIELCZE KASY OSZCZĘDNOŚCIOWO-KREDYTOWE W SPEŁNIENIU NOWYCH WYMAGAŃ NADZORCZYCH
SKORING JAKO NARZĘDZIE WSPIERAJĄCE SPÓŁDZIELCZE KASY OSZCZĘDNOŚCIOWO-KREDYTOWE W SPEŁNIENIU NOWYCH WYMAGAŃ NADZORCZYCH Katarzyna Cioch, Towarzystwo Zarządzające SKOK Sp. z o.o. SKA Spółdzielcze kasy oszczędnościowo
BUDOWA MODELU SCORINGOWEGO DO E-POŻYCZKI Z WYKORZYSTANIEM NARZĘDZI STATISTICA
BUDOWA MODELU SCORINGOWEGO DO E-POŻYCZKI Z WYKORZYSTANIEM NARZĘDZI STATISTICA Kamila Karnowska i Katarzyna Cioch, SKOK im. Franciszka Stefczyka Wykorzystanie metod scoringowych do oceny punktowej klientów
Wykorzystanie i monitorowanie scoringu
Analiza danych Data mining Sterowanie jakością Analityka przez Internet Wykorzystanie i monitorowanie scoringu Tomasz Sudakowski Biuro Informacji Kredytowej S.A. StatSoft Polska Sp. z o.o. ul. Kraszewskiego
STATISTICA DATA MINER I STATISTICA ENTERPRISE SPOSÓB NA SZYBKĄ BUDOWĘ I WDRAŻANIE MODELI
STATISTICA DATA MINER I STATISTICA ENTERPRISE SPOSÓB NA SZYBKĄ BUDOWĘ I WDRAŻANIE MODELI Grzegorz Migut, StatSoft Polska Sp. z o.o. Modelowanie statystyczne staje się obecnie nieodzownym elementem wsparcia
WYKORZYSTANIE SKORINGU DO PRZEWIDYWANIA WYŁUDZEŃ KREDYTÓW W INVEST-BANKU
WYKORZYSTANIE SKORINGU DO PRZEWIDYWANIA WYŁUDZEŃ KREDYTÓW W INVEST-BANKU Bartosz Wójcicki Naczelnik Wydziału Analiz i Prewencji Przestępstw, Invest-Bank S.A. Grzegorz Migut StatSoft Polska Sp. z o.o. Problem
WYKORZYSTANIE MODELI SKORINGOWYCH I REGUŁ DO OPTYMALIZACJI PROCESÓW BIZNESOWYCH
WYKORZYSTANIE MODELI SKORINGOWYCH I REGUŁ DO OPTYMALIZACJI PROCESÓW BIZNESOWYCH Grzegorz Migut, StatSoft Polska Sp. z o.o. Modele skoringowe na trwałe wpisują się w kulturę organizacyjną coraz większej
Metody scoringowe w regresji logistycznej
Metody scoringowe w regresji logistycznej Andrzej Surma Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego 19 listopada 2009 AS (MIMUW) Metody scoringowe w regresji logistycznej 19
Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU
Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów
WYKORZYSTANIE SKORINGU MARKETINGOWEGO DO OPTYMALIZACJI KAMPANII SPRZEDAŻOWYCH
WYKORZYSTANIE SKORINGU MARKETINGOWEGO DO OPTYMALIZACJI KAMPANII SPRZEDAŻOWYCH Grzegorz Migut, StatSoft Polska Sp. z o.o. Znajomość wzorców zachowania klientów oraz czynników, jakie na nie wpływają, jest
Wykład 2: Arkusz danych w programie STATISTICA
Wykład 2: Arkusz danych w programie STATISTICA Nazwy przypadków Numer i nazwa zmiennej Elementy arkusza danych Cechy statystyczne Zmienne (kolumny) Jednostki statystyczne Przypadki (wiersze) Tworzenie
STATISTICA DECISIONING PLATFORM, CZYLI JAK PODEJMOWAĆ DECYZJE W EPOCE BIG DATA
STATISTICA DECISIONING PLATFORM, CZYLI JAK PODEJMOWAĆ DECYZJE W EPOCE BIG DATA Mirosław Popieluch, StatSoft Polska Sp. z o.o. Gromadzenie coraz większych ilości danych w każdej dziedzinie życia i gospodarki
ALGORYTM RANDOM FOREST
SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM
Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów
Eksploracja danych Piotr Lipiński Informacje ogólne Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów UWAGA: prezentacja to nie
Regresja linearyzowalna
1 z 5 2007-05-09 23:22 Medycyna Praktyczna - portal dla lekarzy Regresja linearyzowalna mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie Data utworzenia:
Wykład 4: Statystyki opisowe (część 1)
Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można
TWORZENIE I STOSOWANIE MODELU DATA MINING ZA POMOCĄ PRZEPISÓW STATISTICA DATA MINER NA PRZYKŁADZIE WYKRYWANIA NADUŻYĆ
TWORZENIE I STOSOWANIE MODELU DATA MINING ZA POMOCĄ PRZEPISÓW STATISTICA DATA MINER NA PRZYKŁADZIE WYKRYWANIA NADUŻYĆ Tomasz Demski, StatSoft Polska Sp. z o.o. Narzędzia zgłębiania danych (data mining)
Piotr Wójtowicz StatSoft Polska Sp. z o.o.
ROZWIĄZANIA STATISTICA DLA SKORINGU Piotr Wójtowicz StatSoft Polska Sp. z o.o. Skuteczność działania systemu skoringowego przede wszystkim zależy od dostępności, zakresu i jakości gromadzonych danych.
Odzyskać pożyczone. Przyjrzyjmy się praktycznym aspektom modelowania ryzyka kredytowego. Grzegorz Migut StatSoft Polska sp. z o.o., Dział Konsultingu
Autorzy Jadwiga Żarna Can-Pack SA, Dział Zarządzania Ryzykiem Grzegorz Migut StatSoft Polska sp. z o.o., Dział Konsultingu Ilustracja Maciej Grzesiak 53 Odzyskać pożyczone Przyjrzyjmy się praktycznym aspektom
MS Excel cz.1 funkcje zaawansowane
MS Excel cz.1 funkcje zaawansowane Spis zagadnień: Funkcje daty i czasu, dzięki którym możemy manipulować danymi typu data i czas i np. wstawić do arkusza aktualną datę. Funkcje warunkowe, które pozwalają
I. OGÓLNE INFORMACJE PODSTAWOWE O PRZEDMIOCIE. Nie dotyczy. podstawowy i kierunkowy
1.1.1 Statystyka opisowa I. OGÓLNE INFORMACJE PODSTAWOWE O PRZEDMIOCIE STATYSTYKA OPISOWA Nazwa jednostki organizacyjnej prowadzącej kierunek: Kod przedmiotu: P6 Wydział Zamiejscowy w Ostrowie Wielkopolskim
DLACZEGO GORSZA METODA JEST CZASEM LEPSZA, CZYLI REGRESJA LOGISTYCZNA W WYKRYWANIU WYŁUDZEŃ ODSZKODOWAŃ
DLACZEGO GORSZA METODA JEST CZASEM LEPSZA, CZYLI REGRESJA LOGISTYCZNA W WYKRYWANIU WYŁUDZEŃ ODSZKODOWAŃ Barbara Leśniarek-Woźniak, TUiR WARTA S.A. Wyłudzenia odszkodowań w sektorze ubezpieczeniowym są
z wyszczególnieniem usług automatyzacji procesów mgr inż. Adam Smółkowski mgr inż. Marcin Wójciuk Aspartus (Grupa ProService FINTECO)
Przewidywane kierunki outsourcingu w ubezpieczeniach z wyszczególnieniem usług automatyzacji procesów mgr inż. Adam Smółkowski mgr inż. Marcin Wójciuk Aspartus (Grupa ProService FINTECO) Outsourcing definicja
PRZYKŁAD WYKORZYSTANIA MODELI SKORINGOWYCH W MEDYCYNIE
PRZYKŁAD WYKORZYSTANIA MODELI SKORINGOWYCH W MEDYCYNIE Grzegorz Migut, StatSoft Polska Sp. z o.o. Jednym z szerzej wykorzystywanych typów modeli statystycznych są modele klasyfikacyjne, gdzie modelowana
Szkolenie Analiza dyskryminacyjna
Szkolenie Analiza dyskryminacyjna program i cennik Łukasz Deryło Analizy statystyczne, szkolenia www.statystyka.c0.pl Szkolenie Analiza dyskryminacyjna Co to jest analiza dyskryminacyjna? Inną nazwą analizy
JAK NIE OFEROWAĆ GRZEBIENI ŁYSYM, CZYLI MODELE PREDYKCYJNE W OPTYMALIZACJI KAMPANII SPRZEDAŻOWYCH
JAK NIE OFEROWAĆ GRZEBIENI ŁYSYM, CZYLI MODELE PREDYKCYJNE W OPTYMALIZACJI KAMPANII SPRZEDAŻOWYCH Grzegorz Migut, StatSoft Polska Sp. z o.o. W ostatnich latach bardzo dużą popularność zdobyły sobie strategie
ALGORYTMY SZTUCZNEJ INTELIGENCJI
ALGORYTMY SZTUCZNEJ INTELIGENCJI Sieci neuronowe 06.12.2014 Krzysztof Salamon 1 Wstęp Sprawozdanie to dotyczy ćwiczeń z zakresu sieci neuronowych realizowanym na przedmiocie: Algorytmy Sztucznej Inteligencji.
FINALYSE Wykrywanie wyłudzeń w zautomatyzowanych systemach decyzyjnych. Kongres Antyfraudowy. Amsterdam I Brussels I Luxembourg I Warsaw
FINALYSE Wykrywanie wyłudzeń w zautomatyzowanych systemach decyzyjnych Kongres Antyfraudowy Amsterdam I Brussels I Luxembourg I Warsaw 10-2017 AGENDA Wprowadzenie Wyzwania Best Practise Korzyści Confidential
MODELE SKORINGOWE W BIZNESIE I NAUCE
MODELE SKORINGOWE W BIZNESIE I NAUCE Grzegorz Migut, StatSoft Polska Sp. z o.o. Jednym z szerzej wykorzystywanych typów modeli statystycznych są modele klasyfikacyjne, gdzie modelowana zmienna zależna
SKORING KREDYTOWY A MODELE DATA MINING
SKORING KREDYTOWY A MODELE DATA MINING Janusz Wątroba StatSoft Polska Sp. z o.o. Przedmiotem rozważań w niniejszym artykule jest problematyka oceny ryzyka kredytowego oraz wybrane zagadnienia związane
Aproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA
PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA Krzysztof Suwada, StatSoft Polska Sp. z o.o. Wstęp Wiele różnych analiz dotyczy danych opisujących wielkości charakterystyczne bądź silnie
Sposoby prezentacji problemów w statystyce
S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki
HURTOWNIE DANYCH I BUSINESS INTELLIGENCE
BAZY DANYCH HURTOWNIE DANYCH I BUSINESS INTELLIGENCE Akademia Górniczo-Hutnicza w Krakowie Adrian Horzyk horzyk@agh.edu.pl Google: Horzyk HURTOWNIE DANYCH Hurtownia danych (Data Warehouse) to najczęściej
Business Intelligence
Business Intelligence Paweł Mielczarek Microsoft Certified Trainer (MCT) MCP,MCSA, MCTS, MCTS SQL 2005, MCTS SQL 2008, MCTS DYNAMICS, MBSS, MBSP, MCITP DYNAMICS. Geneza Prowadzenie firmy wymaga podejmowania
Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji
Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji Michał Witczak Data Mining 20 maja 2012 r. 1. Wstęp Dostarczone zostały nam 4 pliki, z których dwa stanowiły zbiory uczące
PRZEWIDYWANIE WYŁUDZEŃ W SZKODACH KOMUNIKACYJNYCH ZA POMOCĄ MODELI PREDYKCYJNYCH W TUIR WARTA
PRZEWIDYWANIE WYŁUDZEŃ W SZKODACH KOMUNIKACYJNYCH ZA POMOCĄ MODELI PREDYKCYJNYCH W TUIR WARTA Barbara Leśniarek, TUiR WARTA S.A. Ubezpieczenia komunikacyjne są strategicznym filarem biznesu ubezpieczeniowego.
Dopasowywanie modelu do danych
Tematyka wykładu dopasowanie modelu trendu do danych; wybrane rodzaje modeli trendu i ich właściwości; dopasowanie modeli do danych za pomocą narzędzi wykresów liniowych (wykresów rozrzutu) programu STATISTICA;
OPIS PRZEDMIOTU ZAMÓWIENIA. Część nr 8 OPROGRAMOWANIE DO ANALIZ MARKETINGOWYCH (pom. nr 1.21)
Zamówienie publiczne współfinansowane przez Unię Europejską ze środków Europejskiego Funduszu Rozwoju Regionalnego w ramach Regionalnego Programu Operacyjnego Województwa Mazowieckiego 2007-2013 w związku
Priorytetyzacja przypadków testowych za pomocą macierzy
Priorytetyzacja przypadków testowych za pomocą macierzy W niniejszym artykule przedstawiony został problem przyporządkowania priorytetów do przypadków testowych przed rozpoczęciem testów oprogramowania.
PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE
UNIWERSYTET WARMIŃSKO-MAZURSKI W OLSZTYNIE PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE http://matman.uwm.edu.pl/psi e-mail: psi@matman.uwm.edu.pl ul. Słoneczna 54 10-561
w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą
SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.
SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny
Zarządzanie firmą Celem specjalności jest
Zarządzanie firmą Celem specjalności jest przygotowanie jej absolwentów do pracy na kierowniczych stanowiskach średniego i wyższego szczebla we wszystkich rodzajach przedsiębiorstw. Słuchacz specjalności
Agnieszka Nowak Brzezińska
Agnieszka Nowak Brzezińska jeden z algorytmów regresji nieparametrycznej używanych w statystyce do prognozowania wartości pewnej zmiennej losowej. Może również byd używany do klasyfikacji. - Założenia
DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:
DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DATAMINING 1 S t r o n a WSTĘP Czyli jak zastąpić wróżenie z fusów i przysłowiowego nosa, statystyką i modelami ekonometrycznymi. Niniejszy dokument,
Wykład z dnia 8 lub 15 października 2014 roku
Wykład z dnia 8 lub 15 października 2014 roku Istota i przedmiot statystyki oraz demografii. Prezentacja danych statystycznych Znaczenia słowa statystyka Znaczenie I - nazwa zbioru danych liczbowych prezentujących
( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:
ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0
Nazwa przedmiotu: Kierunek: Matematyka - Statystyka matematyczna Mathematical statistics Inżynieria materiałowa Materials Engineering Rodzaj przedmiotu: Poziom studiów: forma studiów: obowiązkowy studia
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
BANK DANYCH LOKALNYCH
BANK DANYCH LOKALNYCH Podstawowe informacje dotyczące Banku Danych Lokalnych Jest największym w Polsce uporządkowanym zbiorem informacji o sytuacji społecznogospodarczej, demograficznej, oraz stanie środowiska,
Część 3 - Konfiguracja
Spis treści Część 3 - Konfiguracja... 3 Konfiguracja kont użytkowników... 4 Konfiguracja pól dodatkowych... 5 Konfiguracja kont email... 6 Konfiguracja szablonów dokumentów... 8 Konfiguracja czynności
Widzenie komputerowe (computer vision)
Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja
Statystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki
Dwie szkoły oceny 360 stopni. Sprawdź różnicę pomiędzy klasycznym a nowoczesnym podejściem
Sprawdź różnicę pomiędzy klasycznym a nowoczesnym podejściem Czy stosowanie tradycyjnego podejścia do metody 360 stopni jest jedynym rozwiązaniem? Poznaj dwa podejścia do przeprowadzania procesu oceny
SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU)
SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU) 1. Opis problemu - ocena końcowa projektu Projekt jako nowe, nietypowe przedsięwzięcie wymaga właściwego zarządzania. Podjęcie się realizacji
SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006
SAS wybrane elementy DATA MINING Część III Seweryn Kowalski 2006 Algorytmy eksploracji danych Algorytm eksploracji danych jest dobrze zdefiniowaną procedurą, która na wejściu otrzymuje dane, a na wyjściu
Systemy uczące się Lab 4
Systemy uczące się Lab 4 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 26 X 2018 Projekt zaliczeniowy Podstawą zaliczenia ćwiczeń jest indywidualne wykonanie projektu uwzględniającego
Adonis w Banku Spółdzielczym w Trzebnicy
Adonis w Banku Spółdzielczym w Trzebnicy J O A N N A M O R O Z PAW E Ł K O N I E C Z N Y AGENDA I. Charakterystyka Banku II. Wdrożenie systemu ADONIS III.Proces zarządzania ryzykiem operacyjnym w BS Trzebnica
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Rola analityki danych w transformacji cyfrowej firmy
Rola analityki danych w transformacji cyfrowej firmy Piotr Czarnas Querona CEO Analityka biznesowa (ang. Business Intelligence) Proces przekształcania danych w informacje, a informacji w wiedzę, która
Model referencyjny doboru narzędzi Open Source dla zarządzania wymaganiami
Politechnika Gdańska Wydział Zarządzania i Ekonomii Katedra Zastosowań Informatyki w Zarządzaniu Zakład Zarządzania Technologiami Informatycznymi Model referencyjny Open Source dla dr hab. inż. Cezary
2
1 2 3 4 5 Dużo pisze się i słyszy o projektach wdrożeń systemów zarządzania wiedzą, które nie przyniosły oczekiwanych rezultatów, bo mało kto korzystał z tych systemów. Technologia nie jest bowiem lekarstwem
Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych
Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych Tomasz Demski StatSoft Polska www.statsoft.pl Analiza danych Zaawansowana analityka, data
Monitoring procesów z wykorzystaniem systemu ADONIS
Monitoring procesów z wykorzystaniem systemu ADONIS BOC Information Technologies Consulting Sp. z o.o. e-mail: boc@boc-pl.com Tel.: (+48 22) 628 00 15, 696 69 26 Fax: (+48 22) 621 66 88 BOC Management
Sterowanie wielkością zamówienia w Excelu - cz. 3
Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji
STUDIA PODYPLOMOWE. Analiza i Eksploracja Danych Rynkowych i Marketingowych. Podstawa prawna
STUDIA PODYPLOMOWE Analiza i Eksploracja Danych Rynkowych i Marketingowych Rodzaj studiów: doskonalące Liczba godzin: 250 Liczba semestrów: dwa semestry Kierownik studiów: dr Paweł Kaczmarczyk Koszt studiów
Proces i narzędzia analizy potencjału wybranych obszarów rynku farmaceutycznego
Proces i narzędzia analizy potencjału wybranych obszarów rynku farmaceutycznego Przyglądając się rynkowi farmaceutycznemu w Polsce możemy zauważyć, że jest to jedna z lepiej zwymiarowanych i opisanych
Trendy BI z perspektywy. marketingu internetowego
Trendy BI z perspektywy marketingu internetowego BI CECHUJE ORGANIZACJE DOJRZAŁE ANALITYCZNIE 2 ALE JAKA JEST TA DOJRZAŁOŚĆ ANALITYCZNA ORGANIZACJI? 3 Jaka jest dojrzałość analityczna organizacji? Zarządzanie
Zamówienia algorytmiczne
Zamówienia algorytmiczne Strona 1 z 13 Spis treści 1. Działanie zamówień algorytmicznych... 3 2. Konfiguracja... 3 2.2 Włączenie zamówień algorytmicznych poprzez wybór typu zamówienia... 3 2.3 Włączenie
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
www.ioz.pwr.wroc.pl/pracownicy/zabawa AFWK 2012
www.ioz.pwr.wroc.pl/pracownicy/zabawa AFWK 2012 AFWK 2012: zasady Prezentacja - poprawa zestawu (czyli przygotowanie konkurencyjnego wariantu) pod względem zysku netto i sprzedaży (wyrażonej w złotych)
UONET+ moduł Dziennik
UONET+ moduł Dziennik Jak założyć dziennik oddziału i wprowadzić do niego podstawowe dane? Aby w systemie UONET+ możliwe było dokumentowanie lekcji, wychowawcy oddziałów muszą w module Dziennik założyć
KREATOR REGRESJI LOGISTYCZNEJ
KREATOR REGRESJI LOGISTYCZNEJ Grzegorz Migut, StatSoft Polska Sp. z o.o. W niniejszym opracowaniu zaprezentowany zostanie przykład budowy modelu regresji logistycznej za pomocą Kreatora Regresji Logistycznej.
Wprowadzenie do analizy dyskryminacyjnej
Wprowadzenie do analizy dyskryminacyjnej Analiza dyskryminacyjna to zespół metod statystycznych używanych w celu znalezienia funkcji dyskryminacyjnej, która możliwie najlepiej charakteryzuje bądź rozdziela
Transformacja wiedzy w budowie i eksploatacji maszyn
Uniwersytet Technologiczno Przyrodniczy im. Jana i Jędrzeja Śniadeckich w Bydgoszczy Wydział Mechaniczny Transformacja wiedzy w budowie i eksploatacji maszyn Bogdan ŻÓŁTOWSKI W pracy przedstawiono proces
Opis efektów kształcenia dla modułu zajęć
Nazwa modułu: Eksploracja danych Rok akademicki: 2030/2031 Kod: MIS-2-105-MT-s Punkty ECTS: 5 Wydział: Inżynierii Metali i Informatyki Przemysłowej Kierunek: Informatyka Stosowana Specjalność: Modelowanie
NUK w Banku Spółdzielczym (19) System IT w zarządzaniu ryzykiem kredytowym
1 NUK w Banku Spółdzielczym (19) System IT w zarządzaniu ryzykiem kredytowym Przyszedł czas, aby po nowemu spojrzeć na zarządzanie ryzykiem w banku spółdzielczym, zwłaszcza przed wyborem oferty systemu
STUDIA PODYPLOMOWE. Analiza i Eksploracja Danych Rynkowych i Marketingowych. Podstawa prawna
STUDIA PODYPLOMOWE Analiza i Eksploracja Danych Rynkowych i Marketingowych Rodzaj studiów: doskonalące Liczba godzin: 250 Liczba semestrów: dwa semestry Kierownik studiów: dr Paweł Kaczmarczyk Koszt studiów
Optymalizacja ciągła
Optymalizacja ciągła 5. Metoda stochastycznego spadku wzdłuż gradientu Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 04.04.2019 1 / 20 Wprowadzenie Minimalizacja różniczkowalnej
WPROWADZANIE STRATEGII NA PRZYKŁADZIE WSKOK
WPROWADZANIE STRATEGII ZARZĄDZANIA RYZYKIEM NA PRZYKŁADZIE WSKOK 1 AGENDA 1. AFS Grupa 2. Geneza i ogólny zarys projektu 3. Przedstawienie procesu w rozbiciu na etapy 4. Scoring jako narzędzie wspierające
Jak przekształcać zmienne jakościowe?
Data Preparation Jak przekształcać zmienne jakościowe? Marta Płonka Predictive Solutions W ostatnim artykule zobaczyliśmy, jak sprawdzić, czy między wybranymi przez nas predyktorami a zmienną przewidywaną
ASM 603 + ASM 604 + ASM 605: Finansowanie i wycena nieruchomości jako inwestycji cz. 1-3
ASM 603 + ASM 604 + ASM 605: Finansowanie i wycena nieruchomości jako inwestycji cz. 1-3 Szczegółowy program kursu ASM 603: Finansowanie i wycena nieruchomości jako inwestycji cz. 1 1. Zagadnienia ekonomiczne
Rachunek prawdopodobieństwa WZ-ST1-AG--16/17Z-RACH. Liczba godzin stacjonarne: Wykłady: 15 Ćwiczenia: 30. niestacjonarne: Wykłady: 9 Ćwiczenia: 18
Karta przedmiotu Wydział: Wydział Zarządzania Kierunek: Analityka gospodarcza I. Informacje podstawowe Nazwa przedmiotu Rachunek prawdopodobieństwa Nazwa przedmiotu w j. ang. Język prowadzenia przedmiotu
Tworzenie szablonów użytkownika
Poradnik Inżyniera Nr 40 Aktualizacja: 12/2018 Tworzenie szablonów użytkownika Program: Plik powiązany: Stratygrafia 3D - karty otworów Demo_manual_40.gsg Głównym celem niniejszego Przewodnika Inżyniera
Miary jakości w Call Center
OFERTA SZKOLENIOWA Miary jakości w Call Center TELEAKADEMIA to profesjonalne centrum szkoleniowe mające swoją siedzibę w Pomorskim Parku Naukowo-Technologicznym w Gdyni. TELEAKADEMIA realizuje szkolenia
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
Ćwiczenie 6 - Hurtownie danych i metody eksploracje danych. Regresja logistyczna i jej zastosowanie
Ćwiczenie 6 - Hurtownie danych i metody eksploracje danych Regresja logistyczna i jej zastosowanie Model regresji logistycznej jest budowany za pomocą klasy Logistic programu WEKA. Jako danych wejściowych
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
WYKORZYSTANIE MODELI SKORINGOWYCH I REGUŁ BIZNESOWYCH DO OPTYMALIZACJI PROCESÓW BIZNESOWYCH
WYKORZYSTANIE MODELI SKORINGOWYCH I REGUŁ BIZNESOWYCH DO OPTYMALIZACJI PROCESÓW BIZNESOWYCH Grzegorz Migut, StatSoft Polska Sp. z o.o. Modele skoringowe na trwałe wpisują się w kulturę organizacyjną coraz
Instrukcja obsługi Systemu monitorowania pomocy publicznej DEMINIMIS (v. 2.00)
Instrukcja obsługi Systemu monitorowania pomocy publicznej DEMINIMIS (v. 2.00) Spis treści: 1. Informacje ogólne o Systemie monitorowania pomocy publicznej DEMINIMIS 1.1 Informacje techniczne 1.2 Zastosowania
PYTANIA PRÓBNE DO EGZAMINU NA CERTYFIKAT ZAAWANSOWANY REQB KLUCZ ODPOWIEDZI. Część DODATEK
KLUCZ ODPOWIEDZI Część DODATEK 8.1 9.4 PYTANIA PRÓBNE DO EGZAMINU NA CERTYFIKAT ZAAWANSOWANY REQB Na podstawie: Syllabus REQB Certified Professional for Requirements Engineering, Advanced Level, Requirements
Elementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: PROGNOZOWANIE Z WYKORZYSTANIEM SYSTEMÓW INFORMATYCZNYCH Kierunek: Informatyka Rodzaj przedmiotu: obowiązkowy w ramach treści kierunkowych Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU
Wykład 5: Statystyki opisowe (część 2)
Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz