Algorithms in Business

everywhere

Modele scoringowe w windykacji cz. 3- modele statystyczne

Dzisiaj ostatnia część cyklu modele scoringowe w windykacji.

Podczas budowy modeli scoringowych w procesach windykacyjnych wykorzystywane są najczęściej następujące modele statystyczne:

  1. Regresja logistyczna - używana jest najczęściej we wczesnym etapie windykacji w celu określenia prawdopodobieństwa z jakim dana sprawa „przejdzie” z cyklu 1 do 2 oraz 2 do 3.
  2. Regresja liniowa - używana najczęściej w późnym etapie windykacji w celu określenia oczekiwanej kwoty spłaty. W sytuacji gdy wyliczamy również prawdopodobieństwo spłaty kwoty oczekiwanej wykorzystywana w tym celu jest również regresja logistyczna.
  3. Drzewo klasyfikacyjne - stosowane w przypadku dużej ilości zmiennych w badanej próbce danych. Drzewo klasyfikacyjne nie zawiera w sobie karty punktacyjnej, przydzielającej wagi dla atrybutów poszczególnych charakterystyk. Metoda ta polega na klasyfikowaniu klientów do mniej lub bardziej rzetelnej grupy klientów. Wadą tej metody jest to, że nie tylko chcemy informacji o tej klasyfikacji ale również o prawdopodobieństwie tej rzetelności.
  4. Analiza dyskryminacyjna - wykorzystywana jest w sytuacji gdy mamy znaleźć granicę (wartość punktu krytycznego) poniżej którego sprawy obsługiwane są wg. strategii windyakcyjnej X a powyżej tego punktu – wg. strategii Y.

Ponieważ każda z tych metod ma podobną wartość predykcyjną o wyborze modelu decydują najczęściej takie czynniki jak:

  1. Dostępność i powszechność stosowania oraz większa ilość informacji statystycznej decyduje o wyborze metody regresji liniowej;
  2. Regresja logistyczna jest stosowana tam gdzie dostępne dane nie spełniają założeń dla regresji liniowej;
  3. Prostota oraz dążenie do automatyzacji procesów decyduje o wyborze drzew klasyfikacyjnych

Na koniec trochę matematyki czyli mierzenie efektywności modelu.

Jedną z miar efektywności modelu scoringowego jest współczynnik Giniego zawierający krzywą Lorentza.

Nasze doświadczenia wskazują, że współczynnik Giniego (pole pomiędzy czerwoną a niebieską linią w stosunku do połowy pola jednostkowego kwadratu na wykresie poniżej) wyniósł 0,34.

Założenia:

  • suma zaległości: 189493,56
  • populacja: 30000
  • wsp. Giniego: 0,343658393
  • wsp. Giniego – całkowo: 0,34362506

Suma zaległości to suma zaległych spłat dla 30 tys. dłużników.

modele scoringowe - krzywa lorenza

Przykładowo: 65 % badanej populacji posiada zaległość w wysokości średnio 40% całkowitej kwoty zaległości.

Powrót

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Możesz użyć następujących tagów oraz atrybutów HTML-a: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>