lunedì 4 maggio 2015

WOE e Information Value

Quando gli istituti bancari devono decidere se erogare un prestito ad una controparte, si avvalgono, tra i vari strumenti, anche di modelli statistici previsionali, per essere sicuri di non compiere azioni imprudenti.

Nel rischio di credito, un tipico modello statistico che si pone l'obiettivo di stimare se la controparte sia o meno in grado di fare fronte ad un impegno preso con la banca, ovvero sia in grado di pagare in certo intervallo di tempo tutte le rate del prestito, è il modello logistico.

Tale modello per ogni controparte restituisce un valore dicotomico che può assumere i seguenti valori:
·       0, se si tratta di una controparte sicura (anche detta “good”), che molto probabilmente non creerà problemi alla banca;
·         1 (“bad”) se si stima che non sarà in grado di pagare, nell'intervallo di tempo considerato, tutte le rate e quindi andrà incontro ad un default finanziario.

Una delle fasi più importanti nella costruzione di un modello logistico è la scelta dei predittori, ovvero di variabili che abbiano una buona capacità discriminante e siano significativamente legate all’evento preso in considerazione: il default.
Una tra le varie misure utilizzate per decidere se un predittore sia statisticamente significativo è l’Information Value.

L’information value rappresenta la sommatoria della capacità predittiva di ogni classe del predittore raggruppato intesa come differenza tra distribuzione di good e bad pesata per il totale della classe nella distribuzione. L’information value fornisce quindi un’indicazione circa la predittività del raggruppamento effettuato sulla variabile. Si riporta il seguente esempio:
Classe
Totale
Tot good
Tot bad
Distr Tot
Distr Good
Distr Bad
WOE
DG-DB
IV
1
25
20
5
0,25
0,24
0,29
-0,18924
-0,05
0,009462
2
45
41
4
0,45
0,49
0,23
0,756327
0,26
0,196645
3
30
22
8
0,30
0,26
0,47
-0,59205
-0,21
0,124331
Totali
100
83
17
1
1
1


0,330438

Da tale esempio si evince come per ogni classe della variabile considerata viene calcolata la capacità esplicativa corrispondente e la somma di tali valori sia l’Information Value. Si evince inoltre che l’Information Value può variare qualora per una stessa variabile si utilizzi un differente criterio di raggruppamento, ovvero: una stessa variabile con un certo raggruppamento può entrare nel modello, con un differente raggruppamento no.
Il WOE, o “weight of evidence” è il logaritmo naturale (in base e) della distribuzione dei good sulla distribuzione dei bad per ogni classe, ovvero:

WOE(i) = ln[DG(i) / DB(i)]

L’information Value è pari a:

IV(i) = [DG(i) – DB(i)] * WOE

La tabella che segue ci aiuta ad interpretare il valore dell’Information Value ottenuto:
Information Value
Capacità predittiva
< 0,02
Troppo bassa
0,02 – 0,1
Debole
0,1 – 0,3
Media
0,3 – 0,5
Forte
> 0,5
Troppo alta o sospetta


Nessun commento:

Posta un commento