barre - Free

Download Report

Transcript barre - Free

Sélection de clientèle
Plan du Cours
•
•
•
•
•
•
•
Enjeux, Modélisation
Mesure de performance,
construction des variables
Biais, Modèles de Durée
Utilisation à l’acceptation
Utilisation Bâle II et Marketing
Veille Technologique
Examen
C. Cattelan
C. Cattelan
V. Mouveroux
C. Cattelan
V. Mouveroux
V. Mouveroux
Cyrille Cattelan: [email protected], 0672148294
Vincent Mouveroux: [email protected], 0614434247
Page 1
Séance 1
1. La sélection de clientèle
1.
2.
Problématique du Crédit Scoring
Autres problématiques
2. Modélisation
1.
2.
3.
4.
5.
6.
7.
Critère endogène qualitatif
Population d’estimation
Modèles économétriques à variable latente (logit, probit)
Analyse discriminante
Modèle de durée
Comparaison des approches
Autres modèles
1.
2.
Segmentation
Réseau de neurones
Page 2
1.1 Problématique du crédit scoring
• Octroi de crédit: un demandeur de crédit demande un financement à un
organisme préteur
• Question de l’organisme: est ce que l’emprunteur va rembourser son crédit?
– L’organisme a besoin d’évaluer le risque de défaillance de l’emprunteur
– Le risque est le facteur critique de la rentabilité d’un établissement de crédit
• Exemple; marge de 1%, perte de 100% si défaillance, p=probabilité de défaillance
• Gain= 1% x (100-p)-100% x p => Gain > 0 si p < 100/101 < 1%
– Un arbitrage entre: perte de marge et prendre du risque
• Le crédit est un produit dont le coût unitaire est inconnu (à cause de
l’évaluation du risque)
– => prévision du risque à partir des caractéristiques de l’emprunteur pour évaluer ce
coût
• Un score: l’outil de prévision de ce risque et donc de décision d’attribution du
crédit : Oui/ non; tarification différenciée
– Dissocier la partir commerciale du risque
– Obtenir une politique d’octroi Nationale et homogène
– Former et aider les forces commerciales
Page 3
ACCEPTE
Exemple: Score d’octroi
SI note
>
barre
Client
Base de
données
d’octroi
demande
d’information
calcul du
score
20 ans
Médecin
Célibataire
Locataire
+3
+5
0
0
Note de score :
+8
note de
score
probabilité
d’être un
bon payeur
barre
de
score
risque
limite
SI note
<
barre
stockage
REFUSE
Un score est un
système de points
Un score est un
classement
Points clés:
Un score est un classement obtenu en sommant des points
Le score d’octroi évalue le risque de non-paiement de toute demande
Permet:
un arbitrage entre volume de production et risque engrangé
de choisir et contrôler son niveau de risque
de prévoir son niveau de risque et de tarifer en conséquence
d’augmenter la productivité
Page 4
1.1 Problématique du crédit scoring
Client au contentieux
Client qui rembourse bien
• Idée du score:
+
Taux d’endettement
Score
+8
+6
+3
+
+1
Age
Note de score = 2 + 3x taux - 0.05 x âge
Page 5
1.1 Problématique du crédit scoring
• Idée du score:
– Prévoir le risque en fonction des caractéristiques de
l’individu X1,… Xp(signalétique, produit acheté,…)
– A chaque variable on associe une note
– La somme des notes donnent le score de l’individu
• S(X1,…, Xp)=Somme (Si(Xi)) pour i de 1 à p
– => modèle additif
– Recherche des variables discriminantes et des
croisements discriminants
• Analyse des corrélations entre risque et Xi
– Inférence sur le passé
Page 6
1.1 Problématique du crédit scoring
• Types de variables disponibles:
– Par domaine : signalétique, produit, risque
– Par origine: déclaratif client, comportement observé, fichiers externes
• Les variables disponibles dépendent:
–
–
–
–
Du type de client (particulier, entreprise,…)
Du type de relation (prospect, client,…)
Du type d’emprunt (immobilier, crédit consommation,…)
Du type de distribution (Octroi, Pre-acceptation,…)
• Les catégories les plus fréquentes:
–
–
–
–
Mesure de solvabilité (revenu, CSP…)
Mesure de stabilité (ancienneté dans l’emploi, enfants,…)
Comportement passé (bon-mauvais payeurs, épargnants,..)
Déclaratif
Page 7
1.1 Problématique du crédit scoring
• Exemple octroi crédit consommation prospects:
– Revenu, charges, conjoint, CSP, propriétaire, locataire
– Situation familiale, enfants, age, ancienneté dans l’emploi,
dans la banque
– Fichage risque
– Prise d’assurance, ,…
• Exemple pre-acceptation crédit consommation:
– Flux créditeurs, flux débiteurs, épargne acquise, CSP
– Situation familiale, ancienneté de la relation
– Fichage risque, qualité de la relation passée (nombre
d’impayés,…), crédit passé
Page 8
1.1 Problématique du crédit scoring
• Exemple: crédit immobilier (proche crédit auto)
– Variables emprunteurs (Cf. crédit consommation)
– Apport personnel (capacité à épargner, risque sur
l’hypothèque)
– Nature du bien: valeur du bien, neuf ou ancien, immeuble ou
maison, nombre de pièces,…
• Impact sur la revente en cas de défaut
• Exemple: crédit aux entreprises
–
–
–
–
Variable du dirigeant
Bilan et ratio financiers
Type d’utilisation du crédit (matériel, trésorerie,…)
Secteur d’activité
• POINT CLE: la collecte est la sauvegarde des
données fiables
Page 9
1.2 Autres domaines d’applications
• Marketing:
– Ciblage clientèle pour
• Mailing - phoning
• Tatouage agence
– Prévision des remboursements anticipés – fermeture
de produit
• Risque:
– Optimisation de la gestion contentieuse
– Evaluation de la qualité d’un encours
• => de nombreuses autres utilisations
Page 10
1.2 Autres domaines d’applications
Exemple: Score de réponse Assurance vie
Construction du score S pour prévoir la
réponse au premier mailing : classement
Envoi du premier
Mailing assurance vie
Répondant
au premier
mailing
MAILING
Application du score S puis sélection pour
second mailing (+ témoins )
Points clés:
 Outils pour des clients ou des prospects
Envoi
du
second
mailing
 Hypothèse faite: les personnes qui ont des
caractéristiques proches des personnes qui
ont répondu au mailing sont plus appétents à
ce mailing.
MAILING
 Besoin de mailing préalable
 Outil le plus performant
Témoins
 Outil améliorable
Mesure de la performance du scor
Ré-estimation éventuelle
Pagedu11score
1.2 Autres domaines d’applications
Client
accepté
2 mensualités
de retard
recouvrement
Base de
données
d’octroi
Base de
données de
comportement
ENVOI
D’UN
COURRIER
score de
comportement
note
=
probabilité
de payer
le retard
âge
ancienneté emploi
apport personnel
...
durée depuis l’octroi
retard maximum atteint
durée depuis dernier impayé
remboursement anticipé partiel
...
si note
>
barre
si note
<
barre
APPEL
TELEPHONIQUE
Page 12
2.1 Critère endogène qualitatif
• On cherche à prévoir une caractéristique qualitative dichotomique
Y:
– Remboursement (Y=1) / contentieux (perte) (Y=0)
• Remarque: utilisation d’indicateurs avancés (3 mois de retard,..)
– Vie / dépôt de bilan
– Achète un produit / n’achète pas un produit*
– …
• Un score: étude de la loi (X1,…,Xp, Y)
• La règle d’attribution d’un crédit A( ) sur la base des
caractéristiques X1,.. Xp doit permettre de maximiser le profit de
l’établissement prêteur
– A(X) = 1: Client accepté
– A(X) = 0 : Client refusé
– Coût:
C0 : accepter un client non solvable A(X)=1 et Y=0
C1 : refuser un bon client A(X)=0 et Y=1
– Gain:
G : accepter un bon client A(X)=1 et Y=1
Page 13
2.1 Critère endogène qualitatif
• Hypothèse: on suppose les coûts et gains indépendants de X
• La régle d’octroi A ( ) est optimale pour A qui maximise:
– G(A) = - C0 x P[A(X)=1 et Y=0] - C1 x P[A(X)=0 et Y=1] + G x
P[A(X)=1 et Y=1]
– Posons les lois f(x/Y=0) et f(x/Y=1)
– Rappel: P(Y=1/X=x) = P(Y=1) x f(x/Y=1) / f(x)
• On obtient:
– A = { x tel que (f(x/Y=1)/f(x/Y=0)) > C0 x P(Y=0) / (C1+G) / P(Y=1) }
– A = { x tel que P[Y=1/X=x] > C0 / (C0+C1+G) }
• Conclusion: deux approches
– Discrimination : évaluation de f(x/Y=1)/f(x/Y=0)
– Prévision: évaluation de P[Y=1/X=x]
– Note de scores équivalentes à une fonction croissante près
• Remarque: les modèles de durée ont une autre approche
Page 14
2.2 Population d’estimation
• Les demandeurs de crédit des années passées
– Avec toutes les données clients (instruction, données
comportementales,…)
– Avec l’observation passée de Y (risque)
– Population représentative et homogène
• Choix d’un horizon (sauf modèle de durée)
• Au final:
–
–
–
–
Y: bon ou mauvais payeurs
X: caractéristiques clients
Objectifs de prévision: f(x/Y=1)/f(x/Y=0) ou P[Y=1/X=x]
Données: X et Y sur une population représentative
– => modélisation
Page 15
2.3 Modèle économétrique à variable
latente
• Principe:
– Il existe une variable latente Y* non observable tel que:
• Y= 1 si Y*>= 0
• Y= 0 si Y*< 0
• Interprétation: Y* représente le niveau de risque du client
• Modélisation
– probit: Y*=X+u avec u~>N(0,1)
– Logit: Y*=X+u avec u~> logit [proche d’une loi normale]
• On exprime P[Y=1/X=x] sous forme paramétrée:
– P[Y=1/X=x; ] = P[Y*>=0/X=x; ]=P[X +u>0]=P[X >-u]=F(X )
– Loi probit: P[Y=1/X=x; ]= (X )
=> estimation de 
– Loi logit: P[Y=1/X=x; ]= 1/(1+exp(- X ))
=> estimation de 
• Remarque, on travaille sur X  qui est linéaire en X:
– En pratique on utilise X ou des transformées de X: X2, log(X), découpage en
morceau ,…
Page 16
2.3 Analyse discriminante
• Modélisation de f(x/y) avec une classe de loi de paramètre
 pour prévoir f(x/Y=1)/f(x/Y=0)
– On pose:
• f(x/y=1; )=f1(x; )
• f(x/y=0; )=f0(x; )
loi de X des bons clients
loi de X des mauvais clients
– On observe les écarts entre les deux distributions, on estime  et
on prendra comme score: f1(x; )/f0(x; )
• En pratique: analyse de données linéaires
–
–
–
–
X quantitatives suivant une loi multinormale
f1(x; )~> N(m1,1) et f0(x; )~> N(m0,0)
On fait l’hypothèse que 1= 0 = 
Alors: f1(x; )/f0(x; ) = exp (-1/2 [2(m0-m1) X + constante])
• C’est une forme linéaire en X
– Remarque: hypothèse forte sur la normalité de x (transformation de x en g(x)
parfois)
Page 17
2.4 Modèle de durée
• Logique très différente (séance 3)
• Modèle de durée semi-paramétrique à hasard
proportionnel h(x,t)=h0(t) Exp(- X )
– Note de score X 
– Hasard de base: h0(t)
• Utile si:
– Peu de données (car on ne prend plus d’horizon)
– Impact du temps fort (crédits longs, mélange de génération de
crédit d’ancienneté très différentes,…)
– Dans ce cas:
• Évite les biais de population
• Permet d’utiliser toutes les données
Page 18
2.5 Comparaison des approches
• L’analyse discriminante est un sous-modèle du modèle
logit dans lequel on a fixé f normale et de même
variance
– => préférence pour le modèle logit
• Modèle de durée:
– ne permet pas de calculer la probabilité de survenance
P[Y=1/X=x] (sauf modélisation complémentaire)
– plus complexe et moins facile à interpréter (semiparamétrique, gestion des censures, horizon)
– permet d’éviter les biais de population et d’utiliser toutes les
données quand il y en a peu
Page 19
2.6 Autres modèles
• Segmentation
– Méthodes Cart, Chaid
– A chaque étape, on cherche la variable qui coupe une
population en 2 sous-populations de niveaux de risque très
différents
– Critères: variance interclasse,…
– En pratique: peu robuste, difficulté à prendre en compte de
nombreuses variables, utile pour une première phase
descriptive
• Réseau de Neurones
– En pratique: boîte noire peu interprétable et maîtrisable, pas
plus performant sauf sur quelques problématiques
• …
Page 20