Modèle de correction de données en assurance vie

Transcript Modèle de correction de données en assurance vie

Modèle de correction de
données en assurance vie
Mohamed BACCOUCHE
Actuariat assurances de Personnes -
Axa France
12 septembre 2013
1
1
Contexte
On dit souvent que « les assureurs ne savent pas ce qu’ils savent » en
référence à une exploitation présumée faible de leur données
D’un autre coté,
Ces bases de données sont la principale richesse d’un assureur en raison
de de l’inversion du cycle de production en assurance
Objectif de Cette présentation: une illustration de ce que font les
assureurs en matière d’exploitation des données
2
Modèle de correction de données en assurance vie \ Mohamed BACCOUCHE – AXA France
Exploitation optimale des données
3

Pourquoi c’est un sujet difficile?
Les bases de données peuvent contenir des données qui ne correspondent pas
totalement aux besoins d’une étude
 Les portefeuilles vie peuvent s’étaler sur 40 voire 80 ans
 Modifications règlementaires et/ou Nouveaux produits  cout
informatiques significatif d’adaptation des bases
 Données conçues pour un autre besoin
 Erreurs de conception dans les bases de données en raison de la
complexité des situations
 Dysfonctionnements informatiques ponctuels ou structurels

Défi
 Corrections manuelles couteuses et fastidieuses

Innovation
 Idée: un modèle de correction basé sur un modèle statistique
 Application: compte de résultat d’un portefeuille Vie
Modèle de correction de données en assurance vie \ Mohamed BACCOUCHE – AXA France
Exemple d’application
4

Portefeuille d’assurance vie mature
 PM: 30 G€
 Chiffre d’affaires: 3G€
 Prestations: 3G€
 Portefeuille complexe
 Plusieurs générations de produits
 Produits transférés plusieurs fois d’un système informatique à un autre
 Plusieurs modifications réglementaires
 Contribution significative aux résultats d’Axa France

Contrainte réglementaire
 Garder la même fiabilité du compte de résultats et de l’analyse de marge de
notre activité

Indicateurs des comptes
 La marge relative non expliquée: impact direct sur le résultat annoncé
 La marge absolue non expliquée: mesure le risque sur le compte de résultat
Modèle de correction de données en assurance vie \ Mohamed BACCOUCHE – AXA France
Exemple d’application

Nature de portefeuille







Structure des bases de données: les données qui permettent de calculer
le résultat





5
Assurance vie avec des garanties en cas de vie et/ou en cas de décès
Des primes régulières ou libres
 Possibilité d’arrêter, d’augmenter, de baisser et de reprendre des paiements même pour les primes périodiques
 Possibilité de rachat partiel, programmé ou total
Plusieurs supports d’investissements
 Des réorientations au choix ou automatiques
Les règles fiscales dépendent des générations
 Plusieurs génération de Contributions sociales
 Fiscalité en cas de rachat ou de succession
Règle complexes de participations aux bénéfices financier et/ou techniques
Plusieurs générations de garantie de taux
 Taux garantie à durée fixe ou viagère
 TMGA
Stock: PM,
Flux: Chiffre d’affaires, prestations, réorientations, intérêts
Caractéristiques des produits, assurés, souscripteurs et distributeurs
Caractéristiques des bases de données
Plusieurs sources de données
Modèle de correction de données en assurance vie \ Mohamed BACCOUCHE – AXA France
Exemple d’application

Principe de la méthode
 Tester une analyse statistique à partir de l’historique des analyses
manuelles: correction de plus de 14 M€ avec un taux de succès de plus de
91% (en montant)
 1ère Application industrielle : correction de 13.5 M€ avec 7148 contratssupports dont l’écart après correction est inférieur à 2€

Conclusion
 Il existe des « régularités » dans les dysfonctionnements des bases de
données qu’on peut donc capturer avec des modèles statistiques
 Ces techniques de type « BIG DATA » est une opportunité pour les
assureurs dans les prochaines années
6
Modèle de correction de données en assurance vie \ Mohamed BACCOUCHE – AXA France
Statistiques descriptives sur les
anomalies

Statistiques descriptives sur les anomalies :
 base des contrats-supports corrigés manuellement sur les
exercices précédents ;
 8.408 contrats-supports avec un écart en relatif de -24M€;
 les libellés des anomalies sont regroupés selon une syntaxe qui
permet l’identification.
7
Modèle de correction de données en assurance vie \ Mohamed BACCOUCHE – AXA France
Statistiques descriptives sur les
anomalies
Tableau I : Nombre des postes corrigés
Correction poste
CA
Correction poste
prestation
Correction
poste Stock
Correction poste
ajustement
Correction poste arbitrage
correction poste
explication
Nbre de poste
corrigé
1089
6,70%
3421
21,06%
1967
12,11%
3363
20,70%
1462
9,00%
4943
30,43%
16245
Nbre de contrat-support
Tableau II : Nombre des postes corrigés par contrat- support
5000
4179
4000
2621
3000
2000
1000
1180
310
28
65
18
5
6
3
4
0
0
1
2
3
4
7
8
Tableau III : Cas d'une seule correction
Nbre de contrats
%
8
Correction CA
Correction
prestation
Correction
Stock
Correction
ajustement
Correction
arbitrage
Correction E.
Explicatif
Nombre de
correction
65
2%
549
21%
375
14%
755
29%
214
8%
663
25%
2621
Modèle de correction de données en assurance vie \ Mohamed BACCOUCHE – AXA France
Statistiques descriptives sur les
anomalies
Tableau IV : Cas de deux corrections par contrats-supports en UC
Nbre Contrat-support
S. Ecart
S.Ecart abs
Max
Min
dont 1795 ajust flux
Ajustements
Correction CA
Correction
prestation
Correction
Stock
Correction
arbitage
Correction E.
Explicatif
1 805
3 250 281
6 889 950
106 220
-51 398
41
-1 156 256
1 216 571
12 329
-186 594
980
2 516 802
11 509 222
207 434
-342 122
65
377 836
1 247 813
174 664
-201 860
632
3 250 281
6 889 950
106 220
-51 398
87
-10 237
493 125
28 809
-29 786
Tableau V : Cas de deux corrections par contrats-supports en EURO
Nbre Contrat-support
S. Ecart
S.Ecart abs
Max
Min
Intérêts non distribués
Correction CA
Correction
prestation
Correction
Stock
Correction
arbitage
Ajustement
1 382
-8 913
687 745
15 220
-65 012
88
-859 597
2 821 802
119 546
-1 000 000
1 112
8 147 238
14 983 042
274 637
-131 693
79
-701 018
891 960
15 250
-224 000
102
-2 583 550
3 974 728
134 606
-202 164
1
51 813
51 813
51 813
51 813
Les postes les plus corrigés sont : ajustement/IND (UC/Euro) + poste de stock/flux
9
Modèle de correction de données en assurance vie \ Mohamed BACCOUCHE – AXA France
Méthode de correction :
Régression logistique multinomiale

Principe de fonctionnement de la régression logistique
P(Yi  k X )
Yi , k  log(
)  1, k X 1,i   2, k X 2,i  ...   p , k X p ,i   i
1  P(Yi  k X )
avec  i  N (0, ²)


Modalités
 Stock;
 Prestation;
 Chiffre d’affaire;
 Ajustement;
 Autre..
Choix des variables discriminantes






10
Le poste de Compte de
résultat en anomalie
écart flux (plusieurs sources);
écart stock (plusieurs sources);
indicateur1 (PMC=0 & prestation=0, variable binaire) ;
indicateur2 (PMO=PMC=0, variable binaire) ;
indicateur3 (PMC>>PMO et CA = 0 & arbitrage =0);
signe de l’écart résiduel …
Modèle de correction de données en assurance vie \ Mohamed BACCOUCHE – AXA France
 Test d’ANOVA
 Test de Ki²
 Stepwise Selection
Choix des variables

Natures des Variables testées
 Ecarts éventuels entres plusieurs sources de données
 Utilisation des sources indépendantes
 Ecarts entre deux calculs indépendants de la PM fin d’exercice de chaque
contrat
 Détection des données incohérentes
 Libellé de l’anomalie dans la correction manuelle

sensibilité
 Seuil de correction: en valeur absolue et en valeur relatives
 Stabilité dans le temps
11
Modèle de correction de données en assurance vie \ Mohamed BACCOUCHE – AXA France
Résultats de la régression
logistique multinomiale
Anomalie correction
manuelle
Anomalie modèle
Ajust
Stock
Prestation
CA
Total
234
54
408
49
745
201
49
403
40
693
85,90%
90,74%
98,77%
81,63%
93,02%
Tableau VII : Répartition des bonnes corrections

Un taux de succès significatif sur le nombre des contrats supports corrigés (93%)
et sur les montants (92% pour un total de correction de 9.7M€);
 Modèle robuste sur le panier « Out Of Sample »;
12
Modèle de correction de données en assurance vie \ Mohamed BACCOUCHE – AXA France
Résultat : application sur tous les
contrats en anomalies
X = 5€ , Y = 98%

Correction de 12 760 contrats-supports avec un écart résiduel absolu égal à
13.5M€

1 803 contrats-supports dont l’écart après correction est égal à 0€

7 148 contrats-supports dont l’écart après correction est inférieur à 2€

11 727contrats-supports dont l’écart après correction est inférieur à 5€
Echantillon de 63 contrats supports choisis pour tester la
robustesse du modèle (1,5M€)
Un taux de bon classement de 92% sur le nombre des
contrats supports
13
Un taux de bon classement de 95% sur le montant des écarts
corrigés
Modèle de correction de données en assurance vie \ Mohamed BACCOUCHE – AXA France
Résultat : application sur tous les
contrats en anomalies
Tableau VIII : Répartition des contrats supports corrigés (écart après
correction < 1€)
Fréquence
ARB
Ajust
CA
Echus
IC
PB
PMC
PMO
Rachat
Sinistre
118
1577
1811
21
98
27
730
274
384
74
Fig 1 : Distribution des écarts résiduels
des contrats-supports après correction
14
Modèle de correction de données en assurance vie \ Mohamed BACCOUCHE – AXA France
Pourcentage
2%
31%
35%
0,4%
2%
1%
14%
5%
8%
1%
Fréquence Pourcentage
Cumulée
cumulé
118
2%
1695
33%
3506
69%
3527
69%
3625
71%
3652
71%
4382
86%
4656
91%
5040
99%
5114
100%
Conclusion et perspective

Modèle robuste et stable en termes de taux de bon classement sur les
contrats et sur le montant des écarts (plus que 90%)

Il faut le maintenir dans le temps:
 Ré-estimer ces paramètres à partir des erreurs de second espèces détectées
 Développer des nouveaux modèles de détection des anomalies en fonction de chaque
situation
15
Modèle de correction de données en assurance vie \ Mohamed BACCOUCHE – AXA France
Merci pour votre attention
16
Modèle de correction de données en assurance vie \ Mohamed BACCOUCHE – AXA France