L`hétérogénéité non observée et la vulnérabilité

Download Report

Transcript L`hétérogénéité non observée et la vulnérabilité

Programmes de maîtrise et de doctorat en démographie
Modèles de risque et de durée
Cours 11
Séance du 18 avril 2014
Benoît Laplante, professeur
Plan
 L’hétérogénéité non observée
 La vulnérabilité comme effet aléatoire
 L’événements renouvelable
 La vulnérabilité partagée comme effets aléatoire
L’hétérogénéité non observée et la vulnérabilité
Question :
 Imaginons un échantillon tiré d’une population dont la moitié des
individus partagent une caractéristique qui les rend plus vulnérables
au risque étudié.
 Imaginons que l’on ne dispose pas de la variable qui correspond à
cette caractéristique.
 Comment les résultats de l’analyse sont-ils affectés?
L’hétérogénéité non observée et la vulnérabilité
Réponse :
 Les individus les plus vulnérables changent d’état plus rapidement.
 La composition du groupe à risque change au fil du temps : il
contient de moins en moins d’individus vulnérables.
 Le risque de base décroît donc au fil du temps.
L’hétérogénéité non observée et la vulnérabilité
 Dans les modèles de risque (ou de durée, ou de survie), la
composante aléatoire représente l’évolution du risque au fil du
temps net des effets des variables indépendantes.
 On lit souvent que dans ces modèles, la composante aléatoire peut
être interprétée comme un terme d’erreur (cette interprétation est
plus évidente ou plus claire dans les modèles de durée), mais
qu’elle n’a pas — comme elle l’a dans la régression conventionnelle
— la propriété de représenter ou capter les effets des variables
indépendantes absentes.
L’hétérogénéité non observée et la vulnérabilité
 Ceci est sûrement vrai dans la mesure où la loi de probabilité qui
représente l’évolution du risque au fil du temps ne représente pas la
somme d’un nombre infini de tirages aléatoires indépendants régis
par une loi de Bernouilli comme le fait la loi normale.
 Ceci peut prêter à confusion si on oublie que le rôle que la loi
normale joue dans la régression conventionnelle ne permet
d’obtenir des résultats sans biais que si l’équation n’omet aucune
variable indépendante importante…
L’hétérogénéité non observée et la vulnérabilité
Le modèle de vulnérabilité
 Le modèle à vulnérabilité ajoute à l’équation un élément aléatoire,
régi par une loi de probabilité, qui « capte », dans le processus
d’estimation, la part « régulière » de la variation de la variable
dépendante qui n’est pas expliquée par les variables
indépendantes.
L’hétérogénéité non observée et la vulnérabilité
Le modèle de vulnérabilité
 On peut représenter comme suit la fonction de risque du modèle de
vulnérabilité :
hi (t |  i )  i hi (t )
ln hi (t | i )  ln hi (t )  ln i
ln hi (t | i )  n hi (t ) 
 et somme suit sa fonction de séjour :
S (t |  )  S (t )

L’hétérogénéité non observée et la vulnérabilité
Le modèle de vulnérabilité
 La vulnérabilité constitue une « deuxième composante aléatoire »
du modèle.
 Elle suit une loi de probabilité.
 En pratique, on lui fait suivre généralement
 soit la loi Gamma: la dispersion de la vulnérabilité dans le groupe à
risque demeure constante au fil du temps même si ce groupe devient
plus homogène (si le problème de l’hétérogénéité non observée se
pose).
 Soit la loi de Wald: la dispersion de la vulnérabilité dans le groupe à
risque diminue au fil du temps alors que ce groupe devient plus
homogène (si le problème de l’hétérogénéité non observée se pose).
L’hétérogénéité non observée et la vulnérabilité
Le modèle de vulnérabilité
 Avec Stata on ne peut utiliser le modèle de vulnérabilité qu’avec les
modèles paramétriques.
 En pratique, la vulnérabilité ne présente d’intérêt que lorsqu’on
l’utilise dans le modèle exponentiel par parties.
 On peut estimer un modèle équivalent en utilisant le modèle
logistique ou le modèle de Poisson par parties à effet aléatoire.
L’événement renouvelable
La typologie de Hosmer et Lemeshow
 Hosmer et Lemeshow proposent une typologie de l’étude des
processus qui régissent les événements renouvelables qui repose
sur trois critères .
 Le processus
 utilise une seule « horloge » ou bien une « horloge » par rang;
 utilise une seule fonction de risque de base ou bien une fonction de
risque de base par rang;
 répartit le risque en plusieurs épisodes ou le regroupe en un seul
épisode.
Le’événement renouvelable
La typologie de Hosmer et Lemeshow
Comptage
Une seule horloge
Une seule fonction
Conditionnel A
Une seule horloge
Une fonction par rang
Conditionnel B
Une horloge par rang
Une fonction par rang
Marginal
Une seule horloge
Une seule fonction
Simultanéité
Les événements renouvelables
La typologie de Hosmer et Lemeshow
 La modélisation de l’événement renouvelable se ramène donc
d’abord et avant à l’arrangement des données et l’écriture de
l’équation
 En principe, ce travail se pratique avec tout modèle de risque ou de
durée
 et les modèles s’estiment avec les procédures ordinaires des
logiciels.
L’événement renouvelable
Il reste cependant un problème
 Les épisodes vécus par le même individus sont corrélés.
 Problème d’estimation de la variance des estimations, même avec
un échantillon aléatoire simple.
 Solution: estimateur de Huber-White.
L’événement renouvelable
Il reste cependant encore un problème
 La source des différences entre les informations contenues dans
les observations ne se limite pas à la différence entre les valeurs
des variables indépendantes.
 Il est presque certain qu’il existe des similitudes entre les
observations d’un individu et des différences entre les observations
d’individus différents qui ne sont pas captées par les variables
indépendantes.
 Il nous manque un terme d’erreur à estimer au niveau de l’individu.
L’événement renouvelable
Les observations corrélées
 La vulnérabilité partagée :
 le risque de chaque individu dépend vraisemblablement d’un ensemble
de facteurs dont on cherchera à résumer les effets dans un terme
d’erreur qui suit une loi de probabilité.
 On peut interpréter le modèle à vulnérabilité partagée comme un
modèle à effet aléatoire ou un modèle multiniveau.
 Le modèle peut s’exprimer comme suit :
hij (t |  i )   i hij (t )
ln[hij (t |  i )]  ln[hij (t )]  ln  i
ln[hij (t |  i )]  ln[hij (t )]  i
L’événement renouvelable
La vulnérabilité partagée
 Avec Stata, s’estime avec le modèle semi-paramétrique de Cox et
avec certains modèles paramétriques.
 Avec le modèle de Cox
 l’estimation fait un usage intensif des dérivées numériques;
 le processus est très long, voire impossible, avec les échantillons de la
taille qu’on utilise habituellement en sciences sociales..
 Beaucoup plus rapide à estimer avec les modèles paramétriques.
 En pratique, comme pour la vulnérabilité « simple », la vulnérabilité
partagée ne présente d’intérêt que lorsqu’on l’utilise dans le modèle
exponentiel par parties.
 Comme pour la vulnérabilité « simple », on peut estimer un modèle
équivalent en utilisant le modèle logistique ou le modèle de Poisson
par parties à effet aléatoire.