transparents

Download Report

Transcript transparents

Démographie: paradigmes
et modèles
Daniel Courgeau
Ined
Introduction
 La démographie a développé depuis sa naissance au
XVIIème siècle un certain nombre de paradigmes qui ont
entrainé la mise en place de modèles de type très
différents.
 Nous allons les examiner successivement ici. Nous
verrons s’ils peuvent se compléter ou, au contraire, s’ils
présentent des différences qui vont les rendre
incomparables comme le prétend Kuhn en 1962 pour les
paradigmes de la physique.
 Nous conclurons sur une possibilité ou une impossibilité de
cumulativité en démographie.
Le paradigme transversal
 Le premier paradigme, dit transversal, examine la
population à un moment donné. Il considère que les
phénomènes démographiques ont une existence
indépendante des individus qui les vivent et s’expliquent
par les caractéristiques économiques, politiques, sociales,
religieuses, etc., de la société.
 Il va utiliser le modèle de régression qui a été mis en place
dès le début du XIXème siècle par Gauss, Legendre et
Laplace. Celui-ci était alors utilisé essentiellement à l’étude
des phénomènes astronomiques ou géodésiques. Son
application aux sciences sociales a nécessité un long
cheminement au cours de ce siècle.
Figure 1 : Modèle au niveau agrégé, indiquant la variation du pourcentage
de migrants en Norvège, lorsque la proportion d’agriculteurs présents dans
les régions augmente
0,7
Proportion de migrants
 C’est finalement Durkheim qui
l’appliqua à la fin du XIXème
siècle. Le modèle appelé ‘des
variations concomitantes’ est en
fait une régression sur variables
agrégées
 Nous donnons ici son
application à des données du
registre de population
norvégien . Nous avons réalisé
une régression entre le taux de
migration de chacune des 19
régions et leur proportion
d’agriculteurs à 22 ans. Elle
permet d’estimer une
probabilité de migrer de 0,60
pour les agriculteurs et de 0,12
pour les autres professions.
0,6
prop. migrants théorique
prop. migrants observée
0,5
0,4
0,3
0,2
0,1
0
0
0,125 0,25 0,375
0,5
0,625 0,75 0,875
Proportion d'agriculteurs
1
 Ce résultat peut paraître surprenant étant donné le coût tant
financier que personnel d’un changement de région pour les
agriculteurs. Nous verrons plus loin une autre interprétation que
l’on peut en donner.
 Indiquons ici que l’utilisation de ce paradigme conduit à un
certain nombre de problèmes méthodologiques.
 Il peut d’abord conduire à une erreur écologique, lorsque l’on
pense que ces résultats sont directement interprétables en
termes de comportements individuels. Robinson a clairement
montré en 1950 que l’on ne pouvait utiliser une corrélation
écologique calculée au niveau agrégé comme substitut d’une
corrélation au niveau individuel.
 Certains indices synthétiques que l’on peut élaborer en
démographie, tel que l’indice synthétique de premier mariage,
qui devraient par définition être inférieurs ou égaux à l’unité,
sont parfois bien supérieurs: ainsi pour les premiers mariages il
est plus grand que 1,5 pour l’année 1946.
Le paradigme longitudinal
 A la fin de la seconde guerre mondiale le paradigme
longitudinal se met en place et évite l’objection adressée
au paradigme transversal sur les indices synthétiques.
Cette analyse est proposée par Henry en France et
Welpton aux Etats-Unis et a prévalu jusqu’à la fin des
années 1970.
 Son paradigme peut s’énoncer ainsi: le démographe ne
peut étudier que l’arrivée d’un événement, et d’un seul,
dans une population qui conserve tous ses caractères et
les mêmes tant que le phénomène se manifeste.
 Pour que ce postulat soit vérifié, il est nécessaire qu’il y ait
d’abord indépendance entre le phénomène étudié et les
phénomènes perturbateurs.
 Une seconde condition est également nécessaire: il faut
que la cohorte soit homogène.
 On va dès lors considérer une cohorte que l’on va suivre d’un
instant initial, souvent sa naissance, jusqu’à son extinction.
Cela permet de traiter les différents phénomènes séparément.
 Une telle analyse ne conduit plus aux objections faites au
paradigme transversal sur les indices synthétiques: ils sont
toujours inférieurs ou au plus égaux à l’unité.
 Les modèles vont relier les quotients estimés à leur valeur
calculée à partir d’un petit nombre de caractéristiques
théoriques. Ainsi pour la constitution de la famille les notions de
fécondabilité, de temps mort, de mortalité intra-utérine, de
stérilité, de contraception, etc., sont utilisées pour reconstituer
les quotients mensuels de fécondité.
 Louis Henry a pu écrire en 1972: Ici il ne s’agit pas seulement
de démêler un écheveau embrouillé de relations: le modèle
approche assez de la réalité pour remplacer l’expérience et
conduire à des conclusions assez sûres sur ce qu’est et n’est
pas cette réalité.
 Cependant les deux conditions de validité d’une analyse
longitudinale vont poser des problèmes insolubles sous ce
paradigme.
 Le fait reconnu qu’une population n’est pas homogène conduit
à décomposer la population étudiée en un nombre toujours
croissant de sous-populations plus homogènes. On va alors se
trouver en présence de groupes trop restreints dont le faible
effectif va empêcher toute analyse sérieuse.
 Pour la condition d’indépendance, il n’est pas possible de
considérer les phénomènes indépendamment les uns des
autres. De plus comme le paradigme utilisé ne permet l’étude
que d’un événement et d’un seul, on se trouve dans
l’impossibilité d’étudier les sorties par événements compétitifs
tels que les études de mortalité par cause, de la sortie du
célibat par mariage ou par cohabitation, etc.
 Il est dès lors nécessaire de remettre en cause ce paradigme et
d’en poser un nouveau. Cela se produit au début des années
1980 avec Trussell aux Etats Unis et moi-même en France.
Le paradigme biographique
 Un changement de point de vue est alors nécessaire: on ne va
plus travailler sur des populations homogènes et des
événements indépendants, mais on va étudier les trajectoires
individuelles entre un certain nombre d’états.
 Le nouveau paradigme peut alors s’énoncer ainsi: un individu
parcourt, tout au long de sa vie, une trajectoire complexe, qui
dépend à un instant donné, de sa trajectoire antérieure et des
informations qu’il a pu acquérir dans son passé.
 Les événements étudiés n’ont plus de raison d’être
indépendants entre eux, mais c’est au contraire une analyse de
dépendance entre eux qui constituera l’une des nouveautés de
l’analyse biographique.
 C’est maintenant l’analyse de l’hétérogénéité des populations
sous forme dynamique et non plus statique, comme dans
l’analyse transversale, que va réaliser l’analyse biographique.
Figure 2: Modèle logit indiquant la probabilité de migrer des
agriculteurs et des non agriculteurs norvégiens
0,2
0,15
Probabilité de migrer
 Les modèles utilisés vont permettre
une régression, non plus sur les
données du moment, mais sur des
processus temporels complexes
 Reprenons ici l’analyse précédente
et voyons comment vont migrer les
agriculteurs et les non agriculteurs en
Norvège.
 Cette fois-ci la probabilité de migrer
est de 0,09 pour les agriculteurs
contre 0,15 pour les autres
professions.
 Ce modèle vient donc contredire les
résultats du modèle transversal .
 Il est cependant plus proche de ce
que l’on pourrait attendre des
constatations de coût plus élevé pour
les agriculteurs.
0,1
0,05
0
non agriculteurs
agricuteurs
 Contrairement aux modèles transversaux qui présentaient le
risque d’erreur écologique, ces modèles vont présenter le
risque d’erreur atomiste.
 En effet, le paradigme biographique fait intervenir, pour
expliquer les comportements individuels, les caractéristiques
de l’individu à la fois internes et externes à la démographie.
 On ignore dans ce cas le contexte plus général dans lequel ces
conduites se produisent. Il paraît fallacieux d’isoler l’individu
des contraintes imposées, consciemment ou non, par la
société.
 Ce risque d’erreur a été reconnu depuis 1961 par les
sociologues Lazarsfeld et Menzel, qui montraient la nécessité
de définir avec précision les divers types de groupes,
communautés, organisations, etc.
 En considérant une pluralité de niveaux, nous pouvons quitter
l’approche dualiste qui oppose l’individu à la société. Il n’y a
alors plus de sens à choisir entre holisme et individualisme
pour les sciences sociales.
Le paradigme multiniveau
 Un nouveau changement de point de vue s’est produit
dans certaines sciences sociales environ cinq ans après la
mise en place du paradigme biographique.
 L’approche contextuelle, complétée par une approche
vraiment multiniveau permet de résoudre les problèmes
précédents.
 La première approche va chercher à prédire un
comportement individuel à l’aide à la fois des
caractéristiques individuelles et des caractéristiques de
groupes auxquels ces individus appartiennent.
 Elle permet donc de séparer les effets individuels,
contextuels et écologiques qui jouent sur le phénomène
étudié et de les interpréter correctement.
Figure 3: Modèle contextuel indiquant la
probabilité de migrer des agriculteurs et des
non agriculteurs en fonction de la proportion
d’agriculteurs dans les zones
Non agricult.
Agriculteurs
0,25
0,2
probabilité de migrer
 Reprenons l’exemple précédent en
faisant intervenir non seulement le fait
que l’individu soit agriculteur ou non,
mais également le pourcentage
d’agriculteurs présent dans la région
où il vit dans un modèle logit
contextuel.
 Le fait d’être agriculteur réduit comme
dans le modèle biographique, sa
probabilité de migrer. Mais le fait de
vivre dans une région où le
pourcentage d’agriculteurs est
important va seulement augmenter les
chances de migrer d’un non agriculteur
sans modifier celle d’un agriculteur.
 Cela permet de réconcilier certains
résultats discordants obtenus avec le
paradigme transversal et le paradigme
biographique.
0,15
0,1
0,05
0
0,00
0,05
0,10
Proportion d'agriculteurs
0,15
 Cependant cette combinaison conduit à une interprétation
différente du résultat agrégé. Le fait que la probabilité de migrer
de l’ensemble de la population augmente avec le pourcentage
d’agriculteurs n’est pas la conséquence d’une augmentation de
la probabilité de migrer des agriculteurs, comme l’interprétait
l’analyse transversale. Il s’agit au contraire d’une augmentation
de la probabilité de migrer des autres professions, comme
l’indique l’analyse contextuelle.
 Cependant les modèles contextuels supposent que les
comportements des individus à l’intérieur d’un même groupe
sont indépendants entre eux. En fait il est plus vraisemblable
que le risque encouru par un individu d’un groupe donné
dépende des risques rencontrés par les individus du même
groupe.
 Les modèles multiniveau permettent de répondre correctement
à ces questions.
 Le modèle multiniveau permet de trouver un compromis entre
un modèle n’imposant aucune contrainte à ses estimateurs,
mais ne permettant guère une estimation significative, et un
modèle avec de trop fortes contraintes dont on ne peut guère
tester la validité.
 Les trois graphiques suivants, qui portent les résultats pour
chaque région, illustrent toujours dans le cas norvégien ces
trois possibilité.
 Le premier porte les résultats du modèle contextuel, qui conduit
à des segments tous concourant au même point, illustrant les
contraintes imposées par ce modèle.
 Le second porte les résultats d’un modèle séparé par région:
les probabilités de migrer ne sont significativement différentes
que pour 7 régions sur 19, montrant que ce modèle sans
contraintes n’apporte guère de résultats significatifs.
 Enfin le troisième est un modèle multiniveau qui représente
bien mieux que le modèle contextuel la variété des résultats, et
permet de représenter avec peu de variables, significatives
cette fois-ci, la réalité.
Modèle estimé séparément pour chaque région
Modèle multiniveau
0,3
0,3
0,25
0,25
0,25
0,2
0,2
0,2
0,15
0,15
0,1
0,1
0,05
0,05
0
Non agriculteurs
Agriculteurs
Probabilité de migrer
0,3
Probabilité de migrer
Probabilité de migrer
Modèle contextuel
0
Non agriculteur
0,15
0,1
0,05
Agriculteur
0
Non agriculteur
Agriculteur
 Ce dernier modèle représente toujours correctement
l’effet de la variable contextuelle ‘proportion
d’agriculteurs’ seulement sur la probabilité de migrer
des non agriculteurs. Il va ajouter des variances et
covariances entre les aléas au niveau des zones,
réduites par les caractéristiques contextuelles, mais
toujours significatives. Une telle analyse multiniveau
contextuelle permet de travailler sur des données
biographiques situées dans un espace multiniveau.
 Le nouveau paradigme va donc toujours considérer
que le comportement d’un individu dépend de son
histoire passée, dans toute sa complexité, mais il va
ajouter que ce comportement peut également
dépendre de contraintes extérieures exercées sur
l’individu, que celui-ci en soit conscient ou non.
 Bien entendu cette analyse pose encore certains problèmes.
 Le premier problème touche la pertinence de certains niveaux
d’agrégation habituellement utilisés. Si des niveaux comme
celui du ménage semblent parfaitement pertinents, d’autres
comme certains découpages géographiques peuvent l’être
moins. Cependant c’est sur eux que pose le recueil habituel
des données.
 Le second problème est lié à l’approche finalement individuelle
prise ici: c’est par rapport à l’individu que les différents niveaux
d’agrégation sont pris. Comment expliquer dans ces conditions
les changements survenus dans règles qui prévalent dans les
niveaux supérieurs?
 Le troisième problème est lié à la complexité de la structure
sociale des groupes considérés, qu’il est difficile de considérer
comme homogènes.
 Seule la mise en place d’un paradigme à venir répondra à ces
questions.
Conclusions
 Nous avons ainsi parcouru trois siècles et demi de l’histoire
de la démographie et montré les divers paradigmes
apparus au cours de ce parcours.
 Kuhn en 1962, examinant les différences entre paradigme
newtonien et relativiste, constate que l’on peut être assuré
que les différences entre les paradigmes successifs sont à
la fois nécessaires et inconciliables.
 Il nous parait cependant nécessaire de distinguer entre: a)
cumulativité des paradigmes et b) cumulativité des
connaissances acquises au sein de paradigmes différents.
 A priori non-cumulativité des paradigmes n’exclut pas la
cumulativité des connaissances obtenues au travers de
paradigmes différents.
 Les connaissances de la mécanique classique ne sont pas
annulées par la théorie de la relativité. De même les
connaissances acquises par l’analyse longitudinale ne le sont
pas par l’analyse biographique.
 On peut donc dire que chaque nouveau paradigme vient
compléter le précédent pour pouvoir traiter des cas sortant du
champ de celui-ci, tout en conservant en partie certains
résultats obtenus avec celui-ci.
 Cependant cette conservation n’est que partielle car le nouveau
paradigme permet des raisonnements plus précis et détaillés
que les précédents, comme nous l’a montré l’exemple
norvégien.
 La cumulativité des paradigmes va don être non linéaire, car
les objets traités par les différents paradigmes sont différents
entre eux. Ainsi l’analyse transversale ignore le temps vécu par
un individu, alors que l’analyse longitudinale et biographique
est centrée sur ce temps.
 Ainsi chacun des paradigmes ne permet de raisonner que sur
ses propres objets, mais il est parfaitement cohérent par
rapport à eux, comme les divers ouvrages d’analyse
démographique l’ont montré depuis le XVIIème siècle.
 Il existe cependant une relation non linéaire entre eux qui peut
être interprétée comme une cumulativité.
 Ainsi Agazzi en 1985, dépassant la position de Kuhn, montre
que: le progrès scientifique ne consiste pas en une relation
purement logique entre théories, et en plus cette relation n’est
pas linéaire. Cependant ce progrès existe et peut même être
interprété comme cumulatif, dans la mesure où l’on n’oublie
pas que chaque théorie scientifique est seulement vraie pour
ses propres objets spécifiques.
 Nous ne pouvons pas présenter ici en détail sa démonstration.
Indiquons seulement qu’il distingue deux types d’objets: un
premier qui dépend fortement du contexte de la théorie et un
autre qui constitue sa part référentielle.
 En démographie les divers événements traités constituent la
part référentielle, alors que les relations supposées entre ces
objets en constituent la part contextuelle. Ces relations
dépendent fortement du paradigme utilisé pour les traiter.
 Il en résulte une possibilité de comparaison entre théories car
elles ont la même part référentielle et c’est ce qui en constitue
la cumulativité non linéaire et partielle, car la part contextuelle
est différente.
 Comme le dit Granger en 1994: le fait humain ne peut certes
être scientifiquement connu qu’à travers une pluralité de
géométrals, mais à la condition toutefois que soit
découverte l’opération contrôlable qui le restitue à partir
d’eux stéréoscopiquement.
 Il nous semble que la pluralité des paradigmes observés en
démographie corresponde bien à cette pluralité de géométrals
et que les relations que nous avons dégagées entre eux en
permettent un début de restitution stéréoscopique fort
prometteuse pour l’avenir.
Travaux à consulter
 Agazzi: Commensurability, incommensurability and cumulativity in scientific
knowledge, Erkenntnis, 1985.
 Courgeau et Lelièvre: Analyse démographique des biographies, 1989, Ined.
 Courgeau: Du groupe à l’individu. Synthèse multiniveau, 2004, Ined.
 Courgeau: Paradigmes démographiques et cumulativité, in La cumulativité
du savoir en sciences sociales, 2009, Editions de l’EHESS.
 Courgeau: Probability and social sciences, 2012, Springer.
 Durkheim: Les règles de la méthode sociologique, 1895, Alcan.
 Granger: Formes, opérations, objets, 1994, Vrin.
 Henry: Démographie, analyse et modèle, 1972, Larousse.
 Kuhn: The structure of scientific revolutions, 1962, The University of Chicago
Press.
 Lazarsfeld et Menzel: On the relation between individual and collectives
properties, in Complex organizations, 1961 , Holt, Reinhart, Winston.