Analyse biographique

Principe

Ces méthodes sont utilisées depuis de nombreuses années en épidémiologie, et ont été utilisées et adaptées à partir des années 1980 en démographie (Courgeau et Lelièvre, 1989). L’analyse des biographies permet de traiter des données longitudinales censurées. Ces données peuvent notamment être obtenues dans des enquêtes comportant un volet rétrospectif, décrivant l’histoire résidentielle, familiale ou professionnelle de l’individu. On peut alors étudier l’éventuelle survenue d’un évènement dans le cycle de vie d’un individu en fonction de ses caractéristiques.

On distinguera les méthodes non paramétriques, paramétriques, et semi-paramétriques. L’utilisation de méthodes non paramétriques permet notamment d’étudier la forme de la fonction de survie, et les différences dans le calendrier et l’intensité de survenue de l’évènement en fonction de variables de stratification. La méthode semi paramétrique (modèle de Cox) permet quant à elle d’effectuer une modélisation et de mesurer l’impact de variables explicatives, fixes ou dépendantes du temps, sur le quotient instantané. La méthode de régression logistique à temps discret permet, quant à elle, d’obtenir une modélisation sur un fichier individus-années dans le cas de données recueillies de manière discrète.

Applications logicielles

La mise en œuvre à partir du logiciel Sas® se fait via la procédure lifetest dans le cadre de méthodes non paramétriques, phreg dans le cadre de modèle de Cox, et lifereg dans le cadre de modèles paramétriques.
Le logiciel Stata® nécessite de prédéfinir par l’instruction stset la base de données de durée à analyser (définition de la variable de durée et de la condition de censure d’une observation). Une batterie de fonction permettent ensuite d’analyser de manière exploratoire et non paramétriques cette base de durée (stdes, sts list, sts graph …), et les modèles de Cox sont mis en œuvre par une instruction stcox, les modèles paramétriques par une instruction streg en définissant une distribution pour la fonction de survie.
Le package survival permet de mettre en œuvre ce type d’analyse dans le logiciel R.

Exemple de graphique

Le graphique suivant est publié dans l’ouvrage « Analyse Démographique des biographies » (Courgeau et Lelièvre, 1989) et illustre une utilisation des fonctions de séjour.

Références bibliographiques (théorie)

  • Allison, P.D. (1984). Event history analysis: regression for longitudinal event data (Sage Publ.).
  • Blossfeld, H.-P., and Rohwer, G. (2002). Techniques of event history modeling: new approaches to causal analysis (New York: Lawrence Erlbaum Associates).
  • Courgeau, D. (1992). Event History Analysis in Demography (Clarendon Press).
  • Courgeau, Daniel, and Eva Lelièvre. 1989. Analyse démographique des biographies. INED.
  • Cox, D.R., and Oakes, D. (1984). Analysis of Survival Data (Chapman and Hall).
  • Hosmer, D.W., Lemeshow, S., and May, S. (2008). Applied survival analysis: regression modeling of time-to-event data (Hoboken, N.J.: Wiley-Interscience).

Références bibliographiques (mise en œuvre)

  • Allison, Paul David. 2010. Survival Analysis Using the SAS® a Practical Guide. Cary (N.C.): SAS Pub.
  • Blossfeld, Hans-Peter, Katrin Golsch, and Gotz Rohwer. 2007. Event History Analysis With Stata. Psychology Press.
  • Cleves, Mario, William Gould, Roberto Gutierrez, Yulia Marchenko, and &. 1. more. 2010. An Introduction to Survival Analysis Using Stata, Third Edition. 3 edition. College Station, Tex: Stata Press.

 

Références bibliographiques (Applications)

  • Beaujouan, Eva. 2011. “La fécondité des deuxièmes unions en France : âges des conjoints et autres facteurs.” Population 66(2):275.
  • Meron, M., and I. Widmer. 2002. “Les femmes au chômage retardent l’arrivée du premier enfant.” Population 57(2):327–57.