Sequence analysis
Principe
Les enquêtes démographiques permettent aujourd’hui de collecter des informations permettant de retracer la trajectoire d’individus, par exemple dans le domaine professionnel, familial ou résidentiel. Cette information peut être collectée de manière prospective (cas des panels par exemple), ou rétrospective (enquêtes biographiques). L’analyse de séquence permettra de décrire et classifier les trajectoires des individus, en considérant chaque trajectoire d’un individu comme une suite d’états dans un espace fini de modalités. Ainsi, on pourra étudier la trajectoire familiale en définissant la composition de la famille d’appartenance de chaque individu à chaque âge (seul, en couple sans enfant, en couple avec enfant, famille monoparentale …).
Un certain nombre de graphiques (chronogramme, tapis) permettront de visualiser les trajectoires les plus fréquentes ou l’hétérogénéité des trajectoires. Diverses méthodes, analyse harmonique qualitative ou optimal matching (Robette et Thibault, 2009), permettront in fine d’opérer une classification afin de regrouper des trajectoires similaires.
La méthode d’optimal matching (Abbott, 1995) se base sur le calcul d’un coût représentant le nombre d’opérations minimal (de type insertion, destruction, substitution d’état) pour transiter d’une trajectoire d’un individu 1 à la trajectoire d’un individu 2. Il en résulte une matrice de coûts, synthèse sur l’ensemble des individus sur laquelle sera opérée la classification.
Applications logicielles
La mise en œuvre à partir du logiciel R se fait via le module Traminer, développé à l’université de Genève (http://mephisto.unige.ch/traminer/ ).
Exemples de graphique
Les exemples ci-dessous, publiés par N. Robette, dans l’ouvrage publié au Ceped en 2011 «Explorer et décrire les parcours de vie: les typologies de trajectoires» donnent une image de chronogramme et de tapis. Le premier graphique représente la part, âge par âge, d’individus encore présents dans chacune des 3 grandes catégories (Etudiants, chômeurs ou inactifs, en emploi). Le second graphique superpose les trajectoires individuelles de l’ensemble des individus.
Bibliographie théorique
- Abbott, A. 1995. “A comment on ‘Measuring the agreement between sequences.’” Sociological Methods & Research 24(2):232–43.
- Deville, J.-C. Analyse harmonique du calendrier de constitution des familles en France. Population 32(1) (1977), 17–63.
- Elzinga, C. H. 2003. “Sequence Similarity A Nonaligning Technique.” Sociological Methods & Research 32(1):3–29.
- Halpin, B. 2010. “Optimal matching analysis and life-course data: the importance of duration.” Sociological Methods & Research 38(3):365–88.
- Lesnard, Laurent, and Thibaut (de) Saint Pol. 2006. “Introduction aux méthodes d’appariement optimal (Optimal Matching Analysis).” Bulletin de méthodologie sociologique 90(1):5–25.
- Robette, N., and N. Thibault. 2009. “Analyse harmonique qualitative ou méthodes d’appariement optimal?” INED - Population (F) 63(4):621–46.
- Abbott, Andrew. 1995. “Sequence Analysis: New Methods for Old Ideas.” Annual Review of Sociology 21:93–113.
Bibliographie appliquée
- Bonvalet, Catherine, and Arnaud Bringé. 2010. “Les trajectoires socio-spatiales des Franciliens depuis leur départ de chez les parents.” Temporalités. Revue de sciences sociales et humaines.
- Morand, E., and L. Toulemon. 2009. “Analyse des séquences et Optimal Matching : Le passage à l’âge adulte des Femmes et des Hommes en France.” Paris: Xème Journées de Méthodologie Statistique de l’Insee, 23–25 mars 2009
- Robette N., 2011, Explorer et décrire les parcours de vie: les typologies de trajectoires, CEPED ("Les Clefs pour"), 86 p. (pdf)