Analyse multiniveau

Principe

La modélisation de comportements individuels peut être effectuée non seulement en fonction de caractéristiques individuelles, mais aussi de données contextuelles qui vont influencer de manière similaire tous les individus soumis au même contexte.

L’analyse multiniveau, dans ce cadre, vise à s’affranchir de l’erreur écologique (erreur qui consisterait à interpréter au niveau individuel les résultats d’une modélisation effectuée à un niveau agrégé) et de l’erreur atomiste (ignorer le contexte dans lequel évolue l’individu et étendre à la dimension du contexte un ensemble d’effets individuels).

On distinguera les modèles à constante aléatoire (l’effet des variables explicatives est le même dans chacun des contextes, seul change l’effet moyen de chaque contexte par rapport à l’ensemble), et les modèles à pente aléatoire ou l’effet d’une variable est considéré différent selon l’unité contextuelle analysée. Ne pas prendre en compte un effet multiniveau revient notamment à sous-estimer la variance des effets contextuels, et donc surestimer leur significativité.

Ces méthodes ont été initiées et développées notamment dans les sciences de l’Education (Goldstein, 1995), où la notation d’un élève dépend non seulement de ses caractéristiques, mais aussi de paramètres propres à son environnement scolaire (professeur, classe). Elles ont fait l’objet de nombreuses publications en démographie (Courgeau, 2004), (Courgeau et Baccaïni, 1997).

Type de données analysées

Des données contextuelles seront intégrées aux variables explicatives lors de la modélisation, soit exogènes (provenant d’une source administrative distincte), soit endogènes (calcul de proportion sur une région par exemple à partir des données individuelles d’enquête).

Applications logicielles

La mise en œuvre à partir du logiciel Sas® se fait via la procédure mixed dans le cadre linéaire, les procédures glimmix et nlmixed dans le cadre non linéaire.

Le logiciel Stata® possède plusieurs fonctions permettant de mettre en œuvre les modèles à effets aléatoires (xtmixed dans le cadre linéaire, xtmelogit et xtpoisson par exemple dans le cadre non linéaire).

Les packages lme4 (cadre linéaire) et nlme4 (cadre non linéaire) permettent quant à eux la mise en œuvre dans le cadre du logiciel R.

Bibliographie théorique

  • Courgeau, D. 2004. Du groupe à l’individu: synthèse multiniveau. Institut national d’études démographiques.
  • Goldstein, H. 1995. Multilevel Statistical Models. Edward Arnold.
  • Snijders, T. A. B., and R. J. Bosker. 2012. Multilevel Analysis: An Introduction to Basic and Advanced Multilevel Modeling. Los Angeles: Sage.

Bibliographie appliquée

  • Courgeau, Daniel, and Brigitte Baccaïni. 1997. “Analyse Multi-Niveaux En Sciences Sociales.” Population (French Edition) 52(4):831–63.
  • Rabe-Hesketh, S., and Anders Skrondal. 2005. Multilevel and Longitudinal Modeling Using Stata. College Station, Tex.: Stata Press.
  • Singer, Judith D., and John B. Willett. 2003. Applied Longitudinal Data Analysis: Modeling Change and Event Occurrence. Oxford; New York: Oxford University Press.
  • Wang, Jichuan, Haiyi Xie, and James H. Fisher. 2011. Multilevel Models: Applications using SAS. Walter de Gruyter.

Exemples d’articles

  • Schoumaker, B. 2001. “Une analyse multiniveaux dynamique de la fécondité légitime au Maroc rural.” Salvador, BR.
  • Testa, M. R., and L. Grilli. 2006. “L’influence des différences de fécondité dans les régions européennes sur la taille idéale de la famille.” Population 61(1):107–37.