La grande régression
Présenté par : Julien Boelaert (Ceraps, Université de Lille) ; Discutant : Ewen Gallic (Aix-Marseille Université)
Que peuvent faire les sciences sociales avec le machine learning, et que peut-il leur faire ? Cette présentation propose une introduction à cette classe de méthodes statistiques. Elle détaille ses prémisses, sa logique, et les défis qu’elle pose pour les sciences (sociales), au moyen d’une comparaison avec d’autres approches quantitative plus conventionnelles, les régressions paramétriques en premier lieu, et ce tant au niveau général qu’en pratique. Au-delà de l’exercice méthodologique, l’article se propose de revenir sur les débats houleux qui entourent le learning. Il soutient que la révolution promise par beaucoup et crainte par d’autres ne se produira pas de sitôt, ou en tout cas pas dans les termes souvent mentionnés. Le changement de paradigme évoqué de manière prophétique n’aura pas lieu. Plutôt, une concurrence accrue entre différentes formes de quantification du monde social va se mettre en place. Contre toute attente, cette incertitude croissante pourrait être de bon augure pour la connaissance en général.
On évoquera enfin l’un des domaines de la quantification pour lequel l’apprentissage statistique pourrait jouer un rôle important dans les années à venir : la production et l’enrichissement de données. A titre d’exemple, on présentera une procédure permettant de corriger le décompte des couples de même sexe au recensement, mise au point à l’Ined en 2018.
Julien Boelaert
Julien Boelaert est maître de conférences en science politique à l’université de Lille. Depuis sa thèse en économie, soutenue en 2012, il s’intéresse aux méthodes d’apprentissage statistique, tant pour les utiliser dans des travaux empiriques en sciences sociales que pour réfléchir au rôle qu’elles ont à jouer dans ces sciences.