Gallicagram : un outil de lexicométrie pour explorer de grands corpus diachroniques
Gallicagram : un outil de lexicométrie pour explorer de grands corpus diachroniques
Intervenant : Benoit de Courson (doctorant en sciences sociales à l’institut Max Planck de Freiburg, Allemagne) ; discutante : Claire-Lise Gaillard (post-doctorante chercheuse Ined UR04 : Genre, sexualité et inégalités)
Gallicagram est un logiciel de lexicométrie, destiné à mesurer l’évolution au cours de temps de la fréquence de mots ou syntagmes dans de grands corpus. Pour parer aux écueils, largement documentés, de Ngram Viewer, il se concentre sur des corpus de périodiques homogènes et, dans la mesure du possible, sur des corpus ouverts. On y trouvera notamment la presse de Gallica, les archives du journal Le Monde, ou encore les revues de la plateforme Persée (la RFS, les Annales, les Actes...). Ses bases de données de fréquences d’occurrence sont accessibles par API. La séance illustrera les mérites et limites de l’application. Elle développera (selon le temps disponible) trois exemples : les grèves sous la IIIe République entre Gallica et Charles Tilly, le taux de masculinité dans Le Monde depuis 1945 et une illustration de la récente thèse de Bernard Lahire, "l’oubli du réel" en sociologie.
Biographie de Benoît de Courson :
Benoît de Courson est doctorant en sciences sociales à l’institut Max Planck de Freiburg. Sa thèse porte sur le lien entre pauvreté et criminalité. En dehors de sa thèse, il a créé avec Benjamin Azoulay la plateforme Gallicagram.