Henri Leridon
référent intégrité scientifique pour l’Ined, nous parle de la charte Ined sur l’ouverture des données d’enquêtes (science ouverte).
(Entretien réalisé en mai 2021)
Que recouvre le principe d’ouverture des données notamment énoncé dans la loi d’octobre 2016 pour une République numérique ?
Ce texte prévoit que, dès lors que les données ont été collectées sur financement public (national ou européen), qu’elles « ne sont pas protégées par un droit spécifique ou une réglementation particulière » et qu’elles « ont été rendues publiques par le chercheur, l’établissement ou l’organisme de recherche », alors « leur réutilisation est libre ». Le principe d’une ouverture des données est donc clairement énoncé, mais ses modalités ne sont pas précisées : il faut seulement qu’elles aient été rendues publiques.
La charte Ined propose donc un cadre pour cette mise à disposition, laquelle suppose d’abord que soit constitué un fichier numérique dans un format accessible, et que les données aient été vérifiées et documentées. Sans cela, les données « n’existent » pas vraiment. On peut ensuite convenir d’une durée d’embargo pendant laquelle les données ne seront accessibles qu’aux concepteurs et réalisateurs de l’enquête qui peuvent légitimement prétendre à un accès prioritaire car celles-ci n’auraient pas existé sans leur travail (de souvent plusieurs années). Cette durée doit évidemment être limitée : la charte prévoit un maximum de trois ans depuis la fin de la collecte, sauf dérogation.
Quels sont les enjeux de la mise à disposition de données comme celles que collecte l’Ined, à savoir, des données d’enquêtes quantitatives en sciences sociales portant sur des personnes ?
L’Ined a toujours été, et continue d’être, un remarquable collecteur de données, avec des méthodologies toujours améliorées et qui en font un des meilleurs organismes d’enquêtes en sciences sociales. Ses chercheurs travaillent souvent en association avec ceux d’autres établissements. Ils disposent donc d’excellents matériaux pour faire avancer la recherche dans les domaines qui sont les leurs, à condition qu’on leur en donne les moyens. Quant au stock de données ainsi créé, il importe qu’il soit accessible à l’ensemble de la communauté des chercheurs, en France comme à l’étranger, afin qu’il continue d’être exploité de façon aussi intensive que possible. C’est la seconde responsabilité de l’Institut, et c’est encore dans l’intérêt des concepteurs d’enquête que leurs données soient le plus possible valorisées ! Tout ceci suppose que les données aient été documentées de façon détaillée pour éviter toute mauvaise interprétation par des utilisateurs secondaires, notamment par un mauvais usage des pondérations.
Et en pratique ?
Pour tout projet d’enquête, les auteurs doivent préparer un « plan de gestion des données » prévoyant les conditions d’élaboration et de stockage du fichier des données collectées comme par exemple leur dépôt sur la plate-forme Quetelet-Progedo. Ils doivent aussi satisfaire aux conditions du RGPD européen (Règlement général pour la protection des données), qui visent notamment à s’assurer du consentement des personnes interrogées et du respect de leur anonymat après la collecte. Ils doivent enfin convenir avec la Direction de l’établissement de la durée d’embargo à appliquer, compte tenu des spécificités de l’enquête projetée. Ils pourront ainsi exploiter leurs données sans pression excessive pendant la durée de l’embargo, tout en respectant les objectifs de la « science ouverte ».