Traitement des données manquantes
Imputation, MIVQUE et préservation des relations entre variables
Les données manquantes représentent souvent un cauchemar pour tout
statisticien confronté à une analyse de ses données. La non-réponse
dans les enquêtes peut en effet affecter significativement les
estimateurs calculés.
Après avoir défini différents types de non-réponse rencontrés dans
les fichiers d’enquêtes, cette séance se propose de présenter dans
un premier exposé quelques solutions à mettre en œuvre pour la
correction de non-réponse. Le cas des données manquantes en analyse
de données sera ensuite présenté dans le cas de variables
catégorielles, par adaptation de l’algorithme NIPALS. Enfin, un
dernier exposé présentera la mise en œuvre d’une méthode
d’imputation jointe, par régression aléatoire, visant à préserver
les relations entre variables tout en évitant la variance dite
d’imputation.
- Guillaume CHAUVET (Ensai (Crest))Exposé introductif : Méthodes de correction de la non-réponse dans les enquêtes
- Christian DERQUENNE (EDF R&D - Département OSIRIS) : Données manquantes et algorithme NIPALS : le cas des variables catégorielles
- Brigitte GELEIN (Ensai) : Imputation, MIVQUE et préservation des relations entre variables