Variations sur l’analyse exploratoire de données

le Vendredi 12 Juin 2009 à l’Ined, salle Sauvy à 14h

Avec le développement de l’informatique et la mise à disposition de larges bases de données, le statisticien se tourne de plus en plus vers des méthodes interactives, intuitives et robustes qui lui permettent d’appréhender la singularité ou la diversité de ses données. La statistique exploratoire, très présente aujourd’hui dans le Data Mining largement ancré dans les entreprises, s’est développée au cours des trente dernières années et est aujourd’hui intégrée dans les principaux logiciels de statistique (module Sas-Insight, module Stat-Studio, SPSS, Spad, logiciel R etc.). La démarche exploratoire, qui rehausse le graphique et la robustesse comme éléments centraux d’appréciation d’une analyse statistique, met le statisticien au centre de ses données et lui permet d’en comprendre la structure et la complexité.
Statistique exploratoire et statistique confirmatoire (modélisation) ont souvent été opposées, pourtant ces deux démarches sont complémentaires, c’est cette articulation que les présentations suivantes essaierons notamment de mettre en évidence.

* La place de John W. TUKEY au sein de la statistique exploratoire - Monique LE GUEN (CES-Matisse, Université Paris 1)
* La statistique visuelle - Eugène HORBER (Université de Genève)
* Apports de la statistique exploratoire dans le cadre de la régression linéaire - Josiane CONFAIS (Isup)
* Classification de séries temporelles : application à la prévision - Dominique LADIRAY (Insee, Chef du département Statistiques de Court Terme)

A l’issue d’une discussion générale, des questions pratiques sur la mise en œuvre pourront être abordées.