Variations sur l’analyse exploratoire de données
Avec le développement de l’informatique et la mise à disposition
de larges bases de données, le statisticien se tourne de plus en
plus vers des méthodes interactives, intuitives et robustes qui lui
permettent d’appréhender la singularité ou la diversité de ses
données. La statistique exploratoire, très présente aujourd’hui
dans le Data Mining largement ancré dans les entreprises, s’est
développée au cours des trente dernières années et est aujourd’hui
intégrée dans les principaux logiciels de statistique (module
Sas-Insight, module Stat-Studio, SPSS, Spad, logiciel R etc.). La
démarche exploratoire, qui rehausse le graphique et la robustesse
comme éléments centraux d’appréciation d’une analyse statistique,
met le statisticien au centre de ses données et lui permet d’en
comprendre la structure et la complexité.
Statistique exploratoire et statistique confirmatoire
(modélisation) ont souvent été opposées, pourtant ces deux
démarches sont complémentaires, c’est cette articulation que les
présentations suivantes essaierons notamment de mettre en
évidence.
* La place de John W. TUKEY au sein de la statistique
exploratoire - Monique LE GUEN (CES-Matisse, Université Paris
1)
* La statistique visuelle - Eugène HORBER (Université de
Genève)
* Apports de la statistique exploratoire dans le cadre de la
régression linéaire - Josiane CONFAIS (Isup)
* Classification de séries temporelles : application à la prévision
- Dominique LADIRAY (Insee, Chef du département Statistiques de
Court Terme)
A l’issue d’une discussion générale, des questions pratiques sur la mise en œuvre pourront être abordées.