Inscription
thomas.vannienwenhove[at]meshs[POINT]frLa technologie moderne a facilité la collecte de très grands ensembles de données. Aujourd'hui, nous générons plusieurs billions d'octets de données chaque jour, caractérisés par une grande dimension et une grande taille d'échantillon et appelées Big Data ou données massives. Au cours des deux dernières décennies, on a assisté à un développement considérable d'outils statistiques capables de gérer d'énormes quantités de données constituées d'une matrice de n vecteurs de données, chacun contenant p mesures, généralement avec de grandes valeurs de n et p. Entre autres, l'analyse de données massives est devenue un champ de la statistique pour la modélisation des données dans ce contexte, en particulier lorsque p≫n.
Ce cours dispensé par Sophie Dabo (professeure des universités en mathématiques appliquées à l'université de Lille-laboratoire LEM) présente les outils statistiques (analyse exploratoire et régression, en grande dimension) modernes permettant d'analyser des données massives ainsi que leur mise en pratique avec le logiciel R.
Cours : 3 séances de 2h - Mise en pratique : 2 séances de 2h
Objectifs
- Savoir extraire l'information de données de grande dimension
- Maîtriser les techniques d’analyses statistiques modernes
- Savoir les mettre en œuvre avec le logiciel R
Pré-requis et publics visés
- Bases en statistique inférentielle, analyse de données et logiciel R
- Publics : tous les chercheurs/chercheuses en SHS et sciences expérimentales intéressé-e-s au traitement de gros volumes d’informations avec des méthodes quantitatives adaptées.
URI/Permalink: