M2 Data Sciences

Apply for the degree
  • Places available
    10
  • Language(s) of instruction
    French
Présentation
Objectives

Les grands acteurs du monde économique ont aujourd’hui une conscience de plus en plus précise du potentiel que recèlent leurs données et recherche les moyens d’exploiter et d’en tirer le maximum d’informations utiles. Pour les aider dans cette tâche, les datascientists (littéralement les scientifiques des données) sont les personnes en charge de récupérer, stocker, organiser, traiter cette masse d’informations afin d’en tirer de la valeur et de créer des outils d’aide à la décision automatisés avec des techniques d’intelligence artificielle.

L’objectif du M2 "Data Sciences - Intelligence Artificielle" est de préparer les étudiant.e.s à devenir les datascientists de demain aussi bien dans le monde académique que dans le monde industriel.

Le programme d’enseignement souhaite combler le déficit en experts dans ce secteur aujourd’hui stratégique. Il couvre toutes les facettes du Big Data et les connexions avec l’intelligence articifielle : mathématiques, en particulier statistique et optimisation, machine learning et intelligence articifielle, informatique des grandes structures de données. De nombreux modules sont issus de recherches en cours.

Location
PALAISEAU
Course Prerequisites
Le M2 "Data Sciences - Intelligence Artificielle" est ouvert aux étudiant.e.s ayant un master 1 en mathématiques ou informatique de l'université Paris Saclay, et en particulier aux étudiant.e.s ayant suivi le M1 Mathématiques Appliquées ou le M1 Mathématiques Fondamentales. Les étudiants hors Paris Saclay doivent candidater au master Data Science de l'Institut Polytechnique de Paris avec lequel le M2 "Data Sciences - Intelligence Artificielle" est co-accrédité.
Skills
  • Maîtriser et mettre en oeuvre des outils et méthodes mathématiques de haut niveau, en particulier dans le domaine du machine learning et de l'intelligence artificielle.

  • Comprendre et modéliser mathématiquement un problème afin de le résoudre.

  • Maîtriser des outils numériques et langages de programmation de référence, en particulier dans le cadre de données volumineuses.

  • Analyser des données et mettre en oeuvre des simulations numériques.

  • Analyser un document de recherche en vue de sa synthèse et de son exploitation.

  • Expliquer clairement une théorie et des résultats mathématiques.

Post-graduate profile

Les étudiant.e.s issu.e.s de la formation sont des Datascientists doté.e.s d'un profil issu de la convergence des statistiques et de l’informatique, caractérisé par la variété des compétences maîtrisées. Il s’agit d’un profil hybride, disposant d’un solide bagage en mathématiques, statistiques, optimisation, mais aussi maîtrisant les outils informatiques ou les infrastructures nécessaires à la gestion et au traitement des données.
Ils sont à la pointe des méthodes de machine learning et d'intelligence artificielle pour l'aide à la décision et savent prendre du recul sur leurs utilisations tout en suivant leur rapide évolution.

Career prospects

Datascientist dans le monde industriel ou dans le monde académique.
Une partie des étudiant.e.s s’oriente vers une thèse en entreprise ou académique

Collaboration(s)
Laboratories

Laboratoire de mathématiques d'Orsay.

Centre de Mathématiques Appliquées (IPP)
Laboratoire Traitement et Communication de l'Information
Centre de recherche en économie et statistique.

Programme

Le S3 est dédié à la mise en place des outils et concepts de l'apprentissage et du machine learning. Le seul module obligatoire est le Data Camp. Les autres modules sont à la carte.

Matières ECTS Cours TD TP Cours-TD Cours-TP TD-TP A distance Projet Tutorat
Data Camp 5 40
Matières ECTS Cours TD TP Cours-TD Cours-TP TD-TP A distance Projet Tutorat
UE d'ouverture 2 2.5 20
UE d'ouverture 1 2.5 20
Statistique en grande dimension 2.5 20
Statistical Learning Theory 2.5 20
Reinforcement learning 2.5 20
Partially observed Markov chains in signal and image 2.5 20
Optimization practice for Data Science 5 40
Non parametric estimation 2.5 20
Modèles à chaînes de Markov cachées 2.5 20
Machine Learning 2.5 20
Introduction to Graphical Models 2.5 20
Introduction to Bayesian learning 2.5 20
Introduction au deep learning 2.5 20
High dimensional matrix estimation 2.5 20
Generalisation properties of algorithms in ML 2.5 20
Convex Analysis and Optimization Theory 5 40
Computer Vision 2.5 20
Bootstrap and resampling methods in machine learning 2.5 20
Big Data Framework 5 40
Bayesian Learning in partially observerd evolving graphical models 2.5 20
Apprentissage et optimisation Séquentiels 5 40

Le S4 permet l'approfondissement théorique et la mise en oeuvre applicative. Le stage est obligatoire, les autres modules sont à la carte.

Matières ECTS Cours TD TP Cours-TD Cours-TP TD-TP A distance Projet Tutorat
Stage 20
Matières ECTS Cours TD TP Cours-TD Cours-TP TD-TP A distance Projet Tutorat
UE d'ouverture 4 2.5 20
UE d'ouverture 3 2.5 20
Tail events analysis: Robustness, outliers and models for extreme values 2.5 20
Structured Data : learning and prediction 2.5 20
Stochastic approximation and reinforcement learning 2.5 20
Recherche opérationnelle et données massives 5 20
Optimisation non différentiable et méthodes proximales 2.5 20
Multi-object estimation and filtering 2.5 20
Mixed effects models: methods, algorithms and applications in life sciences 2.5 20
Missing Data and causality 2.5 20
Kernel Techniques with Information Theoretical Applications 2.5 20
Introduction to compressive sensing 2.5 20
Geometric methods in machine learning 2.5 20
Deep learning II 2.5 20
Modalités de candidatures
Application period
From 15/04/2020 to 05/07/2020
Compulsory supporting documents
  • Curriculum Vitae.

  • Motivation letter.

  • All transcripts of the years / semesters validated since the high school diploma at the date of application.

Additional supporting documents
  • VAP file (obligatory for all persons requesting a valuation of the assets to enter the diploma).

Contact(s)
Course manager(s)
Administrative office