M2 DataScale : Gestion de données et extraction de connaissances à large échelle

Candidater à la formation
  • Capacité d'accueil
    40
  • Langue(s) d'enseignement
    Français, Anglais
  • Régime(s) d'inscription
    Formation initiale
Présentation
Objectifs pédagogiques de la formation

Le parcours DataScale se focalise sur l'étude et la maîtrise des nouvelles architectures de gestion de données et d'extraction de connaissances, dont l'échelle varie des très grands serveurs de données (data centers) aux myriades d'objets connectés (edge computing). Il ambitionne d'apporter aux étudiants une compréhension fine des défis technologiques et scientifiques liés à la conception de ces nouvelles architectures et au développement d'applications Big Data les exploitant. Doivent être pris en compte tout autant la complexité, l'hétérogénéité, et la distribution des données et des traitements que la fiabilité, la sécurité et les performances des gestionnaires de données (RDBMS ou NoSQL) sous-jacents.

Les compétences acquises à l'issue de la formation s'articulent autour de 3 axes : (1) architectures pour le big data, le cloud et l'IoT, sécurité et performance, (2) intégration et qualité des données, fouille de donnée et extraction de connaissances, (3) développement et déploiement de services et d'applications data-driven. Les étudiants reçoivent en tronc commun une formation commune fondamentale sur les 3 axes cités. Ce tronc commun est complété par des UE optionnelles couvrant des thèmes variés tels que la fouille de données, la confidentialité des données, le Web sémantique, le cloud computing, la gestion de données ambiantes, l'internet des objets ou encore les frameworks de développement d'applications en ouvrant sur les perspectives recherche associées à ces différents thèmes.

Lieu(x) d'enseignement
EVRY
VERSAILLES
Pré-requis, profil d’entrée permettant d'intégrer la formation

Le parcours DataScale est proposé en formation initiale uniquement. Les pré-requis correspondent à un niveau équivalent à celui d'un master 1 en informatique français avec de solides notions en bases de données. Les profils typiques d'étudiants intégrant la formation DataScale sont : étudiants ayant obtenu un master 1 informatique en France, étudiants d'écoles d'ingénieurs partenaires effectuant leur dernière année en double cursus, étudiants ayant déjà obtenu un diplôme d'ingénieur ou de master informatique à l'étranger.

Compétences
  • Déployer, utiliser et administrer une infrastructure de gestion de données à large échelle.

  • Extraire, analyser et exploiter l’information et la connaissance stockées dans une infrastructure de gestion de données à large échelle.

  • Développer et déployer des applications de gestion de données orientés services.

  • Produire et présenter un état de l’art et conduire une démarche scientifique.

Profil de sortie des étudiants ayant suivi la formation

A l'issue de leur formation, les étudiants devront maîtriser 3 grandes compétences en relation directe avec les trois piliers de la formation, à savoir :
-Déployer, utiliser et administrer une infrastructure de gestion de données à large échelle
-Extraire, analyser et exploiter l’information et la connaissance stockées dans une infrastructure de gestion de données à large échelle
-Développer et déployer des applications de gestion de données orientés services
Ils devront en outre être en capacité de produire et présenter un état de l’art et de conduire une démarche scientifique sur un sujet donné.

Ces compétences sont acquises au travers d'UEs de tronc commun et d'options leur apportant un savoir académique ciblé, de projets complétant la formation par un savoir empirique, de séminaires ouvrant les étudiants sur des sujets et pratiques issus du monde de la recherche, de l'industrie et des services et enfin d'un stage de longue durée confrontant les savoirs acquis à la réalité terrain.

Débouchés de la formation

La formation conduit les étudiants vers des carrières de cadres et cadres supérieurs en informatique dans l'industrie et les services ou de carrières tournées vers la recherche et la R&D en gestion de données dans les universités, les organismes de recherche privés et publics, les grandes entreprises et les start-up. Les étudiants peuvent poursuivre leurs études après l'obtention du master et s'inscrire en doctorat.

Les étudiants seront particulièrement armés pour accomplir des missions telles que : administration de bases de données (DBA), administration de la sécurité des systèmes d'information (DSA), analyse de données (data scientists), urbanisation de systèmes d'information, conception et déploiement d'appliun savoir empirique et cations distribuées, etc.

Contexte Covid-19 (rentrée académique 2020-2021 pour cette formation)

Proposition de formation entièrement en distanciel jusqu'à fin décembre 2020 pour les étudiants internationaux retenus hors de France

Plus d'informations

--------------------------------------------------------------

Informations sur la rentrée 2020-2021
- Réunion de rentrée : lundi 19 octobre 2020 à 9h30, Amphi B, bâtiment Descartes, UFR des Sciences de l'UVSQ (http://www.uvsq.fr/acceder-au-campus-des-sciences-a-versailles-405040.kjsp?RH=1501069813329)


- Calendrier annuel prévisionnel :

- Emploi du temps prévisionnel du tronc commun :

-------------------------------------------------------------

Collaboration(s)
Laboratoire(s) partenaire(s) de la formation

Inria Saclay-Île-de-France.

Données et Algorythmes pour une Ville Intelligente et Durable
Services répartis, Architectures, MOdélisation, Validation, Administration des Réseaux.

Programme

Le semestre 1 est composé d'un Tronc Commun (6 UE) et d'Options (6 UE au choix).

Matières ECTS Cours TD TP Cours-TD Cours-TP TD-TP A distance Projet Tutorat
Qualité des données 2.5 21
Modèles et éco-systèmes Post-Relationnels 2.5 15 6
Machine Learning 2.5 21
Intégration de données 2.5 21
Architectures orientées Services 2.5 15 12
Architectures des gestionnaires de données 2.5 18 3
Matières ECTS Cours TD TP Cours-TD Cours-TP TD-TP A distance Projet Tutorat
Web sémantique 2.5 21
Sûreté, Sécurité Informatique et Fiabilité 2.5 21
Sécurité des données corporate et personnelles 2.5 21
Modélisation de processus métiers 2.5 15 6
Gestion et analyse de données spatio-temporelles 2.5 21
Gestion de données et de services dans le cloud 2.5 15 6
Gestion de données ambiantes et internet des objets 2.5 21
Frameworks pour le développement d'applications Web avancées 2.5 15 6
Fouille de données et analyse prédictive 2.5 12 12

Le second semestre est composé principalement d'un stage de 5 mois ainsi que d'un groupe d'UE professionnalisantes composé d'une UE d'anglais, une UE de connaissance de l'entreprise, une UE de séminaires industriels/recherche et d'un projet annuel.

Matières ECTS Cours TD TP Cours-TD Cours-TP TD-TP A distance Projet Tutorat
Séminaires Industriels et Recherche 1 20
Projet Programmation 1.5 1.5
Projet Conception 1.5 1.5
Connaissance du monde du travail 2 21
Anglais 3 27
Matières ECTS Cours TD TP Cours-TD Cours-TP TD-TP A distance Projet Tutorat
Stage 21 2
Modalités de candidatures
Période(s) de candidatures
Du 03/02/2020 au 17/07/2020
Pièces justificatives obligatoires
  • Curriculum Vitae.

  • Lettre de motivation.

  • Tous les relevés de notes des années/semestres validés depuis le BAC à la date de la candidature.

Pièces justificatives complémentaires
  • Dossier VAPP (obligatoire pour toutes les personnes demandant une validation des acquis pour accéder à la formation).

  • Attestation de français (obligatoire pour les non francophones).

Contact(s)
Responsable(s) de la formation
Philippe PUCHERAL - philippe.pucheral@uvsq.fr
Zoubida Kedad-Cointot - zoubida.kedad@uvsq.fr