Aller au contenu principal

M1 - Data Science - Alternance

Candidater à la formation
  • Capacité d'accueil
    25
  • Langue(s) d'enseignement
    Français
  • Régime(s) d'inscription
    Formation en apprentissage
Présentation
Objectifs pédagogiques de la formation

Dans les projets « big data » industriels (e.g. e-santé, IoT), 80 % du coût sont liés à des problématiques d’ingénierie du logiciel, telles que la récolte, le stockage, la sécurisation et à la mise en forme des données. Seulement 10% sont dédiés à l’analyse de l’information et les 10% restants à la visualisation de cette information.

Ce parcours Data Science propose donc de fournir les compétences nécessaires pour gérer toute la chaîne de valeur partant des données à l’information pertinente, avec une partie importante sur la gestion et la préparation des données (stockage, partage, extraction, sécurisation, mise en forme, visualisation, ...) pour rendre l’information plus facile à exploiter, protéger et valoriser.

Le Master offre aux étudiants des bases théoriques et pratiques solides qui leur permettront de s’insérer facilement dans le monde industriel ou d’intégrer des organismes de la recherche publique ou privée pour s’orienter vers le monde de la recherche théorique ou appliquée de haut niveau.

En termes de compétences que la formation donnera aux étudiants, l’évolution de l’informatique, avec la présence de ces grandes masses de données, oblige à repenser le paradigme informatique. L’ingénieur doit savoir appréhender des interfaces différentes liées à la mobilité et à des environnements hétérogènes. Les transferts d’information deviennent complexes et nécessitent des compétences mêlant le réseau et la sécurité. L’extraction d’information requiert des techniques spécifiques et des algorithmes évolués. Quant à l’analyse de grandes masses de données, elle ne peut se faire sans connaissance de modèles et techniques mathématiques et informatiques, tant pour la pertinence de l’information résultante que pour sa représentation et sa visualisation.

Lieu(x) d'enseignement
ORSAY
GIF SUR YVETTE
PALAISEAU
Pré-requis, profil d’entrée permettant d'intégrer la formation

Diplômés d’une licence en informatique ou analogue.

Modalités pédagogiques particulières

Rythme d’alternance :  3 semaines à l'Université, 4 semaines en Entreprise

Compétences
  • Gérer toute la chaîne de valeur partant des données brutes initiales et aboutissant à l’information pertinente.

  • Programmer et maitriser l’ingénierie du logiciel.

  • Acquérir les fondements théoriques relatifs à différentes types d'approches issues des sciences des données.

  • Construire, évaluer et interpréter des modèles d'analyse et d'apprentissage en tenant compte de la nature des données.

  • Maitriser la méthodologie d'apprentissage à partir des données brutes (from scratch) à l'évaluation.

Profil de sortie des étudiants ayant suivi la formation

Au terme du M1 Data Science, les étudiants intègrent le Master 2 Data Science en alternance.

Débouchés de la formation

Au terme du Master les métiers visés sont notamment :

. Data analyst
. Administrateur de bases de données
. Gestionnaire de données massives
. Gestionnaire d’applications
. Architecte de données
. Concepteur/développeur d’applications Big Data
. Ingénieur R&D

Collaboration(s)
Laboratoire(s) partenaire(s) de la formation

Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur

Laboratoire de recherche en informatique

Laboratoire Spécification et Vérification

Programme

60 ECTS doivent être validées. Les UEs sont organisées en trois blocs : un bloc disciplinaire (16 UEs pour 48 ECTS), un bloc Soft skills (2 UEs pour 6 ECTS), et un bloc Période Entreprise (une UE pour 6 ECTS).

Matières ECTS Cours TD TP Cours-TD Cours-TP TD-TP A distance Projet Tutorat
[ISD] Traitement distribué des données 3 25
[ISD] Services et applications Web 3 25
[ISD] Sécurité 3 25
[ISD] Réseaux sans fil 3 25
[ISD] Réseaux 3 25
[ISD] Rapport d'activité 6 5
[ISD] Projets tuteurés 6 25
[ISD] Probabilités/Statistiques 3 25
[ISD] Modélisation 3 25
[ISD] Modèles Mathématiques 3 25
[ISD] Langages Dynamiques 3 25
[ISD] Introduction à l'apprentissage 3 25
[ISD] Data Warehouse II 3 25
[ISD] Data Warehouse I 3 25
[ISD] Data Lake 3 25
[ISD] Communication 3 25
[ISD] Anglais 3 25
[ISD] Algorithmique avancée 3 25
Contenu des UEs

Thème 1 : Gestion des données

- UE Data lake - 3 ECTS

Cours/TD : 25h

Ce module a pour objectif de présenter les nouveaux outils du domaine du Big Data. Il permettra de comprendre les solutions de stockage de données volumineuses et d’en faire des analyses. Il abordera quelques aspects préliminaires de la programmation distribuée ou Hadoop permettra de manipuler des données volumineuses pour aider à la prise de décision. Les étudiants verront également comment interroger de grandes masses de données en temps réel.

Période(s) : Mars - Avril - Mai - Juin.

Lieu(x) : ORSAY

 

- UE Data warehouse I - 3 ECTS

Cours/TD : 25h

Ce module couvre les technologies des BD relationnelles permettant de transformer des données issues de sources diverses en informations utiles à la prise de décision. Nous aborderons en particulier:
- modélisation:
au niveau conceptuel (modèles multidimensionnels) et niveau logique (schémas en étoiles...)
- le langage SQL et les optimisations de bases de données pour les requêtes OLAP:
indexes, partitionnement et vues
- l'architecture des entrepôts
- les processus ETL (rapidement)
- les grands principes des bases de données 'in memory'


Pré-requis (couvert par le programme de Licence) :
- programmation en Java
- BD relationnelles : schéma et notions associées (clé primaires, clé
étrangères, contraintes, …), requêtes en SQL et mises à jour.

Période(s) : Septembre - Octobre - Novembre - Décembre.

Lieu(x) : ORSAY

 

- UE Réseaux - 3 ECTS

Cours/TD : 25h

Pour fonctionner correctement, les réseaux nécessitent un grand nombre d'équipements et de processus, rendant leur architecture souvent complexe. Pour réduire cette complexité, les différentes fonctions ont été décomposées en couches protocolaires. Après avoir posé les fondements des télécommunications et rappelé les bases de la transmission de l’information, cette unité d'enseignement détaille les deux premiers niveaux des réseaux, à savoir « physique » (bande passante, débit binaire, codage, …) et « liaison » (codes détecteurs, codes correcteurs, techniques d'accès, …). Les principaux protocoles correspondants sont également présentés. Une série de travaux dirigés et de travaux pratiques permet d’assimiler et d’appliquer les différents concepts étudiés.

Période(s) : Septembre.

Lieu(x) : ORSAY

 

- UE Réseaux sans fil - 3 ECTS

Cours/TD : 25h

Ce cours a pour objectif de présenter plusieurs notions avancées des réseaux informatiques et de télécommunications. Un premier volet sera consacré à introduire les fondements et concepts de base des réseaux cellulaires, mobiles et sans fil : concept cellulaire, techniques d’accès au support radio (FDMA, TDMA, CDMA, CSMA-CA), en détaillant le fonctionnement de quelques systèmes représentatifs tels que la 2G, la 3G ou encore le Wi-Fi.  Un second volet sera dédié à l’étude de plusieurs notions essentielles des nouvelles générations de réseaux telles que la qualité de service (QoS), la mobilité (MIP) ou encore la signalisation dans IP (SIP, VoIP).

Période(s) : Janvier - Février - Mars - Avril.

Lieu(x) : ORSAY

 

- UE Sécurité - 3 ECTS

Cours/TD : 25h

Ce cours vise à faire un tour d'horizon le plus large possible des vulnérabilités potentielles des différents éléments des systèmes traitant l'information et de décrire les ripostes possibles, au travers de mots clé comme respect de la vie privée et anonymat, disponibilité,  authentification et imputabilité des accès, secret et partage de secret: Identification et authentification (mots de passe, techniques biométriques), contrôle d'accès (accès hiérarchique, listes d'accès, capacités, systèmes "take and grant »), attaques par déni de service, virus, vers - techniques des antivirus - systèmes de détection d'intrusions, problèmes de sécurité des réseaux et exemples d'attaques connues, généralités sur le codage et la cryptographie. Principes de sécurité (sécurité IPv4/IPv6,  pare-feux, cloisonnement, VPN).

Période(s) : Février - Mars - Avril - Mai.

Lieu(x) : ORSAY

 

Thème 2 – Algorithmique et ingénierie du logiciel

- UE Modélisation - 3 ECTS

Cours/TD : 25h

Dans ce cours, sont abordés les langages de modélisation tels que SDL, BPMN. Il s’agit de sensibiliser les étudiants à la nécessité de réfléchir à un problème posé avant de le programmer. Ces langages permettent de décrire des systèmes, des processus métier. BPMN permet de modéliser des processus non informatiques. Des choix devront être faits pour se concentrer sur l’analyse de ces systèmes. Ces choix porteront sur le niveau d’abstraction, les choix des interactions, des algorithmes. Les détails liés à l’implémentation seront laissés de côté pour la phase de conception.

Période(s) : Septembre - Octobre - Novembre - Décembre.

Lieu(x) : ORSAY

 

- UE langages dynamiques - 3 ECTS

Cours/TD : 25h

Dans ce cours, l’accent sera mis sur les langages dits dynamiques, c’est à dire des langages qui exécutent des actions au moment de l’exécution alors que d’autres langages les exécutent à la compilation. Des langages tels que Javascript, Python, PHP, Ruby seront étudiés. Des travaux pratiques permettront de mettre en œuvre les concepts liés à ces langages qui seront vus pendant le cours.

Période(s) : Septembre - Octobre - Novembre - Décembre.

Lieu(x) : ORSAY

 

- UE Services et application web - 3 ECTS

Cours/TD : 25h

Dans ce cours, il s’agira d’étudier les concepts et langages pour le développement d’application Web  et de services Web. Côté client, seront étudiés les traitements complexes à mettre en œuvre. Côté serveur, seront vus certains environnements (Apache struts, Ocsigen, …). Sera également abordée l’intégration des données hétérogènes (BD, XML, Json, …). Pour la partie service Web, le cours portera sur la création des services Web (SOAP, REST) simples et complexes (orchestration de services).

Période(s) : Février - Mars - Avril.

Lieu(x) : ORSAY

 

- UE Algorithmique avancée - 3 ECTS

Cours/TD : 25h

L’objectif de ce cours est de fournir des outils et techniques algorithmiques de pointe aux apprentis. Etude de l’algorithmique sur les graphes (plus court chemin, tri topologique, …), les techniques de mémorisation, de programmation dynamique et de backtraching. Présentation de la notion de flots et des algorithmes de calcul de flot maximal. Enfin, les thèmes des algorithmes online et approchés seront abordés.

Période(s) : Janvier - Février - Mars - Avril.

Lieu(x) : ORSAY

 

- UE Outils pour la manipulation et l'extraction de données - 3 ECTS

Cours/TD : 25h

Les données échangées sont souvent exploitées par les différents systèmes en fonction de représentation interne de chaque logiciel. Il est dont souvent nécessaire de produire des analyseurs syntaxiques et lexicaux pour manipuler ces données. Nous verrons dans ce cours comment construire des analyseurs en utilisant Lex et Yacc. Nous verrons également comment manipuler des textes avec sed et awk. Enfin, nous verrons également comment automatiser sous forme de script batch ou autres des tâches.

Période(s) : Septembre - Octobre - Novembre - Décembre.

Lieu(x) : ORSAY

 

- UE Traitement distribuée des données - 3 ECTS

Cours/TD : 25h

Ce cours présente des concepts avancés de traitement distribué des données, selon trois grands axes :
- traitement de donnée distribuées sur une même machine (multi-thread/multi-processus). Ce schéma est utilisée pour les tâches de traitement hautement parallélisable afin d'utiliser au mieux les ressources d'une machine. Le cours rappelle des principes généraux de programmation parallèle (threads, verrous) ainsi que des concepts bas-niveau pour accélérer le traitement de données (pagination fichier/mémoire).
- traitement client/serveur : utilisé dans le cadre classique d'une base de données unique répondant à des requêtes de plusieurs clients. Le cours présente le concept fondamental de transaction dans les BDs
relationnelles ainsi que les différents algorithmes de verrouillages et les structures de données associées.
- traitement distribué « big data » : utilisé dans le cas où les données sont tellement volumineuses qu'elles doivent résider sur un cluster de machine. Le cours donne une introduction au paradigme « map/reduce » ainsi qu'une initiation aux frameworks Hadoop et Spark.

Période(s) : Novembre - Décembre - Janvier - Février.

Lieu(x) : ORSAY

 

Thème 3 – Traitement de l’information

- UE Probabilités, statistiques - 3 ECTS

Cours/TD : 25h

Ce module est une introduction au langage des probabilités et à leurs applications aux statistiques. Le cours commencera par un rappel sur les probabilités et s'étendra sur des notions essentielles (loi des grands nombres, convergence, ...). Des applications seront vues en TP sur la compréhension des statistiques, l'utilisation des  estimateurs et l'analyse de données.

Période(s) : Septembre - Octobre - Novembre - Décembre.

Lieu(x) : ORSAY

 

- UE Introduction à l’apprentissage - 3 ECTS

Cours/TD : 25h

Ce module a pour objectif de familiariser les étudiants avec des approches basiques de machine learning. Le cours commencera en présentant les modèles traditionnels d'apprentissage supervisé et non-supervisé (tel que l'algorithme des k-moyennes, la décomposition en valeurs principales, le percetron, ...) pour entrevoir par la suite des modèles plus complexes. Le cours presentera les aspects théoriques du machine learning, et une grand part de travaux pratiques sera mis à disposition pour appliquer les techniques vues en cours à divers problèmes (classification, partitionnement, filtrage collaboratif, ...).

Période(s) : Octobre - Novembre - Décembre.

Lieu(x) : ORSAY

 

- UE Modèles mathématiques - 3 ECTS

Cours/TD : 25h

L’objectif de ce cours est de fournir un tour d’horizon des modèles mathématiques possibles. Ecriture sous formes mathématiques de problèmes réels prenant en compte le temps (modèles avec équations différentielles), des données certaines (programmes mathématiques linéaires et non linéaires en variables mixtes), des données incertaines (programmation robuste et stochastique), plusieurs décideurs (modèles à choix discrets).

Période(s) : Septembre - Octobre - Novembre - Décembre.

Lieu(x) : ORSAY

 

- Projet Etude de cas - 3 ECTS

Cours/TD : 25h

Ce module vient en complément des modules "Introduction à l'apprentissage" et du module "probabilistés/Statistiques". Il vise à donner une étude de cas en lien avec ces deux modules.

Période(s) : Février - Mars - Avril - Mai - Juin.

Lieu(x) : ORSAY

 

Thème 4 – Vie de l’entreprise

- Anglais - 3 ECTS

Cours/TD : 25h

Le cours a pour but d’amener les apprentis à améliorer leurs compétences que ce soit à l’écrit et à l’oral. Les contenus abordés portent sur le monde du travail en général et le vocabulaire spécifique au domaine des systèmes d’information. Une préparation au TOEIC est également prévue.

Période(s) : Septembre - Octobre - Novembre - Décembre.

Lieu(x) : ORSAY

 

- Communication - 3 ECTS

Cours/TD : 25h

L’objectif de ce cours est de donner d’une part les bases de la recherche scientifique : processus et méthodologie de la recherche scientifique, méthode de recherche bibliographique et sources bibliographiques scientifiques, principes de standardisation, étude et analyse de documents scientifiques et technologiques et d’autre part de présenter les principes de la communication et de l’information auprès des différents participants concernés par les projets menés.

Période(s) : Septembre - Octobre - Novembre - Décembre.

Lieu(x) : ORSAY

 

- Rapport d’activité - 6 ECTS

Tutorat par un enseignant

Ce module vise à écrire un rapport sur les missions effectuées en entreprise. Une soutenance est prévue pour présenter des missions.

Période(s) : Janvier - Février - Mars - Avril - Mai - Juin - Juillet.

Lieu(x) : ORSAY

Modalités de candidatures
Période(s) de candidatures
Du 15/03/2022 au 13/06/2022
Pièces justificatives obligatoires
  • Justificatif de suivi d'une année d'études en France pour les ressortissants non européens.

    (carte d'étudiant ou carte de séjour)
  • Lettre de motivation.

  • Tous les relevés de notes des années/semestres validés depuis le BAC à la date de la candidature.

  • Curriculum Vitae.

Pièces justificatives complémentaires
Contact(s)
Responsable(s) de la formation
Fatiha ZAIDI - fatiha.zaidi@lri.fr
Secrétariat pédagogique