Aller au contenu principal

M1 Informatique pour la Science des Données - par alternance

Candidater à la formation
  • Capacité d'accueil
    25
  • Langue(s) d'enseignement
    Français
  • Régime(s) d'inscription
    Formation en apprentissage
Présentation
Objectifs pédagogiques de la formation

Dans les projets « big data » industriels (e.g. e-santé, IoT), 80 % du coût sont liés à des problématiques d’ingénierie du logiciel, telles que la récolte, le stockage, la sécurisation et à la mise en forme des données. Seulement 10% sont dédiés à l’analyse de l’information et les 10% restants à la visualisation de cette information.

Ce parcours Data Science propose donc de fournir les compétences nécessaires pour gérer toute la chaîne de valeur partant des données à l’information pertinente, avec une partie importante sur la gestion et la préparation des données (stockage, partage, extraction, sécurisation, mise en forme, visualisation, ...) pour rendre l’information plus facile à exploiter, protéger et valoriser.

Le Master offre aux étudiants des bases théoriques et pratiques solides qui leur permettront de s’insérer facilement dans le monde industriel ou d’intégrer des organismes de la recherche publique ou privée pour s’orienter vers le monde de la recherche théorique ou appliquée de haut niveau.

En termes de compétences que la formation donnera aux étudiants, l’évolution de l’informatique, avec la présence de ces grandes masses de données, oblige à repenser le paradigme informatique. L’ingénieur doit savoir appréhender des interfaces différentes liées à la mobilité et à des environnements hétérogènes. Les transferts d’information deviennent complexes et nécessitent des compétences mêlant le réseau et la sécurité. L’extraction d’information requiert des techniques spécifiques et des algorithmes évolués. Quant à l’analyse de grandes masses de données, elle ne peut se faire sans connaissance de modèles et techniques mathématiques et informatiques, tant pour la pertinence de l’information résultante que pour sa représentation et sa visualisation.

Lieu(x) d'enseignement
ORSAY
GIF SUR YVETTE
PALAISEAU
Pré-requis, profil d’entrée permettant d'intégrer la formation

Diplômés d’une licence en informatique ou analogue.

Modalités pédagogiques particulières

Rythme d’alternance :  3 semaines à l'Université, 4 semaines en Entreprise

Compétences
  • Gérer toute la chaîne de valeur partant des données brutes initiales et aboutissant à l’information pertinente.

  • Programmer et maitriser l’ingénierie du logiciel.

  • Acquérir les fondements théoriques relatifs à différentes types d'approches issues des sciences des données.

  • Construire, évaluer et interpréter des modèles d'analyse et d'apprentissage en tenant compte de la nature des données.

  • Maitriser la méthodologie d'apprentissage à partir des données brutes (from scratch) à l'évaluation.

Profil de sortie des étudiants ayant suivi la formation

Au terme du M1 Data Science, les étudiants intègrent le Master 2 Data Science en alternance.

Débouchés de la formation

Au terme du Master les métiers visés sont notamment :

. Data analyst
. Administrateur de bases de données
. Gestionnaire de données massives
. Gestionnaire d’applications
. Architecte de données
. Concepteur/développeur d’applications Big Data
. Ingénieur R&D

Collaboration(s)
Laboratoire(s) partenaire(s) de la formation
Laboratoire Méthodes Formelles
Laboratoire Interdisciplinaire des Sciences du Numérique
Programme

60 ECTS doivent être validées. Les UEs sont organisées en trois blocs : un bloc disciplinaire (16 UEs pour 48 ECTS), un bloc Soft skills (2 UEs pour 6 ECTS), et un bloc Période Entreprise (une UE pour 6 ECTS).

Matières ECTS Cours TD TP Cours-TD Cours-TP TD-TP A distance Projet Tutorat
[ISD] Algorithmique avancée 3 25
[ISD] Anglais 3 25
[ISD] Communication 3 25
[ISD] Data Lake 3 25
[ISD] Data Warehouse I 3 25
[ISD] Data Warehouse II 3 25
[ISD] Introduction à l'apprentissage 3 25
[ISD] Langages Dynamiques 3 25
[ISD] Modèles Mathématiques 3 25
[ISD] Modélisation 3 25
[ISD] Probabilités/Statistiques 3 25
[ISD] Programmation Python 3 25
[ISD] Projet apprentissage 6 25
[ISD] Rapport d'activité 6
[ISD] Réseaux 3 25
[ISD] Réseaux sans fil 3 25
[ISD] Sécurité 3 25
[ISD] Traitement distribué de l’information 3 25
[ISD] Visualisation des données 3 25
Contenu des UEs

Thème 1 : Gestion des données

- UE Data lake - 3 ECTS

Cours/TD : 25h

Descriptif : savoir concevoir un datalake et une architecture orientée Big data

Plan : Identifier les différents types de données avec les outils qui permettent de les ingérés, stockage brute et stockage distribué, Nosql, lakehouse et data mesh

Projet : Non

Prérequis : Python ou Scala

Période(s) : Mars - Avril - Mai - Juin.

Lieu(x) : ORSAY

 

- UE Data warehouse I - 3 ECTS

Cours/TD : 25h

Ce module couvre les technologies des BD relationnelles permettant de transformer des données issues de sources diverses en informations utiles à la prise de décision. Nous aborderons en particulier:
- modélisation:
au niveau conceptuel (modèles multidimensionnels) et niveau logique (schémas en étoiles...)
- le langage SQL et les optimisations de bases de données pour les requêtes OLAP:
indexes, partitionnement et vues
- l'architecture des entrepôts
- les processus ETL (rapidement)
- les grands principes des bases de données 'in memory'


Pré-requis (couvert par le programme de Licence) :
- programmation en Java
- BD relationnelles : schéma et notions associées (clé primaires, clé
étrangères, contraintes, …), requêtes en SQL et mises à jour.

Période(s) : Septembre - Octobre - Novembre - Décembre.

Lieu(x) : ORSAY

 

- L’UE Data Warehouse II - 3 ECTS

Descriptif : Comprendre les principaux enjeux du Data Warehouse – Pouvoir conceptualiser un Data Warehouse. Utiliser un ETL.

Plan : Présentation de l’histoire des entrepôts de données jusqu’aux Data Lake actuels. Gouvernances des données : améliorer la qualité, la sécurité et la traçabilité des données. Petit TP de Data Viz et de reporting simple pour comprendre la finalité. Plusieurs TP d’ETL. TP de qualité de données. Discussions et retour d’expérience sur les projets décisionnelles. Facteur de succès d’un projet décisionnel. Présentation de différentes méthodologies de création de Data Warehouse.

Projet : oui

 

- UE Réseaux - 3 ECTS

Cours/TD : 25h

Pour fonctionner correctement, les réseaux nécessitent un grand nombre d'équipements et de processus, rendant leur architecture souvent complexe. Pour réduire cette complexité, les différentes fonctions ont été décomposées en couches protocolaires. Après avoir posé les fondements des télécommunications et rappelé les bases de la transmission de l’information, cette unité d'enseignement détaille les deux premiers niveaux des réseaux, à savoir « physique » (bande passante, débit binaire, codage, …) et « liaison » (codes détecteurs, codes correcteurs, techniques d'accès, …). Les principaux protocoles correspondants sont également présentés. Une série de travaux dirigés et de travaux pratiques permet d’assimiler et d’appliquer les différents concepts étudiés.

Période(s) : Septembre.

Lieu(x) : ORSAY

 

- UE Réseaux sans fil - 3 ECTS

Cours/TD : 25h

Ce cours a pour objectif de présenter plusieurs notions avancées des réseaux informatiques et de télécommunications. Un premier volet sera consacré à introduire les fondements et concepts de base des réseaux cellulaires, mobiles et sans fil : concept cellulaire, techniques d’accès au support radio (FDMA, TDMA, CDMA, CSMA-CA), en détaillant le fonctionnement de quelques systèmes représentatifs tels que la 2G, la 3G ou encore le Wi-Fi.  Un second volet sera dédié à l’étude de plusieurs notions essentielles des nouvelles générations de réseaux telles que la qualité de service (QoS), la mobilité (MIP) ou encore la signalisation dans IP (SIP, VoIP).

Période(s) : Janvier - Février - Mars - Avril.

Lieu(x) : ORSAY

 

- UE Sécurité - 3 ECTS

Cours/TD : 25h

Ce cours vise à faire un tour d'horizon le plus large possible des vulnérabilités potentielles des différents éléments des systèmes traitant l'information et de décrire les ripostes possibles, au travers de mots clé comme respect de la vie privée et anonymat, disponibilité,  authentification et imputabilité des accès, secret et partage de secret: Identification et authentification (mots de passe, techniques biométriques), contrôle d'accès (accès hiérarchique, listes d'accès, capacités, systèmes "take and grant »), attaques par déni de service, virus, vers - techniques des antivirus - systèmes de détection d'intrusions, problèmes de sécurité des réseaux et exemples d'attaques connues, généralités sur le codage et la cryptographie. Principes de sécurité (sécurité IPv4/IPv6,  pare-feux, cloisonnement, VPN).

Période(s) : Février - Mars - Avril - Mai.

Lieu(x) : ORSAY

 

Thème 2 – Algorithmique et ingénierie du logiciel

- UE Modélisation - 3 ECTS

Cours/TD : 25h

Dans ce cours, sont abordés les langages de modélisation tels que SDL, BPMN. Il s’agit de sensibiliser les étudiants à la nécessité de réfléchir à un problème posé avant de le programmer. Ces langages permettent de décrire des systèmes, des processus métier. BPMN permet de modéliser des processus non informatiques. Des choix devront être faits pour se concentrer sur l’analyse de ces systèmes. Ces choix porteront sur le niveau d’abstraction, les choix des interactions, des algorithmes. Les détails liés à l’implémentation seront laissés de côté pour la phase de conception.

Période(s) : Septembre - Octobre - Novembre - Décembre.

Lieu(x) : ORSAY

 

- UE langages dynamiques - 3 ECTS

Cours/TD : 25h

Dans ce cours, l’accent sera mis sur les langages dits dynamiques, c’est à dire des langages qui exécutent des actions au moment de l’exécution alors que d’autres langages les exécutent à la compilation. Des langages tels que Javascript, Python, PHP, Ruby seront étudiés. Des travaux pratiques permettront de mettre en œuvre les concepts liés à ces langages qui seront vus pendant le cours.

Période(s) : Septembre - Octobre - Novembre - Décembre.

Lieu(x) : ORSAY

 

- UE Visualisation des données - 3 ECTS
 
Cours/TD : 25h
 
Objectif du cours 

Avec l’accroissement des données, les techniques et technologies de visualisation jouent désormais un rôle de plus en important dans tous les secteurs d’activité. Il s’agit d’outils puissant permettant d’aider à découvrir et à comprendre la logique derrière un ensemble de données et à la partager avec d’autres personnes. Le cours vise donc à aborder un certain nombre de sujets dans ce domaine : Comment analyser, trier et traiter efficacement des données ? Comment concevoir des visualisations de données pertinentes et lisibles qui nous aideront dans la prise de décision et la transmission des connaissances de façon claire et efficace ?


Aspects abordés :

·      Explorer, transformer et découvrir les tendances dans les données


·      Savoir choisir la meilleure visualisation pour chaque type de données


·      Exploiter un outil de visualisation professionnel


·      Apprendre à raconter une histoire pertinente à l’aide des données.

 

- UE Algorithmique avancée - 3 ECTS

Cours/TD : 25h

L’objectif de ce cours est de fournir des outils et techniques algorithmiques de pointe aux apprentis. Etude de l’algorithmique sur les graphes (plus court chemin, tri topologique, …), les techniques de mémorisation, de programmation dynamique et de backtraching. Présentation de la notion de flots et des algorithmes de calcul de flot maximal. Enfin, les thèmes des algorithmes online et approchés seront abordés.

Période(s) : Janvier - Février - Mars - Avril.

Lieu(x) : ORSAY

 

- UE Programmation Python - 3 ECTS

Acquérir les bases et les concepts avancés de la programmation en Python

Plan :

            - Les bases de Python (types de base, variables, comparaisons, boucles, conteneurs, fonctions, exceptions, etc.)

            Entrées-sorties, modules (sys, math, random, datetime, re, etc.)

            - Programmation fonctionnelle (lambdas, itérateurs, décorateurs)

            - Programmation orientée objets (classe, héritage)

            - Calcul matriciel (pandas), tracé de courbes (matplotlib)

            - Interfaces graphiques (tkinter, pyqt5)

Projet :  Le cours inclut un mini-projet à développer en binôme.

Prérequis : Notions d’algorithmique, de programmation fonctionnelle et maîtrise d’un langage de programmation impératif

 

- UE Traitement distribuée des données - 3 ECTS

Cours/TD : 25h

Ce cours présente des concepts avancés de traitement distribué des données, selon trois grands axes :
- traitement de donnée distribuées sur une même machine (multi-thread/multi-processus). Ce schéma est utilisée pour les tâches de traitement hautement parallélisable afin d'utiliser au mieux les ressources d'une machine. Le cours rappelle des principes généraux de programmation parallèle (threads, verrous) ainsi que des concepts bas-niveau pour accélérer le traitement de données (pagination fichier/mémoire).
- traitement client/serveur : utilisé dans le cadre classique d'une base de données unique répondant à des requêtes de plusieurs clients. Le cours présente le concept fondamental de transaction dans les BDs
relationnelles ainsi que les différents algorithmes de verrouillages et les structures de données associées.
- traitement distribué « big data » : utilisé dans le cas où les données sont tellement volumineuses qu'elles doivent résider sur un cluster de machine. Le cours donne une introduction au paradigme « map/reduce » ainsi qu'une initiation aux frameworks Hadoop et Spark.

Période(s) : Novembre - Décembre - Janvier - Février.

Lieu(x) : ORSAY

 

Thème 3 – Traitement de l’information

- UE Probabilités, statistiques - 3 ECTS

Cours/TD : 25h

Ce module est une introduction au langage des probabilités et à leurs applications aux statistiques. Le cours commencera par un rappel sur les probabilités et s'étendra sur des notions essentielles (loi des grands nombres, convergence, ...). Des applications seront vues en TP sur la compréhension des statistiques, l'utilisation des  estimateurs et l'analyse de données.

Période(s) : Septembre - Octobre - Novembre - Décembre.

Lieu(x) : ORSAY

 

- UE Introduction à l’apprentissage - 3 ECTS

Cours/TD : 25h

Ce module a pour objectif de familiariser les étudiants avec des approches basiques de machine learning. Le cours commencera en présentant les modèles traditionnels d'apprentissage supervisé et non-supervisé (tel que l'algorithme des k-moyennes, la décomposition en valeurs principales, le percetron, ...) pour entrevoir par la suite des modèles plus complexes. Le cours presentera les aspects théoriques du machine learning, et une grand part de travaux pratiques sera mis à disposition pour appliquer les techniques vues en cours à divers problèmes (classification, partitionnement, filtrage collaboratif, ...).

Période(s) : Octobre - Novembre - Décembre.

Lieu(x) : ORSAY

 

- UE Modèles mathématiques - 3 ECTS

Cours/TD : 25h

L’objectif de ce cours est de fournir un tour d’horizon des modèles mathématiques possibles. Ecriture sous formes mathématiques de problèmes réels prenant en compte le temps (modèles avec équations différentielles), des données certaines (programmes mathématiques linéaires et non linéaires en variables mixtes), des données incertaines (programmation robuste et stochastique), plusieurs décideurs (modèles à choix discrets).

Période(s) : Septembre - Octobre - Novembre - Décembre.

Lieu(x) : ORSAY

 

- Projet Etude de cas - 3 ECTS

Cours/TD : 25h

Ce module vient en complément des modules "Introduction à l'apprentissage" et du module "probabilistés/Statistiques". Il vise à donner une étude de cas en lien avec ces deux modules.

Période(s) : Février - Mars - Avril - Mai - Juin.

Lieu(x) : ORSAY

 

Thème 4 – Vie de l’entreprise

- Anglais - 3 ECTS

Cours/TD : 25h

Le cours a pour but d’amener les apprentis à améliorer leurs compétences que ce soit à l’écrit et à l’oral. Les contenus abordés portent sur le monde du travail en général et le vocabulaire spécifique au domaine des systèmes d’information. Une préparation au TOEIC est également prévue.

Période(s) : Septembre - Octobre - Novembre - Décembre.

Lieu(x) : ORSAY

 

- Communication - 3 ECTS

Cours/TD : 25h

L’objectif de ce cours est de donner d’une part les bases de la recherche scientifique : processus et méthodologie de la recherche scientifique, méthode de recherche bibliographique et sources bibliographiques scientifiques, principes de standardisation, étude et analyse de documents scientifiques et technologiques et d’autre part de présenter les principes de la communication et de l’information auprès des différents participants concernés par les projets menés.

Période(s) : Septembre - Octobre - Novembre - Décembre.

Lieu(x) : ORSAY

 

- Rapport d’activité - 6 ECTS

Tutorat par un enseignant

Ce module vise à écrire un rapport sur les missions effectuées en entreprise. Une soutenance est prévue pour présenter des missions.

Période(s) : Janvier - Février - Mars - Avril - Mai - Juin - Juillet.

Lieu(x) : ORSAY

Modalités de candidatures
Période(s) de candidatures
Du 02/05/2024 au 02/07/2024
Modalités description
Les candidatures en M1 se font sur MonMaster du 26 février au 24 mars (www.monmaster.gouv.fr) sauf pour le public concerné par la procédure dérogatoire et qui doit candidater sur INCEPTION aux dates indiquées ci-dessus.
Pour connaître votre situation : https://www.universite-paris-saclay.fr/admission/etre-candidat-un-master-paris-saclay
Pièces justificatives obligatoires
  • Justificatif de suivi d'une année d'études en France pour les ressortissants non européens.

    (carte d'étudiant ou carte de séjour)
  • Lettre de motivation.

  • Tous les relevés de notes des années/semestres validés depuis le BAC à la date de la candidature.

  • Curriculum Vitae.

Pièces justificatives complémentaires
  • Dossier VAPP (obligatoire pour toutes les personnes demandant une validation des acquis pour accéder à la formation) https://www.universite-paris-saclay.fr/formation/formation-continue/validation-des-acquis-de-lexperience.

  • Document justificatif des candidats exilés ayant un statut de réfugié, protection subsidiaire ou protection temporaire en France ou à l’étranger (facultatif mais recommandé, un seul document à fournir) :
    - Carte de séjour mention réfugié du pays du premier asile
    - OU récépissé mention réfugié du pays du premier asile
    - OU document du Haut Commissariat des Nations unies pour les réfugiés reconnaissant le statut de réfugié
    - OU récépissé mention réfugié délivré en France
    - OU carte de séjour avec mention réfugié délivré en France
    - OU document faisant état du statut de bénéficiaire de la protection subsidiaire en France ou à l’étranger.

Contact(s)
Responsable(s) de la formation