18/09/2025

Ingénieur en science des données spécialisé en infrastructure data ou en apprentissage automatique
Mastère Data Engineer

Session

CA Contrat d'apprentissage
du 28/09/2026 au 29/09/2028

Nantes Ynov Campus

20 Boulevard du Général de Gaulle CS 46339 , 44200 Nantes
02 28 44 04 40

Portes ouvertes

  • le 14/03/2026
  • le 08/04/2026
  • le 29/04/2026
Voir la fiche de l'organisme

Formation en présentiel et en distanciel

Descriptif de formation

Objectif général

Certification

Objectif

Collecter, transformer et sécuriser des données Analyser, organiser et valoriser des données Elaborer et piloter un projet dataSpécialisation infrastructure data - Concevoir et opérer une infrastructure data Spécialisation apprentissage automatique - Concevoir et déployer des modèles d'apprentissage automatique

Précision de l'organisme de formation
Collecter, transformer et sécuriser des données Analyser, organiser et valoriser les données Elaborer et piloter un projet data Spécialisation infrastructure et data – Concevoir et opérer une infrastructure data Spécialisation apprentissage automatique - Concevoir et déployer des modèles d'apprentissage automatique

Résultats attendus

Certification

Les pré-requis

Quel niveau d'entrée ?

Niveau 6 (Licence, Licence pro, BUT, Titres ou équivalents)

Type de prérequis
Sans pré-requis spécifique
Précision sur les prérequis

Être titulaire d'un titre ou diplôme de niveau 6 validé dans le domaine de l’informatique OU avoir validé les 3 premières années d'une formation qui vise un titre ou diplôme de niveau 7 dans le domaine de l'informatique.

Les blocs de compétences

Collecter, transformer et sécuriser des données

Élaborer une stratégie de collecte de données en définissant les données utiles et nécessaires pour répondre à une problématique, et en identifiant les sources des données afin de cadrer le travail à réaliser pour collecter les données ciblées. Mettre en œuvre des techniques de collecte de données en exploitant les API externes et les bases de données disponibles, des techniques de web crawling et de web scraping afin de recueillir les données ciblées. Automatiser la col... Voir plus

Programme
Mise en situation professionnelle réelle ou fictive. : À partir de l’analyse d’une organisation réelle ou fictive de son choix, le candidat propose une stratégie de collecte et de transformation des données. Il remet au jury un dossier écrit comprenant : Une stratégie de collecte de données - Un exemple de collecte de données - Une méthode d’automatisation de collecte - Une stratégie de stockage des données - Un modèle de données - Une base de données - Une solution de stockage Big Data - Une présentation des outils et des technologies de traitement des données - Une présentation des données transformées, des méthodes et outils utilisés - Un processus ETL - Les solutions utilisés pour l’automatisation et l’orchestration du traitement des données - Une politique de sécurité des données - Un schéma d’architecture de sécurité
Analyser, organiser et valoriser des données

Analyser les besoins métier et les enjeux exprimés par un commanditaire en réalisant des entretiens exploratoires et en récupérant les informations stratégiques nécessaires afin de cadrer le travail d’analyse des données à produire. Définir les axes d’analyse et les métriques en identifiant les données à exploiter, celles disponibles et pertinentes pour traduire la problématique d’entreprise énoncée en problème numérique. Réaliser des requêtes et des calculs en ut... Voir plus

Programme
Mise en situation professionnelle réelle ou fictive. À partir de l’analyse d’une organisation réelle ou fictive de son choix, le candidat propose une stratégie d’analyse, de mise en forme et de valorisation des données. Il remet au jury un dossier écrit comprenant : Une analyse du besoin - Une présentation d’un plan d’analyse - Une présentation des requêtes et des résultats - Une méthodologie de tests statistiques - La visualisation des résultats de l’analyse - Une présentation de recommandations - Un support de formation - Une documentation technique
Elaborer et piloter un projet data

Définir les objectifs à atteindre et le périmètre du projet, en analysant les contraintes techniques et réglementaires, en étudiant le contexte et les enjeux afin de dimensionner le projet en termes de délai et budget. Dimensionner le projet en évaluant la charge de travail et les ressources nécessaires (humaines, matérielles) au regard des exigences attendues et des contraintes préalablement définies afin d’estimer le temps et le budget nécessaires à la faisabilité du projet... Voir plus

Programme
Mise en situation professionnelle réelle ou fictive. À partir de l’analyse d’une organisation réelle ou fictive de son choix, le candidat propose la gestion d’un projet Data. Il remet au jury un dossier écrit comprenant : Le cadrage du projet - Le dimensionnement du projet - La documentation projet - Le planning projet - Un outil de suivi de projet - Un tableau de bord - Un plan de développement des compétences - Les outils de communication et managériaux utilisés - La présentation d’un cas d’arbitrage rencontré au cours du projet - Une méthodologie de veille - Un plan d’actions relatif aux enjeux RSE, de sécurité, d’éthique et de confidentialité
Spécialisation infrastructure data - Concevoir et opérer une infrastructure data

Analyser l’environnement du projet en recueillant les besoins métiers, les volumes de données à traiter, en réalisant un état des lieux des composants existants afin d’orienter le choix de conception de l’architecture DATA à mettre en Å“uvre. Sélectionner l’ensemble des composants et technologies de l’infrastructure en étudiant les solutions existantes, en vérifiant leur compatibilité et les normes en vigueur afin de concevoir une architecture DATA correctement dimensionnÃ... Voir plus

Programme
Mise en situation professionnelle réelle ou fictive. À partir de l’analyse d’un projet réel ou fictif, le candidat présente la stratégie de conception et de maintien d’une architecture DATA. À l’aide d’un support de présentation de son choix, il présente lors d’une soutenance orale : Un rapport d’analyse - Une présentation des composants de l’architecture DATA - Un schéma de données - Des pipelines de traitement de la donnée - Un pipeline CI/CD - Une présentation d’un système de supervision - Une feuille de route d’exploitation - Une documentation technique - Un cahier de recettes et de tests - Une méthodologie d’investigation et de traitement d’un incident.
Spécialisation apprentissage automatique - Concevoir et déployer des modèles d'apprentissage automatique

Analyser la problématique et le contexte d’un commanditaire en réalisant des entretiens exploratoires, des questionnaires et une analyse de l’existant afin de lui apporter une réponse appropriée. Cadrer la stratégie de résolution du problème, en utilisant des algorithmes, en traduisant le problème en un problème d’optimisation afin de le résoudre avec les outils des modèles d’apprentissage automatique. Sélectionner les technologies, les outils et les algorithmes en iden... Voir plus

Programme
Mise en situation professionnelle réelle ou fictive. À partir de l’analyse d’un projet réel ou fictif, le candidat présente la stratégie de conception et de déploiement de modèles de Machine Learning. À l’aide d’un support de présentation de son choix, il présente lors d’une soutenance orale : Une analyse du besoin - Une présentation de la stratégie de résolution du problème - Une présentation des technologies et des outils sélectionnés - Un jeu de données exploitables pour le Machine Learning - Des méthodes de sélection de variables - Un entrainement d’un modèle d’apprentissage automatique - Une méthode d’optimisation des modèles d’apprentissage automatique - Une méthode de sauvegarde - Un processus CI/CD - Un système de monitoring de la performance - Un système de collecte de données

Organisation pédagogique

Rythme
Temps plein
Modalité pédagogique
formation à distance
En alternance
En organisme de formation
En entreprise
Cycle de l'alternance
2 semainesen entreprise et1 semaine en entreprise
Durée
952 heures en centreheures en centre
2723 heures en entreprise

Infos sur la certification / Plus de détails

Formacode principal
Informatique - Systèmes d’information et numérique
Organisme certificateur
YNOV
Source : Cariforef des Pays de la Loire - 258033 - Code d'établissement : 51594