20/08/2025

Concepteur développeur en intelligence artificielle et analyse big data
Option Data science - développer et mettre en production des algorithmes d’IA par apprentissage profond (Deep Learning)

Le Wagon

Icône de localisation
Pas de la Poule Noire , 44000 Nantes
Icône de téléphone
07 56 79 80 80
Voir la fiche de l'organisme

Descriptif de formation

Explorez l'IA et la Data Science : manipulez de grandes bases de données et développez des modèles prédictifs. Profitez d'intervenants certifiées et travaillez sur des projets réels pour répondre aux enjeux stratégiques des entreprises. 

Objectif général

Certification

Objectif

  • Concevoir un processus de collecte de données en évaluant et choisissant des outils adaptés pour faciliter l'accessibilité, la sécurité et l'intégrité des données centralisées dans le respect de la réglementation en vigueur (RGPD).
  • Créer un système automatisé de collecte de données en intégrant des solutions ETL (comme Fivetran ou Stitch) et/ou en développant des scripts informatiques en Python ou SQL pour une agrégation rapide et exacte des données correspondant aux besoins métier.
  • Développer des stratégies de nettoyage de données, en analysant le contexte spécifique des données pour assurer un traitement approprié et sécurisé des données qui réponde aux besoins métier de l’entreprise.
  • Extraire des données en développant des scripts personnalisés (par exemple en Python ou SQL) pour récupérer des informations précises et pertinentes depuis une ou plusieurs bases de données.
  • Mener des analyses exploratoires en calculant des techniques statistiques descriptives (comme la moyenne ou l’analyse des fréquences) pour comprendre la distribution des données et écarter les valeurs anormales.
  • Identifier et interpréter des tendances en utilisant des langages de programmation (par exemple Python) et/ou des outils métiers adaptés (par exemple un tableur) pour comprendre finement le contexte et la nature des données analysées.
  • Sélectionner l’algorithme d’apprentissage le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente à la problématique métier rencontrée.
  • Préparer et transformer des données en utilisant des techniques de prétraitement (preprocessing) pour les adapter aux spécificités du modèle d'apprentissage automatique choisi.
  • Entraîner un modèle d'apprentissage automatique en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
  • Identifier les évolutions clés en IA et Big Data en analysant des sources d'information spécialisées pour rester à la pointe des dernières innovations et alimenter les stratégies de projet.
  • Élaborer et évaluer la problématique métier en utilisant des approches analytiques, pour créer un cahier des charges qui reflète précisément les besoins et les objectifs du projet data.
  • Évaluer les risques inhérents au projet IA et Big Data concernant l’impact éthique, le respect du RGPD ou encore la conformité aux normes environnementales, en proposant des méthodes d’audit pour garantir une conformité globale du projet.
  • Planifier et coordonner les ressources humaines et matérielles de manière efficace, en structurant un calendrier des activités qui garantit le respect des délais et des budgets du projet data.
  • Piloter une équipe multidisciplinaire en mettant en place des mécanismes d'évaluation et de feedback continus, assurant ainsi une progression fluide et coordonnée du projet data.
  • Présenter les résultats de projets IA et Big Data en adaptant le contenu et la forme aux différentes parties prenantes, y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG pour garantir une compréhension claire et inclusive.
  • Préparer des données non structurées en les convertissant en données numériques et sous forme tabulaires pour servir de données d'entraînement à un algorithme d’apprentissage profond.
  • Sélectionner l’algorithme d’apprentissage profond le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente adaptée à la problématique métier rencontrée.
  • Entraîner un modèle d'apprentissage profond en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
  • Déployer efficacement un modèle d'apprentissage profond en utilisant des outils et plateformes de production adaptés (MLOps), pour assurer une accessibilité et une performance optimale des prédictions de l'algorithme aux utilisateurs finaux.
  • Identifier les indicateurs clés à calculer en interrogeant les besoins métier afin de structurer les tableaux de bords nécessaires à des prises de décisions stratégiques.
  • Choisir des visualisations pertinentes en prenant en considération la nature massive des données et le profil des usagers y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG afin de faciliter la compréhension des informations obtenues grâce à l’IA et au Big Data.
  • Créer des tableaux de bord en utilisant des outils de BI (comme PowerBI ou Looker Studio) afin de rendre accessibles et interactives les analyses prédictives aux autres membres de l'entreprise.

Précision de l'organisme de formation
Icône chevron
Module 1 - Setup
Objectif : Installer et configurer tous les outils nécessaires (GitHub, git, VS Code, Jupyter, Terminal, Python, Kitt, Slack) pour garantir un environnement de travail optimal pendant tout le bootcamp. Module 2 - Python
Objectif : Apprendre à coder en Python, collecter des données de qualité depuis différents formats (CSV, API, web scraping) et interagir avec des bases de données relationnelles en SQL, afin de maîtriser les bases essentielles du travail en Data Science. Module 3 - Data Toolkit
Objectif : Maîtriser les outils fondamentaux d’analyse, de sourcing et de visualisation de données (Jupyter, NumPy, Pandas, Matplotlib, Seaborn, Plotly) pour explorer, manipuler et représenter efficacement des données issues de multiples sources. Module 4 - Math
Objectif : Acquérir les bases essentielles en algèbre, calcul, statistiques et probabilités pour comprendre et appliquer les concepts mathématiques fondamentaux nécessaires en Data Science, Decision Science, Machine Learning et Deep Learning. Module 5 - Decision Science
Objectif : Appliquer les bases de l’inférence statistique, de la régression linéaire et logistique pour analyser un jeu de données réel, et apprendre à structurer et communiquer efficacement ses résultats dans un projet de Data Science. Module 6 - Machine Learning
Objectif : Maîtriser les fondamentaux et les techniques avancées du Machine Learning supervisé et non supervisé (préparation des données, modélisation, tuning, pipelines, ensembles, séries temporelles, NLP) pour concevoir, optimiser et déployer des modèles adaptés à divers types de données et de problématiques. Module 7 - Deep Learning
Objectif : Comprendre les fondamentaux du Deep Learning, concevoir et optimiser des réseaux de neurones (classiques, convolutifs, récurrents) et découvrir les applications avancées en traitement d'images et de langage naturel (NLP et Transformers). Module 8 - ML Ops
Objectif : Développer, entraîner, industrialiser et déployer un modèle de Machine Learning à grande échelle dans un environnement cloud, en construisant une API et une interface utilisateur prêtes pour la production. Module 9 - Projet
Objectif : Mobiliser toutes les compétences acquises pendant le bootcamp pour concevoir, développer et présenter en équipe un projet final ambitieux et abouti.

Résultats attendus

Évaluations des compétences
Les compétences de 5 blocs sur 6 sont évaluées via un cas pratique. Le candidat reçoit un jeu de données associé à une problématique métier et doit réaliser les tâches suivantes :

  • Bloc 1 : Traitement de la donnée et transfert automatique.

  • Bloc 2 : Analyse des données, calcul de statistiques descriptives et conclusions.

  • Bloc 3 : Création d’un algorithme d’apprentissage automatique et évaluation des performances.

  • Bloc 5 (Option Data Science) : Algorithme de deep learning, évaluation des performances et déploiement en production.

  • Bloc 6 (Option Data Analyse) : Identification d’indicateurs clés, création d’un tableau de bord et recommandations.

Bloc 4 : Le candidat produit une présentation répondant à une problématique métier : analyse, identification d’innovations technologiques, justification des choix techniques, plan de gestion de projet (ressources, planification, suivi, coordination) et analyse des risques.

Session d'information
Une session dédiée à la certification est organisée pendant la formation. Elle couvre :

  • Le déroulement de l’examen.

  • Les dates et inscriptions.
    Slides et replay sont rapidement partagés avec les apprenants.

Évaluations en ligne
Toutes les évaluations se déroulent à distance. Les dates et liens d’inscription sont communiqués durant la formation. Une convocation officielle est envoyée par mail après inscription.

Les pré-requis

Quel niveau d'entrée ?

Niveau 4 (Bac, Bac Pro, BP, Titres ou équivalents)

Type de prérequis
18 ans révolus
Expérience professionnelle
Précision sur les prérequis

Conditions d'admission

Le candidat doit remplir les conditions suivantes :

  • Être titulaire d’un diplôme de niveau 4 avec au moins 1 an d’expérience professionnelle.

  • Ou être titulaire d’un diplôme de niveau 5 ou plus dans un domaine scientifique et/ou de gestion.

Le candidat doit également posséder les compétences suivantes :

  • Bases en programmation : types de données, variables, conditions, boucles, fonctions et structures de données.

  • Mathématiques : fonctions, dérivées, systèmes d'équations linéaires.

Le candidat devra obtenir l’aval de la commission pédagogique, comprenant un entretien en visioconférence et un test d’entrée.

Un bon niveau d'anglais est requis pour suivre la formation, car la majorité des ressources et outils techniques sont en anglais.

Matériel requis

Pour suivre la formation, il est obligatoire de disposer d’un ordinateur portable récent et performant.
Les tablettes et Chromebooks sont inadéquats, et les ordinateurs professionnels ne doivent être utilisés que si vous en avez un contrôle total.

Assurez-vous également d’installer toutes les mises à jour du système d’exploitation avant de commencer pour garantir une compatibilité optimale.

Connexion Internet

Une connexion Wi-Fi rapide et stable est obligatoire.
Les données mobiles et hotspots ne sont pas acceptés.

Important : Sans ces configurations, vous risquez de ne pas pouvoir suivre la formation dans de bonnes conditions.

Les blocs de compétences

Mener des projets IA et Big Data en équipe en intégrant les contraintes légales et des considérations éthiques

Identifier les évolutions clés en IA et Big Data en analysant des sources d'information spécialisées pour rester à la pointe des dernières innovations et alimenter les stratégies de projet. Élaborer et évaluer la problématique métier en utilisant des approches analytiques, pour créer un cahier des charges qui reflète précisément les besoins et les objectifs du projet data. Évaluer les risques inhérents au projet IA et Big Data concernant l’impact éthique, le respect du RGPD o... Voir plus

Programme
Icône chevron
Etude d'un cas pratique, production d'une présentation répondant à une problématique métier. Le candidat devra analyser une problématique métier, identifier des innovations technologiques pertinentes, justifier ses choix techniques, proposer un plan de gestion de projet (ressources, planification, modalités de suivi et de coordination) et une analyse des risques inhérents à la réalisation de ce projet.
Automatiser la collecte et le traitement des données (Data Engineering)

Concevoir un processus de collecte de données en évaluant et choisissant des outils adaptés pour faciliter l'accessibilité, la sécurité et l'intégrité des données centralisées dans le respect de la réglementation en vigueur (RGPD). Créer un système automatisé de collecte de données en intégrant des solutions ETL (comme Fivetran ou Stitch) et/ou en développant des scripts informatiques en Python ou SQL pour une agrégation rapide et exacte des données correspondant aux besoi... Voir plus

Programme
Icône chevron
Un cas pratique d'étude d'un jeu de données concernant une problématique métier. Le candidat devra réaliser un traitement de cette donnée et son transfert automatique.
Analyser et synthétiser les données préalablement à l’utilisation d’algorithmes d’IA

Extraire des données en développant des scripts personnalisés (par exemple en Python ou SQL) pour récupérer des informations précises et pertinentes depuis une ou plusieurs bases de données. Mener des analyses exploratoires en calculant des techniques statistiques descriptives (comme la moyenne ou l’analyse des fréquences) pour comprendre la distribution des données et écarter les valeurs anormales. Identifier et interpréter des tendances en utilisant des langages de programma... Voir plus

Programme
Icône chevron
Un cas pratique d'étude d'un jeu de données sur une problématique métier sera donné au candidat. Ce dernier devra effectuer une analyse de données en récupérant ces données puis en calculant des statistiques descriptives pour en tirer des conclusions.
Appliquer des techniques d’analyse IA via des algorithmes d'apprentissage automatiques (Machine Learning)

Sélectionner l’algorithme d’apprentissage le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente à la problématique métier rencontrée. Préparer et transformer des données en utilisant des techniques de prétraitement (preprocessing) pour les adapter aux spécificités du modèle d'apprentissage automatique choisi. Entraîner un modèle d'apprentissage automatique en optimisant une... Voir plus

Programme
Icône chevron
Un cas pratique d'étude d'un jeu de données sur une problématique métier sera donné au candidat. Ce dernier devra réaliser un algorithme d’apprentissage automatique et évaluer les performances de son modèle.
Option Data Science - Développer et mettre en production des algorithmes d’IA par apprentissage profond (Deep Learning)

Préparer des données non structurées en les convertissant en données numériques et sous forme tabulaires pour servir de données d'entraînement à un algorithme d’apprentissage profond. Sélectionner l’algorithme d’apprentissage profond le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente adaptée à la problématique métier rencontrée. Entraîner un modèle d'apprentissage pro... Voir plus

Programme
Icône chevron
Un cas pratique d'étude d'un jeu de données sur une problématique métier sera donné au candidat. Ce dernier devra réaliser un algorithme d’apprentissage automatique profond et évaluer les performances de son modèle. De plus, le candidat se verra donner un modèle qu’il devra alors déployer en production.
Option Data Analyse - Concevoir des tableaux de bords avancés (Business Intelligence)

Identifier les indicateurs clés à calculer en interrogeant les besoins métier afin de structurer les tableaux de bords nécessaires à des prises de décisions stratégiques. Choisir des visualisations pertinentes en prenant en considération la nature massive des données et le profil des usagers y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG afin de faciliter la compréhension des informations obtenues grâce à l’IA et au Big Data.... Voir plus

Programme
Icône chevron
Un cas pratique d'étude d'un jeu de données sur une problématique métier sera donné au candidat. Ce dernier devra identifier les indicateurs clés à calculer afin de réaliser un tableau de bord. A partir de ce tableau de bord, le candidat donnera ses conclusions et ses recommandations.

Organisation pédagogique

Rythme
Temps plein
Modalité pédagogique
Pédagogie adaptée aux handicapés
En organisme de formation
Durée
360 heures en centre
Précision sur la durée

Programme intensif sur 9 semaines. 

Détails des coûts

Coûts
Frais d'équipement
Équipement numérique

Infos sur la certification / Plus de détails

Source : Cariforef des Pays de la Loire - 252496 - Code d'établissement : 57586