Data analyst

Session
Descriptif de formation
Formation professionnalisante, basée sur la pratique et l'accompagnement vers l'emploi
Certification
- Identifier les possibilités d’utilisation des données, en fonction des besoins métier, en étant force de proposition dans l'exploration, l'évaluation de la qualité et l’interprétation de ces données
- Définir une stratégie de prise de décision par les données suivant les besoins métier
- Modéliser des bases de données relationnelles
- Réaliser des requêtes avancées répondant à des besoins métier complexes
- Automatiser des collectes de données
- Mettre en place une interface standard de partage automatique de données entre différentes applications et langages
- Contrôler les modalités de collecte et d’utilisation de données et mesurer les enjeux du RGPD
- Effectuer des choix méthodologiques pour l'automatisation des traitements et les documenter avec clarté et concision
- Utiliser les outils et méthodes modernes : méthodes agiles afin de permettre le travail en équipe, outils de suivi de projets, logiciel adapté à la rédaction de code
- Manipuler des structures de données et utiliser l’algorithmie afin de traduire en script des besoins de traitements de données
- Appliquer les bonnes pratiques de la programmation afin d'avoir un code organisé, réutilisable et partageable
- Utiliser les tableaux de données afin de faciliter l’import, la manipulation et la fusion de données
- Nettoyer les données, retraiter les valeurs aberrantes (outliers) et les valeurs manquantes
- Utiliser les expressions régulières (RegEx) pour traiter les valeurs textuelles et permettre une anonymisation des données personnelles dans le cadre du RGPD
- Utiliser les statistiques descriptives afin de modéliser les données
- Maîtriser le process d’apprentissage automatique (Machine Learning)
- Modéliser des régressions afin de définir des modèles de prévisions, et de trouver des tendances futures
- Modéliser des classifications et interpréter les métriques associées afin de catégoriser automatiquement des informations
- Traiter automatiquement le langage naturel (NLP) à partir de texte brut
- Contrôler et documenter les biais d'un modèle et des données d'entrainement afin d’estimer les risques éthiques
- Identifier et prioriser les informations à rendre accessibles et à présenter visuellement
- Utiliser les visualisations descriptives afin de représenter graphiquement des données statistiques et des informations modélisées
- Manipuler la Dataviz interactive et dynamique
- Réaliser de la cartographie
- Utiliser un Tableur afin de proposer des croisements de variables pour obtenir des informations recherchées
- Réaliser des tableaux de bord avec des outils de Business Intelligence afin d’intégrer et de croiser des informations utiles à des approches stratégiques de problématiques
- Prendre en compte les handicaps visuels afin de produire des graphiques lisibles par tous
- Présenter à l'oral et à l'écrit de manière claire, concise et sans ambiguité les informations
Les pré-requis
Sans niveau spécifique
Les blocs de compétences
Identifier les possibilités d’utilisation des données, en fonction des besoins métier, en étant force de proposition dans l'exploration, l'évaluation de la qualité et l’interprétation de ces données Définir une stratégie de prise de décision par les données suivant les besoins métier Modéliser des bases de données relationnelles (notamment SQL) afin de répondre avec rigueur aux besoins des utilisateurs Réaliser des requêtes avancées répondant à des besoins méti... Voir plus
Effectuer des choix méthodologiques pour l'automatisation des traitements et les documenter avec clarté et concision Utiliser les outils et méthodes modernes : méthodes agiles afin de permettre le travail en équipe, outils de suivi de projets, logiciel adapté à la rédaction de code Manipuler des structures de données (chaînes de caractères, listes, dictionnaires et tuples) et utiliser l’algorithmie (variables, boucles, itérateur, conditions, fonctions) afin de traduire en scr... Voir plus
Utiliser les statistiques descriptives afin de modéliser les données et en faire émerger des informations pertinentes Maîtriser le process d’apprentissage automatique (Machine Learning) afin de permettre à des algorithmes d’apprendre automatiquement à partir de données : syntaxe, découpage jeu d’entrainement et de validation, entrainement, prédiction, mesure Modéliser des régressions et interpréter les métriques associées afin de définir des modèles de prévisions, et... Voir plus
Identifier et prioriser, en fonction du besoin métier, les informations à rendre accessibles et à présenter visuellement, afin de structurer des représentations graphiques de tableaux bord Utiliser les visualisations descriptives, notamment les nuages de points, les boîtes à moustache et les histogrammes afin de représenter graphiquement des données statistiques et des informations modélisées à destination d’analyste de données Manipuler la Dataviz interactive et dynamique (... Voir plus
Organisation pédagogique
Temps plein : 9h00-12h30 / 14h00-17h30, du lundi au vendredi.