Parcours 2 · Data Engineering

Formation

✅ Paiement 100 % sécurisé via Stripe  ·  Annulation 30 jours  ·  Facture émise sous 24 h
⚙️ Parcours 2 · Data Engineering & Big Data

De développeur à Data Engineer
prêt pour la production

"

En 10 jours de formation, vous apprenez à concevoir et implémenter un pipeline de données distribué complet — du traitement Spark aux bases du déploiement Kubernetes, jusqu'aux fondamentaux du MLOps en production.

📅 Avril → Novembre 2026 10 jours · 70h en direct 👤 Data Engineers, DevOps, Développeurs, ML Engineers
Diagnostic gratuit →

4 formations en 2026

Formation F3 : Plateforme d'Orchestration de Clusters Applicatifs (2 jours – 14 heures)
📅 Lundi 13 - Mardi 14 avril 2026
💻 En ligne 👥 15 places 💶 690 € HT

👥 Public : DevOps, Cloud Engineers, Développeurs

🎯 Objectifs : Comprendre l'architecture interne de Kubernetes, déterminer les services de la plateforme, déployer une application distribuée, comprendre et analyser une application déployée.

📚 Contenu :

\\ \\ \\
JourContenu
Jour 1 (7h)Introduction orchestration (CNCF, cas d'usage), Architecture Kubernetes (Master, Worker, API Server, etcd, Scheduler), Installation Minikube et configuration kubectl, TP1 : Déploiement NGINX
Jour 2 (7h)ConfigMaps et Secrets, Persistent Volumes et PVC, Horizontal Pod Autoscaling (HPA), Ingress Controllers, Supervision (kubectl logs, Prometheus, Grafana, troubleshooting), TP2 : Stack microservices (Frontend + Backend + DB), Évaluation finale (QCM + TP)

💻 Prérequis : Bases en virtualisation et réseaux, Docker, systèmes Linux, architectures distribuées.

🛠️ Outils : Kubernetes, Minikube, kubectl, Play with Kubernetes, Lens/K9s, Prometheus, Grafana.

✅ Évaluation : QCM final (30%) + TP complet (50%) + Participation (20%). Ressources : Support PDF, Manifests YAML, Cheat sheet kubectl et Documentation.

Formation F4 : Traitement Distribué des Données (2 jours – 14 heures)
📅 Lundi 27 - Mardi 28 avril 2026
💻 En ligne 👥 12 places 💶 690 € HT

👥 Public : Data Engineers, Data Scientists avancés

🎯 Objectifs : Expliquer les principes de la programmation distribuée, prendre en main Apache Spark (PySpark), implémenter le traitement distribué des données, optimiser les performances des pipelines distribués.

📚 Contenu :

\\ \\ \\
JourContenu
Jour 1 (7h)Introduction traitement distribué (MapReduce, Hadoop, Spark), Architecture Spark (Driver, Executors, RDD, DAG), Installation et prise en main PySpark (Google Colab), TP1 : Traitement distribué sur dataset réel
Jour 2 (7h)Spark SQL et Spark Streaming, Optimisation (partitionnement, cache, broadcast), Mini-projet : Pipeline ETL complet end-to-end, Introduction Apache Airflow (orchestration), Évaluation finale (QCM + Projet)

💻 Prérequis : Python (Pandas, NumPy), SQL, bases du data processing.

🛠️ Outils : Python, Apache Spark (PySpark), Dask, Google Colab, Apache Airflow.

✅ Évaluation : QCM (20%) + Mini-projet pipeline (60%) + Participation (20%). Ressources : Support PDF complet, Jupyter Notebooks, Cheat sheet PySpark, Datasets, Code GitHub.

Formation F7 : Machine Learning Fondamental (4 jours – 28 heures)
📅 Lundi 18 - Mardi 19 mai 2026
📅 Lundi 25 - Mardi 26 mai 2026
💻 En ligne 👥 15 places 💶 1 190 € HT

📊 Description : Apprentissage automatique : algorithmes supervisés et non supervisés, évaluation de modèles, cas pratiques.

🎯 Objectifs : Maîtriser les fondamentaux du Machine Learning, savoir choisir et évaluer des modèles, appliquer les algorithmes à des cas concrets, préparer les données pour l'entraînement.

Formation F11 : MLOps et Déploiement de Modèles en Production (2 jours – 14 heures)
📅 Lundi 2 - Mardi 3 novembre 2026
💻 En ligne 👥 12 places 💶 790 € HT

🎯 Objectifs : Comprendre le cycle de vie complet d'un modèle ML en production, maîtriser les outils de versioning et tracking (MLflow, DVC), conteneuriser et déployer des modèles avec Docker et Kubernetes, mettre en place du monitoring et de la maintenance de modèles, implémenter CI/CD pour le ML.

📚 Programme :

\\ hilabihan\\ 全天\\
JourContenuJour 1 (7h)Introduction au MLOps, Versioning de code, données et modèles (Git, DVC), Tracking d'expériences avec MLflow, Containerisation avec Docker, TP1 : Versioning et tracking d'un projet MLJour 2 (7h)Déploiement de modèles (API REST avec FastAPI/Flask), Orchestration avec Kubernetes, CI/CD pour ML (GitHub Actions, Jenkins), Monitoring de modèles en production, TP2 : Déploiement end-to-end avec monitoring

💻 Prérequis : Expérience en Machine Learning, Bases en Python et Git, Notions de Docker recommandées.

🛠️ Outils : Python, MLflow, DVC, Docker, Kubernetes, FastAPI, GitHub Actions.

✅ Évaluation : TP de déploiement complet (70%) + QCM (30%).

3 190 €
HT · parcours complet (4 formations)
À l'unité : 690€ + 690€ + 1190€ + 790€
💳 Paiement en 3 fois disponible sur demande · 🏢 Devis entreprise sur mesure
Demander un diagnostic gratuit →