Parcours 2 · Data Engineering & Big Data

Programme du parcours

4 formations en 2026

Formation F3 : Plateforme d'Orchestration de Clusters Applicatifs (2 jours – 14 heures)

📅 Lundi 13 - Mardi 14 avril 2026

💻 En ligne 👥 15 places 💶 690 € HT

👥 Public : DevOps, Cloud Engineers, Développeurs

🎯 Objectifs : Comprendre l'architecture interne de Kubernetes, déterminer les services de la plateforme, déployer une application distribuée, comprendre et analyser une application déployée.

📚 Contenu :

\\ \\ \\

Jour	Contenu
Jour 1 (7h)	Introduction orchestration (CNCF, cas d'usage), Architecture Kubernetes (Master, Worker, API Server, etcd, Scheduler), Installation Minikube et configuration kubectl, TP1 : Déploiement NGINX
Jour 2 (7h)	ConfigMaps et Secrets, Persistent Volumes et PVC, Horizontal Pod Autoscaling (HPA), Ingress Controllers, Supervision (kubectl logs, Prometheus, Grafana, troubleshooting), TP2 : Stack microservices (Frontend + Backend + DB), Évaluation finale (QCM + TP)

💻 Prérequis : Bases en virtualisation et réseaux, Docker, systèmes Linux, architectures distribuées.

🛠️ Outils : Kubernetes, Minikube, kubectl, Play with Kubernetes, Lens/K9s, Prometheus, Grafana.

✅ Évaluation : QCM final (30%) + TP complet (50%) + Participation (20%). Ressources : Support PDF, Manifests YAML, Cheat sheet kubectl et Documentation.

Formation F4 : Traitement Distribué des Données (2 jours – 14 heures)

📅 Lundi 27 - Mardi 28 avril 2026

💻 En ligne 👥 12 places 💶 690 € HT

👥 Public : Data Engineers, Data Scientists avancés

🎯 Objectifs : Expliquer les principes de la programmation distribuée, prendre en main Apache Spark (PySpark), implémenter le traitement distribué des données, optimiser les performances des pipelines distribués.

📚 Contenu :

\\ \\ \\

Jour	Contenu
Jour 1 (7h)	Introduction traitement distribué (MapReduce, Hadoop, Spark), Architecture Spark (Driver, Executors, RDD, DAG), Installation et prise en main PySpark (Google Colab), TP1 : Traitement distribué sur dataset réel
Jour 2 (7h)	Spark SQL et Spark Streaming, Optimisation (partitionnement, cache, broadcast), Mini-projet : Pipeline ETL complet end-to-end, Introduction Apache Airflow (orchestration), Évaluation finale (QCM + Projet)

💻 Prérequis : Python (Pandas, NumPy), SQL, bases du data processing.

🛠️ Outils : Python, Apache Spark (PySpark), Dask, Google Colab, Apache Airflow.

✅ Évaluation : QCM (20%) + Mini-projet pipeline (60%) + Participation (20%). Ressources : Support PDF complet, Jupyter Notebooks, Cheat sheet PySpark, Datasets, Code GitHub.

Formation F7 : Machine Learning Fondamental (4 jours – 28 heures)

📅 Lundi 18 - Mardi 19 mai 2026

📅 Lundi 25 - Mardi 26 mai 2026

💻 En ligne 👥 15 places 💶 1 190 € HT

📊 Description : Apprentissage automatique : algorithmes supervisés et non supervisés, évaluation de modèles, cas pratiques.

🎯 Objectifs : Maîtriser les fondamentaux du Machine Learning, savoir choisir et évaluer des modèles, appliquer les algorithmes à des cas concrets, préparer les données pour l'entraînement.

Formation F11 : MLOps et Déploiement de Modèles en Production (2 jours – 14 heures)

📅 Lundi 2 - Mardi 3 novembre 2026

💻 En ligne 👥 12 places 💶 790 € HT

🎯 Objectifs : Comprendre le cycle de vie complet d'un modèle ML en production, maîtriser les outils de versioning et tracking (MLflow, DVC), conteneuriser et déployer des modèles avec Docker et Kubernetes, mettre en place du monitoring et de la maintenance de modèles, implémenter CI/CD pour le ML.

📚 Programme :

\\ hilabihan\\ 全天\\

Jour	Contenu	Jour 1 (7h)	Introduction au MLOps, Versioning de code, données et modèles (Git, DVC), Tracking d'expériences avec MLflow, Containerisation avec Docker, TP1 : Versioning et tracking d'un projet ML	Jour 2 (7h)	Déploiement de modèles (API REST avec FastAPI/Flask), Orchestration avec Kubernetes, CI/CD pour ML (GitHub Actions, Jenkins), Monitoring de modèles en production, TP2 : Déploiement end-to-end avec monitoring

💻 Prérequis : Expérience en Machine Learning, Bases en Python et Git, Notions de Docker recommandées.

🛠️ Outils : Python, MLflow, DVC, Docker, Kubernetes, FastAPI, GitHub Actions.

✅ Évaluation : TP de déploiement complet (70%) + QCM (30%).

3 190 €

HT · parcours complet (4 formations)

À l'unité : 690€ + 690€ + 1190€ + 790€

💳 Paiement en 3 fois disponible sur demande · 🏢 Devis entreprise sur mesure

Demander un diagnostic gratuit →

Formation

De développeur à Data Engineerprêt pour la production

4 formations en 2026

De développeur à Data Engineer
prêt pour la production