Optimiser les performances IA (GPU, CUDA, NumPy avancé)
Référence: IA FORGE005
Objectifs
- Comprendre le fonctionnement du calcul parallèle et du GPU.
- Vectoriser le code Python pour améliorer les temps d’exécution.
- Exploiter NumPy et CuPy pour l’optimisation mémoire et la parallélisation.
- Accélérer l’entraînement des modèles avec CUDA et Tensor Cores.
- Évaluer l’impact des optimisations sur les performances globales.
Programme
1. Calcul parallèle et GPU : principes
- Architecture CPU/GPU et goulots d’étranglement.
- Découverte de NumPy, CuPy, Numba.
- Mise en pratique : comparaison d’un calcul séquentiel et vectorisé.
2. Vectorisation et parallélisation du code Python
- Techniques de broadcasting et slicing.
- Utilisation de multiprocessing et numba.jit.
- Mise en pratique : optimisation d’un algorithme de régression simple
3. Accélération GPU avec CUDA et CuPy
- Principes des threads, blocs et kernels.
- Exécution d’opérations matricielles sur GPU et gestion mémoire.
- Mise en pratique : entraînement accéléré d’un modèle ML sur GPU.
4. Tensor Cores et optimisation de réseaux neuronaux
- Exploiter CUDA et Tensor Cores pour le Deep Learning.
- Mesurer la performance et ajuster les hyperparamètres.
- Mise en pratique : benchmark CPU vs GPU sur un modèle supervisé léger
5. Mesure et suivi des performances
- Mettre en place des benchmarks et tests automatisés.
- Analyser temps, mémoire et consommation énergétique.
- Mise en pratique : automatisation d’un test de performance dans le pipeline ML.
Évaluation
Le formateur évalue la progression des participants tout au long de la formation
à travers des échanges, QCM et études de cas. Un test de positionnement ou
une activité de synthèse permet d’évaluer les acquis en début et fin de session
Parmi les meilleurs experts RH pour partager, transmettre et échanger sur les sujets clés de votre métier
Une pédagogie centrée sur la pratique, les échanges et les retours d’expériences
Des échanges collaboratifs et actifs au service d’un apprentissage efficace
8 participants max. par session
Des formats de 2h à un an pour permettre à chacun de trouver le rythme et le format le plus adapté