LIVRES BLANCS CUDA — Programmation GPU Haute Performance : Guide Complet (404… 📌 CUDA — Programmation GPU Haute… 🔹 Contenu du livre 🔸 Technologies couvertes ayinedjimi-consultants.fr

CUDA — Programmation GPU Haute Performance

La référence francophone CUDA de 404 pages rédigée par Ayi NEDJIMI. Couvre l'architecture GPU NVIDIA, le modèle de programmation CUDA C++, l'optimisation mémoire (coalescence, shared memory, warp divergence), les streams, le profiling avec Nsight et les kernels avancés. De l'inférence LLM à la simulation scientifique.

Contenu du livre

Ce guide couvre en profondeur : l'architecture des GPU NVIDIA (SM, warps, registres), le modèle d'exécution CUDA (grilles, blocs, threads), la hiérarchie mémoire (global, shared, constant, texture), l'optimisation des accès mémoire coalescents, les streams et la concurrence asynchrone, les bibliothèques CUDA (cuBLAS, cuDNN, cuFFT), le profiling avec Nsight Systems et Nsight Compute, et les kernels avancés pour l'inférence LLM.

Technologies couvertes

CUDA C++ · NVIDIA · PyTorch · cuBLAS · Nsight Systems · Nsight Compute · cuDNN · cuFFT