Téléchargez gratuitement la référence francophone CUDA : architecture GPU NVIDIA, modèle de programmation, optimisation mémoire, streams, profiling Nsight et kernels avancés. 404 pages pour maîtriser le calcul GPU.
CUDA — Programmation GPU Haute Performance
La référence francophone CUDA de 404 pages rédigée par Ayi NEDJIMI. Couvre l'architecture GPU NVIDIA, le modèle de programmation CUDA C++, l'optimisation mémoire (coalescence, shared memory, warp divergence), les streams, le profiling avec Nsight et les kernels avancés. De l'inférence LLM à la simulation scientifique.
Contenu du livre
Ce guide couvre en profondeur : l'architecture des GPU NVIDIA (SM, warps, registres), le modèle d'exécution CUDA (grilles, blocs, threads), la hiérarchie mémoire (global, shared, constant, texture), l'optimisation des accès mémoire coalescents, les streams et la concurrence asynchrone, les bibliothèques CUDA (cuBLAS, cuDNN, cuFFT), le profiling avec Nsight Systems et Nsight Compute, et les kernels avancés pour l'inférence LLM.
Technologies couvertes
CUDA C++ · NVIDIA · PyTorch · cuBLAS · Nsight Systems · Nsight Compute · cuDNN · cuFFT
Télécharger cet article en PDF
Format A4 optimisé pour l'impression et la lecture hors ligne
À propos de l'auteur
Ayi NEDJIMI
Auditeur Senior Cybersécurité & Consultant IA
Expert Judiciaire — Cour d'Appel de Paris
Habilitation Confidentiel Défense
[email protected]
Ayi NEDJIMI est un vétéran de la cybersécurité avec plus de 25 ans d'expérience sur des missions critiques. Ancien développeur Microsoft à Redmond sur le module GINA (Windows NT4) et co-auteur de la version française du guide de sécurité Windows NT4 pour la NSA.
À la tête d'Ayi NEDJIMI Consultants, il réalise des audits Lead Auditor ISO 42001 et ISO 27001, des pentests d'infrastructures critiques, du forensics et des missions de conformité NIS2 / AI Act.
Conférencier international (Europe & US), il a formé plus de 10 000 professionnels.
Domaines d'expertise
Ressources & Outils de l'auteur
Articles connexes
Catalogue Solutions SOTA 2026 : 78 Pages d'Outils IT par Cas d'Usage — Téléchargement Gratuit
Construire des grands modeles de langage a partir de zero — PyTorch & CUDA (342 pages)
Telechargez gratuitement l ouvrage complet sur la construction d un LLM from scratch avec PyTorch : tokenizer BPE, RoPE, GQA, MoE, RLHF et kernels CUDA. 342 pages, ISBN 978-2-9580154-1-1.
Durcissement Windows Server 2025 — Le guide complet : 96 contrôles ANSSI/NIS2
Guide complet de durcissement Windows Server 2025 : 96 contrôles, PowerShell, GPO exportables, conformité ANSSI/NIS2/CIS. Le livre de référence francophone.
Un projet cybersécurité ? Parlons-en.
Pentest, conformité NIS 2, ISO 27001, audit IA, RSSI externalisé… nos experts répondent sous 24h pour évaluer votre besoin et vous proposer un accompagnement sur mesure.
Commentaires
Aucun commentaire pour le moment. Soyez le premier à commenter !
Laisser un commentaire