Optimisation Proxmox VE 9 : CPU, RAM, ZFS, Ceph et HA

22 March 2026

•

Mis à jour le 10 May 2026

•

7 min de lecture

•

1834 mots

•

427 vues

•

L'optimisation d'un cluster Proxmox VE 9 est un processus multi-dimensionnel qui touche au système hôte, aux performances CPU, à la gestion mémoire, au tuning du stockage ZFS et Ceph, à la configuration réseau SDN et à la résilience HA. Ce guide expert compile les meilleures pratiques d'optimisation avec des recettes concrètes adaptées à chaque type de workload, des outils de monitoring et des métriques de référence pour valider les gains. L'optimisation Proxmox ne se limite pas à augmenter les ressources allouées aux VMs : elle passe par une configuration précise de l'hôte (sysctl, scheduler, IRQ affinity), du stockage (ZFS ARC, prefetch, Ceph CRUSH), du réseau (MTU, offloading, SDN) et du cluster (Corosync, HA fencing). Ce guide couvre chaque couche d'optimisation avec les commandes de mesure avant/après, permettant de quantifier les gains et de prendre des décisions basées sur les données. Les recettes par workload (bases de données, VMs Linux, Windows, Kubernetes) permettent une application directe selon votre contexte.

Identification des vecteurs d'attaque et de la surface d'exposition
Stratégies de détection et de réponse aux incidents
Recommandations de durcissement et bonnes pratiques opérationnelles
Impact sur la conformité réglementaire (NIS2, DORA, RGPD)

Points clés à retenir

L'optimisation Proxmox VE commence par le système hôte : scheduler I/O, IRQ affinity, sysctl réseau et limites ZFS ARC avant tout tuning applicatif.
Le ZFS ARC doit être limité sur les hôtes Proxmox pour laisser suffisamment de RAM aux VMs : règle des 8-16 Go maximum pour ARC.
Ceph nécessite une séparation stricte des réseaux public/cluster et un calcul précis des Placement Groups pour des performances optimales.
Le monitoring proactif (Prometheus/Grafana) est indispensable pour identifier les goulets d'étranglement avant qu'ils n'impactent la production.

Optimisation du Système Hôte Proxmox

Les optimisations système de base à appliquer sur chaque nœud Proxmox VE 9. Dans /etc/sysctl.conf :

vm.swappiness = 10 : minimiser l'utilisation du swap (désactiver avec 0 si suffisamment de RAM)
net.core.rmem_max = 134217728 et wmem_max : buffers réseau pour les hauts débits
net.ipv4.tcp_congestion_control = bbr : algorithme de contrôle de congestion moderne (meilleur throughput)
kernel.numa_balancing = 0 : désactiver l'auto-balancing NUMA si CPU pinning configuré

Le scheduler I/O : pour les disques SSD/NVMe, utiliser none ou mq-deadline via /sys/block/{disk}/queue/scheduler. Pour les disques rotatifs, mq-deadline ou bfq. L'IRQ affinity permet de dédier des cœurs CPU spécifiques aux interruptions des interfaces réseau 10/25GbE pour réduire la latence.

Optimisation CPU : Pinning, Topology et Fréquence

Le CPU governor de l'hôte Proxmox doit être configuré en mode performance pour éliminer les latences de changement de fréquence : cpupower frequency-set -g performance (persistant via /etc/init.d/cpufrequtils). Désactiver également C-states dans le BIOS pour les workloads latence-sensitifs.

Le CPU pinning (vcpu affinity) dans Proxmox assigne des vCPUs à des cœurs physiques spécifiques via le paramètre affinity dans la configuration VM. Pour une VM DB haute performance sur un processeur 32 cœurs avec NUMA 2 domaines (0-15 et 16-31) : assigner les 8 vCPUs aux cœurs 0-7 (domaine NUMA 0) avec la RAM allouée sur le même domaine. La commande de vérification : numactl --hardware pour voir la topologie, taskset -p {pid} pour vérifier l'affinity.

Le Hyper-Threading doit être considéré selon le workload : bénéfique pour les workloads multi-threads légers (serveurs web), potentiellement problématique pour les workloads HPC sensibles au partage de ressources L1/L2. Pour les VMs critiques nécessitant des performances CPU prévisibles, désactiver HT dans le BIOS ou utiliser uniquement les cœurs physiques (pair ou impair selon la numérotation).

Optimisation Mémoire : ZFS ARC et Hugepages

La gestion de la mémoire est critique sur les hôtes Proxmox car ZFS ARC, les VMs QEMU et le système hôte se disputent la RAM disponible. La règle d'or : limiter l'ARC ZFS à 8-16 Go maximum sur les hôtes avec des VMs, quelle que soit la RAM totale. Configuration dans /etc/modprobe.d/zfs.conf :

options zfs zfs_arc_max=8589934592 (8 Go en octets)

Désactiver le ZFS prefetch pour les workloads avec des patterns d'accès aléatoires (bases de données) : options zfs zfs_prefetch_disable=1. Le prefetch est bénéfique pour les accès séquentiels (media, backups).

Les hugepages doivent être configurées selon le nombre de VMs et leur RAM totale. Exemple pour 10 VMs de 8 Go chacune (80 Go de hugepages 2 Mo) : vm.nr_hugepages = 40960 dans sysctl.conf. La RAM hugepages est allouée statiquement au démarrage : s'assurer que la RAM totale hôte = RAM VMs hugepages + ARC ZFS + 4-8 Go pour l'OS hôte.

Optimisation Stockage ZFS

Le tuning ZFS pour la virtualisation inclut plusieurs paramètres clés :

recordsize : 16K pour les bases de données (MySQL InnoDB, PostgreSQL), 128K (défaut) pour les workloads généraux, 1M pour le stockage de gros fichiers (backups, media)
compression : zstd recommandé (excellent ratio CPU/compression, meilleur que lz4 pour les VMs OS)
atime=off : désactiver la mise à jour du timestamp d'accès (réduit les écritures)
sync=disabled : UNIQUEMENT pour les VMs non-critiques sur baie SSD (risque de perte de données en cas de crash)

Les ZVOLs (ZFS Volumes) sont préférés aux fichiers image pour les disques VM : ils se comportent comme des périphériques bloc et offrent de meilleures performances I/O. Configuration via zfs create -V 100G -s rpool/vm-100-disk-0 (le flag -s crée un ZVOL thin-provisioned). Pour une analyse complète du dimensionnement ZFS, consultez notre guide de dimensionnement Proxmox VE 9.

Optimisation Ceph : CRUSH, PGs et Réseau

L'optimisation Ceph pour Proxmox VE 9 commence par la configuration correcte du CRUSH Map (Controlled Replication Under Scalable Hashing, algorithme de placement des données). Le nombre de Placement Groups (PGs) doit être calculé précisément : trop peu de PGs = mauvaise distribution, trop de PGs = overhead de gestion. Formule : PGs par pool = (Total OSDs × 100) / facteur_réplication, arrondis à la puissance de 2 supérieure.

Les paramètres Ceph critiques pour les performances :

osd_pool_default_size = 3, min_size = 2 : réplication 3x, lecture possible avec 2 OSDs
osd_journal_size = 10240 (10 Go sur SSD NVMe dédié) pour les HDDs OSD
bluestore_cache_size : limiter le cache BlueStore à 4 Go par OSD pour éviter la contention mémoire
Réseau Ceph : MTU 9000 (jumbo frames) sur le réseau cluster pour maximiser le débit de réplication

Pour le diagnostic Ceph, ceph osd perf affiche la latence apply/commit par OSD. La latence cible en production est < 1ms pour les NVMe, < 5ms pour les SSD SATA. Des latences élevées indiquent généralement un problème réseau ou de disque.

Optimisation Réseau et SDN

Les optimisations réseau sur les hôtes Proxmox VE 9 :

MTU 9000 (Jumbo Frames) sur le réseau dédié Ceph et migration : réduction du nombre de paquets, meilleur throughput
TX/RX offloading sur les interfaces physiques : ethtool -K {iface} tso on gso on gro on
Multi-queue NIC : ethtool -L {iface} combined 8 pour utiliser 8 files d'attente (= nombre de cœurs CPU)
VXLAN MTU : avec jumbo frames à 9000 sur le physique, MTU VXLAN effectif = 8950 (overhead 50 bytes)

Pour les VMs réseau-intensive, activer le vhost-net (accélération KVM du réseau virtuel) et configurer la VM avec VirtIO Net + multiqueue=8 pour les VMs multi-cœurs. Consulter notre guide SDN Proxmox VE 9 pour les configurations réseau avancées.

Monitoring et Métriques de Référence

Le monitoring avec Prometheus + Grafana est essentiel pour valider les optimisations et détecter les régressions. Métriques clés à surveiller :

Latence I/O ZFS : zpool iostat -v 1, cible < 1ms pour NVMe, < 5ms pour SSD
Ceph OSD latency : ceph osd perf, cible < 2ms apply latency
CPU steal time : indique la contention CPU entre VMs (cible < 5%)
RAM balloon : monitoring du ballooning (utilisation mémoire effective des VMs)
Corosync ring latency : corosync-cfgtool -s, cible < 2ms

La documentation officielle Proxmox VE et le wiki Performance Tweaks complètent ce guide avec des ajustements spécifiques aux versions. Pour les outils de monitoring complets, consultez notre panorama des outils Proxmox VE.

Couche	Paramètre clé	Valeur optimale	Impact
Système hôte	CPU governor	performance	Latence réduite
Mémoire	ZFS ARC max	8-16 Go	RAM disponible VMs
ZFS	compression	zstd	Espace + performances
Ceph	Réseau cluster MTU	9000 (jumbo)	Débit réplication
Réseau VM	VirtIO multiqueue	= nb vCPUs	Bande passante VM

Questions fréquentes

Comment limiter le ZFS ARC pour optimiser la mémoire disponible aux VMs Proxmox ?

Par défaut, ZFS ARC peut utiliser jusqu'à 50% de la RAM disponible, ce qui sur un hôte avec 256 Go représente 128 Go potentiellement soustrait aux VMs. La limitation se configure dans /etc/modprobe.d/zfs.conf avec le paramètre zfs_arc_max en octets. Pour limiter à 16 Go : options zfs zfs_arc_max=17179869184. Après modification, mettre à jour le initramfs : update-initramfs -u -k all et redémarrer. La valeur en runtime peut être modifiée sans redémarrage via echo 17179869184 > /sys/module/zfs/parameters/zfs_arc_max. La taille optimale dépend du workload : plus d'ARC bénéficie aux VMs qui lisent fréquemment les mêmes données du stockage ZFS.

Quels paramètres Ceph optimiser en priorité pour améliorer les performances I/O des VMs Proxmox ?

Les trois optimisations Ceph avec le plus grand impact sur les performances I/O des VMs : 1) Séparation réseaux public/cluster sur des interfaces dédiées 10/25GbE (évite la congestion entre trafic client et réplication). 2) Calcul correct des PGs : sous-dimensionner les PGs crée des hot spots, surdimensionner génère de l'overhead de gestion. 3) Déploiement des WAL/DB BlueStore sur SSD NVMe dédiés séparés des OSDs HDD pour accélérer les opérations d'écriture. En complément, activer les jumbo frames (MTU 9000) sur les réseaux Ceph et s'assurer que les OSDs utilisent BlueStore (défaut depuis Ceph Nautilus) plutôt que FileStore.

Comment mesurer et valider les gains d'optimisation sur un cluster Proxmox VE 9 ?

La validation des optimisations nécessite des mesures avant/après avec des outils standardisés. Pour le stockage : fio (flexible I/O tester) mesure les IOPS et latences avec des patterns représentatifs du workload cible (4K random read/write pour les bases de données, 128K sequential pour les backups). Pour le réseau : iperf3 mesure le débit entre nœuds. Pour ZFS : zpool iostat -v 1 pendant un test de charge. Pour Ceph : rados bench. Les dashboards Grafana avec les métriques Prometheus permettent de comparer les performances avant/après optimisation sur des périodes représentatives de la charge réelle de production.

Sources et références : Proxmox VE Wiki · ANSSI

Conclusion

L'optimisation de Proxmox VE 9 est un processus itératif qui passe par la mesure, l'ajustement et la validation à chaque couche : hôte, CPU, mémoire, ZFS, Ceph et réseau. Les gains peuvent être significatifs : 20-50% d'amélioration des performances I/O avec un tuning ZFS correct, 2-3× de débit réseau VM avec VirtIO multiqueue et jumbo frames, et une réduction de la latence de 30-50% avec le CPU pinning sur les workloads critiques.

Article suivant recommandé

Dimensionnement Proxmox VE 9 : CPU, RAM, Stockage, HA →

Découvrez mon outil

proxmox-cluster-manager

Gestionnaire de cluster Proxmox VE

Voir →

Surface d'attaque : Ensemble des points d'entrée exploitables par un attaquant pour compromettre un système, incluant les services exposés, les interfaces utilisateur et les API.

Snapshotez systématiquement vos machines virtuelles avant toute modification critique. Un snapshot prend quelques secondes et peut éviter des heures de reconstruction.

Sécurisez votre infrastructure virtualisée

Audit Proxmox, VMware, Hyper-V — durcissement hyperviseur, segmentation, protection anti-ransomware.

Demander un audit ayi@ayinedjimi-consultants.fr

Partager cet article

Twitter LinkedIn

À propos de l'auteur

Ayi NEDJIMI

Auditeur Senior Cybersécurité & Consultant IA

Expert Judiciaire — Cour d'Appel de Paris
Habilitation Confidentiel Défense

ayi@ayinedjimi-consultants.fr

25+

ans d'expérience

700+

articles publiés

100+

missions réalisées

Ayi NEDJIMI est un vétéran de la cybersécurité avec plus de 25 ans d'expérience sur des missions critiques. Ancien développeur Microsoft à Redmond sur le module GINA (Windows NT4) et co-auteur de la version française du guide de sécurité Windows NT4 pour la NSA.

À la tête d'Ayi NEDJIMI Consultants, il réalise des audits Lead Auditor ISO 42001 et ISO 27001, des pentests d'infrastructures critiques, du forensics et des missions de conformité NIS2 / AI Act.

Conférencier international (Europe & US), il a formé plus de 10 000 professionnels.

Domaines d'expertise

ISO 42001 Lead Auditor ISO 27001 · NIS2 Pentest & Forensics IA / LLM / RAG Cloud & Active Directory

Voir le profil complet Demander un devis

Ressources & Outils de l'auteur

GitHub

Code & projets open source

Hugging Face

Modèles IA & datasets

CertifExpress

Préparez vos certifications IT

WindowsBooster

Optimisation Windows 11

Testez vos connaissances

Mini-quiz de certification lié à cet article — propulsé par CertifExpress

Articles connexes

Proxmox VE 9 : Hyperviseur Open Source KVM/LXC 2026

Proxmox VE 9 (Debian 13, kernel 6.14, ZFS 2.3, QEMU 10.0) : hyperviseur open source KVM/LXC, Ceph hyperconverge, HA cluster, SDN, comparatif VMware.

10/05/2026

Proxmox Backup Manager : Vérifier et Auditer un Datastore

Vérifier l'intégrité d'un datastore Proxmox Backup Server (PBS) constitue un pilier souvent négligé de toute stratégie de sauvegarde robuste. La commande proxmox-backup-manager datastore verify garantit que chaque chunk déduplikué correspond bien à son hash SHA-256 d'origine, détectant ainsi la corruption silencieuse (bit rot) et les défaillances matérielles. Ce guide explore le cycle complet : commandes CLI, audit du status, planification, gestion des erreurs, performance multi-thread, monitoring Prometheus/Grafana et chiffrement.

08/05/2026

Proxmox vs VMware : Comparatif Complet et Guide de Migration 2026

Comparatif détaillé Proxmox VE vs VMware vSphere : technique, TCO sur 3 ans, scénarios migration, retours d'expérience. Contexte Broadcom 2026.

19/04/2026

Article précédent

Outils Proxmox VE : Monitoring, IaC et Écosystème 2026

Article suivant

Dimensionnement Proxmox VE 9 : CPU, RAM, Stockage, HA

Commentaires

Aucun commentaire pour le moment. Soyez le premier à commenter !

Laisser un commentaire