HuggingFace CVE-2026-4372 : RCE par fichier de config IA

6 juin 2026

•

Mis à jour le 26 juillet 2026

•

8 min de lecture

•

1316 mots

•

162 vues

•

Une faille critique (CVE-2026-4372) dans la bibliothèque HuggingFace Transformers permet l'exécution de code à distance via des modèles IA malveillants, exposant 232 millions de téléchargements sur six mois.

En bref

La CVE-2026-4372 est une faille critique dans la bibliothèque HuggingFace Transformers qui permet l'exécution de code arbitraire via un fichier de configuration IA malveillant, même avec la protection trust_remote_code=False activée.
Environ 232 millions de téléchargements ont été effectués pendant la fenêtre d'exposition de six mois (août 2025 à mars 2026), créant un risque de chaîne d'approvisionnement majeur pour l'écosystème IA.
La version 5.3.0 de HuggingFace Transformers corrige la vulnérabilité — toute organisation utilisant des modèles IA tiers doit mettre à jour immédiatement.

Une faille critique exposée dans le cœur de l'écosystème IA open source

Des chercheurs en sécurité ont révélé une vulnérabilité critique dans la bibliothèque HuggingFace Transformers, officiellement répertoriée sous l'identifiant CVE-2026-4372. Cette faille permet à un attaquant de provoquer l'exécution de code Python arbitraire sur la machine d'une victime au simple moment du chargement d'un modèle IA — sans que l'utilisateur ne réalise que quelque chose d'anormal se produit. La bibliothèque Transformers, maintenue par HuggingFace, est l'une des plus utilisées au monde pour l'entraînement, le déploiement et l'inférence de modèles de traitement du langage naturel et d'IA générative.

Le vecteur d'attaque est particulièrement insidieux. La vulnérabilité réside dans la manière dont la bibliothèque traite l'attribut _attn_implementation_internal lors du chargement d'un fichier de configuration de modèle (config.json). Un attaquant peut injecter une valeur malveillante dans cet attribut à l'intérieur d'un modèle distribué publiquement sur le Hub HuggingFace ou via tout autre canal de partage. Lorsque la victime charge le modèle avec l'instruction AutoModel.from_pretrained(), la bibliothèque exécute silencieusement le code injecté dans le processus courant, avec les privilèges de l'utilisateur qui l'exécute.

Ce qui rend la CVE-2026-4372 particulièrement grave est qu'elle contourne le mécanisme de protection trust_remote_code. Ce paramètre, présent dans la bibliothèque depuis plusieurs versions, est censé protéger les utilisateurs contre l'exécution de code non vérifiable provenant de modèles distants. Lorsque trust_remote_code=False (valeur par défaut), la bibliothèque est supposée refuser tout code personnalisé fourni par le créateur du modèle. La CVE-2026-4372 exploite un chemin de code distinct qui échappe entièrement à ce contrôle, rendant la protection inefficace dans toutes les versions affectées.

La fenêtre d'exposition est considérable. D'après les chercheurs, le code vulnérable a été introduit dans la version 4.56.0 de la bibliothèque, publiée en août 2025. La faille est restée exploitable jusqu'en mars 2026, date à laquelle une version corrective a été préparée en coulisses. Le correctif officiel a été intégré dans la version 5.3.0, dont la disponibilité publique a coïncidé avec la divulgation coordonnée de la CVE. Cette chronologie représente une fenêtre de vulnérabilité d'environ six mois pendant laquelle des millions d'installations étaient potentiellement compromettables.

L'ampleur de l'exposition est vertigineuse : les versions affectées de HuggingFace Transformers ont enregistré environ 232 millions de téléchargements sur PyPI durant cette période. Ce chiffre ne correspond pas à 232 millions d'installations uniques — beaucoup sont des pipelines CI/CD, des environnements d'entraînement cloud et des images Docker reconstruites régulièrement — mais il illustre le périmètre potentiel de la menace. Toute organisation utilisant la bibliothèque dans ses pipelines d'IA et chargeant des modèles tiers depuis le Hub HuggingFace ou d'autres sources est potentiellement concernée.

Le scénario d'attaque le plus probable implique un acteur malveillant publiant un modèle apparemment légitime sur le Hub HuggingFace — un fine-tune de LLaMA, un modèle de classification d'images ou un embedder spécialisé — avec un fichier config.json modifié pour contenir le payload malveillant. Les chercheurs ont démontré que le code peut s'exécuter sans déclencher d'avertissement visible. Une fois exécuté, le payload dispose de tous les droits du processus courant et peut exfiltrer des données, déposer un implant persistant, accéder à des secrets d'environnement (clés AWS, tokens d'API) ou pivoter vers d'autres systèmes du réseau interne.

HuggingFace a réagi en publiant la version 5.3.0 qui bloque les attributs internes non sûrs lors de l'analyse de la configuration et renforce les contrôles sur le chargement de noyaux optionnels. La mise à jour garantit que l'exécution de code externe requiert désormais un consentement explicite via trust_remote_code=True, et que ce mécanisme ne peut plus être contourné par les chemins d'attributs internes. HuggingFace a également procédé à une analyse rétrospective de son Hub pour identifier les modèles ayant pu exploiter cette technique.

Les versions affectées couvrent HuggingFace Transformers 4.56.0 à 5.2.x lorsque le paquet optionnel kernels est installé conjointement. Les utilisateurs de versions antérieures à 4.56.0 ne sont pas concernés par ce vecteur spécifique. La mise à jour vers la version 5.3.0 ou ultérieure est la seule action corrective recommandée : aucun contournement (workaround) n'a été publié pour les versions affectées, ce qui rend la mise à jour impérative pour toute organisation exposée.

Une alerte sur la sécurité de la chaîne d'approvisionnement IA

La CVE-2026-4372 illustre de manière frappante un risque systémique encore largement sous-estimé : la chaîne d'approvisionnement des modèles IA. Contrairement aux dépendances logicielles classiques — où l'audit du code source d'une bibliothèque est techniquement possible — les modèles IA distribués sur des hubs publics comme HuggingFace, Ollama ou Civitai sont des artefacts en partie opaques. Leurs fichiers de configuration, leurs poids et leurs scripts associés peuvent contenir du code exécutable difficile à inspecter sans outils spécialisés, et il n'existe pas encore de standard universellement adopté pour signer cryptographiquement ces artefacts.

Ce vecteur d'attaque n'est pas nouveau conceptuellement : la recherche en sécurité avait démontré dès 2023 que les fichiers pickle (format couramment utilisé pour sérialiser les poids de modèles PyTorch) pouvaient embarquer du code arbitraire. La CVE-2026-4372 démontre que les vecteurs se diversifient : désormais, même un fichier JSON de configuration — réputé inoffensif — peut servir de point d'entrée. Cette évolution du paysage des menaces doit inciter les équipes de sécurité à considérer les modèles IA comme des artefacts à risque, au même titre que les images de conteneurs ou les packages npm.

Du point de vue des entreprises, la gestion du risque exige plusieurs actions concrètes. En priorité, il faut auditer les pipelines d'IA qui chargent des modèles depuis des sources externes et vérifier que HuggingFace Transformers est mis à jour vers la version 5.3.0. À moyen terme, il est recommandé de mettre en place un registre interne de modèles approuvés, similaire aux registres de conteneurs privés utilisés pour maîtriser les images Docker en production. Des outils comme ModelScan ou les fonctionnalités de sécurité du Hub HuggingFace Enterprise peuvent aider à détecter les modèles suspects avant leur utilisation en production.

L'incident rappelle également l'importance de l'isolation des environnements d'exécution pour les charges de travail IA. Charger des modèles dans des environnements sandboxés, avec des droits réseau et filesystem minimaux, limite significativement l'impact d'une exploitation réussie. Cette pratique, courante dans les SOC pour l'analyse de malwares, devrait devenir standard dans tout pipeline d'intégration de modèles IA tiers, en particulier lorsque ces modèles proviennent de sources non vérifiées ou d'auteurs inconnus sur des hubs publics.

Ce qu'il faut retenir

CVE-2026-4372 permet l'exécution de code arbitraire au chargement d'un modèle HuggingFace, même avec trust_remote_code=False — le contournement du mécanisme de protection est au cœur de la gravité de la faille.
232 millions de téléchargements effectués pendant la fenêtre de six mois (août 2025 - mars 2026) créent un risque de compromission étendu pour tous les pipelines IA utilisant des modèles tiers.
Action immédiate : mettre à jour HuggingFace Transformers vers la version 5.3.0 et auditer les pipelines qui chargent des modèles depuis des sources externes non vérifiées.

Comment vérifier si mon environnement est affecté par CVE-2026-4372 ?

Exécutez pip show transformers pour connaître la version installée. Si elle est comprise entre 4.56.0 et 5.2.x et que le paquet kernels est présent, votre environnement est vulnérable. Mettez à jour avec pip install --upgrade transformers vers la version 5.3.0 ou supérieure. Vérifiez également les images Docker et les environnements conda de votre organisation.

Besoin d'un accompagnement expert ?

Ayi NEDJIMI vous accompagne sur vos projets cybersécurité et IA.

Prendre contact

Sources et références

#Alertes CVE

Partager cet article

Twitter LinkedIn

À propos de l'auteur

Ayi NEDJIMI

Auditeur Senior Cybersécurité & Consultant IA

Expert Judiciaire — Cour d'Appel de Paris
Habilitation Confidentiel Défense

[email protected]

25+

ans d'expérience

700+

articles publiés

100+

missions réalisées

Ayi NEDJIMI est un vétéran de la cybersécurité avec plus de 25 ans d'expérience sur des missions critiques. Ancien développeur Microsoft à Redmond sur le module GINA (Windows NT4) et co-auteur de la version française du guide de sécurité Windows NT4 pour la NSA.

À la tête d'Ayi NEDJIMI Consultants, il réalise des audits Lead Auditor ISO 42001 et ISO 27001, des pentests d'infrastructures critiques, du forensics et des missions de conformité NIS2 / AI Act.

Conférencier international (Europe & US), il a formé plus de 10 000 professionnels.

Domaines d'expertise

ISO 42001 Lead Auditor ISO 27001 · NIS2 Pentest & Forensics IA / LLM / RAG Cloud & Active Directory

Voir le profil complet Demander un devis

Ressources & Outils de l'auteur

GitHub

Code & projets open source

ORCID

Identifiant chercheur

Hugging Face

Modèles IA & datasets

CertifExpress

Préparez vos certifications IT

WindowsBooster

Optimisation Windows 11

Testez vos connaissances

Mini-quiz de certification lié à cet article — propulsé par CertifExpress

Articles connexes

CVE-2026-48286 : RCE non-auth CVSS 10.0 Adobe Campaign

CVE-2026-48286 est une faille de sévérité maximale (CVSS 10.0) dans Adobe Campaign Classic on-premise, permettant une exécution de code arbitraire sans authentification. L’une des 7 failles CVSS 10.0 du Security Bulletin APSB26-34 d’Adobe (juillet 2026).

25/07/2026

CVE-2026-64600 RefluXFS : LPE root silencieuse Linux RHEL

RefluXFS (CVE-2026-64600, CVSS 7.8) est une race condition vieille de 9 ans dans le filesystem XFS du noyau Linux, permettant une escalade silencieuse vers root sur 16,4 millions de systèmes RHEL. Découverte par Qualys le 22 juillet 2026, elle bypass SELinux et les conteneurs.

25/07/2026

CVE-2026-54121 Certighost : domaine AD compromis via ADCS

Certighost (CVE-2026-54121, CVSS 8.8) permet à tout utilisateur de domaine d'usurper l'identité d'un contrôleur Active Directory via AD CS et de compromettre l'intégralité du domaine. PoC public disponible depuis le 24 juillet 2026.

25/07/2026

Article précédent

ChatGPT Dreaming V3 : OpenAI refond la mémoire personnalisée

Article suivant

FIFA 2026 : le FBI signale 4 300 domaines pirates et malwares

Besoin d'un expert ?

Un projet cybersécurité ? Parlons-en.

Pentest, conformité NIS 2, ISO 27001, audit IA, RSSI externalisé… nos experts répondent sous 24h pour évaluer votre besoin et vous proposer un accompagnement sur mesure.

Nous contacter

Commentaires (1)

Nadia Corvaisier 01/01/0001 à 00:00

Est-ce que la faille touche aussi les modèles chargés via l'API Inference Endpoints ou seulement les dépôts publics avec un config.json mal formé ? On déploie des pipelines Transformers en interne et je cherche à évaluer notre exposition.

Laisser un commentaire