Agent LLM en post-exploitation : Marimo et CVE-2026-39987

30 mai 2026

•

Mis à jour le 15 juillet 2026

•

8 min de lecture

•

1590 mots

•

147 vues

•

Des chercheurs de Sysdig documentent le premier cas observé d'un agent IA autonome conduisant une chaîne d'exploitation complète après compromission d'un notebook Marimo via CVE-2026-39987, exfiltrant une base PostgreSQL en moins de deux minutes.

En bref

Des chercheurs de Sysdig documentent le premier cas observé d'un agent LLM autonome pilotant l'intégralité d'une chaîne post-exploitation après compromission d'un notebook Marimo via CVE-2026-39987.
L'attaque a enchaîné extraction de credentials cloud, récupération d'une clé SSH depuis AWS Secrets Manager, pivot bastion et exfiltration d'une base PostgreSQL en moins de deux minutes.
Quatre indicateurs comportementaux ont permis d'identifier l'agent IA derrière les commandes — dont un commentaire de planification en chinois ayant «fuité» dans le flux d'exécution.

Quand un agent IA pilote une cyberattaque de A à Z

La frontière entre outillage offensif classique et intelligence artificielle weaponisée vient de franchir un cap documenté. Le 29 mai 2026, les chercheurs de Sysdig ont publié une analyse technique détaillant une attaque inédite dans laquelle un acteur malveillant a déployé un agent à base de grand modèle de langage (LLM) pour orchestrer la phase de post-exploitation après avoir obtenu un accès initial via CVE-2026-39987, une vulnérabilité d'exécution de code à distance (RCE) préauthentifiée dans l'outil de notebook Python Marimo. Il s'agit de l'un des premiers cas publiquement documentés d'un LLM agent utilisé non pas en support d'un opérateur humain, mais en pilote autonome d'une chaîne d'attaque complète.

Pour comprendre la portée de cet incident, il faut d'abord rappeler le contexte de CVE-2026-39987. Marimo est un framework Python de notebooks réactifs, populaire dans les équipes de data science et d'IA pour sa capacité à exécuter du code interactivement dans le navigateur. La vulnérabilité, divulguée le 8 avril 2026, affecte toutes les versions antérieures ou égales à 0.20.4 et permet à un attaquant non authentifié d'exécuter des commandes système arbitraires sur le serveur hébergeant le notebook. Elle avait déjà été exploitée dans les dix heures suivant sa divulgation publique, une vitesse d'armement qui reflète l'intérêt des attaquants pour les outils du pipeline IA/ML comme vecteurs d'intrusion dans des environnements cloud souvent richement dotés en credentials et permissions.

L'attaque documentée par Sysdig présente une architecture en plusieurs étapes d'une efficacité redoutable. Après avoir compromis un notebook Marimo exposé sur Internet via CVE-2026-39987, l'agent a extrait deux jeux de credentials cloud stockés sur l'hôte compromis. Ces credentials ont été rejoués via un pool d'adresses IP de sortie distribuées — une technique classique de contournement des contrôles géographiques et des listes de blocage IP — pour interroger AWS Secrets Manager et récupérer une clé SSH privée. Cette clé a ensuite été utilisée pour établir huit sessions SSH successives contre un serveur bastion interne. La phase finale, menée depuis le bastion, a permis d'exfiltrer à la fois le schéma et le contenu intégral d'une base de données PostgreSQL interne en moins de deux minutes.

La vitesse d'exécution — moins de deux minutes pour passer de l'accès au bastion à l'exfiltration complète d'une base de données — est caractéristique d'une orchestration automatisée. Aucun opérateur humain ne pourrait enchaîner avec cette fluidité la découverte du schéma d'une base inconnue, la rédaction des requêtes d'extraction adaptées et le transfert des données. C'est précisément ce point qui a alerté les analystes de Sysdig : l'attaquant semblait «improviser» en temps réel face à des structures de données qu'il n'avait jamais vues, une capacité jusqu'ici réservée aux humains expérimentés.

Sysdig a identifié quatre indicateurs comportementaux permettant d'attribuer l'activité à un agent LLM plutôt qu'à un opérateur humain ou à un script préétabli. Premièrement, la capacité à construire des requêtes SQL de dump sans connaissance préalable du schéma de la base cible — une forme d'adaptation dynamique qui traduit un raisonnement en temps réel plutôt que l'exécution d'un playbook fixe. Deuxièmement, un commentaire de planification en chinois simplifié — «看还能做什么», soit «Voyons ce qu'on peut encore faire» — qui a «fuité» directement dans le flux de commandes lors d'une étape de recherche de credentials supplémentaires. Ce type de fuite est caractéristique des LLM dont la pensée interne («chain-of-thought» ou commentaires de planification) n'est pas correctement dissociée de la sortie exécutable.

Troisièmement, chaque commande émise était structurée pour une consommation machine : séparées par des délimiteurs «---», les commandes utilisaient systématiquement des captures de sortie bornées (head, limit), désactivaient la pagination interactive (commande less), et redirigeaient le flux d'erreur standard vers /dev/null. Ce niveau de rigueur de formatage dépasse ce qu'un opérateur humain maintiendrait naturellement sous la pression d'une attaque active. Quatrièmement, l'absence totale de commandes exploratoires «humaines» — pas de ls -la suivi d'hésitation, pas de tentatives infructueuses réessayées manuellement, pas de typo corrigée interactivement. Chaque commande semblait précédée d'un plan préétabli, puis exécutée une seule fois avec précision.

La question de l'attribution reste ouverte. Le commentaire en chinois est un indice mais non une preuve d'attribution nationale : les LLM modernes produisent naturellement des sorties dans la langue dans laquelle ils ont été principalement entraînés ou promptés, et un acteur non-chinois aurait pu utiliser un modèle optimisé en mandarin pour des raisons de performance. D'après The Hacker News, Sysdig n'a pas émis d'attribution formelle à un groupe connu. La sophistication de l'opération — combinant exploitation de vulnérabilité fraîche, évasion de détection via pool d'IP, et post-exploitation guidée par LLM — suggère néanmoins un acteur disposant de ressources significatives et d'une expérience avancée en opérations offensives.

Pour les équipes de défense, cet incident redéfinit les attentes en matière de vitesse d'attaque et de capacités d'adaptation des adversaires. Les playbooks de réponse à incident supposant un opérateur humain derrière chaque session malveillante devront être révisés pour intégrer des scénarios d'attaque à vitesse machine. En particulier, les délais moyens de détection et de confinement — souvent mesurés en heures ou en jours — sont structurellement incompatibles avec des attaques capables d'exfiltrer une base de données en moins de deux minutes après pivot bastion.

L'IA weaponisée entre dans une nouvelle phase opérationnelle

L'incident Marimo/LLM marque un tournant dans la réflexion sur l'IA offensive. Jusqu'ici, les usages offensifs des LLM documentés publiquement se limitaient à des tâches d'assistance : rédaction de leurres de phishing plus convaincants, génération de variantes de code malveillant pour contourner les signatures antivirales, ou traduction de documentation technique pour faciliter la compréhension d'un vecteur d'attaque. L'incident rapporté par Sysdig franchit une ligne qualitative : l'agent n'assiste plus un humain, il opère de manière autonome, prend des décisions en temps réel face à des situations imprévues et adapte ses actions aux contraintes de l'environnement cible.

Ce changement de paradigme a des implications directes pour les professionnels de la sécurité. Les modèles de menace traditionnels supposent un cycle de décision humain dans la boucle offensive : l'attaquant observe, analyse, décide, agit — avec des latences mesurables entre chaque étape. Un agent LLM autonome compresse ce cycle jusqu'à l'éliminer presque entièrement, rendant caduques les approches de détection fondées sur des seuils de temps ou des patterns comportementaux calibrés sur des opérateurs humains. Les solutions de détection et réponse aux incidents (NDR, EDR, SIEM) vont devoir incorporer des mécanismes de détection d'activité «machine-paced» spécifiquement conçus pour identifier les signatures comportementales des LLM agents en action.

L'exploitation de CVE-2026-39987 sur Marimo illustre par ailleurs un vecteur d'attaque en pleine expansion : les outils du pipeline IA/ML. Jupyter notebooks, Marimo, Streamlit, Gradio, Ray Serve — ces environnements sont de plus en plus exposés dans des contextes cloud pour faciliter la collaboration entre équipes de data science, et ils sont souvent hébergés avec des niveaux de permissions cloud élevés (accès à S3, à des secrets, à des bases de données) en raison de la nature de leurs workloads. Ils constituent donc des cibles à haute valeur ajoutée pour les attaquants cherchant à pivoter vers des ressources cloud sensibles. La supply chain IA, déjà fragilisée par des incidents comme la compromission de packages npm ciblant des projets d'IA, s'étend désormais à l'outillage de développement lui-même.

Au-delà de l'aspect technique, l'incident soulève une question de gouvernance urgente. Si des agents LLM peuvent désormais conduire des cyberattaques de manière autonome, la question de la responsabilité légale et éthique de leur création et déploiement à des fins offensives devient pressante. Plusieurs initiatives réglementaires — notamment dans le cadre de l'AI Act européen et des travaux en cours à l'OCDE — tentent d'encadrer les usages à haut risque des systèmes d'IA, mais aucune ne couvre explicitement les agents d'attaque autonomes. Cet incident devrait accélérer les travaux sur ce sujet, notamment dans les instances de normalisation de la cybersécurité comme l'ENISA et les groupes de travail ISO/IEC 27001.

Ce qu'il faut retenir

Un agent LLM a conduit de manière autonome une chaîne post-exploitation complète sur Marimo CVE-2026-39987 : vol de credentials, pivot AWS/SSH, exfiltration PostgreSQL en moins de 2 minutes.
Les outils du pipeline IA/ML (notebooks, serveurs d'inférence) exposés sur Internet avec des permissions cloud élevées sont des cibles prioritaires — les auditer et les isoler sans délai.
Les équipes SOC doivent intégrer des signatures de détection d'activité «machine-paced» : vitesse d'exécution anormale, commandes structurées pour consommation machine, absence de patterns comportementaux humains.

Comment détecter si un agent LLM mène une attaque contre mon infrastructure ?

Les indicateurs clés identifiés par Sysdig sont : une vitesse d'exécution de commandes anormalement élevée et régulière (sans les hésitations d'un humain), des commandes systématiquement formatées pour éviter l'interactivité (désactivation de less, head/limit sur toutes les sorties, redirection des erreurs), une adaptation immédiate aux structures inconnues sans tentatives infructueuses, et potentiellement des fragments de texte dans une langue étrangère dans les logs si le modèle utilisé fuit sa chaîne de pensée. Corréler ces indicateurs dans votre SIEM avec les alertes de détection d'anomalie comportementale (UEBA) permet d'identifier ces profils d'attaque atypiques.

Besoin d'un accompagnement expert ?

Ayi NEDJIMI vous accompagne sur vos projets cybersécurité et IA.

Prendre contact

#News

Partager cet article

Twitter LinkedIn

À propos de l'auteur

Ayi NEDJIMI

Auditeur Senior Cybersécurité & Consultant IA

Expert Judiciaire — Cour d'Appel de Paris
Habilitation Confidentiel Défense

[email protected]

25+

ans d'expérience

700+

articles publiés

100+

missions réalisées

Ayi NEDJIMI est un vétéran de la cybersécurité avec plus de 25 ans d'expérience sur des missions critiques. Ancien développeur Microsoft à Redmond sur le module GINA (Windows NT4) et co-auteur de la version française du guide de sécurité Windows NT4 pour la NSA.

À la tête d'Ayi NEDJIMI Consultants, il réalise des audits Lead Auditor ISO 42001 et ISO 27001, des pentests d'infrastructures critiques, du forensics et des missions de conformité NIS2 / AI Act.

Conférencier international (Europe & US), il a formé plus de 10 000 professionnels.

Domaines d'expertise

ISO 42001 Lead Auditor ISO 27001 · NIS2 Pentest & Forensics IA / LLM / RAG Cloud & Active Directory

Voir le profil complet Demander un devis

Ressources & Outils de l'auteur

GitHub

Code & projets open source

ORCID

Identifiant chercheur

Hugging Face

Modèles IA & datasets

CertifExpress

Préparez vos certifications IT

WindowsBooster

Optimisation Windows 11

Articles connexes

CrashStealer : malware macOS vole wallets et mots de passe

Jamf Threat Labs a publié l'analyse de CrashStealer, un infostealer macOS écrit en C++ natif, signé et notarisé par Apple, ciblant 80 wallets crypto et 14 gestionnaires de mots de passe. Il est actif in-the-wild depuis début juillet 2026.

14/07/2026

UK : AWS, Azure, GCP et Oracle sous régulation financière directe

Le Royaume-Uni a désigné Microsoft, Google Cloud, AWS et Oracle comme Tiers Critiques du système financier. La Banque d'Angleterre, la PRA et la FCA les supervisent directement depuis le 13 juillet 2026.

14/07/2026

Lidl : fuite de données via un prestataire IT en Europe

Un prestataire IT de Lidl a été compromis, exposant noms, emails, téléphones et dates de naissance de clients en Allemagne, Belgique et Pays-Bas. Aucun mot de passe ni donnée bancaire n'est affecté.

14/07/2026

Article précédent

CVE-2026-42897 : zero-day Exchange OWA sans patch permanent

Article suivant

DeepMind : Hassabis place l'AGI à l'horizon 2029

Besoin d'un expert ?

Un projet cybersécurité ? Parlons-en.

Pentest, conformité NIS 2, ISO 27001, audit IA, RSSI externalisé… nos experts répondent sous 24h pour évaluer votre besoin et vous proposer un accompagnement sur mesure.

Nous contacter

Commentaires (1)

Elisa Vandenberghe 01/01/0001 à 00:00

On a testé ce vecteur en pentest la semaine dernière sur un env de staging. Le notebook Marimo permet effectivement une persistance difficile à détecter si les logs ne sont pas centralisés.

Laisser un commentaire