Agentjacking : les agents IA de codage dans le viseur

13 juin 2026

•

Mis à jour le 30 juillet 2026

•

8 min de lecture

•

1324 mots

•

157 vues

•

Tenet Security documente l'Agentjacking, une nouvelle classe d'attaque capable de détourner des agents IA de codage (Cursor, Devin, GitHub Copilot Workspace) pour exécuter du code arbitraire sur les machines des développeurs via de faux rapports d'erreur Sentry.

En bref

Des chercheurs de Tenet Security ont documenté « Agentjacking », une nouvelle classe d'attaque permettant d'exécuter du code arbitraire sur les machines des développeurs via des agents IA de codage.
Les victimes potentielles sont tous les développeurs utilisant des assistants IA autonomes comme Cursor, Devin ou GitHub Copilot Workspace — des outils désormais courants dans les équipes d'ingénierie.
Les équipes de sécurité doivent auditer les permissions accordées aux agents IA et isoler leur exécution dans des environnements sandboxés.

Une chaîne d'attaque invisible au cœur des outils de développement

La sécurité des agents IA de codage vient de franchir un cap préoccupant. Les chercheurs de Tenet Security ont publié le 12 juin 2026 une analyse détaillant une nouvelle classe d'attaque qu'ils ont baptisée « Agentjacking » — contraction d'agent et de hijacking. La technique cible spécifiquement les outils de développement pilotés par des modèles de langage, capables d'exécuter des actions de façon autonome sur les postes de travail des ingénieurs : lire des fichiers, modifier du code, lancer des commandes shell, accéder à des dépôts distants.

Le vecteur initial décrit dans le rapport est particulièrement insidieux. L'attaquant forge un faux rapport d'erreur au format Sentry — la plateforme de suivi des erreurs et de monitoring de performance open source utilisée par des millions de projets à travers le monde — et le fait remonter vers le système de l'agent IA cible. Lorsque l'agent traite ce rapport pour « résoudre » l'erreur, il interprète le contenu malveillant comme une instruction légitime et exécute le code embarqué dans le faux rapport.

Ce mécanisme exploite un principe fondamental du fonctionnement des agents IA modernes : leur capacité à interpréter du contenu issu de sources externes pour prendre des décisions et agir en conséquence. Là où un développeur humain lirait un rapport d'erreur avec un œil critique, l'agent IA suit les instructions sans le filtre d'un raisonnement sceptique systématique. Tenet Security décrit une attaque par injection de prompt indirect portée à un nouveau niveau d'impact, puisque l'exécution de code arbitraire est directement possible sans interaction humaine supplémentaire.

Les chercheurs ont testé leur vecteur d'attaque contre plusieurs agents populaires sur le marché, dont Cursor — l'éditeur de code IA qui a connu une adoption massive en 2025-2026 avec plusieurs millions d'utilisateurs actifs — ainsi que GitHub Copilot Workspace, la fonctionnalité autonome de GitHub permettant de déléguer des tickets entiers à un agent IA, et Devin, l'agent de codage autonome de Cognition Labs. L'attaque s'est révélée fonctionnelle sur l'ensemble des cibles testées, avec des variantes selon le niveau d'accès accordé à chaque agent dans l'environnement de développement.

L'impact potentiel d'un Agentjacking réussi est considérable. Selon le rapport de Tenet Security, un attaquant parvenant à détourner un agent IA doté d'accès complets à un poste de développeur peut exfiltrer des secrets d'environnement (clés d'API, tokens SSH, credentials AWS/Azure), modifier silencieusement du code source avant qu'il ne soit soumis à une révision humaine, installer des backdoors dans les dépendances du projet, ou encore pivoter vers d'autres systèmes accessibles depuis le poste compromis. Dans le contexte d'un développeur travaillant sur des infrastructures critiques ou des produits SaaS, les conséquences d'une telle compromission peuvent toucher des centaines de milliers d'utilisateurs finaux.

Tenet Security insiste sur le fait que la surface d'attaque créée par les agents IA n'est pas seulement liée aux permissions explicitement accordées. Beaucoup d'environnements de développement sont configurés pour que l'agent accède à l'historique Git complet, aux fichiers .env non versionnés, aux configurations de cloud CLI stockées localement, et aux credentials de bases de données de développement. Ces éléments sont rarement isolés du reste du système. L'agent IA opère avec les droits de l'utilisateur connecté, sans cloisonnement par défaut.

La technique ne requiert pas de compromission préalable de l'infrastructure Sentry. Les faux rapports peuvent être injectés via d'autres canaux : un README malveillant dans un dépôt public que l'agent est invité à analyser, une issue GitHub formulée de façon à tromper l'agent en mode « résolution automatique », ou des commentaires de code dans des fichiers partagés. Toute source de contenu textuel que l'agent est amené à lire et à interpréter comme des instructions devient un vecteur potentiel d'Agentjacking.

La publication de Tenet Security ne mentionne pas de correctif disponible à ce stade. Les éditeurs concernés — Anysphere pour Cursor, GitHub/Microsoft pour Copilot Workspace, Cognition pour Devin — ont été contactés dans le cadre d'une divulgation responsable avant la publication. Les mesures de mitigation proposées reposent essentiellement sur des bonnes pratiques d'architecture : sandboxer l'exécution des agents, limiter strictement les permissions d'accès aux fichiers sensibles, et activer une validation humaine obligatoire pour toute action à fort impact décidée par l'agent.

Une menace qui cristallise les risques de l'IA autonome dans les pipelines DevSecOps

L'émergence de l'Agentjacking s'inscrit dans une tendance plus large que la communauté de la sécurité observe avec une attention croissante depuis l'explosion de l'adoption des agents IA en 2025. Les attaques par prompt injection — technique consistant à injecter des instructions malveillantes dans le contexte d'un modèle de langage pour lui faire dévier de son comportement attendu — étaient jusqu'ici principalement étudiées dans le contexte des chatbots grand public. La nouveauté ici est que la cible n'est plus un assistant conversationnel mais un agent disposant de capacités d'exécution réelles sur des systèmes sensibles.

Le modèle d'accès accordé aux agents de codage est structurellement problématique du point de vue de la sécurité. Pour être utiles, ces agents doivent avoir accès à de larges pans du contexte de travail du développeur : l'ensemble du dépôt, les fichiers de configuration, les variables d'environnement, parfois les secrets dans des vaults locaux. Ce niveau d'accès est précisément ce qui les rend productifs — et simultanément ce qui fait de leur détournement une opération à très fort rendement pour un attaquant.

D'un point de vue historique, ce type de risque était déjà documenté de façon théorique. Les travaux du chercheur Johann Rehberger sur les attaques par injection de prompt indirect publiés en 2024 avaient prévu que l'autonomisation croissante des agents IA en ferait des cibles de choix. La nouveauté introduite par Tenet Security est la démonstration empirique, avec une chaîne d'exploitation complète et reproductible sur des outils commerciaux en production.

Pour les équipes de sécurité, l'Agentjacking pose un défi particulier : la détection est difficile. L'agent IA opère souvent de façon légitime sur le poste du développeur, ses actions sont mélangées à un flux normal d'activité, et les logs produits peuvent être insuffisants pour distinguer une action légitime d'une action déclenchée par un contenu malveillant. Les solutions de type EDR (Endpoint Detection and Response) ne sont pas conçues pour analyser la sémantique des prompts traités par un LLM. Il s'agit d'une lacune de visibilité réelle que les équipes SOC vont devoir adresser à mesure que l'adoption des agents IA en entreprise s'accélère.

Ce qu'il faut retenir

L'« Agentjacking » est une technique d'attaque documentée par Tenet Security permettant de détourner des agents IA de codage (Cursor, Copilot Workspace, Devin) pour exécuter du code arbitraire sur les machines des développeurs.
Le vecteur initial démontré passe par un faux rapport d'erreur Sentry, mais tout contenu textuel interprété comme instruction par l'agent constitue une surface d'attaque potentielle.
La mitigation recommandée combine sandboxing des agents, limitation stricte des permissions et validation humaine obligatoire pour les actions à fort impact.

Mon équipe utilise Cursor ou Copilot Workspace — quelles mesures prendre immédiatement ?

En priorité, restreignez les permissions accordées à l'agent au strict nécessaire : évitez qu'il accède aux fichiers .env, aux configurations cloud CLI et aux secrets locaux. Activez la validation humaine pour toutes les commandes shell proposées par l'agent. Utilisez des environnements de développement isolés (VM, containers) pour les projets sensibles, et formez vos développeurs à signaler tout comportement inattendu de l'agent à l'équipe sécurité.

Besoin d'un accompagnement expert ?

Ayi NEDJIMI vous accompagne sur vos projets cybersécurité et IA.

Prendre contact

Sources et références

#News

Partager cet article

Twitter LinkedIn

À propos de l'auteur

Ayi NEDJIMI

Auditeur Senior Cybersécurité & Consultant IA

Expert Judiciaire — Cour d'Appel de Paris
Habilitation Confidentiel Défense

[email protected]

25+

ans d'expérience

700+

articles publiés

100+

missions réalisées

Ayi NEDJIMI est un vétéran de la cybersécurité avec plus de 25 ans d'expérience sur des missions critiques. Ancien développeur Microsoft à Redmond sur le module GINA (Windows NT4) et co-auteur de la version française du guide de sécurité Windows NT4 pour la NSA.

À la tête d'Ayi NEDJIMI Consultants, il réalise des audits Lead Auditor ISO 42001 et ISO 27001, des pentests d'infrastructures critiques, du forensics et des missions de conformité NIS2 / AI Act.

Conférencier international (Europe & US), il a formé plus de 10 000 professionnels.

Domaines d'expertise

ISO 42001 Lead Auditor ISO 27001 · NIS2 Pentest & Forensics IA / LLM / RAG Cloud & Active Directory

Voir le profil complet Demander un devis

Ressources & Outils de l'auteur

GitHub

Code & projets open source

ORCID

Identifiant chercheur

Hugging Face

Modèles IA & datasets

CertifExpress

Préparez vos certifications IT

WindowsBooster

Optimisation Windows 11

Articles connexes

RufRoot CVE-2026-59726 : CVSS 10 dans Ruflo, 233 outils IA exposés

CVE-2026-59726 (CVSS 10.0) dite RufRoot, découverte par Noma Security, exposait 233 outils de l'orchestrateur d'agents IA Ruflo via un pont MCP sans authentification, permettant le vol de clés API Claude et OpenAI ainsi que l'exécution de commandes shell arbitraires.

30/07/2026

CVE-2026-60004 : RCE critique dans Gitea via un git hook

Une faille d'exécution de code à distance CVSS 9.8 corrigée dans Gitea 1.27.1 le 27 juillet 2026 permet à tout utilisateur enregistré de planter un git hook malveillant et d'exécuter des commandes shell sur le serveur hébergeant la forge.

30/07/2026

30 réseaux d'eau du Minnesota victimes d'une cyberattaque OT

Une cyberattaque coordonnée a paralysé plus de 30 systèmes d'alimentation en eau du Minnesota les 26 et 27 juillet 2026, ciblant les automates industriels via des connexions sans fil et mettant hors ligne la station de traitement de Braham.

30/07/2026

Article précédent

Crimenetwork 2.0 démantelé : admin arrêté en Espagne

Article suivant

DiffusionGemma : la diffusion de texte open-weight selon Google

Besoin d'un expert ?

Un projet cybersécurité ? Parlons-en.

Pentest, conformité NIS 2, ISO 27001, audit IA, RSSI externalisé… nos experts répondent sous 24h pour évaluer votre besoin et vous proposer un accompagnement sur mesure.

Nous contacter

Commentaires (1)

Aurelie Dupasquier 01/01/0001 à 00:00

On a justement discute de ca en reunion SSI cette semaine. Le vecteur via Sentry est malin parce que personne ne remet en question les SDK de monitoring. Va falloir revoir nos politiques sur les dependances autorisees dans les environnements de dev.

Laisser un commentaire