Tenet Security documente l'Agentjacking, une nouvelle classe d'attaque capable de détourner des agents IA de codage (Cursor, Devin, GitHub Copilot Workspace) pour exécuter du code arbitraire sur les machines des développeurs via de faux rapports d'erreur Sentry.
En bref
- Des chercheurs de Tenet Security ont documenté « Agentjacking », une nouvelle classe d'attaque permettant d'exécuter du code arbitraire sur les machines des développeurs via des agents IA de codage.
- Les victimes potentielles sont tous les développeurs utilisant des assistants IA autonomes comme Cursor, Devin ou GitHub Copilot Workspace — des outils désormais courants dans les équipes d'ingénierie.
- Les équipes de sécurité doivent auditer les permissions accordées aux agents IA et isoler leur exécution dans des environnements sandboxés.
Une chaîne d'attaque invisible au cœur des outils de développement
La sécurité des agents IA de codage vient de franchir un cap préoccupant. Les chercheurs de Tenet Security ont publié le 12 juin 2026 une analyse détaillant une nouvelle classe d'attaque qu'ils ont baptisée « Agentjacking » — contraction d'agent et de hijacking. La technique cible spécifiquement les outils de développement pilotés par des modèles de langage, capables d'exécuter des actions de façon autonome sur les postes de travail des ingénieurs : lire des fichiers, modifier du code, lancer des commandes shell, accéder à des dépôts distants.
Le vecteur initial décrit dans le rapport est particulièrement insidieux. L'attaquant forge un faux rapport d'erreur au format Sentry — la plateforme de suivi des erreurs et de monitoring de performance open source utilisée par des millions de projets à travers le monde — et le fait remonter vers le système de l'agent IA cible. Lorsque l'agent traite ce rapport pour « résoudre » l'erreur, il interprète le contenu malveillant comme une instruction légitime et exécute le code embarqué dans le faux rapport.
Ce mécanisme exploite un principe fondamental du fonctionnement des agents IA modernes : leur capacité à interpréter du contenu issu de sources externes pour prendre des décisions et agir en conséquence. Là où un développeur humain lirait un rapport d'erreur avec un œil critique, l'agent IA suit les instructions sans le filtre d'un raisonnement sceptique systématique. Tenet Security décrit une attaque par injection de prompt indirect portée à un nouveau niveau d'impact, puisque l'exécution de code arbitraire est directement possible sans interaction humaine supplémentaire.
Les chercheurs ont testé leur vecteur d'attaque contre plusieurs agents populaires sur le marché, dont Cursor — l'éditeur de code IA qui a connu une adoption massive en 2025-2026 avec plusieurs millions d'utilisateurs actifs — ainsi que GitHub Copilot Workspace, la fonctionnalité autonome de GitHub permettant de déléguer des tickets entiers à un agent IA, et Devin, l'agent de codage autonome de Cognition Labs. L'attaque s'est révélée fonctionnelle sur l'ensemble des cibles testées, avec des variantes selon le niveau d'accès accordé à chaque agent dans l'environnement de développement.
L'impact potentiel d'un Agentjacking réussi est considérable. Selon le rapport de Tenet Security, un attaquant parvenant à détourner un agent IA doté d'accès complets à un poste de développeur peut exfiltrer des secrets d'environnement (clés d'API, tokens SSH, credentials AWS/Azure), modifier silencieusement du code source avant qu'il ne soit soumis à une révision humaine, installer des backdoors dans les dépendances du projet, ou encore pivoter vers d'autres systèmes accessibles depuis le poste compromis. Dans le contexte d'un développeur travaillant sur des infrastructures critiques ou des produits SaaS, les conséquences d'une telle compromission peuvent toucher des centaines de milliers d'utilisateurs finaux.
Tenet Security insiste sur le fait que la surface d'attaque créée par les agents IA n'est pas seulement liée aux permissions explicitement accordées. Beaucoup d'environnements de développement sont configurés pour que l'agent accède à l'historique Git complet, aux fichiers .env non versionnés, aux configurations de cloud CLI stockées localement, et aux credentials de bases de données de développement. Ces éléments sont rarement isolés du reste du système. L'agent IA opère avec les droits de l'utilisateur connecté, sans cloisonnement par défaut.
La technique ne requiert pas de compromission préalable de l'infrastructure Sentry. Les faux rapports peuvent être injectés via d'autres canaux : un README malveillant dans un dépôt public que l'agent est invité à analyser, une issue GitHub formulée de façon à tromper l'agent en mode « résolution automatique », ou des commentaires de code dans des fichiers partagés. Toute source de contenu textuel que l'agent est amené à lire et à interpréter comme des instructions devient un vecteur potentiel d'Agentjacking.
La publication de Tenet Security ne mentionne pas de correctif disponible à ce stade. Les éditeurs concernés — Anysphere pour Cursor, GitHub/Microsoft pour Copilot Workspace, Cognition pour Devin — ont été contactés dans le cadre d'une divulgation responsable avant la publication. Les mesures de mitigation proposées reposent essentiellement sur des bonnes pratiques d'architecture : sandboxer l'exécution des agents, limiter strictement les permissions d'accès aux fichiers sensibles, et activer une validation humaine obligatoire pour toute action à fort impact décidée par l'agent.
Une menace qui cristallise les risques de l'IA autonome dans les pipelines DevSecOps
L'émergence de l'Agentjacking s'inscrit dans une tendance plus large que la communauté de la sécurité observe avec une attention croissante depuis l'explosion de l'adoption des agents IA en 2025. Les attaques par prompt injection — technique consistant à injecter des instructions malveillantes dans le contexte d'un modèle de langage pour lui faire dévier de son comportement attendu — étaient jusqu'ici principalement étudiées dans le contexte des chatbots grand public. La nouveauté ici est que la cible n'est plus un assistant conversationnel mais un agent disposant de capacités d'exécution réelles sur des systèmes sensibles.
Le modèle d'accès accordé aux agents de codage est structurellement problématique du point de vue de la sécurité. Pour être utiles, ces agents doivent avoir accès à de larges pans du contexte de travail du développeur : l'ensemble du dépôt, les fichiers de configuration, les variables d'environnement, parfois les secrets dans des vaults locaux. Ce niveau d'accès est précisément ce qui les rend productifs — et simultanément ce qui fait de leur détournement une opération à très fort rendement pour un attaquant.
D'un point de vue historique, ce type de risque était déjà documenté de façon théorique. Les travaux du chercheur Johann Rehberger sur les attaques par injection de prompt indirect publiés en 2024 avaient prévu que l'autonomisation croissante des agents IA en ferait des cibles de choix. La nouveauté introduite par Tenet Security est la démonstration empirique, avec une chaîne d'exploitation complète et reproductible sur des outils commerciaux en production.
Pour les équipes de sécurité, l'Agentjacking pose un défi particulier : la détection est difficile. L'agent IA opère souvent de façon légitime sur le poste du développeur, ses actions sont mélangées à un flux normal d'activité, et les logs produits peuvent être insuffisants pour distinguer une action légitime d'une action déclenchée par un contenu malveillant. Les solutions de type EDR (Endpoint Detection and Response) ne sont pas conçues pour analyser la sémantique des prompts traités par un LLM. Il s'agit d'une lacune de visibilité réelle que les équipes SOC vont devoir adresser à mesure que l'adoption des agents IA en entreprise s'accélère.
Ce qu'il faut retenir
- L'« Agentjacking » est une technique d'attaque documentée par Tenet Security permettant de détourner des agents IA de codage (Cursor, Copilot Workspace, Devin) pour exécuter du code arbitraire sur les machines des développeurs.
- Le vecteur initial démontré passe par un faux rapport d'erreur Sentry, mais tout contenu textuel interprété comme instruction par l'agent constitue une surface d'attaque potentielle.
- La mitigation recommandée combine sandboxing des agents, limitation stricte des permissions et validation humaine obligatoire pour les actions à fort impact.
Mon équipe utilise Cursor ou Copilot Workspace — quelles mesures prendre immédiatement ?
En priorité, restreignez les permissions accordées à l'agent au strict nécessaire : évitez qu'il accède aux fichiers .env, aux configurations cloud CLI et aux secrets locaux. Activez la validation humaine pour toutes les commandes shell proposées par l'agent. Utilisez des environnements de développement isolés (VM, containers) pour les projets sensibles, et formez vos développeurs à signaler tout comportement inattendu de l'agent à l'équipe sécurité.
Besoin d'un accompagnement expert ?
Ayi NEDJIMI vous accompagne sur vos projets cybersécurité et IA.
Prendre contactÀ propos de l'auteur
Ayi NEDJIMI
Auditeur Senior Cybersécurité & Consultant IA
Expert Judiciaire — Cour d'Appel de Paris
Habilitation Confidentiel Défense
[email protected]
Ayi NEDJIMI est un vétéran de la cybersécurité avec plus de 25 ans d'expérience sur des missions critiques. Ancien développeur Microsoft à Redmond sur le module GINA (Windows NT4) et co-auteur de la version française du guide de sécurité Windows NT4 pour la NSA.
À la tête d'Ayi NEDJIMI Consultants, il réalise des audits Lead Auditor ISO 42001 et ISO 27001, des pentests d'infrastructures critiques, du forensics et des missions de conformité NIS2 / AI Act.
Conférencier international (Europe & US), il a formé plus de 10 000 professionnels.
Domaines d'expertise
Ressources & Outils de l'auteur
Articles connexes
Colorado AI Act : refonte et report au 1er janvier 2027
Le Colorado a profondément révisé sa loi pionnière sur l'IA : SB 26-189, signé le 14 mai 2026, repousse l'entrée en vigueur au 1er janvier 2027 et abandonne les obligations les plus contraignantes au profit d'une simple obligation de notification.
DiffusionGemma : la diffusion de texte open-weight selon Google
Google DeepMind publie DiffusionGemma, son premier modèle de langage open-weight basé sur la diffusion de texte : 4x plus rapide qu'un modèle autorégressif de taille comparable, 18 Go de VRAM, fenêtre de 256 000 tokens et licence Apache 2.0.
Crimenetwork 2.0 démantelé : admin arrêté en Espagne
Le BKA et la police espagnole ont démantelé Crimenetwork 2.0, marché darkweb à 22 000 utilisateurs relancé en décembre 2024, et arrêté son administrateur présumé à Mallorca le 4 juin 2026 avec 314 000 euros en bitcoins saisis.
Un projet cybersécurité ? Parlons-en.
Pentest, conformité NIS 2, ISO 27001, audit IA, RSSI externalisé… nos experts répondent sous 24h pour évaluer votre besoin et vous proposer un accompagnement sur mesure.
Commentaires
Aucun commentaire pour le moment. Soyez le premier à commenter !
Laisser un commentaire