Sophos a découvert un laboratoire malveillant automatisé utilisant Claude Opus 4.5 et l'IDE Cursor pour développer et tester des outils d'évasion EDR. Le lab testait ses charges contre Sophos, CrowdStrike et Microsoft Defender dans des VMs Windows Server 2022 dédiées, dans le cadre d'opérations liées au ransomware.
En bref
- Sophos a découvert un laboratoire malveillant orchestré par Claude Opus 4.5 et l'IDE Cursor pour automatiser le développement d'outils d'évasion EDR
- Le lab testait ses outils contre Sophos, CrowdStrike Falcon et Microsoft Defender dans des VMs Windows Server 2022 dédiées
- L'infrastructure inclut Cobalt Strike profilé, un C2 Telegram, le framework Sliver et un panneau automatisé de reconnaissance Active Directory
Les faits
Le 2 juin 2026, Sophos a publié un rapport intitulé « Pointing a Cursor at evading detection », révélant la découverte d'un laboratoire de développement malveillant entièrement orchestré par intelligence artificielle. Les chercheurs de Sophos X-Ops ont mis la main sur un dépôt Git contenant les composants d'un système automatisé de développement, test et optimisation d'outils d'évasion des solutions EDR (Endpoint Detection and Response). L'infrastructure est formellement liée à des opérations de déploiement de ransomware et de vol de données.
Au cœur du dispositif : Claude Opus 4.5, le modèle d'Anthropic, utilisé comme agent coordinateur principal. Selon le rapport Sophos, cet agent « fixait les règles et orchestrait les autres agents » spécialisés dans des tâches précises — test EDR, durcissement OPSEC, documentation technique, stress-test des proxies, déploiement de machines virtuelles. L'IDE Cursor, conçu nativement pour l'assistance IA au développement, servait à l'écriture et la révision du code malveillant. Des agents supplémentaires surveillaient les publications de recherche en sécurité pour intégrer proactivement les techniques de bypass documentées publiquement.
Le laboratoire s'appuyait sur Ludus, une plateforme open source conçue pour les exercices de red team légitimes, permettant de déployer et gérer rapidement des environnements de test virtualisés. L'attaquant avait configuré quatre machines virtuelles : une VM Windows Server 2022 dédiée au test d'évasion du module Sophos, une seconde pour CrowdStrike Falcon, une VM contrôle sans aucun agent EDR installé, et un serveur Ubuntu faisant tourner le framework post-exploitation Sliver comme serveur C2.
Le processus de développement suivait un cycle itératif : l'IA générait un outil d'évasion, la soumettait aux VMs de test, analysait les résultats de détection, identifiait précisément les signatures comportementales ou statiques déclenchées, puis générait une version améliorée. Ce cycle « build-test-refine » reproduit exactement les méthodes des équipes red team professionnelles, compressé dans le temps grâce à l'automatisation IA. Ce qui prenait des jours à un opérateur humain peut désormais être accompli en quelques heures.
L'arsenal technique inclus dans le dépôt Git est sophistiqué. Des profils Cobalt Strike personnalisés font passer le trafic beacon pour du trafic HTTPS légitime vers des domaines de confiance — technique de Living-off-the-Land appliquée au trafic réseau. Un canal C2 basé sur l'API Telegram Bot route les communications via l'infrastructure Telegram, exploitant la confiance accordée aux domaines Telegram dans de nombreuses organisations. Des outils d'injection de shellcode et un Cloudflare Worker servant de couche d'obfuscation pour masquer l'infrastructure backend complètent le dispositif.
Le panneau de découverte Active Directory automatisé constitue l'un des éléments les plus préoccupants. La reconnaissance AD — identification des contrôleurs de domaine, des comptes privilégiés Kerberoastables, des Group Policy Objects, des chemins de latéralisation — est traditionnellement chronophage et bruyante pour les attaquants. Automatiser cette phase avec précision et discrétion accélère considérablement la progression vers les actifs critiques et l'exfiltration avant le chiffrement ransomware.
Sophos précise un point important : le workflow reste humain-dépendant. Aucune IA n'est embarquée dans les charges utiles déployées chez les victimes, et chaque cycle de test nécessite une validation humaine. L'IA agit comme un accélérateur du cycle de développement, non comme un acteur autonome. Cette nuance est importante pour calibrer la menace : nous ne sommes pas face à une IA qui attaque de manière indépendante, mais face à une IA qui multiplie la productivité d'un attaquant humain expérimenté par un facteur significatif.
L'identité du groupe responsable n'a pas été divulguée, l'enquête étant toujours active au moment de la publication. Le niveau de sophistication technique, la qualité des profils Cobalt Strike et l'attention portée à l'OPSEC suggèrent un acteur expérimenté. La découverte de Sophos n'est pas isolée : en mai 2026, le Google Threat Intelligence Group (GTIG) avait documenté des usages similaires d'IA dans le développement d'exploits. La tendance est structurelle.
Impact et exposition
Cette découverte n'implique pas de CVE spécifique ni de patch à déployer. Son impact est systémique : elle valide empiriquement que des acteurs malveillants utilisent l'IA pour accélérer le développement d'outils capables de contourner les EDR commerciaux les plus répandus. Les organisations qui comptent uniquement sur leurs solutions EDR comme dernier rempart défensif doivent reconsidérer leur modèle. Le fait que le laboratoire ait testé ses outils contre les trois acteurs dominants du marché EDR — Sophos, CrowdStrike, Microsoft Defender — signifie que les techniques développées ciblent directement les solutions que la majorité des entreprises françaises ont déployées.
Recommandations
- Ne pas considérer l'EDR comme une défense ultime — intégrer des contrôles complémentaires (NDR, SIEM avec règles comportementales, honeypots, UEBA)
- Activer la détection des outils de post-exploitation légitimes détournés — Cobalt Strike, Sliver, Brute Ratel C4 — dans vos règles SIEM et EDR
- Surveiller les connexions sortantes vers
api.telegram.orgdepuis les postes et serveurs — signal fort d'un C2 Telegram - Renforcer la détection des activités de reconnaissance Active Directory anormales : requêtes LDAP massives, énumération des SPN (Kerberoasting), accès inhabituels aux GPO
- Auditer les accès à des plateformes de virtualisation comme Proxmox ou Ludus depuis le réseau corporate — usage non-autorisé peut signaler une compromission
Mon EDR est-il encore efficace face aux techniques d'évasion développées par IA ?
La réponse honnête : partiellement, et de moins en moins longtemps. Les techniques développées dans ce laboratoire sont spécifiquement optimisées contre Sophos, CrowdStrike et Microsoft Defender. Cela ne signifie pas que ces solutions sont inutiles — elles continuent de bloquer la très grande majorité des attaques génériques. Mais la fenêtre entre le développement d'une nouvelle technique d'évasion et sa détection par les EDR se réduit structurellement avec l'IA offensive. La réponse correcte est la défense en profondeur : EDR + NDR + segmentation réseau + surveillance AD + SIEM. Un EDR seul, même excellent, n'est plus suffisant en 2026.
Votre infrastructure est-elle exposée ?
Ayi NEDJIMI réalise des audits de sécurité ciblés pour identifier et corriger vos vulnérabilités avant qu'elles ne soient exploitées.
Demander un auditÀ propos de l'auteur
Ayi NEDJIMI
Auditeur Senior Cybersécurité & Consultant IA
Expert Judiciaire — Cour d'Appel de Paris
Habilitation Confidentiel Défense
ayi@ayinedjimi-consultants.fr
Ayi NEDJIMI est un vétéran de la cybersécurité avec plus de 25 ans d'expérience sur des missions critiques. Ancien développeur Microsoft à Redmond sur le module GINA (Windows NT4) et co-auteur de la version française du guide de sécurité Windows NT4 pour la NSA.
À la tête d'Ayi NEDJIMI Consultants, il réalise des audits Lead Auditor ISO 42001 et ISO 27001, des pentests d'infrastructures critiques, du forensics et des missions de conformité NIS2 / AI Act.
Conférencier international (Europe & US), il a formé plus de 10 000 professionnels.
Domaines d'expertise
Ressources & Outils de l'auteur
Articles connexes
WeedHack infecte 116 000 Minecraft avec un MaaS à 5€/mois
WeedHack, une opération de Malware-as-a-Service ciblant les joueurs Minecraft, a infecté 116 464 systèmes depuis janvier 2026 via de faux mods trojanisés. L'infostealer, vendu dès 5 $/mois, vole sessions Minecraft, cookies de 36 navigateurs, crypto-wallets et accès Discord/Steam. Analyse complète McAfee juin 2026.
CVE-2026-8206 : Kirki WordPress, 500 000 sites exposés
CVE-2026-8206, CVSS 9.8 : faille non-authentifiée dans Kirki — Freeform Page Builder permet de prendre le contrôle d'un compte administrateur WordPress. Plus de 500 000 sites exposés, exploitation active confirmée par Defiant/Wordfence. Mise à jour vers 6.0.7 requise.
IBM WebSphere : quatre CVE critiques, RCE CVSS 9.8
IBM divulgue quatre vulnérabilités critiques dans WebSphere Application Server 8.5/9.0 et ses Web Server Plug-ins : une RCE non authentifiée CVSS 9.8 (CVE-2026-8633) et trois failles CVSS 9.0+. Des correctifs sont disponibles.
Un projet cybersécurité ? Parlons-en.
Pentest, conformité NIS 2, ISO 27001, audit IA, RSSI externalisé… nos experts répondent sous 24h pour évaluer votre besoin.
Commentaires (1)
Laisser un commentaire