Sophos : un lab IA teste l'évasion EDR avec Claude Opus 4.5

4 juin 2026

•

Mis à jour le 26 juillet 2026

•

6 min de lecture

•

1040 mots

•

175 vues

•

Sophos a découvert un laboratoire malveillant automatisé utilisant Claude Opus 4.5 et l'IDE Cursor pour développer et tester des outils d'évasion EDR. Le lab testait ses charges contre Sophos, CrowdStrike et Microsoft Defender dans des VMs Windows Server 2022 dédiées, dans le cadre d'opérations liées au ransomware.

En bref

Sophos a découvert un laboratoire malveillant orchestré par Claude Opus 4.5 et l'IDE Cursor pour automatiser le développement d'outils d'évasion EDR
Le lab testait ses outils contre Sophos, CrowdStrike Falcon et Microsoft Defender dans des VMs Windows Server 2022 dédiées
L'infrastructure inclut Cobalt Strike profilé, un C2 Telegram, le framework Sliver et un panneau automatisé de reconnaissance Active Directory

Les faits

Le 2 juin 2026, Sophos a publié un rapport intitulé « Pointing a Cursor at evading detection », révélant la découverte d'un laboratoire de développement malveillant entièrement orchestré par intelligence artificielle. Les chercheurs de Sophos X-Ops ont mis la main sur un dépôt Git contenant les composants d'un système automatisé de développement, test et optimisation d'outils d'évasion des solutions EDR (Endpoint Detection and Response). L'infrastructure est formellement liée à des opérations de déploiement de ransomware et de vol de données.

Au cœur du dispositif : Claude Opus 4.5, le modèle d'Anthropic, utilisé comme agent coordinateur principal. Selon le rapport Sophos, cet agent « fixait les règles et orchestrait les autres agents » spécialisés dans des tâches précises — test EDR, durcissement OPSEC, documentation technique, stress-test des proxies, déploiement de machines virtuelles. L'IDE Cursor, conçu nativement pour l'assistance IA au développement, servait à l'écriture et la révision du code malveillant. Des agents supplémentaires surveillaient les publications de recherche en sécurité pour intégrer proactivement les techniques de bypass documentées publiquement.

Le laboratoire s'appuyait sur Ludus, une plateforme open source conçue pour les exercices de red team légitimes, permettant de déployer et gérer rapidement des environnements de test virtualisés. L'attaquant avait configuré quatre machines virtuelles : une VM Windows Server 2022 dédiée au test d'évasion du module Sophos, une seconde pour CrowdStrike Falcon, une VM contrôle sans aucun agent EDR installé, et un serveur Ubuntu faisant tourner le framework post-exploitation Sliver comme serveur C2.

Le processus de développement suivait un cycle itératif : l'IA générait un outil d'évasion, la soumettait aux VMs de test, analysait les résultats de détection, identifiait précisément les signatures comportementales ou statiques déclenchées, puis générait une version améliorée. Ce cycle « build-test-refine » reproduit exactement les méthodes des équipes red team professionnelles, compressé dans le temps grâce à l'automatisation IA. Ce qui prenait des jours à un opérateur humain peut désormais être accompli en quelques heures.

L'arsenal technique inclus dans le dépôt Git est sophistiqué. Des profils Cobalt Strike personnalisés font passer le trafic beacon pour du trafic HTTPS légitime vers des domaines de confiance — technique de Living-off-the-Land appliquée au trafic réseau. Un canal C2 basé sur l'API Telegram Bot route les communications via l'infrastructure Telegram, exploitant la confiance accordée aux domaines Telegram dans de nombreuses organisations. Des outils d'injection de shellcode et un Cloudflare Worker servant de couche d'obfuscation pour masquer l'infrastructure backend complètent le dispositif.

Le panneau de découverte Active Directory automatisé constitue l'un des éléments les plus préoccupants. La reconnaissance AD — identification des contrôleurs de domaine, des comptes privilégiés Kerberoastables, des Group Policy Objects, des chemins de latéralisation — est traditionnellement chronophage et bruyante pour les attaquants. Automatiser cette phase avec précision et discrétion accélère considérablement la progression vers les actifs critiques et l'exfiltration avant le chiffrement ransomware.

Sophos précise un point important : le workflow reste humain-dépendant. Aucune IA n'est embarquée dans les charges utiles déployées chez les victimes, et chaque cycle de test nécessite une validation humaine. L'IA agit comme un accélérateur du cycle de développement, non comme un acteur autonome. Cette nuance est importante pour calibrer la menace : nous ne sommes pas face à une IA qui attaque de manière indépendante, mais face à une IA qui multiplie la productivité d'un attaquant humain expérimenté par un facteur significatif.

L'identité du groupe responsable n'a pas été divulguée, l'enquête étant toujours active au moment de la publication. Le niveau de sophistication technique, la qualité des profils Cobalt Strike et l'attention portée à l'OPSEC suggèrent un acteur expérimenté. La découverte de Sophos n'est pas isolée : en mai 2026, le Google Threat Intelligence Group (GTIG) avait documenté des usages similaires d'IA dans le développement d'exploits. La tendance est structurelle.

Impact et exposition

Cette découverte n'implique pas de CVE spécifique ni de patch à déployer. Son impact est systémique : elle valide empiriquement que des acteurs malveillants utilisent l'IA pour accélérer le développement d'outils capables de contourner les EDR commerciaux les plus répandus. Les organisations qui comptent uniquement sur leurs solutions EDR comme dernier rempart défensif doivent reconsidérer leur modèle. Le fait que le laboratoire ait testé ses outils contre les trois acteurs dominants du marché EDR — Sophos, CrowdStrike, Microsoft Defender — signifie que les techniques développées ciblent directement les solutions que la majorité des entreprises françaises ont déployées.

Recommandations

Ne pas considérer l'EDR comme une défense ultime — intégrer des contrôles complémentaires (NDR, SIEM avec règles comportementales, honeypots, UEBA)
Activer la détection des outils de post-exploitation légitimes détournés — Cobalt Strike, Sliver, Brute Ratel C4 — dans vos règles SIEM et EDR
Surveiller les connexions sortantes vers api.telegram.org depuis les postes et serveurs — signal fort d'un C2 Telegram
Renforcer la détection des activités de reconnaissance Active Directory anormales : requêtes LDAP massives, énumération des SPN (Kerberoasting), accès inhabituels aux GPO
Auditer les accès à des plateformes de virtualisation comme Proxmox ou Ludus depuis le réseau corporate — usage non-autorisé peut signaler une compromission

Mon EDR est-il encore efficace face aux techniques d'évasion développées par IA ?

La réponse honnête : partiellement, et de moins en moins longtemps. Les techniques développées dans ce laboratoire sont spécifiquement optimisées contre Sophos, CrowdStrike et Microsoft Defender. Cela ne signifie pas que ces solutions sont inutiles — elles continuent de bloquer la très grande majorité des attaques génériques. Mais la fenêtre entre le développement d'une nouvelle technique d'évasion et sa détection par les EDR se réduit structurellement avec l'IA offensive. La réponse correcte est la défense en profondeur : EDR + NDR + segmentation réseau + surveillance AD + SIEM. Un EDR seul, même excellent, n'est plus suffisant en 2026.

Votre infrastructure est-elle exposée ?

Ayi NEDJIMI réalise des audits de sécurité ciblés pour identifier et corriger vos vulnérabilités avant qu'elles ne soient exploitées.

Demander un audit

Sources et références

#News

Partager cet article

Twitter LinkedIn

À propos de l'auteur

Ayi NEDJIMI

Auditeur Senior Cybersécurité & Consultant IA

Expert Judiciaire — Cour d'Appel de Paris
Habilitation Confidentiel Défense

[email protected]

25+

ans d'expérience

700+

articles publiés

100+

missions réalisées

Ayi NEDJIMI est un vétéran de la cybersécurité avec plus de 25 ans d'expérience sur des missions critiques. Ancien développeur Microsoft à Redmond sur le module GINA (Windows NT4) et co-auteur de la version française du guide de sécurité Windows NT4 pour la NSA.

À la tête d'Ayi NEDJIMI Consultants, il réalise des audits Lead Auditor ISO 42001 et ISO 27001, des pentests d'infrastructures critiques, du forensics et des missions de conformité NIS2 / AI Act.

Conférencier international (Europe & US), il a formé plus de 10 000 professionnels.

Domaines d'expertise

ISO 42001 Lead Auditor ISO 27001 · NIS2 Pentest & Forensics IA / LLM / RAG Cloud & Active Directory

Voir le profil complet Demander un devis

Ressources & Outils de l'auteur

GitHub

Code & projets open source

ORCID

Identifiant chercheur

Hugging Face

Modèles IA & datasets

CertifExpress

Préparez vos certifications IT

WindowsBooster

Optimisation Windows 11

Articles connexes

Abbott Laboratories : ShinyHunters exfiltre données cancer research via vishing Entra SSO

ShinyHunters a compromis Abbott Laboratories via vishing mi-juin 2026, pivotant sur un compte Microsoft Entra SSO. Deux incidents distincts, 30 millions de dossiers revendiqués, données de recherche cancer potentiellement exfiltrées.

26/07/2026

Fortinet FortiSandbox : 3 injections OS non authentifiées CVSS 9.1 au CISA KEV

CVE-2026-25089, CVE-2026-39808 et CVE-2026-39813 — trois injections OS non authentifiées dans Fortinet FortiSandbox (CVSS 9.1) — ajoutées au CISA KEV le 16 juillet 2026 avec délai de 72h.

26/07/2026

JadePuffer : le premier ransomware entièrement autonome piloté par LLM

La Sysdig Threat Research Team documente JadePuffer, premier ransomware opéré de bout en bout par un agent LLM sans intervention humaine. Un tournant dans le paysage des menaces cybersécurité.

26/07/2026

Article précédent

CVE-2026-8206 : Kirki WordPress, 500 000 sites exposés

Article suivant

WeedHack infecte 116 000 Minecraft avec un MaaS à 5€/mois

Besoin d'un expert ?

Un projet cybersécurité ? Parlons-en.

Pentest, conformité NIS 2, ISO 27001, audit IA, RSSI externalisé… nos experts répondent sous 24h pour évaluer votre besoin et vous proposer un accompagnement sur mesure.

Nous contacter

Commentaires (1)

Isabelle Gautheron 01/01/0001 à 00:00

Ludus je connaissais côté red team légitime, mais pas dans ce contexte-là. Ça change la perspective.

Laisser un commentaire