Alibaba Cloud a présenté le 26 mai 2026 à Singapour Qwen3.7-Max, son modèle IA pour agents autonomes capable de travailler 35 heures sans interruption, avec une fenêtre de contexte d'un million de tokens et l'écosystème Qwen Cloud.
En bref
- Alibaba Cloud a présenté le 26 mai 2026 à Singapour Qwen3.7-Max, son modèle de langage le plus avancé pour les agents IA autonomes, avec une fenêtre de contexte d'un million de tokens et une capacité d'exécution ininterrompue de 35 heures.
- L'annonce s'inscrit dans un écosystème complet incluant la nouvelle plateforme cloud IA Qwen Cloud, la puce propriétaire Zhenwu M890 et l'adhésion d'Alibaba Cloud à la PyTorch Foundation en tant que membre Platine.
- Les entreprises peuvent accéder dès maintenant à Qwen3.7-Max via Model Studio (région Singapour), OpenRouter et Together AI à un tarif de 2,50 dollars par million de tokens en entrée.
Premier Qwen Conference international : Alibaba Cloud frappe fort à Singapour
Le 26 mai 2026, Alibaba Cloud a tenu à Singapour la première édition internationale de la Qwen Conference, marquant l'ambition de l'entreprise de positionner son écosystème d'IA agentique à l'échelle mondiale. La conférence, qui a réuni développeurs, partenaires et entreprises de la région Asie-Pacifique, avait un message central : l'ère des agents IA autonomes est arrivée, et Alibaba Cloud entend en être l'un des principaux architectes planétaires.
Le point culminant de l'événement est le lancement officiel de Qwen3.7-Max, le modèle de langage le plus avancé jamais produit par les équipes Qwen d'Alibaba. Contrairement aux modèles généralistes, Qwen3.7-Max a été conçu dès ses fondements pour les tâches agentiques : codage, débogage, automatisation des workflows bureautiques et exécution de tâches à long horizon impliquant des centaines, voire des milliers d'étapes successives. La nouvelle génération franchit une barrière symbolique en offrant une fenêtre de contexte d'un million de tokens — le double de la limite de 256 000 tokens de son prédécesseur Qwen3.6 Max Preview — permettant à un agent de maintenir une mémoire de travail étendue tout au long d'une session complexe.
Les chiffres partagés lors des démonstrations internes illustrent le niveau de performance visé. Dans un scénario d'optimisation de kernel sur une nouvelle architecture de puce, Qwen3.7-Max a réalisé plus de 1 000 appels d'outils et modifications itératives de code de manière entièrement autonome, aboutissant à une amélioration de la vitesse d'inférence d'un facteur 10 par rapport à la version précédente, selon Alibaba Cloud. Plus significatif encore, le modèle peut maintenir une exécution autonome sur des tâches complexes pendant jusqu'à 35 heures consécutives sans intervention humaine. Cette durée ouvre la voie à des workflows d'automatisation industrielle, de développement logiciel continu ou de recherche scientifique assistée qui étaient jusqu'ici impossibles avec un seul modèle en une seule session.
Sur les benchmarks indépendants, Qwen3.7-Max a décroché la cinquième place mondiale sur l'Artificial Analysis Intelligence Index avec un score de 56,6 points, soit un gain de 4,8 points sur Qwen3.6 Max Preview. Il se positionne en première place parmi les modèles chinois, devançant Kimi-K2.6, DeepSeek-v4-Pro-Max et GLM5.1. Selon Artificial Analysis, les performances sont compétitives avec celles des modèles internationaux de premier plan. À noter que le modèle ne gère pour l'instant que du texte : aucune modalité image n'est prise en charge dans cette version de mai 2026.
Côté disponibilité et tarification, Qwen3.7-Max est proposé à 2,50 dollars par million de tokens en entrée et 7,50 dollars par million de tokens en sortie. Il est accessible via Model Studio dans la région Singapour, OpenRouter et Together AI. Aucune version open-weight n'est publiée à ce stade, ce qui constitue un changement notable par rapport à la politique ouverte de la série Qwen3 précédente, largement disponible sur Hugging Face. Cette décision de rester en mode propriétaire reflète probablement la volonté d'Alibaba Cloud de monétiser directement un modèle conçu pour des charges de travail enterprise à haute valeur ajoutée.
La conférence a également servi de scène pour présenter Qwen Cloud, une plateforme cloud AI-native entièrement repensée pour répondre aux exigences des environnements agentiques. Qwen Cloud propose des sandboxes d'exécution légères, une mémoire cross-tâche persistante entre différentes sessions, une circulation des données transparente entre les modules applicatifs et une gestion intelligente des opérations sur l'ensemble de la stack. L'objectif déclaré est d'offrir aux développeurs et aux entreprises un environnement dans lequel les agents ne sont plus contraints par les limitations architecturales du cloud générique.
La conférence a aussi été l'occasion de dévoiler le chip Zhenwu M890, la puce propriétaire d'Alibaba optimisée pour l'inférence des modèles Qwen dans ses datacenters. Ce développement matériel illustre la stratégie verticale d'Alibaba Cloud : contrôler l'ensemble de la chaîne, du silicium au service managé. Dans le même mouvement, Alibaba Cloud a annoncé son adhésion à la PyTorch Foundation en tant que membre Platine, signalant un engagement envers l'écosystème open source IA au-delà de ses propres technologies propriétaires.
Enfin, dans le cadre de la conférence à Singapour, Alibaba Cloud a lancé une initiative de formation avec des partenaires locaux visant à outiller plus de 1 000 PME et étudiants singapouriens sur les applications pratiques de l'IA générative et agentique. Cette composante pédagogique traduit la stratégie d'expansion internationale d'Alibaba Cloud, qui cherche à construire un réseau dense d'adoptants et de développeurs familiers de l'écosystème Qwen en dehors du marché domestique chinois.
Pourquoi cette annonce marque un tournant dans la course aux agents IA
La Qwen Conference de Singapour symbolise le passage d'une ère de compétition sur les benchmarks texte à une nouvelle phase où la capacité à exécuter des tâches autonomes longues et complexes définit le leadership. En annonçant 35 heures d'exécution autonome et plus de 1 000 appels d'outils, Alibaba Cloud entre de plein fouet dans ce que l'industrie nomme l'agentic frontier. Ce n'est plus seulement une question de qualité de réponse : c'est une question de persistance, de fiabilité sur la durée et de capacité à orchestrer des pipelines multi-étapes sans dégradation de performances.
La stratégie géopolitique est lisible dans le choix de Singapour comme vitrine internationale. La cité-État est délibérément sélectionnée pour toucher des marchés qui restent méfiants vis-à-vis des infrastructures cloud chinoises. En s'associant à la PyTorch Foundation et en déployant une région Model Studio locale, Alibaba signale que Qwen3.7-Max n'est pas un modèle confiné au marché domestique. Cette ouverture est d'autant plus stratégique que les restrictions d'exportation américaines sur les puces GPU ont considérablement compliqué l'accès aux accélérateurs de pointe pour les laboratoires chinois, poussant Alibaba à investir massivement dans sa propre puce Zhenwu M890.
Pour les équipes de sécurité, l'émergence de modèles capables de s'exécuter 35 heures sans supervision humaine introduit une surface de risque encore peu cartographiée. Un agent agissant aussi longtemps sur des systèmes d'entreprise peut potentiellement exfiltrer des données, modifier des configurations critiques ou déclencher des actions difficiles à réverser si ses contraintes de sécurité sont mal définies ou contournées. La gouvernance des agents IA devient un sujet opérationnel urgent pour les équipes de sécurité, de conformité et d'audit interne.
Pour les DSI et CTO, la compétition entre Qwen3.7-Max et ses homologues occidentaux se jouera de moins en moins sur la qualité du texte généré et de plus en plus sur l'efficacité et la fiabilité des pipelines agentiques. La disponibilité d'un modèle de ce calibre via OpenRouter et Together AI à des tarifs compétitifs réduit significativement les barrières à l'adoption. Le choix du LLM pour les workloads agentiques devient ainsi une décision d'architecture aussi structurante que le choix d'un framework applicatif ou d'une base de données.
Ce qu'il faut retenir
- Qwen3.7-Max est disponible dès maintenant avec un million de tokens de contexte, permettant des sessions agentiques autonomes allant jusqu'à 35 heures sans intervention humaine.
- Alibaba Cloud déploie une stratégie verticale intégrée — modèle Qwen3.7-Max, plateforme Qwen Cloud, puce Zhenwu M890 — pour concurrencer les plateformes occidentales sur le terrain de l'IA agentique enterprise.
- Les équipes sécurité doivent anticiper dès maintenant les risques des agents IA longue durée : gouvernance des droits d'accès, journalisation des actions, détection des dérives et mécanismes de coupure d'urgence.
Qwen3.7-Max est-il accessible en open source ?
Non. Contrairement à plusieurs modèles de la série Qwen3 publiés en open-weight sur Hugging Face, Qwen3.7-Max est exclusivement disponible en accès cloud payant via Model Studio (région Singapour), OpenRouter et Together AI. Alibaba Cloud n'a pas annoncé de calendrier pour une éventuelle publication open-weight de ce modèle.
Besoin d'un accompagnement expert ?
Ayi NEDJIMI vous accompagne sur vos projets cybersécurité et IA.
Prendre contactÀ propos de l'auteur
Ayi NEDJIMI
Auditeur Senior Cybersécurité & Consultant IA
Expert Judiciaire — Cour d'Appel de Paris
Habilitation Confidentiel Défense
ayi@ayinedjimi-consultants.fr
Ayi NEDJIMI est un vétéran de la cybersécurité avec plus de 25 ans d'expérience sur des missions critiques. Ancien développeur Microsoft à Redmond sur le module GINA (Windows NT4) et co-auteur de la version française du guide de sécurité Windows NT4 pour la NSA.
À la tête d'Ayi NEDJIMI Consultants, il réalise des audits Lead Auditor ISO 42001 et ISO 27001, des pentests d'infrastructures critiques, du forensics et des missions de conformité NIS2 / AI Act.
Conférencier international (Europe & US), il a formé plus de 10 000 professionnels.
Domaines d'expertise
Ressources & Outils de l'auteur
Articles connexes
Google Cloud Next 2026 : Wiz finalise la sécurité agentique
À Google Cloud Next 2026 à Las Vegas, Google a finalisé l'intégration de Wiz (32 milliards de dollars) et lancé Agentic Defense : trois agents IA pour le SOC, gouvernance des agents cloud et protection des applications IA du code au runtime.
Inde : CERT-In impose 12h de patch face aux exploits IA
Le CERT-In indien a publié le 25 mai 2026 un blueprint de 38 pages imposant une fenêtre de patching de 12 heures pour les systèmes critiques exposés sur internet, en réponse directe à l'automatisation des exploits par l'IA.
AI Act Omnibus : l'UE simplifie et repousse les délais
Le 7 mai 2026, l'UE a conclu un accord provisoire sur l'AI Act Omnibus, prolongeant les délais pour les systèmes à haut risque et interdisant la génération de deepfakes sexuels non consentis dès décembre 2026.
Un projet cybersécurité ? Parlons-en.
Pentest, conformité NIS 2, ISO 27001, audit IA, RSSI externalisé… nos experts répondent sous 24h pour évaluer votre besoin.
Commentaires
Aucun commentaire pour le moment. Soyez le premier à commenter !
Laisser un commentaire