En bref

  • Google finalise Gemini 3.5 Pro, dont la disponibilité générale est attendue en juin 2026 avec une fenêtre contextuelle de 2 millions de tokens.
  • Le modèle intègre un mode de raisonnement approfondi baptisé Deep Think, réservé aux abonnés Ultra (250 $/mois), et rivalise directement avec GPT-5.5 d'OpenAI et Claude Opus 4.8 d'Anthropic.
  • Gemini 3.5 Flash, déjà disponible en GA depuis mai 2026, donne un aperçu des capacités de la famille 3.5 : performances de niveau frontier à quatre fois la vitesse de ses concurrents directs.

Gemini 3.5 Pro : les détails d'un lancement imminent

Dévoilé lors du Google I/O 2026 le 19 mai dernier, Gemini 3.5 Pro entre dans sa dernière ligne droite avant une disponibilité générale attendue en juin 2026. Sundar Pichai avait lui-même demandé à son audience de « patienter encore un mois » lors de la keynote, confirmant ainsi une GA pour juin. Au 6 juin 2026, le modèle n'est pas encore disponible publiquement, mais les spécifications confirmées et la roadmap connue permettent d'en dresser un portrait technique complet.

La caractéristique la plus distinctive de Gemini 3.5 Pro est sa fenêtre contextuelle de deux millions de tokens. Pour contextualiser cette capacité : deux millions de tokens représentent environ 1 500 000 mots, soit l'équivalent d'une dizaine de romans complets, ou d'une large base de code d'entreprise dans son intégralité. Cette fenêtre de contexte est la plus large jamais annoncée par Google et positionne directement le modèle pour les cas d'usage nécessitant l'analyse de vastes corpus documentaires, la revue de codebases entières, ou des conversations prolongées dans des contextes professionnels complexes.

Le second pilier de Gemini 3.5 Pro est le mode Deep Think. Similaire dans sa philosophie au mode Extended Thinking d'Anthropic ou aux modes de raisonnement o3/o4 d'OpenAI, Deep Think permet au modèle de consacrer davantage de ressources computationnelles à la réflexion avant de générer une réponse. Cette approche améliore significativement les performances sur les tâches complexes : raisonnement mathématique avancé, problèmes de codage multi-étapes, analyse stratégique ou questions nécessitant plusieurs niveaux d'inférence. Google a précisé que cette fonctionnalité sera réservée aux abonnés Google Ultra, l'abonnement premium à 250 dollars par mois.

La stratégie de distribution de Gemini 3.5 Pro suit le schéma habituel chez Google : disponibilité d'abord via les abonnements grand public (Google Pro à 20 $/mois et Google Ultra à 250 $/mois), puis déploiement via l'API Gemini dans Google AI Studio, et enfin intégration dans la suite Google Workspace et les services Google Cloud (Vertex AI, Gemini Enterprise Agent Platform). Le modèle sera également accessible dans Android Studio pour les développeurs mobiles.

Sur le plan tarifaire, les premières estimations basées sur le ratio historique entre les modèles Flash et Pro de Google placent Gemini 3.5 Pro autour de 15 dollars par million de tokens en entrée et 60 dollars par million de tokens en sortie — soit dix fois le tarif de Gemini 3.5 Flash ($1,50/$9 par million de tokens). Ces prix le positionneraient dans la même gamme que GPT-5.5 d'OpenAI et Claude Opus 4.8 d'Anthropic, les deux modèles flagship concurrents actuellement sur le marché.

Gemini 3.5 Flash, déjà disponible en GA depuis le 19 mai 2026, donne un aperçu concret des performances de la famille 3.5. Les benchmarks publiés par Google montrent que Flash dépasse les performances du Gemini 1.5 Pro de la génération précédente, tout en opérant à quatre fois la vitesse pour un coût divisé par six. Google a conçu Flash spécifiquement pour les cas d'usage agents et coding, avec des optimisations pour les chaînes d'appels d'outils et l'exécution de tâches longue durée. À partir du 8 juin 2026, Gemini 3.5 Flash sera activé par défaut dans Gemini Enterprise et ne pourra plus être désactivé pour les administrateurs.

Dans le paysage compétitif de l'IA générative, le lancement de Gemini 3.5 Pro intervient dans une période d'effervescence sans précédent. OpenAI a lancé GPT-5.5 comme nouveau modèle flagship pour le raisonnement complexe, Anthropic a atteint une valorisation de 965 milliards de dollars en publiant Claude Opus 4.8 et en déposant confidentiellement un dossier d'introduction en bourse le 1er juin 2026, et Microsoft a dévoilé sept modèles propriétaires MAI — MAI-Thinking-1, MAI-Code-1-Flash, MAI-Image-2.5, MAI-Transcribe-1.5, MAI-Voice-2 et deux modèles de raisonnement spécialisés — développés entièrement sans recours aux modèles OpenAI. Google entre dans ce contexte hyper-compétitif avec l'ambition de positionner Gemini 3.5 Pro comme le meilleur modèle multimodal pour les usages professionnels et agentiques.

L'accent mis sur les agents mérite une attention particulière. Lors du Google I/O, Google a présenté plusieurs démonstrations de Gemini 3.5 orchestrant des flux de travail complexes avec appels d'outils enchaînés, navigation web, lecture et modification de documents, et coordination entre plusieurs sous-agents. La combinaison d'une fenêtre de deux millions de tokens et d'un mode de raisonnement approfondi en fait un modèle théoriquement très bien adapté aux architectures multi-agents, domaine en pleine expansion en 2026.

Pourquoi ce lancement redessine les lignes de la course aux modèles IA

L'annonce de Gemini 3.5 Pro intervient dans un contexte où la fenêtre contextuelle est devenue un différenciateur stratégique majeur. La capacité à traiter deux millions de tokens en une seule interaction ouvre des cas d'usage que les modèles à 200 000 ou 500 000 tokens ne peuvent pas adresser : ingestion complète de la documentation d'un produit, revue de l'intégralité d'un codebase avant un audit de sécurité, analyse de contrats juridiques volumineux, ou encore conversation prolongée sur plusieurs semaines sans perte de contexte. Pour les entreprises qui évaluent des solutions IA, cette capacité représente un critère de sélection de premier ordre.

Le mode Deep Think s'inscrit dans une tendance de fond : après des années à optimiser uniquement la vitesse et le coût des inférences, les grands laboratoires d'IA investissent désormais massivement dans la qualité du raisonnement. La compétition ne se joue plus seulement sur les benchmarks de vitesse ou de coût, mais sur la capacité des modèles à résoudre des problèmes complexes requérant plusieurs étapes de réflexion. Pour les entreprises qui utilisent des LLM pour des tâches à forte valeur ajoutée — code review, analyse de risque, rédaction de documentation technique — cette évolution est directement bénéfique.

La stratégie Google de réserver Deep Think aux abonnés Ultra soulève cependant des questions sur la fragmentation croissante des capacités IA selon les niveaux d'abonnement. Si les fonctionnalités les plus puissantes sont réservées aux abonnements à 250 $/mois, les organisations aux budgets plus contraints risquent d'être progressivement désavantagées dans leur adoption de l'IA par rapport aux grandes entreprises qui peuvent se permettre des abonnements premium. Cette dynamique est observable chez tous les acteurs majeurs et pourrait alimenter des débats réglementaires sur l'accès équitable aux technologies d'IA.

Pour les équipes de sécurité, l'arrivée de modèles toujours plus puissants avec des fenêtres contextuelles gigantesques génère des préoccupations légitimes. Un modèle capable d'ingérer deux millions de tokens peut traiter l'intégralité d'une base de code propriétaire, de la documentation interne ou de communications confidentielles en une seule requête. La gouvernance des usages de l'IA dans les entreprises — qui peut soumettre quoi à un modèle cloud ? — devient un enjeu de sécurité et de conformité à part entière, particulièrement dans le contexte du RGPD et des futures obligations NIS2.

Ce qu'il faut retenir

  • Gemini 3.5 Pro arrivera en GA en juin 2026 avec une fenêtre de 2 millions de tokens et un mode Deep Think exclusif aux abonnés Ultra ($250/mois).
  • La famille Gemini 3.5 (Flash déjà disponible, Pro imminente) représente la réponse de Google à GPT-5.5 et Claude Opus 4.8 dans la course aux modèles frontier pour les usages agentiques.
  • Les DSI et RSSI doivent anticiper les politiques de gouvernance sur l'utilisation de modèles à très large contexte, capables d'ingérer des bases de code ou documents confidentiels complets en une seule requête.

Gemini 3.5 Pro sera-t-il accessible via l'API pour les développeurs ?

Oui, Gemini 3.5 Pro sera disponible via l'API Gemini dans Google AI Studio et via Vertex AI sur Google Cloud, dans le même schéma que les générations précédentes. Les développeurs pourront l'intégrer dans leurs applications et agents IA. La fenêtre de deux millions de tokens sera accessible en API, sous réserve des limites de taux habituelles. Le mode Deep Think sera également disponible via l'API, potentiellement à un tarif différencié.

Besoin d'un accompagnement expert ?

Ayi NEDJIMI vous accompagne sur vos projets cybersécurité et IA.

Prendre contact