En bref

  • Microsoft dévoile trois modèles IA fondationnels maison : MAI-Transcribe-1, MAI-Voice-1 et MAI-Image-2
  • Développés par l'équipe MAI Superintelligence de Mustafa Suleyman, ils visent à réduire la dépendance envers OpenAI
  • Les modèles sont disponibles sur Microsoft Foundry et alimentent déjà Copilot

Ce qui s'est passé

Microsoft AI a annoncé le 2 avril 2026 le lancement de trois modèles d'intelligence artificielle fondationnels développés en interne, marquant une étape décisive dans la stratégie d'autonomisation du géant de Redmond face à son partenaire OpenAI. Les trois modèles couvrent la transcription vocale, la synthèse audio et la génération d'images, selon TechCrunch et The Register.

MAI-Transcribe-1 transcrit la parole en texte dans 25 langues et se révèle 2,5 fois plus rapide que l'offre Azure Fast existante, avec un tarif de départ à 0,36 dollar par heure. MAI-Voice-1 génère 60 secondes d'audio en une seconde et permet de créer des voix personnalisées. MAI-Image-2 est un modèle text-to-image complétant la trilogie multimodale.

Les trois modèles sont disponibles sur Microsoft Foundry. MAI-Voice-1 alimente déjà la fonctionnalité Audio Expressions de Copilot, tandis que MAI-Transcribe-1 propulse le service de transcription de Copilot Voice Mode. Ces modèles ont été développés par l'équipe MAI Superintelligence, dirigée par Mustafa Suleyman, PDG de Microsoft AI, une division créée en novembre 2025.

Pourquoi c'est important

Ce lancement confirme la stratégie de Microsoft de construire sa propre pile IA en parallèle de son partenariat avec OpenAI. Alors que les négociations sur la restructuration d'OpenAI se poursuivent, Microsoft se positionne pour ne plus dépendre d'un seul fournisseur de modèles. Le positionnement tarifaire agressif — Microsoft affirme que ses modèles sont moins chers que ceux de Google et OpenAI — vise directement le marché entreprise.

Pour les entreprises françaises et européennes, cette concurrence accrue entre fournisseurs IA est une bonne nouvelle : elle fait baisser les prix et diversifie les options de déploiement. Les capacités multilingues de MAI-Transcribe-1 avec 25 langues supportées ouvrent des perspectives pour les organisations internationales cherchant des solutions de transcription à grande échelle.

Ce qu'il faut retenir

  • Microsoft développe désormais ses propres modèles IA fondationnels, réduisant sa dépendance historique envers OpenAI
  • Les tarifs se veulent compétitifs face à Google et OpenAI, annonçant une guerre des prix sur le marché IA entreprise
  • Les modèles sont déjà intégrés dans Copilot, ce qui signifie que les utilisateurs Microsoft 365 en bénéficient immédiatement

Quels sont les trois modèles IA lancés par Microsoft ?

Microsoft a lancé MAI-Transcribe-1 pour la transcription vocale multilingue en 25 langues, MAI-Voice-1 pour la génération de voix synthétiques personnalisées, et MAI-Image-2 pour la création d'images à partir de texte. Tous trois sont accessibles via la plateforme Microsoft Foundry et sont déjà utilisés dans les fonctionnalités Copilot.

Besoin d'un accompagnement expert ?

Ayi NEDJIMI vous accompagne sur vos projets cybersécurité et IA.

Prendre contact