Lancement de DeepSeek V4 : une fenêtre de contexte d’un million de jetons et des stratégies de tarification mettent la pression sur OpenAI.
Grâce à sa capacité à traiter des quantités massives de données sans RAG et à un prix bien inférieur à celui de ses concurrents, DeepSeek V4 Pro menace directement la position de GPT-5.5 et de Gemini sur le marché de l'IA.
DeepSeek a officiellement annoncé la version V4 en avant-première, marquant une nouvelle étape dans la course mondiale à l'intelligence artificielle. Le principal atout de ce modèle réside dans sa fenêtre contextuelle pouvant atteindre un million de jetons, lui permettant de traiter des volumes massifs de données avec des performances supérieures à celles de ses concurrents occidentaux.
DeepSeek V4 Pro : Performances d'inférence puissantes sans RAG
Le modèle DeepSeek V4 Pro est doté d'une architecture 16x16 de type Mixture of Experts (MoE). Cette amélioration porte le score MMLU (Massive Multitask Language Understanding) à 88,5 %, surpassant ainsi les 85,5 % de son prédécesseur, le V3. Les capacités de l'agent, sa connaissance du monde et son raisonnement logique du V4 Pro sont considérés comme des références, tant dans le domaine des solutions open source que dans celui des solutions propriétaires.
La capacité de traiter un million de jetons permet notamment à DeepSeek V4 Pro d'analyser directement des documents complexes ou du code source sans passer par la couche de recherche augmentée (RAG). Ceci réduit la latence et améliore la précision lors du traitement de tâches nécessitant un volume important de données.
Segment de prix et variantes de la V4 Flash
Parallèlement à la version Pro, DeepSeek a également lancé la variante V4 Flash dotée de 284 milliards de paramètres, dont 13 milliards de paramètres actifs. Cette version est optimisée pour la vitesse et le coût, et conçue pour concurrencer directement des modèles tels que GPT-4o-mini d'OpenAI ou Claude Haiku d'Anthropic.
| Modèle | Prix d'entrée (par million de jetons) | Prix de sortie (par million de jetons) | Caractéristiques principales |
|---|---|---|---|
| DeepSeek V4 Pro | 2,8 USD | 8,8 USD | Contexte : 1 million de jetons, MMLU 88,5 % |
| Flash DeepSeek V4 | 0,4 USD | 1,2 USD | Traitement rapide, économe en énergie. |
| GPT-5.5 (OpenAI) | nettement plus élevé | nettement plus élevé | Réflexion pointue, moins de jetons |
Une confrontation directe avec GPT-5.5 et Gemini.
L'événement de lancement de DeepSeek V4 a eu lieu quelques heures seulement après l'annonce par OpenAI de GPT-5.5. Alors qu'OpenAI affirmait que son modèle était « le plus intelligent et le plus facile à utiliser » avec des capacités de raisonnement pointues en recherche scientifique, DeepSeek a affirmé sa position grâce à l'avantage du coût et à la flexibilité du code open-source.
Au niveau mondial, le produit chinois n'est actuellement que légèrement en retrait par rapport à Gemini-Pro-3.1 de Google. Cependant, avec un prix jusqu'à 96 % moins cher que les précédentes solutions OpenAI o1, DeepSeek exerce une pression considérable sur les entreprises technologiques américaines pour qu'elles modifient leurs stratégies de prix et optimisent leur technologie.
L'essor de DeepSeek affecte non seulement le marché des logiciels, mais aussi indirectement celui du matériel. Début 2025, les avancées des modèles R1 et V3 ont provoqué d'importantes fluctuations de la capitalisation boursière de Nvidia et ont contraint Meta à créer une équipe dédiée à la recherche sur les technologies d'optimisation des ressources au sein de l'entreprise. Avec la V4, la course à l'IA devrait s'intensifier encore davantage dans les mois à venir.


