Pourquoi le modèle d’IA chinois DeepSeek R1 bouleverse-t-il le monde de la technologie ?
Un modèle avancé d’intelligence artificielle (IA) chinois appelé DeepSeek R1 bouleverse le monde de la technologie avec sa puissance supérieure.
Le nouveau modèle d'IA, baptisé DeepSeek R1, a été développé par DeepSeek, une jeune startup chinoise fondée il y a tout juste un an. Malgré ses débuts, DeepSeek a déjà réalisé une percée si remarquable que le célèbre investisseur technologique Marc Andreessen l'a qualifié de « moment Spoutnik de l'IA », une étape marquant un tournant majeur dans la course à l'IA.
Ce qui rend R1 si formidable, ce ne sont pas seulement ses performances exceptionnelles, mais aussi sa capacité à concurrencer directement des modèles phares comme GPT-4 d'OpenAI, Llama de Meta et Gemini de Google, pour un coût bien inférieur. Ce succès a bouleversé le monde de la technologie et a posé un défi majeur aux géants du secteur.
DeepSeek affirme que l'exécution de son modèle d'IA sous-jacent n'a coûté que 5,6 millions de dollars, un chiffre modeste comparé aux centaines de millions, voire aux milliards de dollars que les entreprises technologiques américaines investissent dans le développement de l'IA.

C’est d’autant plus surprenant que les États-Unis imposent depuis des années des restrictions strictes visant à couper l’approvisionnement de la Chine en puces d’IA hautes performances, invoquant des raisons de sécurité nationale.
Cela signifie que DeepSeek a compris comment construire un modèle d'IA puissant à faible coût, même en utilisant des puces d'IA à puissance relativement limitée, une réussite qui a laissé le monde de la technologie en admiration.
Qu'est-ce que DeepSeek ?
Fondée fin 2023 par Liang Wenfeng, un gestionnaire de fonds spéculatifs chinois, DeepSeek est rapidement devenue l'une des startups les plus en vue dans le secteur de l'IA. Comme des dizaines d'autres startups, DeepSeek a vu le jour avec l'ambition d'attirer des investissements importants pour tirer parti de la vague de l'IA qui transforme l'industrie technologique mondiale.
Liang Wenfeng est aujourd'hui connu comme le « Sam Altman de la Chine », un pionnier de l'IA qui non seulement promeut la recherche, mais investit aussi massivement dans les technologies de pointe. Son fonds spéculatif, High-Flyer, se consacre entièrement au développement de l'IA, témoignant de sa profonde conviction en l'avenir de l'IA.
Au cours de l'année écoulée, DeepSeek a lancé plusieurs modèles d'IA de pointe, en concurrence directe avec des acteurs majeurs comme Anthropic et Perplexity aux États-Unis. L'une des versions les plus marquantes, DeepSeek V3, a contribué à accroître la notoriété de l'entreprise dans le monde des technologies.
Cependant, selon le Wall Street Journal, DeepSeek est toujours confronté à des défis majeurs, notamment des restrictions de contenu liées à des sujets sensibles concernant le gouvernement chinois, ainsi que des inquiétudes quant à la viabilité à long terme de l'entreprise sur un marché de l'IA extrêmement concurrentiel.
À l'instar de GPT-4, Claude, Llama ou tout autre modèle d'IA générative populaire, DeepSeek est un modèle d'IA générative. Cependant, il s'agit plus précisément d'un ensemble de modèles d'IA différents, chaque variante étant conçue pour des applications spécifiques.
La plus grande différence entre les modèles DeepSeek et GPT d'OpenAI est que DeepSeek est publié sous la licence open source du MIT, qui permet une utilisation commerciale sans aucune barrière.

Cela signifie que l'intégralité du code source et du fonctionnement interne du modèle sont publics, permettant à quiconque d'utiliser, de personnaliser ou de construire sur la plate-forme existante, entièrement gratuitement.
Cela fait de DeepSeek un perturbateur sur le marché de l’IA à court terme et a le potentiel de conduire à des corrections plus profondes à long terme.
Cependant, tous ces avantages seraient vains si DeepSeek n'était pas véritablement puissant. Ce sont ses performances qui font de ce modèle le centre des discussions.
Selon les critères d'IA, DeepSeek R1 est comparable à GPT-4 et à d'autres modèles phares, les surpassant même dans certains scénarios. Mais ce qui est vraiment choquant, ce ne sont pas seulement ses performances, mais aussi ses coûts de développement, faramineux comparés aux investissements massifs réalisés par les géants technologiques occidentaux.
L'application DeepSeek a fait une percée impressionnante dans le classement de l'App Store, surpassant ChatGPT le 27 janvier et atteignant près de 2 millions de téléchargements.
Pourquoi DeepSeek R1 bouleverse-t-il le monde de la technologie ?
L’IA est une technologie qui consomme d’énormes quantités d’énergie et dont le développement est très coûteux, à tel point que les géants technologiques américains ont dû acquérir des sociétés d’énergie nucléaire pour répondre aux besoins énergétiques de leurs modèles d’IA.
Meta avait précédemment annoncé qu'il dépenserait plus de 65 milliards de dollars cette année pour le développement de l'IA, tandis que le PDG d'OpenAI, Sam Altman, a averti l'année dernière que l'industrie de l'IA aurait besoin de milliers de milliards de dollars pour développer des puces de haute puissance afin de répondre aux énormes demandes énergétiques des centres de données nécessaires pour exécuter des modèles complexes.
Ainsi, lorsqu’un modèle d’IA aussi puissant que ceux des géants américains peut être construit à un coût bien inférieur et en utilisant des puces de moindre puissance, cela représente un changement majeur dans la vision de l’industrie sur le niveau d’investissement nécessaire à l’IA.
Cette technologie fait encore face au scepticisme et à l’opposition de nombreux milieux, mais ses partisans affirment que l’IA inaugurera une nouvelle ère pour l’économie mondiale, rendant le travail plus efficace et créant de nouvelles opportunités dans tous les domaines, de la recherche au développement.
Andreessen, fondateur d'Andreessen Horowitz, l'une des principales sociétés de capital-risque de la Silicon Valley (États-Unis), a qualifié DeepSeek de « l'une des avancées les plus étonnantes que j'ai jamais vues » dans un article publié sur la plateforme de réseautage social X.
Si le potentiel de l’IA à changer le monde peut être exploité à un coût bien moindre, cela ouvre un tout nouvel éventail de possibilités, mais pose également des menaces imprévisibles pour l’avenir de notre planète.
Qu’est-ce que cela signifie pour l’Amérique ?
Les États-Unis estiment pouvoir recourir aux sanctions pour maintenir leur domination sur une technologie essentielle à leur sécurité nationale. Une semaine seulement avant de quitter ses fonctions, l'ancien président Joe Biden a décidé de renforcer les restrictions sur les exportations de puces d'IA, visant à empêcher des rivaux comme la Chine d'accéder à des technologies de pointe.
DeepSeek, cependant, remet en question cette idée et menace de compromettre l'invincibilité de l'industrie technologique américaine. Si les États-Unis ont peut-être gagné du temps grâce à leurs restrictions sur les exportations de puces, leur avance en matière d'IA s'est considérablement érodée malgré ces efforts.
DeepSeek montre que bloquer l’accès à une technologie critique ne signifie pas nécessairement que les États-Unis gagneront, un message puissant pour le président Donald Trump, d’autant plus qu’il poursuit une politique « America First ».
Wall Street était déjà nerveux face à ces développements, les actions américaines se préparant à une forte baisse le matin du 27 janvier. Nvidia, un important fournisseur de puces d'IA dont les actions ont doublé au cours des deux dernières années, a chuté jusqu'à 12 % dans les échanges avant bourse.
Pendant ce temps, Meta, Alphabet (la société mère de Google), Marvell, Broadcom, Palantir, Oracle et de nombreux autres géants de la technologie ont également enregistré de fortes baisses de la valeur de leurs actions.
Il est toutefois trop tôt pour ignorer l'innovation et le leadership américains dans ce domaine. Une seule réussite, aussi impressionnante soit-elle, pourrait ne pas suffire à contrebalancer les années de progrès réalisés par les entreprises américaines en matière d'IA. De plus, la probabilité que les clients se tournent vers une start-up chinoise reste faible.
Keith Lerner, analyste chez Truist, une société financière américaine, a déclaré : « L'émergence du modèle DeepSeek amène les investisseurs à s'interroger sur le leadership des entreprises américaines, sur les sommes qu'elles dépensent et sur la rentabilité de ces dépenses ou sur leur caractère excessif. »
« Cependant, nous pensons que le coût des données et des facteurs liés à l’IA sera énorme et que les entreprises américaines conserveront leur position de leader », a ajouté M. Keith Lerner.
Bien que les économies de coûts de DeepSeek soient importantes, leur modèle R1, bien que compétitif avec ChatGPT dans le domaine du langage naturel grand public, n’a pas encore prouvé sa capacité à gérer des applications d’IA industrielles ambitieuses, qui nécessitent toujours un énorme investissement en infrastructure.
Giuseppe Sette, président de la société américaine de recherche en IA Reflexivity, a déclaré : « Avec des ressources humaines et des capitaux abondants, les États-Unis restent le « terrain d'accueil » idéal et c'est là que nous nous attendons à voir la première IA auto-améliorée. »