Transformation numérique

Pourquoi le modèle d’IA chinois DeepSeek R1 secoue-t-il le monde de la technologie ?

Phan Van Hoa January 31, 2025 14:41

Un modèle avancé d’intelligence artificielle (IA) venu de Chine, appelé DeepSeek R1, bouleverse le monde de la technologie grâce à sa puissance supérieure.

Le nouveau modèle d'IA, baptisé DeepSeek R1, a été développé par DeepSeek, une jeune startup chinoise fondée il y a tout juste un an. Malgré ses débuts, DeepSeek a déjà réalisé une percée si remarquable que le célèbre investisseur technologique Marc Andreessen l'a qualifié de « moment Spoutnik de l'IA », une étape marquant un tournant majeur dans la course à l'IA.

Ce qui rend R1 si redoutable, ce ne sont pas seulement ses excellentes performances, mais aussi sa capacité à concurrencer directement des modèles phares comme GPT-4 d'OpenAI, Llama de Meta et Gemini de Google, pour un coût bien inférieur. Ce succès a bouleversé le monde de la technologie et a posé un défi de taille aux géants du secteur.

DeepSeek affirme que l'exécution de son modèle d'IA sous-jacent n'a coûté que 5,6 millions de dollars, un chiffre modeste comparé aux centaines de millions, voire aux milliards de dollars que les entreprises technologiques américaines investissent dans le développement de l'IA.

Ảnh minh họa
Photo d'illustration.

C’est d’autant plus surprenant que les États-Unis imposent depuis des années des restrictions strictes visant à couper l’approvisionnement de puces d’IA de haute performance à la Chine, invoquant des raisons de sécurité nationale.

Cela signifie que DeepSeek a compris comment construire un modèle d'IA puissant à faible coût, même en utilisant uniquement des puces d'IA à puissance relativement limitée, une réussite qui a laissé le monde de la technologie en admiration.

Qu'est-ce que DeepSeek ?

Fondée fin 2023 par Liang Wenfeng, un gestionnaire de fonds spéculatifs chinois, DeepSeek est rapidement devenue l'une des startups phares de l'IA. À l'instar de dizaines d'autres startups, DeepSeek a vu le jour avec l'ambition d'attirer des investissements importants pour tirer parti de la vague de l'IA qui transforme l'industrie technologique mondiale.

Liang Wenfeng est désormais connu comme le « Sam Altman de la Chine », un pionnier de l'IA qui non seulement promeut la recherche, mais investit aussi massivement dans les technologies de pointe. Son fonds spéculatif, High-Flyer, est entièrement dédié au développement de l'IA, témoignant de sa profonde conviction en son avenir.

Au cours de l'année écoulée, DeepSeek a lancé plusieurs modèles d'IA de pointe, en concurrence directe avec des concurrents majeurs comme Anthropic et Perplexity aux États-Unis. L'une des versions les plus marquantes, DeepSeek V3, a contribué à accroître la notoriété de l'entreprise dans le monde des technologies.

Cependant, selon le Wall Street Journal, DeepSeek est toujours confronté à des défis majeurs, notamment des restrictions de contenu liées à des sujets sensibles concernant le gouvernement chinois, ainsi que des inquiétudes quant à la viabilité à long terme de l'entreprise sur un marché de l'IA extrêmement concurrentiel.

À l'instar de GPT-4, Claude, Llama ou tout autre modèle d'IA générative populaire, DeepSeek est un modèle d'IA générative. Cependant, il s'agit plus précisément d'un ensemble de modèles d'IA différents, chaque variante étant conçue pour des applications spécifiques.

La plus grande différence entre les modèles DeepSeek et GPT d'OpenAI est que DeepSeek est publié sous la licence open source MIT, qui permet une utilisation commerciale sans aucune barrière.

Ảnh minh họa1
Liang Wenfeng, fondateur de DeepSeek. Photo : Internet

Cela signifie que l'intégralité du code source et le fonctionnement interne du modèle sont publics, ce qui permet à chacun d'utiliser, de personnaliser ou de construire sur la plateforme existante, de manière totalement gratuite.

Cela fait de DeepSeek un perturbateur sur le marché de l’IA à court terme et a le potentiel de conduire à des corrections plus profondes à long terme.

Cependant, tous ces avantages seraient vains si DeepSeek n'était pas réellement puissant. Ce sont ses performances qui font de ce modèle le centre des débats.

Selon les critères d'IA, DeepSeek R1 est comparable à GPT-4 et à d'autres modèles phares, les surpassant même dans certains scénarios. Mais ce qui est vraiment choquant, ce ne sont pas seulement les performances, mais aussi le coût de développement, un chiffre ahurissant comparé aux investissements massifs réalisés par les géants technologiques occidentaux.

L'application DeepSeek a fait une percée impressionnante dans le classement de l'App Store, surpassant ChatGPT le 27 janvier et atteignant près de 2 millions de téléchargements.

Pourquoi DeepSeek R1 bouleverse-t-il le monde de la technologie ?

L’IA est une technologie qui consomme d’énormes quantités d’énergie et dont le développement est très coûteux, à tel point que les géants technologiques américains ont dû acquérir des sociétés d’énergie nucléaire pour répondre aux besoins énergétiques de leurs modèles d’IA.

Meta avait annoncé précédemment qu'elle dépenserait plus de 65 milliards de dollars cette année pour le développement de l'IA, et l'année dernière, Sam Altman, PDG d'OpenAI, a averti que l'industrie de l'IA aurait besoin de milliers de milliards de dollars pour développer des puces de haute puissance afin de répondre aux énormes demandes énergétiques des centres de données nécessaires pour exécuter des modèles complexes.

Ainsi, lorsqu’un modèle d’IA aussi puissant que celui des géants américains peut être construit à un coût bien inférieur et en utilisant des puces de moindre puissance, cela représente un changement majeur dans la vision de l’industrie sur le niveau d’investissement nécessaire pour l’IA.

Cette technologie fait encore face au scepticisme et à l’opposition de nombreux acteurs, mais ses défenseurs affirment que l’IA ouvrira une nouvelle ère pour l’économie mondiale, rendant le travail plus efficace et créant de nouvelles opportunités dans tous les domaines, de la recherche au développement.

Andreessen, fondateur d'Andreessen Horowitz, l'une des principales sociétés de capital-risque de la Silicon Valley (États-Unis), a qualifié DeepSeek de « l'une des avancées les plus étonnantes que j'ai jamais vues » dans un article publié sur la plateforme de réseautage social X.

Si le potentiel de l’IA à changer le monde peut être exploité à un coût bien moindre, cela ouvre un tout nouvel éventail de possibilités, mais pose également des menaces imprévisibles pour l’avenir de notre planète.

Qu’est-ce que cela signifie pour l’Amérique ?

Les États-Unis estiment pouvoir recourir aux sanctions pour maintenir leur domination sur une technologie essentielle, considérée comme essentielle à la sécurité nationale. Une semaine seulement avant de quitter ses fonctions, l'ancien président Joe Biden a décidé de renforcer les restrictions sur les exportations de puces d'IA, afin d'empêcher des rivaux comme la Chine d'accéder à des technologies de pointe.

DeepSeek, cependant, remet en cause cette idée et menace de compromettre l'invincibilité de l'industrie technologique américaine. Si les États-Unis ont peut-être gagné du temps grâce à leurs restrictions sur les exportations de puces, leur avance en matière d'IA s'est considérablement érodée malgré ces efforts.

DeepSeek démontre que bloquer l’accès à une technologie critique ne signifie pas nécessairement la victoire des États-Unis, un message fort pour le président Donald Trump, d’autant plus qu’il poursuit une politique « America First ».

Wall Street était déjà nerveux face à ces développements, les actions américaines se préparant à une forte baisse le matin du 27 janvier. Nvidia, un important fournisseur de puces d'IA dont les actions ont doublé au cours des deux dernières années, a chuté jusqu'à 12 % dans les échanges avant bourse.

Dans le même temps, Meta, Alphabet (la société mère de Google), Marvell, Broadcom, Palantir, Oracle et de nombreux autres géants de la technologie ont également enregistré de fortes baisses de la valeur de leurs actions.

Il est toutefois trop tôt pour ignorer l'innovation et le leadership américains dans ce domaine. Bien qu'impressionnant, cet exploit pourrait ne pas suffire à compenser les années de progrès réalisés par les entreprises américaines en IA. De plus, la probabilité que les clients se tournent vers une start-up chinoise reste faible.

Keith Lerner, analyste chez Truist, une société financière américaine, a déclaré : « L'émergence du modèle DeepSeek rend les investisseurs sceptiques quant à la direction des entreprises américaines, quant aux sommes qu'elles dépensent et quant à la rentabilité de ces dépenses ou à leur caractère excessif. »

« Cependant, nous pensons que le coût des données et des facteurs liés à l’IA sera énorme et que les entreprises américaines conserveront leur position de leader », a ajouté Keith Lerner.

Bien que les économies de coûts de DeepSeek soient importantes, son modèle R1, bien que compétitif avec ChatGPT dans le domaine du langage naturel grand public, n’a pas encore prouvé sa capacité à gérer des applications d’IA industrielles ambitieuses, qui nécessitent toujours un énorme investissement en infrastructure.

Giuseppe Sette, président de la société américaine de recherche en IA Reflexivity, a déclaré : « Avec des ressources humaines et des capitaux abondants, les États-Unis restent le « terrain d'entraînement » idéal et c'est là que nous nous attendons à voir la première IA auto-améliorée. »

Selon CNN, Howtogeek
Copier le lien

Journal Nghe An en vedette

Dernier

x
Pourquoi le modèle d’IA chinois DeepSeek R1 secoue-t-il le monde de la technologie ?
ALIMENTÉ PARUNCMS- UN PRODUIT DENEKO