Chuyển đổi số

Tại sao mô hình AI DeepSeek R1 của Trung Quốc lại làm rung chuyển thế giới công nghệ?

Phan Văn Hòa • 31/01/2025 14:41

Một mô hình trí tuệ nhân tạo (AI) tiên tiến từ Trung Quốc mang tên DeepSeek R1 đang gây chấn động giới công nghệ với sức mạnh vượt trội.

Mô hình AI mới mang tên DeepSeek R1 được phát triển bởi DeepSeek, một công ty khởi nghiệp non trẻ của Trung Quốc, chỉ mới thành lập cách đây một năm. Dù còn rất mới, DeepSeek đã nhanh chóng tạo ra một bước đột phá đáng kinh ngạc, đến mức nhà đầu tư công nghệ danh tiếng Marc Andreessen gọi đây là "Khoảnh khắc Sputnik của AI", một cột mốc quan trọng đánh dấu sự thay đổi lớn trong cuộc đua AI.

Điều khiến R1 trở nên đáng gờm không chỉ là hiệu suất mạnh mẽ mà còn là khả năng cạnh tranh trực tiếp với những mô hình hàng đầu như GPT-4 của OpenAI, Llama của Meta và Gemini của Google, nhưng với chi phí vận hành chỉ bằng một phần nhỏ. Thành công này đã làm rúng động giới công nghệ và đặt ra thách thức lớn đối với các gã khổng lồ trong ngành.

DeepSeek tuyên bố rằng họ chỉ tốn 5,6 triệu USD để vận hành mô hình AI nền tảng của mình, một con số khiêm tốn so với hàng trăm triệu, thậm chí hàng tỷ USD mà các công ty công nghệ Mỹ đổ vào phát triển AI.

Điều này càng gây bất ngờ hơn khi xét đến việc Mỹ đã áp đặt các hạn chế nghiêm ngặt trong nhiều năm nhằm cắt đứt nguồn cung chip AI hiệu suất cao cho Trung Quốc, viện dẫn lý do an ninh quốc gia.

Điều đó có nghĩa là DeepSeek đã tìm ra cách xây dựng một mô hình AI mạnh mẽ với chi phí thấp, ngay cả khi chỉ sử dụng các chip AI có công suất tương đối hạn chế, một thành tựu khiến giới công nghệ không khỏi kinh ngạc.

DeepSeek là gì?

DeepSeek được thành lập vào cuối năm 2023 bởi Liang Wenfeng, một nhà quản lý quỹ đầu cơ người Trung Quốc, và nhanh chóng trở thành một trong những công ty khởi nghiệp nổi bật trong cuộc đua AI. Giống như hàng chục công ty khởi nghiệp (startup) khác, DeepSeek xuất hiện với tham vọng thu hút các khoản đầu tư lớn để tận dụng làn sóng AI đang định hình lại ngành công nghệ toàn cầu.

Liang Wenfeng hiện được ví như "Sam Altman của Trung Quốc", một người tiên phong trong lĩnh vực AI, không chỉ thúc đẩy nghiên cứu mà còn đầu tư mạnh mẽ vào các công nghệ đột phá. Quỹ đầu cơ của ông, High-Flyer, tập trung hoàn toàn vào việc phát triển AI, phản ánh niềm tin sâu sắc của ông vào tương lai của AI.

Trong năm qua, DeepSeek đã ra mắt nhiều mô hình AI tiên tiến, cạnh tranh trực tiếp với các đối thủ lớn như Anthropic và Perplexity của Mỹ. Một trong những phiên bản đáng chú ý nhất, DeepSeek V3, đã giúp nâng cao danh tiếng của công ty trong giới công nghệ.

Tuy nhiên, theo tờ The Wall Street Journal, DeepSeek vẫn phải đối mặt với những thách thức lớn, bao gồm các hạn chế nội dung liên quan đến các chủ đề nhạy cảm về chính phủ Trung Quốc, cũng như những lo ngại về khả năng tồn tại lâu dài của công ty trong một thị trường AI đầy cạnh tranh khốc liệt.

Cũng giống như GPT-4, Claude, Llama hay bất kỳ mô hình AI tạo sinh nào đang được ưa chuộng, DeepSeek cũng thuộc nhóm AI tạo sinh. Tuy nhiên, chính xác hơn, nó là một tập hợp các mô hình AI khác nhau, mỗi biến thể được thiết kế để phục vụ những ứng dụng cụ thể.

Điểm khác biệt lớn nhất giữa DeepSeek và các mô hình GPT của OpenAI là DeepSeek được phát hành dưới giấy phép mã nguồn mở MIT, cho phép sử dụng thương mại mà không gặp bất kỳ rào cản nào.

Ảnh minh họa1 — Liang Wenfeng, nhà sáng lập của DeepSeek. Ảnh: Internet

Điều này có nghĩa là toàn bộ mã nguồn và cơ chế hoạt động bên trong của mô hình đều được công khai, cho phép bất kỳ ai cũng có thể sử dụng, tùy chỉnh hoặc xây dựng dựa trên nền tảng đã có và hoàn toàn miễn phí.

Chính điều này đã khiến DeepSeek trở thành một yếu tố gây xáo trộn trên thị trường AI trong ngắn hạn và có tiềm năng dẫn đến những điều chỉnh sâu rộng hơn trong dài hạn.

Tuy nhiên, tất cả những lợi thế trên sẽ không có ý nghĩa nếu DeepSeek không thực sự mạnh mẽ. Điều khiến mô hình này trở thành tâm điểm bàn luận chính là hiệu suất của nó.

Theo các tiêu chuẩn đánh giá AI, DeepSeek R1 có thể sánh ngang với GPT-4 và các mô hình hàng đầu khác, thậm chí vượt trội trong một số tình huống nhất định. Nhưng điều thực sự gây sốc không chỉ là hiệu năng mà là chi phí phát triển, một con số đáng kinh ngạc khi so sánh với những khoản đầu tư khổng lồ của các gã khổng lồ công nghệ phương Tây.

Ứng dụng DeepSeek đã có một sự bứt phá ấn tượng trên bảng xếp hạng của các cửa hàng ứng dụng, vượt qua cả ChatGPT vào ngày 27/1 vừa qua và đạt gần 2 triệu lượt tải xuống.

Tại sao DeepSeek R1 lại làm rung chuyển thế giới công nghệ?

AI là công nghệ tiêu tốn năng lượng khổng lồ và chi phí phát triển rất cao, đến mức những ông lớn công nghệ ở Mỹ phải mua lại các công ty điện hạt nhân để đáp ứng nhu cầu năng lượng cho các mô hình AI của họ.

Trước đó, Meta tuyên bố sẽ chi hơn 65 tỷ USD trong năm nay cho việc phát triển AI. Còn vào năm ngoái, Sam Altman, CEO của OpenAI, đã cảnh báo rằng ngành công nghiệp AI sẽ cần hàng nghìn tỷ USD để phát triển các loại chip công suất cao, đáp ứng yêu cầu năng lượng khổng lồ của các trung tâm dữ liệu cần thiết để vận hành những mô hình phức tạp.

Vì vậy, khi một mô hình AI mạnh mẽ như của các gã khổng lồ Mỹ có thể được xây dựng với chi phí thấp hơn rất nhiều và sử dụng các loại chip có công suất thấp hơn, đây chính là một bước chuyển lớn trong cách nhìn nhận của ngành về mức độ đầu tư cần thiết cho AI.

Công nghệ này vẫn đối mặt với sự hoài nghi và phản đối từ nhiều phía, nhưng những người ủng hộ khẳng định rằng AI sẽ mở ra một kỷ nguyên mới cho nền kinh tế toàn cầu, giúp công việc trở nên hiệu quả hơn và tạo ra những cơ hội mới cho mọi ngành nghề, từ nghiên cứu đến phát triển.

Andreessen, người sáng lập Andreessen Horowitz, một trong những công ty đầu tư mạo hiểm hàng đầu tại Thung lũng Silicon (Mỹ) đã gọi DeepSeek là "một trong những đột phá đáng kinh ngạc nhất mà tôi từng chứng kiến" trong một bài đăng trên nền tảng mạng xã hội X.

Nếu sức mạnh có khả năng thay đổi thế giới của AI có thể được khai thác với chi phí thấp hơn rất nhiều, nó sẽ mở ra một loạt khả năng mới, nhưng cũng mang đến những mối đe dọa khó lường cho tương lai của hành tinh chúng ta.

Điều này có ý nghĩa gì đối với nước Mỹ?

Mỹ tin rằng họ có thể sử dụng các biện pháp trừng phạt để duy trì sự thống trị đối với một công nghệ quan trọng mà họ cho rằng sẽ củng cố an ninh quốc gia. Chỉ một tuần trước khi rời nhiệm sở, cựu Tổng thống Joe Biden đã quyết định gia tăng các hạn chế xuất khẩu chip AI, nhằm ngăn chặn các đối thủ như Trung Quốc tiếp cận công nghệ tiên tiến.

Tuy nhiên, DeepSeek đã thách thức khái niệm này và đe dọa làm suy yếu vị thế bất khả chiến bại của ngành công nghiệp công nghệ Mỹ. Mặc dù Mỹ có thể đã kéo dài thời gian cho mình nhờ các biện pháp hạn chế xuất khẩu chip, nhưng sự dẫn đầu của quốc gia này trong lĩnh vực AI đã bị suy giảm đáng kể, bất chấp những nỗ lực đó.

DeepSeek cho thấy rằng việc chặn quyền truy cập vào một công nghệ quan trọng không nhất thiết đồng nghĩa với việc Mỹ sẽ chiến thắng. Đây là một thông điệp mạnh mẽ gửi đến Tổng thống Donald Trump, đặc biệt khi ông theo đuổi chính sách "Nước Mỹ trên hết".

Phố Wall đã rất lo ngại trước những diễn biến này. Cổ phiếu của các công ty Mỹ chuẩn bị cho một đợt bán tháo mạnh vào sáng 27/1 vừa qua. Nvidia, nhà cung cấp chip AI hàng đầu, vốn đã chứng kiến cổ phiếu tăng gấp đôi trong 2 năm qua, đã giảm tới 12% trong giao dịch trước giờ mở cửa.

Trong khi đó, Meta, Alphabet (công ty mẹ của Google), Marvell, Broadcom, Palantir, Oracle và nhiều gã khổng lồ công nghệ khác cũng đều ghi nhận sự giảm mạnh trong giá trị cổ phiếu.

Dù vậy, vẫn còn quá sớm để phủ nhận sự đổi mới và vị thế dẫn đầu của Mỹ trong lĩnh vực này. Một thành tựu, dù ấn tượng, có thể không đủ để đối phó với nhiều năm tiến bộ mà các công ty Mỹ đã đạt được trong lĩnh vực AI. Hơn nữa, khả năng khách hàng chuyển sang sử dụng một công ty khởi nghiệp Trung Quốc vẫn còn rất thấp.

Keith Lerner, nhà phân tích tại công ty tài chính Truist của Mỹ nhận định: "Sự xuất hiện của mô hình DeepSeek đang khiến các nhà đầu tư nghi ngờ về vị trí dẫn đầu của các công ty Mỹ, về số tiền họ đang chi tiêu và liệu khoản chi này có mang lại lợi nhuận hay liệu đó có phải là sự chi tiêu quá mức".

Ông Keith Lerner cho biết thêm: "Tuy nhiên, chúng tôi tin rằng chi phí dành cho dữ liệu và các yếu tố liên quan trong AI sẽ rất lớn và các công ty Mỹ vẫn sẽ giữ vững vị trí dẫn đầu".

Mặc dù thành tựu tiết kiệm chi phí của DeepSeek là đáng kể, nhưng mô hình R1 của họ, dù có thể cạnh tranh với ChatGPT trong lĩnh vực ngôn ngữ tự nhiên dành cho người tiêu dùng, vẫn chưa chứng minh được khả năng xử lý các ứng dụng AI đầy tham vọng cho các ngành công nghiệp. Những ứng dụng này vẫn yêu cầu một mức đầu tư cơ sở hạ tầng rất lớn.

Giuseppe Sette, Chủ tịch công ty nghiên cứu AI Reflexivity của Mỹ chia sẻ: "Với nguồn nhân lực và vốn dồi dào, Mỹ vẫn là 'sân nhà' lý tưởng và là nơi chúng tôi kỳ vọng sẽ chứng kiến sự xuất hiện của AI tự cải thiện đầu tiên".

Tại sao mô hình AI DeepSeek R1 của Trung Quốc lại làm rung chuyển thế giới công nghệ?

DeepSeek là gì?

Tại sao DeepSeek R1 lại làm rung chuyển thế giới công nghệ?

Điều này có ý nghĩa gì đối với nước Mỹ?

Trung Quốc

AI

DeepSeek R1

ChatGPT

Bài liên quan

Bài học chuyển đổi các ngành công nghiệp bằng AI của Trung Quốc

Đọc tiếp

Nghiên cứu mới cho biết AI đang khiến con người suy giảm khả năng tư duy phản biện

Các chuyên gia công nghệ dự đoán gì về AI trong năm 2025?

Tỷ lệ sử dụng AI trong cuộc sống hàng ngày tại Trung Quốc cao gấp đôi Mỹ

Đọc tiếp

Nghiên cứu mới cho biết AI đang khiến con người suy giảm khả năng tư duy phản biện

Các chuyên gia công nghệ dự đoán gì về AI trong năm 2025?

Tỷ lệ sử dụng AI trong cuộc sống hàng ngày tại Trung Quốc cao gấp đôi Mỹ

Xem thêm Chuyển đổi số

Nổi bật Báo Nghệ An

Mới nhất

Đọc nhiều