Chuyển đổi số

Những bộ óc AI hàng đầu thế giới nói gì về DeepSeek?

Phan Văn Hòa 04/02/2025 17:57

Các chuyên gia AI hàng đầu trên thế giới đã phân tích tốc độ Trung Quốc rút ngắn khoảng cách với Mỹ trong cuộc đua AI, khi DeepSeek tiên phong áp dụng chiến lược mã nguồn mở.

Những chuyên gia hàng đầu trong lĩnh vực trí tuệ nhân tạo (AI) đều công nhận những thành tựu đáng chú ý của công ty khởi nghiệp (startup) DeepSeek của Trung Quốc.

Tuy nhiên, họ cũng cảnh báo rằng không nên đánh giá quá cao sự thành công của công ty này, đặc biệt khi ngành công nghệ đang xem xét tác động thực tế của các mô hình AI tiên tiến mà DeepSeek phát triển với chi phí chỉ bằng một phần nhỏ so với thông thường.

Ảnh minh họa
Ảnh minh họa.

Các nhân vật có ảnh hưởng lớn trong giới AI, bao gồm Sam Altman, CEO của OpenAI, và Andrew Ng, nhà khoa học từng làm việc tại Baidu và Google, đều đánh giá cao hướng tiếp cận mã nguồn mở của DeepSeek.

Những lời khen ngợi này xuất hiện sau khi công ty ra mắt mô hình AI tiên tiến, thu hút sự quan tâm rộng rãi từ cộng đồng công nghệ. Dù DeepSeek đang tạo ra dấu ấn quan trọng, vẫn còn nhiều câu hỏi về tính bền vững và khả năng cạnh tranh lâu dài của công ty so với các ông lớn trong ngành.

Có trụ sở tại Hàng Châu, thủ phủ tỉnh Chiết Giang (Trung Quốc), DeepSeek đã làm rung chuyển ngành công nghiệp AI toàn cầu khi ra mắt mô hình AI tiên tiến nguồn mở DeepSeek R1. Được công bố vào ngày 20/1 vừa qua, DeepSeek R1 thể hiện hiệu suất tương đương với các mô hình nguồn đóng từ OpenAI – công ty đứng sau ChatGPT nhưng được phát triển với chi phí đào tạo thấp hơn đáng kể.

Bên cạnh đó, DeepSeek tiết lộ rằng mô hình ngôn ngữ lớn nền tảng của họ, DeepSeek R1-V3, được phát hành chỉ vài tuần trước đó, có chi phí đào tạo vỏn vẹn khoảng 5,6 triệu USD. Thông tin này đã làm dấy lên lo ngại về việc các công ty công nghệ có thể đã chi tiêu quá mức vào bộ xử lý đồ họa (GPU) để huấn luyện AI. Những lo ngại này góp phần khiến cổ phiếu của Nvidia, nhà cung cấp chip AI hàng đầu bị bán tháo vào tuần trước.

Ảnh minh họa1
Sam Altman, CEO của OpenAI. Ảnh: Internet

Trong phiên "Hỏi tôi bất cứ điều gì" trên diễn đàn Reddit vào tuần trước, Sam Altman, CEO của OpenAI, thừa nhận rằng công ty đang ở phía sai lầm của lịch sử khi theo đuổi chiến lược nguồn đóng và cần xem xét lại cách tiếp cận mã nguồn mở.

Hiện tại, OpenAI kiểm soát chặt chẽ thông tin về quy trình đào tạo, chi phí năng lượng cũng như các chi tiết kỹ thuật của các mô hình AI tiên tiến của mình.

Tuy nhiên, Altman cũng nhấn mạnh rằng không phải ai trong OpenAI cũng đồng tình với quan điểm này và việc chuyển đổi sang hướng mã nguồn mở không phải là ưu tiên hàng đầu của công ty vào thời điểm hiện tại.

Trong khi đó, Andrew Ng – người sáng lập và cựu giám đốc Google Brain, đồng thời từng là nhà khoa học trưởng tại Baidu nhận định rằng sự trỗi dậy của DeepSeek cùng các đối thủ cạnh tranh trong nước là bằng chứng cho thấy Trung Quốc đang nhanh chóng thu hẹp khoảng cách với Mỹ trong cuộc đua AI.

"Khi ChatGPT ra mắt vào tháng 11/2022, Mỹ vẫn dẫn trước Trung Quốc một khoảng cách khá xa trong lĩnh vực AI tạo sinh, nhưng thực tế, khoảng cách này đã thu hẹp đáng kể chỉ trong vòng 2 năm qua", Andrew Ng viết trên nền tảng mạng xã hội X.

Ông nhấn mạnh rằng, với sự xuất hiện của hàng loạt mô hình AI từ Trung Quốc như Qwen, Kimi, InternVL và DeepSeek, Trung Quốc đã rõ ràng thu hẹp khoảng cách với Mỹ. Thậm chí, trong một số lĩnh vực như AI tạo video, đã có thời điểm Trung Quốc vượt lên dẫn trước.

Theo đó, mô hình AI Qwen là sản phẩm của tập đoàn Alibaba. Trong khi đó, Kimi được phát triển bởi startup Moonshot AI, còn InternVL đến từ Phòng thí nghiệm AI Thượng Hải, một tổ chức được nhà nước hậu thuẫn. Những cái tên này đang góp phần thúc đẩy sự trỗi dậy mạnh mẽ của AI Trung Quốc trên đấu trường quốc tế.

Ảnh minh họa2
Andrew Ng, người sáng lập và cựu Giám đốc Google Brain. Ảnh: Internet

Andrew Ng nhận định: "Nếu Mỹ tiếp tục kìm hãm sự phát triển của mã nguồn mở, Trung Quốc sẽ chiếm lĩnh lĩnh vực này trong chuỗi cung ứng AI. Khi đó, nhiều doanh nghiệp trên thế giới sẽ sử dụng các mô hình phản ánh giá trị và tư duy của Trung Quốc nhiều hơn là của Mỹ".

Trong khi đó, Shawn Kim, nhà phân tích tại tập đoàn tài chính và ngân hàng đầu tư đa quốc gia có trụ sở tại New York (Mỹ) Morgan Stanley nhận định rằng, DeepSeek đang nhận được sự công nhận rộng rãi đúng vào thời điểm các tập đoàn công nghệ lớn của Mỹ tích cực quảng bá cho startup AI đến từ Trung Quốc này.

Kể từ khi ra mắt, mô hình AI tiên tiến DeepSeek R1 đã được nhiều công ty lớn trên thế giới quan tâm và tích hợp vào các dịch vụ của mình. Chẳng hạn, công ty bán dẫn Nvidia của Mỹ đã tích hợp mô hình DeepSeek R1 vào dịch vụ vi mô NIM, giúp người dùng dễ dàng truy cập và khai thác tiềm năng của mô hình này.

Trong khi đó, Microsoft, một trong những nhà đầu tư của OpenAI cũng đã công bố hỗ trợ DeepSeek R1 trên nền tảng điện toán đám mây Azure và GitHub.

Không kém cạnh, Amazon.com đã cho phép khách hàng sử dụng Amazon Web Services (AWS) để xây dựng ứng dụng dựa trên DeepSeek R1, mở rộng khả năng tiếp cận công nghệ AI tiên tiến này.

Dù DeepSeek đang thu hút sự chú ý mạnh mẽ, một số chuyên gia cho rằng quy mô và tác động thực sự của bước đột phá này có thể đã bị đánh giá quá cao.

Yann LeCun, nhà khoa học AI hàng đầu của Meta Platforms, bác bỏ quan điểm cho rằng DeepSeek giúp Trung Quốc vượt mặt Mỹ trong cuộc đua AI. Trên Threads, ông khẳng định: "Cách hiểu đúng phải là các mô hình mã nguồn mở đang dần bắt kịp và thậm chí vượt qua các mô hình độc quyền".

Dù gây tiếng vang, DeepSeek vẫn đối mặt với nhiều hoài nghi, đặc biệt về chi phí thực tế và phương pháp đào tạo AI. Được tách ra từ quỹ đầu cơ High-Flyer Quant của nhà sáng lập Liang Wenfeng vào tháng 5/2023, công ty này chưa hoàn toàn minh bạch về tổng chi phí phát triển các mô hình của mình.

Theo Giáo sư Zheng Xiaoqing từ Đại học Phúc Đán (Trung Quốc), con số 5,6 triệu USD mà DeepSeek công bố cho việc đào tạo mô hình DeepSeek R1-V3 chưa tính đến các chi phí nghiên cứu và thử nghiệm trước đó.

Trả lời phỏng vấn tờ báo kinh tế hàng đầu của Trung Quốc National Business Daily, ông nhận định thành công của DeepSeek phần lớn nhờ vào tối ưu hóa kỹ thuật, nhưng sẽ không tạo ra tác động đáng kể đến thị trường chip AI hoặc chuỗi cung ứng phần cứng.

Theo SCMP
Copy Link

Mới nhất

x
Những bộ óc AI hàng đầu thế giới nói gì về DeepSeek?
POWERED BY ONECMS - A PRODUCT OF NEKO