数字化转型

中国的DeepSeek R1人工智能模型为何能震撼科技界?

潘文和 January 31, 2025 14:41

来自中国的一款名为 DeepSeek R1 的先进人工智能 (AI) 模型正以其卓越的性能震撼科技界。

这款名为 DeepSeek R1 的新 AI 模型由 DeepSeek 开发,DeepSeek 是一家刚刚成立一年的中国初创公司。尽管 DeepSeek 尚处于起步阶段,但它已经取得了令人瞩目的突破,以至于著名科技投资者马克·安德森 (Marc Andreessen) 称之为“AI 的斯普尼克时刻”,这一里程碑标志着 AI 竞赛的重大转变。

R1 的强大之处不仅在于其强大的性能,更在于它能够与 OpenAI 的 GPT-4、Meta 的 Llama 和谷歌的 Gemini 等领先模型直接竞争,而成本却低得多。这一成功震动了科技界,也给行业巨头们带来了巨大的挑战。

DeepSeek 声称运行其底层 AI 模型仅花费 560 万美元,与美国科技公司投入 AI 开发的数亿甚至数十亿美元相比,这个数字并不高。

Ảnh minh họa
插图照片。

鉴于美国多年来以国家安全为由实施严格限制,旨在切断对中国的高性能人工智能芯片供应,这一情况就更加令人惊讶了。

这意味着 DeepSeek 已经找到了如何以低成本构建强大的 AI 模型,即使只使用功率相对有限的 AI 芯片,这一成就也让科技界惊叹不已。

什么是 DeepSeek?

DeepSeek 由中国对冲基金经理梁文峰于 2023 年底创立,并迅速成为人工智能竞赛中脱颖而出的初创企业之一。与其他数十家初创企业一样,DeepSeek 的初衷是吸引大量投资,以抓住重塑全球科技行业的人工智能浪潮。

梁文锋如今被称为“中国的山姆·奥特曼”,他是一位人工智能先驱,不仅致力于推动研究,还在突破性技术上投入巨资。他的对冲基金High-Flyer完全专注于人工智能发展,体现了他对人工智能未来的坚定信念。

在过去的一年里,DeepSeek 发布了多款尖端人工智能模型,与美国的 Anthropic 和 Perplexity 等主要竞争对手展开直接竞争。其中最引人注目的版本之一 DeepSeek V3 帮助提升了该公司在科技界的知名度。

不过,据《华尔街日报》报道,DeepSeek 仍然面临重大挑战,包括与中国政府敏感话题相关的内容限制,以及对该公司在竞争激烈的人工智能市场中长期生存能力的担忧。

与 GPT-4、Claude、Llama 或任何其他流行的生成式 AI 模型一样,DeepSeek 也是一种生成式 AI 模型。然而,更准确地说,它是不同 AI 模型的集合,每个变体都旨在服务于特定的应用。

DeepSeek 与 OpenAI 的 GPT 模型最大的区别在于,DeepSeek 是在 MIT 开源许可证下发布的,这使得商业使用没有任何障碍。

Ảnh minh họa1
DeepSeek创始人梁文峰。图片来源:互联网

这意味着该模型的整个源代码和内部工作原理都是公开的,允许任何人完全免费地使用、定制或在现有平台上构建。

这使得 DeepSeek 在短期内成为 AI 市场的颠覆者,并有可能在长期内引发更深刻的修正。

然而,如果 DeepSeek 不够强大,所有这些优势都将毫无意义。该模型之所以成为讨论的焦点,是因为它的性能。

从AI基准测试来看,DeepSeek R1的表现堪比GPT-4等领先模型,甚至在某些场景下甚至超越它们。但真正令人震惊的不仅仅是其性能,还有其开发成本。与西方科技巨头的巨额投入相比,这一数字令人咋舌。

DeepSeek 应用程序在应用商店排名上取得了令人瞩目的突破,于 1 月 27 日超越 ChatGPT,下载量达到近 200 万次。

DeepSeek R1 为何能震撼科技界?

人工智能是一项消耗大量能源的技术,开发成本非常高,以至于美国科技巨头不得不收购核电公司来满足其人工智能模型的能源需求。

Meta 此前宣布今年将在 AI 开发上投入超过 650 亿美元,而去年 OpenAI 首席执行官 Sam Altman 也曾警告称,AI 行业需要数万亿美元来开发高性能芯片,以满足运行复杂模型所需的数据中心的巨大能源需求。

因此,当能够以低得多的成本并使用低功耗芯片构建与美国巨头一样强大的人工智能模型时,它代表着业界对人工智能所需投资水平的看法发生了重大转变。

这项技术仍然面临多方面的怀疑和反对,但支持者坚称,人工智能将为全球经济开启一个新时代,使工作更加高效,并为从研究到开发的各个领域创造新的机遇。

美国硅谷领先风险投资公司之一的安德森·霍洛维茨基金创始人安德森在社交网络平台X上发表文章称,DeepSeek是“我所见过的最令人惊叹的突破之一”。

如果能够以更低的成本利用人工智能可能改变世界的力量,它将开辟一系列全新的可能性,但也会对我们星球的未来构成不可预测的威胁。

这对美国意味着什么?

美国认为,可以利用制裁来维持其在关键技术领域的主导地位,而这项技术是其国家安全的基础。就在卸任前一周,前总统乔·拜登采取行动,加强对人工智能芯片出口的限制,旨在阻止中国等竞争对手获得尖端技术。

然而,DeepSeek 挑战了这一理念,并威胁到美国科技产业的无敌地位。尽管美国通过芯片出口限制为自己争取了一些时间,但尽管如此,其在人工智能领域的领先地位仍被严重削弱。

DeepSeek 表明,阻止访问关键技术并不一定意味着美国的胜利,这对唐纳德·特朗普总统来说是一个强有力的信息,特别是在他奉行“美国优先”政策的情况下。

华尔街已经对事态发展感到紧张,美国股市在 1 月 27 日上午准备遭遇大幅抛售。领先的人工智能芯片供应商英伟达的股价在过去两年中翻了一番,但在盘前交易中却下跌了 12%。

与此同时,Meta、Alphabet(谷歌母公司)、Marvell、Broadcom、Palantir、甲骨文等多家科技巨头的股价也出现大幅下跌。

然而,现在否定美国在该领域的创新和领导地位还为时过早。尽管令人印象深刻,但这些成就可能不足以抵消美国公司多年来在人工智能领域取得的进步。此外,客户转向中国初创企业的可能性仍然很小。

美国金融公司 Truist 的分析师基思·勒纳 (Keith Lerner) 表示:“DeepSeek 模式的出现让投资者对美国公司的领导层产生了怀疑,怀疑他们到底花了多少钱,以及这些支出是否有利可图,或者是否过度支出。”

“不过,我们认为人工智能的数据和相关因素的成本将是巨大的,美国公司仍将保持领先地位,”Keith Lerner 补充道。

虽然 DeepSeek 的成本节省非常显著,但其 R1 模型虽然在消费者自然语言领域与 ChatGPT 具有竞争力,但尚未证明自己能够处理雄心勃勃的工业 AI 应用,而这些应用仍然需要大量的基础设施投资。

美国人工智能研究公司Reflexivity总裁朱塞佩·塞特表示:“美国拥有丰富的人力资源和资本,仍然是理想的‘主场’,也是我们期待看到第一个自我改进的人工智能的地方。”

据 CNN 报道,Howtogeek
复制链接

特色义安报纸

最新的

x
中国的DeepSeek R1人工智能模型为何能震撼科技界?
供电内容管理系统- 产品