Что говорят ведущие мировые специалисты в области ИИ о DeepSeek?
Ведущие мировые эксперты в области искусственного интеллекта проанализировали скорость, с которой Китай сокращает отставание от США в гонке ИИ, поскольку DeepSeek является пионером стратегии с открытым исходным кодом.
Ведущие эксперты в области искусственного интеллекта (ИИ) признали выдающиеся достижения китайского стартапа DeepSeek.
Однако они также предостерегают от переоценки успехов компании, особенно с учетом того, что технологическая отрасль учитывает реальное влияние передовых моделей ИИ, которые DeepSeek разрабатывает по цене, составляющей лишь малую часть от стоимости обычных моделей.

Влиятельные фигуры в мире ИИ, включая Сэма Альтмана, генерального директора OpenAI, и Эндрю Нга, ученого, ранее работавшего в Baidu и Google, высоко оценили подход DeepSeek к открытому исходному коду.
Похвалы были получены после того, как компания запустила свою передовую модель искусственного интеллекта, которая привлекла широкое внимание технологического сообщества. Несмотря на значительные успехи DeepSeek, остаются вопросы о её долгосрочной устойчивости и конкурентоспособности по сравнению с гигантами отрасли.
Компания DeepSeek, расположенная в Ханчжоу, столице провинции Чжэцзян (Китай), потрясла мировую индустрию искусственного интеллекта, выпустив свою продвинутую модель искусственного интеллекта с открытым исходным кодом DeepSeek R1. Представленная 20 января, DeepSeek R1 демонстрирует производительность, сопоставимую с закрытыми моделями OpenAI (компании, стоящей за ChatGPT), но при этом её разработка потребовала значительно меньших затрат на обучение.
Кроме того, DeepSeek сообщила, что обучение её базовой модели большого языка DeepSeek R1-V3, выпущенной всего несколько недель назад, обошлось всего в 5,6 миллиона долларов. Эта новость вызвала опасения, что технологические компании могут переплачивать за графические процессоры (GPU) для обучения ИИ. Эти опасения привели к распродаже акций Nvidia, ведущего поставщика чипов для ИИ, на прошлой неделе.
.jpg)
Во время сессии «Спросите меня о чем угодно» на Reddit на прошлой неделе генеральный директор OpenAI Сэм Альтман признал, что компания ошибается, придерживаясь стратегии закрытого исходного кода, и ей необходимо пересмотреть свой подход к открытому исходному коду.
Теперь OpenAI строго контролирует информацию о процессе обучения, затратах на электроэнергию и технических деталях своих продвинутых моделей ИИ.
Однако Альтман также подчеркнул, что не все в OpenAI разделяют эту точку зрения, и что переход на открытый исходный код не является главным приоритетом для компании на данный момент.
Тем временем Эндрю Нг, основатель и бывший директор Google Brain, а также бывший главный научный сотрудник Baidu, заявил, что рост DeepSeek и ее внутренних конкурентов свидетельствует о том, что Китай быстро сокращает разрыв с США в гонке в области ИИ.
«Когда ChatGPT будет запущен в ноябре 2022 года, США по-прежнему будут значительно опережать Китай в области генеративного ИИ, но на самом деле этот разрыв значительно сократился всего за последние два года», — написал Эндрю Нг в социальной сети X.
Он подчеркнул, что с появлением ряда китайских моделей искусственного интеллекта, таких как Qwen, Kimi, InternVL и DeepSeek, Китай заметно сократил разрыв с США. В некоторых областях, например, в области ИИ для создания видео, Китай даже какое-то время лидировал.
Соответственно, модель искусственного интеллекта Qwen является продуктом Alibaba Group. Kimi разработана стартапом Moonshot AI, а InternVL — Шанхайской лабораторией искусственного интеллекта (Shanghai AI Lab), организацией, финансируемой государством. Эти компании вносят свой вклад в стремительное развитие китайского искусственного интеллекта на международной арене.
.jpg)
Эндрю Нг прокомментировал: «Если США продолжат подавлять развитие открытого исходного кода, Китай будет доминировать в этой области в цепочке поставок ИИ. К тому времени многие компании по всему миру будут использовать модели, которые больше отражают китайские ценности и мышление, чем американские».
Тем временем Шон Ким, аналитик нью-йоркской многонациональной финансовой и инвестиционной банковской группы Morgan Stanley, прокомментировал, что DeepSeek получает широкое признание в то время, когда крупные американские технологические корпорации активно продвигают этот китайский стартап в области ИИ.
С момента своего запуска передовая модель искусственного интеллекта DeepSeek R1 привлекла внимание многих крупных компаний по всему миру и была интегрирована в их сервисы. Например, американская полупроводниковая компания Nvidia интегрировала модель DeepSeek R1 в свой микросервис NIM, что упростило пользователям доступ к этой модели и позволило использовать её потенциал.
Тем временем компания Microsoft, один из инвесторов OpenAI, также объявила о поддержке DeepSeek R1 на платформе облачных вычислений Azure и GitHub.
Чтобы не отставать, Amazon.com предоставил клиентам возможность использовать Amazon Web Services (AWS) для создания приложений на основе DeepSeek R1, расширив доступ к этой передовой технологии искусственного интеллекта.
Хотя DeepSeek привлекает большое внимание, некоторые эксперты утверждают, что истинные масштабы и влияние этого прорыва, возможно, были переоценены.
Ян Лекун, главный специалист по искусственному интеллекту в Meta Platforms, опроверг утверждение о том, что DeepSeek помогает Китаю обогнать США в гонке ИИ. «Правильно понимать, что модели с открытым исходным кодом догоняют и даже превосходят проприетарные модели», — заявил он в Threads.
Несмотря на шумиху, DeepSeek столкнулась с большим скептицизмом, особенно в отношении её фактических затрат и методов обучения ИИ. Компания, выделившаяся в мае 2023 года из хедж-фонда High-Flyer Quant её основателя Ляна Вэньфэна, не раскрывает полностью общую стоимость разработки своих моделей.
По словам профессора Чжэн Сяоцина из Фуданьского университета (Китай), цифра в 5,6 млн долларов США, которую DeepSeek объявила на обучение модели DeepSeek R1-V3, не учитывает предыдущие затраты на исследования и тестирование.
В интервью ведущей экономической газете Китая National Business Daily он заявил, что успех DeepSeek во многом обусловлен технической оптимизацией, но не окажет существенного влияния на рынок чипов для ИИ или цепочку поставок оборудования.