На сайте используются cookies. Продолжая использовать сайт, вы принимаете условия
Ok
Подписывайтесь на Газету.Ru в Telegram Публикуем там только самое важное и интересное!
Все новости
Новые материалы +
Размер текста
А
А
А

Чипы Huawei подвели нейросеть DeepSeek

FT: DeepSeek отложила выход нового ИИ из-за проблем с обучением на чипах Huawei
true
true
true

Китайская компания DeepSeek отложила выпуск своей новой флагманской языковой модели из-за значительных трудностей с обучением на ускорителях вычислений Huawei. Об этом, ссылаясь на собственные источники, сообщает Financial Times (FT).

Проблема возникла на фоне давления со стороны китайских властей, которые рекомендуют отечественным ИИ-разработчикам, включая DeepSeek, переходить на использование ускорителей Huawei Ascend вместо чипов Nvidia, поставки которых затруднены из-за санкций США. Ранее, в январе этого года, DeepSeek успешно выпустила языковую модель R1, продемонстрировав способность эффективно использовать ограниченные вычислительные ресурсы.

Однако при попытке обучения новой модели R2 на платформах Huawei компания столкнулась с серьезными техническими сложностями. Это вынудило DeepSeek перенаправить имеющиеся ускорители Huawei на задачи инференса (формирование логических выводов), а обучение критически важной R2 продолжить на оборудовании Nvidia. Изначально анонсированный на май релиз R2 был отложен, что, по мнению экспертов, негативно сказывается на конкурентных позициях DeepSeek на быстроразвивающемся рынке ИИ.

Представители Huawei были осведомлены о возникших проблемах и направили в DeepSeek команду профильных специалистов. Тем не менее, их усилия не принесли желаемых результатов в обучении модели R2. Более того, даже процесс адаптации чипов Huawei к задачам инференса до сих пор не завершен. Руководство DeepSeek признает, что текущий прогресс в разработке R2 недостаточен и требует дополнительного времени для доработки, хотя некоторые источники выражают надежду на скорый выход модели.

На фоне этих трудностей конкуренты DeepSeek продолжают активно развиваться. Например, Alibaba в своей модели Qwen3 заимствовала ключевые концепции у DeepSeek и добилась большей эффективности. Эксперты отрасли в целом ожидают, что со временем китайские разработчики смогут создавать успешные языковые модели, полностью обученные на чипах Huawei, несмотря на текущие вызовы.

Ранее выяснилось, что в YouTube появился ИИ-надзиратель для несовершеннолетних пользователей.

Что думаешь?
Загрузка