Cerebras Systems бросает вызов доминированию Nvidia на рынке AI-чипов, опережая графические процессоры в 57 раз

Компания Cerebras Systems 30 января 2025 года объявила, что разместит прорывную модель искусственного интеллекта R1 от DeepSeek на серверах в США, пообещав скорость в 57 раз выше, чем у решений на базе графических процессоров, при этом сохраняя конфиденциальные данные в пределах американских границ. Этот шаг сделан на фоне растущей обеспокоенности быстрым развитием искусственного интеллекта в Китае и конфиденциальностью данных.

Стартап по производству чипов для AI выпустит версию DeepSeek-R1 с 70 миллиардами параметров, работающую на собственном оборудовании, которое можно разместить на пластине, и способную обрабатывать 1600 токенов в секунду. Это значительное улучшение по сравнению с традиционными реализациями графических процессоров, которые не справлялись с новыми «рассуждающими» AI-моделями.

Время отклика ведущих платформ AI измеряется в секундах. Cerebras обеспечивает самый быстрый отклик — чуть более одной секунды, в то время как системе Novita требуется почти 38 секунд для создания первого результата — критически важный показатель для реальных приложений.

«Эти модели рассуждений влияют на экономику, — сказал Джеймс Ванг, старший исполнительный директор Cerebras, в эксклюзивном интервью VentureBeat. — Любой специалист в области знаний в основном выполняет многоэтапные когнитивные задачи. И эти модели рассуждений станут инструментами, которые войдут в их рабочий процесс».

Это объявление последовало за бурной неделей, в течение которой появление DeepSeek привело к самым большим в истории потерям рыночной стоимости Nvidia, почти 600 миллиардов долларов, что вызвало вопросы о превосходстве AI-гиганта в этой сфере. Решение Cerebras напрямую решает две ключевые проблемы, которые возникли в связи с этим: вычислительные потребности передовых моделей AI и суверенитет данных.

“Если вы используете API DeepSeek, который сейчас очень популярен, эти данные отправляются прямо в Китай”, — объяснил Ван. “Это одно из серьезных предостережений, которое заставляет многие американские компании и предприятия… не желать рассматривать это”.

Cerebras демонстрирует значительные преимущества в производительности, обрабатывая 1508 токенов в секунду — почти в шесть раз быстрее, чем его ближайший конкурент Groq, и примерно в 100 раз быстрее, чем традиционные решения на базе графических процессоров, такие как Novita.

Cerebras достигает такого преимущества в скорости благодаря новой архитектуре чипа, которая позволяет хранить все AI-модели на одном процессоре размером с пластину, устраняя узкие места в памяти, характерные для систем на базе графических процессоров. Компания утверждает, что её реализация DeepSeek-R1 соответствует или превосходит производительность проприетарных моделей OpenAI, при этом полностью работая на территории США.

Эта разработка представляет собой значительный сдвиг в сфере AI. DeepSeek, основанная бывшим руководителем хедж-фонда Лян Вэньфэном, потрясла индустрию, продемонстрировав сложные возможности AI, которые, как сообщается, обошлись всего в 1% от стоимости американских конкурентов. Решение для хостинга от Cerebras теперь предлагает американским компаниям возможность использовать эти достижения, сохраняя при этом контроль над данными.

«На самом деле это хорошая история о том, как исследовательские лаборатории США сделали этот подарок всему миру. Китайцы взяли его и улучшили, но у него есть ограничения, потому что он работает в Китае, есть некоторые проблемы с цензурой, и теперь мы возвращаем его и запускаем в американских центрах обработки данных без цензуры и без хранения данных», — сказал Ван.

Тесты производительности показывают, что DeepSeek-R1, работающий на Cerebras, превосходит GPT-4o и o1-mini от OpenAI в задачах, связанных с ответами на вопросы, математическими рассуждениями и программированием. Результаты показывают, что в некоторых областях китайский ИИ может приближаться к возможностям США или превосходить их.

Сервис доступен в режиме предварительной разработки с 30 января. Изначально он будет бесплатным, но из-за высокого спроса в ближайшее время Cerebras планирует внедрить контроль доступа к API.

Этот шаг был предпринят в то время, как американские законодатели пытаются понять последствия роста DeepSeek, который выявил потенциальные ограничения в американских торговых ограничениях, призванных сохранить технологическое преимущество перед Китаем. Способность китайских компаний создавать прорывные технологии искусственного интеллекта, несмотря на контроль за экспортом микросхем, вызвала призывы к введению новых подходов к регулированию.

Аналитики отрасли предполагают, что это нововведение может ускорить переход от инфраструктуры AI, зависящей от графических процессоров, к чему-то другому.

«Nvidia больше не является лидером по производительности логического вывода», — отметил Ван, указав на тесты, демонстрирующие более высокую производительность различных специализированных чипов для AI. «Эти другие компании, производящие чипы для AI, действительно быстрее графических процессоров при работе с новейшими моделями».

Воздействие выходит за рамки технических показателей. По мере того как AI-модели всё больше включают в себя сложные логические возможности, их вычислительные потребности стремительно растут. Компания Cerebras утверждает, что её архитектура лучше подходит для этих новых задач и может изменить конкурентную среду в сфере внедрения AI на предприятиях.

Источник

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”