Компания Cerebras Systems 30 января 2025 года объявила, что разместит прорывную модель искусственного интеллекта R1 от DeepSeek на серверах в США, пообещав скорость в 57 раз выше, чем у решений на базе графических процессоров, при этом сохраняя конфиденциальные данные в пределах американских границ. Этот шаг сделан на фоне растущей обеспокоенности быстрым развитием искусственного интеллекта в Китае и конфиденциальностью данных.
Стартап по производству чипов для AI выпустит версию DeepSeek-R1 с 70 миллиардами параметров, работающую на собственном оборудовании, которое можно разместить на пластине, и способную обрабатывать 1600 токенов в секунду. Это значительное улучшение по сравнению с традиционными реализациями графических процессоров, которые не справлялись с новыми «рассуждающими» AI-моделями.
Время отклика ведущих платформ AI измеряется в секундах. Cerebras обеспечивает самый быстрый отклик — чуть более одной секунды, в то время как системе Novita требуется почти 38 секунд для создания первого результата — критически важный показатель для реальных приложений.
«Эти модели рассуждений влияют на экономику, — сказал Джеймс Ванг, старший исполнительный директор Cerebras, в эксклюзивном интервью VentureBeat. — Любой специалист в области знаний в основном выполняет многоэтапные когнитивные задачи. И эти модели рассуждений станут инструментами, которые войдут в их рабочий процесс».
Это объявление последовало за бурной неделей, в течение которой появление DeepSeek привело к самым большим в истории потерям рыночной стоимости Nvidia, почти 600 миллиардов долларов, что вызвало вопросы о превосходстве AI-гиганта в этой сфере. Решение Cerebras напрямую решает две ключевые проблемы, которые возникли в связи с этим: вычислительные потребности передовых моделей AI и суверенитет данных.
“Если вы используете API DeepSeek, который сейчас очень популярен, эти данные отправляются прямо в Китай”, — объяснил Ван. “Это одно из серьезных предостережений, которое заставляет многие американские компании и предприятия… не желать рассматривать это”.
Cerebras демонстрирует значительные преимущества в производительности, обрабатывая 1508 токенов в секунду — почти в шесть раз быстрее, чем его ближайший конкурент Groq, и примерно в 100 раз быстрее, чем традиционные решения на базе графических процессоров, такие как Novita.
Cerebras достигает такого преимущества в скорости благодаря новой архитектуре чипа, которая позволяет хранить все AI-модели на одном процессоре размером с пластину, устраняя узкие места в памяти, характерные для систем на базе графических процессоров. Компания утверждает, что её реализация DeepSeek-R1 соответствует или превосходит производительность проприетарных моделей OpenAI, при этом полностью работая на территории США.
Эта разработка представляет собой значительный сдвиг в сфере AI. DeepSeek, основанная бывшим руководителем хедж-фонда Лян Вэньфэном, потрясла индустрию, продемонстрировав сложные возможности AI, которые, как сообщается, обошлись всего в 1% от стоимости американских конкурентов. Решение для хостинга от Cerebras теперь предлагает американским компаниям возможность использовать эти достижения, сохраняя при этом контроль над данными.
«На самом деле это хорошая история о том, как исследовательские лаборатории США сделали этот подарок всему миру. Китайцы взяли его и улучшили, но у него есть ограничения, потому что он работает в Китае, есть некоторые проблемы с цензурой, и теперь мы возвращаем его и запускаем в американских центрах обработки данных без цензуры и без хранения данных», — сказал Ван.
Тесты производительности показывают, что DeepSeek-R1, работающий на Cerebras, превосходит GPT-4o и o1-mini от OpenAI в задачах, связанных с ответами на вопросы, математическими рассуждениями и программированием. Результаты показывают, что в некоторых областях китайский ИИ может приближаться к возможностям США или превосходить их.
Сервис доступен в режиме предварительной разработки с 30 января. Изначально он будет бесплатным, но из-за высокого спроса в ближайшее время Cerebras планирует внедрить контроль доступа к API.
Этот шаг был предпринят в то время, как американские законодатели пытаются понять последствия роста DeepSeek, который выявил потенциальные ограничения в американских торговых ограничениях, призванных сохранить технологическое преимущество перед Китаем. Способность китайских компаний создавать прорывные технологии искусственного интеллекта, несмотря на контроль за экспортом микросхем, вызвала призывы к введению новых подходов к регулированию.
Аналитики отрасли предполагают, что это нововведение может ускорить переход от инфраструктуры AI, зависящей от графических процессоров, к чему-то другому.
«Nvidia больше не является лидером по производительности логического вывода», — отметил Ван, указав на тесты, демонстрирующие более высокую производительность различных специализированных чипов для AI. «Эти другие компании, производящие чипы для AI, действительно быстрее графических процессоров при работе с новейшими моделями».
Воздействие выходит за рамки технических показателей. По мере того как AI-модели всё больше включают в себя сложные логические возможности, их вычислительные потребности стремительно растут. Компания Cerebras утверждает, что её архитектура лучше подходит для этих новых задач и может изменить конкурентную среду в сфере внедрения AI на предприятиях.
Источник
Источник: habr.com