Конкурент Nvidia, Cerebras, открывает шесть центров обработки данных

Cerebras Systems планирует расширить свои возможности в области искусственного интеллекта, путем строительства новых центров обработки данных по всей Северной Америке и Европе.

Компания планирует сконцентрировать 85% своих мощностей в Соединенных Штатах, три объекта уже работают в Санта-Кларе, Стоктоне и Далласе. Дополнительные центры откроются в Миннеаполисе (Q2 2025), Оклахома-Сити и Монреале (Q3), а также Атланте и Франции (Q4).

Cerebras планирует значительно расширить свои возможности вывода на основе AI в 2025 году, сосредоточившись в первую очередь на локациях в США.

В основе этих объектов лежат двигатели Cerebras wafer-scale, специализированная архитектура чипов, оптимизированная для приложений AI. Компания заявляет, что ее системы CS-3 будут обрабатывать 40 миллионов токенов Llama-70B в секунду для задач вывода.

На объекте в Оклахома-Сити будет размещено более 300 систем CS-3. Построенный по стандартам уровня 3+, центр включает защиту от торнадо и землетрясений, а также тройное резервирование источников питания. Эксплуатация начнется в июне 2025 года.

Несколько известных компаний в сфере AI уже подписались на использование инфраструктуры Cerebras, включая французский стартап Mistral с его помощником Le Chat и движком ответов AI Perplexity. HuggingFace и AlphaSense также взяли на себя обязательства по платформе.

Технология особенно полезна для таких моделей рассуждений, как Deepseek-R1 и OpenAI o3, которым обычно требуется несколько минут для вычислений и которые генерируют множество токенов в ходе своих мыслительных процессов.

Расширение является частью более широкой стратегии масштабирования Cerebras до 2025 года, при этом некоторые локации будут работать в партнерстве с эмиратской компанией G42. В Монреале дочерняя компания Bit Digital Enovum будет управлять объектом, который обещает скорость вывода в десять раз выше, чем у текущих графических процессоров, когда он будет запущен в июле 2025 года.

Американская компания Cerebras Systems специализируется на разработке чипов AI с использованием уникального подхода: использование целых пластин в качестве отдельных чипов, называемых «Wafer Scale Engines». WSE-3 представляет собой третье поколение этой технологии.

В настоящее время система используется в Аргоннской национальной лаборатории, Питтсбургском суперкомпьютерном центре и GlaxoSmithKline. Однако у нее есть ограничения: она не поддерживает нативную CUDA (стандарт Nvidia) и предлагает меньшую совместимость с серверами, чем решения Nvidia.

Источник

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”