Cerebras Systems планирует расширить свои возможности в области искусственного интеллекта, путем строительства новых центров обработки данных по всей Северной Америке и Европе.
Компания планирует сконцентрировать 85% своих мощностей в Соединенных Штатах, три объекта уже работают в Санта-Кларе, Стоктоне и Далласе. Дополнительные центры откроются в Миннеаполисе (Q2 2025), Оклахома-Сити и Монреале (Q3), а также Атланте и Франции (Q4).
Cerebras планирует значительно расширить свои возможности вывода на основе AI в 2025 году, сосредоточившись в первую очередь на локациях в США.
В основе этих объектов лежат двигатели Cerebras wafer-scale, специализированная архитектура чипов, оптимизированная для приложений AI. Компания заявляет, что ее системы CS-3 будут обрабатывать 40 миллионов токенов Llama-70B в секунду для задач вывода.
На объекте в Оклахома-Сити будет размещено более 300 систем CS-3. Построенный по стандартам уровня 3+, центр включает защиту от торнадо и землетрясений, а также тройное резервирование источников питания. Эксплуатация начнется в июне 2025 года.
Несколько известных компаний в сфере AI уже подписались на использование инфраструктуры Cerebras, включая французский стартап Mistral с его помощником Le Chat и движком ответов AI Perplexity. HuggingFace и AlphaSense также взяли на себя обязательства по платформе.
Технология особенно полезна для таких моделей рассуждений, как Deepseek-R1 и OpenAI o3, которым обычно требуется несколько минут для вычислений и которые генерируют множество токенов в ходе своих мыслительных процессов.
Расширение является частью более широкой стратегии масштабирования Cerebras до 2025 года, при этом некоторые локации будут работать в партнерстве с эмиратской компанией G42. В Монреале дочерняя компания Bit Digital Enovum будет управлять объектом, который обещает скорость вывода в десять раз выше, чем у текущих графических процессоров, когда он будет запущен в июле 2025 года.
Американская компания Cerebras Systems специализируется на разработке чипов AI с использованием уникального подхода: использование целых пластин в качестве отдельных чипов, называемых «Wafer Scale Engines». WSE-3 представляет собой третье поколение этой технологии.
В настоящее время система используется в Аргоннской национальной лаборатории, Питтсбургском суперкомпьютерном центре и GlaxoSmithKline. Однако у нее есть ограничения: она не поддерживает нативную CUDA (стандарт Nvidia) и предлагает меньшую совместимость с серверами, чем решения Nvidia.
Источник
Источник: habr.com