Илон Маск объявил: Grok 4.5 перешёл в стадию закрытого бета-тестирования внутри SpaceX и Tesla. Без широкого анонса, без пресс-конференций — просто взяли и запустили там, где модель действительно может принести пользу.
Что под капотом
В основе новой модели лежит собственная архитектура V9 xAI с 1,5 триллиона параметров. Цифра, конечно, впечатляет, но ключевое отличие — в тренировочных данных. В дополнение к основному пулу xAI использовала данные от Cursor. Это модель, которая с рождения знает, как выглядит хороший код, как строятся сложные системы и где обычно прячутся баги.
Ранние внутренние оценки показывают: производительность Grok 4.5 приближается к Anthropic Opus, а местами даже превосходит её. Какая именно версия Opus — не уточняется, но учитывая темпы Anthropic, можно предположить, что речь о свежей.
Скрытый текст
Кстати, свежие версии Grok и Claude можно сравнить на BotHub
Чем будет заниматься Grok в SpaceX и Tesla
-
Навигационные алгоритмы для ракет.
-
Системы автопилота.
-
Обработка телеметрии.
-
Написание и ревью кода для встроенных систем.
Тестирование в таких условиях даёт модели то, чего не даст никакой бенчмарк — обратную связь от самых требовательных пользователей.
И да, на основе этой обратной связи xAI продолжает дообучать модель с подкреплением (RL), что, по словам Маска, значительно улучшает качество.
Маск также анонсировал, что SpaceX будет выпускать полностью обученные с нуля новые модели каждый месяц до конца года.
Каждый месяц. С нуля. Не дообученные, не донастроенные — а заново обученные на свежих данных.
А что с публичным релизом?
Пока — тишина. Модель доступна только внутри двух компаний. Никаких дат широкого выката, никаких обещаний и анонсов анонсов.
И это, возможно, самое разумное решение. Потому что лучший способ проверить, насколько хороша модель — не поиграть с промптами, а заставить её помочь построить ракету или доработать автопилот.
Итог: ставка на вертикальную интеграцию
OpenAI строит дата-центры, Google покупает чипы, а xAI просто запускает модель внутри собственных компаний, где есть и данные, и вычислительные мощности, и задачи.
Grok 4.5 — это не «ещё один конкурент ChatGPT». Это попытка построить ИИ, который понимает реальный мир, потому что он рос не на абстрактных текстах, а на инженерных задачах.
И если SpaceX действительно будет выпускать по модели в месяц — через год мы можем увидеть нечто, что изменит рынок. Или, как минимум, долетит до Марса.
Источник: habr.com