На OpenRouter можно бесплатно опробовать две тестовых версии нового ИИ, которые проходят под названиями Sonoma Sky Alpha и Sonoma Dusk Alpha. Обе модели обладают контекстным окном в 2M токенов и функцией параллельного вызова нескольких инструментов. При этом Dusk Alpha позиционируется как быстрая модель для простых задач, а Sky Alpha — для задач, требующих глубокой проработки. Нельзя исключать, что Dusk и Sky — одна и та же модель, но с выключенным и включенным режимом рассуждений. На время тестирования модели доступны бесплатно, но учитывайте, что разработчики могут использовать беседы с ИИ для улучшения работы.
Отзывы о моделях в X и на Reddit на данный момент смешанные. Пользователи впечатлены контекстным окном, а для Dusk хвалят скорость работы, которая в некоторых замерах составила 174 токена в секунду. Sky заняла второе место в бенчмарке NYT Connections, уступив только Grok 4. Но есть и критика — например, заявляется, что новинки уступают в веб-разработке текущим передовым моделям.
Что именно это за модели? Пока самая достоверная гипотеза, что перед нами новые версии Grok. Стиль ответов Sky Alpha и Dusk Alpha часто похож на Grok 3 и Grok 4. Также одному из пользователей удалось заставить модель напечатать свой системный промпт, который почти полностью копирует промпт Grok 3.
Разумеется, это может быть и попыткой замаскировать модель другого разработчика, но тестирование Sky Alpha и Dusk Alpha также хорошо совпадает с дорожной картой, которую xAI опубликовала после запуска Grok 4. В ней на август был обещан Grok 4 Coder (запущен в конце месяца), а на сентябрь — Grok Foundation Model V7. Это обновленная «большая» версия Grok, которую Илон Маск называет Grok 4.20. В начале августа Маск сообщал, что модель закончила предварительную тренировку, так что сейчас подходящее время для начала тестирования.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.
Источник: habr.com