Grok 4.20 готовится к выходу? Две анонимных ИИ-модели появились на OpenRouter

На OpenRouter можно бесплатно опробовать две тестовых версии нового ИИ, которые проходят под названиями Sonoma Sky Alpha и Sonoma Dusk Alpha. Обе модели обладают контекстным окном в 2M токенов и функцией параллельного вызова нескольких инструментов. При этом Dusk Alpha позиционируется как быстрая модель для простых задач, а Sky Alpha — для задач, требующих глубокой проработки. Нельзя исключать, что Dusk и Sky — одна и та же модель, но с выключенным и включенным режимом рассуждений. На время тестирования модели доступны бесплатно, но учитывайте, что разработчики могут использовать беседы с ИИ для улучшения работы.

Отзывы о моделях в X и на Reddit на данный момент смешанные. Пользователи впечатлены контекстным окном, а для Dusk хвалят скорость работы, которая в некоторых замерах составила 174 токена в секунду. Sky заняла второе место в бенчмарке NYT Connections, уступив только Grok 4. Но есть и критика — например, заявляется, что новинки уступают в веб-разработке текущим передовым моделям.

Что именно это за модели? Пока самая достоверная гипотеза, что перед нами новые версии Grok. Стиль ответов Sky Alpha и Dusk Alpha часто похож на Grok 3 и Grok 4. Также одному из пользователей удалось заставить модель напечатать свой системный промпт, который почти полностью копирует промпт Grok 3.

Разумеется, это может быть и попыткой замаскировать модель другого разработчика, но тестирование Sky Alpha и Dusk Alpha также хорошо совпадает с дорожной картой, которую xAI опубликовала после запуска Grok 4. В ней на август был обещан Grok 4 Coder (запущен в конце месяца), а на сентябрь — Grok Foundation Model V7. Это обновленная «большая» версия Grok, которую Илон Маск называет Grok 4.20. В начале августа Маск сообщал, что модель закончила предварительную тренировку, так что сейчас подходящее время для начала тестирования.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”