Лучше GPT o3 и Grok 4. Google выпустила Gemini 2.5 Deep Think

Компания Google сообщила о выпуске Gemini 2.5 Pro Deep Think — своей самой мощной языковой модели, которая ранее взяла золотую медаль Международной математической олимпиады 2025 (IMO 2025). Новинка будет доступна подписчикам плана Gemini Ultra, который стоит 250 долларов в месяц. Также компания предоставила доступ к модели группе математиков, а в ближайшее время планирует начать тестирование версии для API.

Режим Deep Think базируется на модели Gemini 2.5 Pro, но обладает рядом собственных особенностей. Во-первых, это увеличенный вычислительный ресурс рассуждений, что важно для задач, требующих длительного решения. Во-вторых, режим Deep Think включает в себя несколько ИИ-агентов, которые, работая параллельно, пробуют разные подходы к решению задачи. В итоге модуль-критик или выбирает лучшее решение, или комбинирует финальный ответ из нескольких решений.

В Google сравнили работу Gemini 2.5 Deep Think с другими версиями Gemini 2.5 при создании воксельной сцены:

В компании поделились результатами Deep Think в бенчмарках без использования инструментов:

Стоит отметить, что Google не стала включать в таблицы результаты GPT o3 Pro и Grok 4 Heavy, что, вероятно, объясняется разной методикой тестирования — xAI и OpenAI дали своим моделям доступ к инструментам.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии