Компания Google сообщила о выпуске Gemini 2.5 Pro Deep Think — своей самой мощной языковой модели, которая ранее взяла золотую медаль Международной математической олимпиады 2025 (IMO 2025). Новинка будет доступна подписчикам плана Gemini Ultra, который стоит 250 долларов в месяц. Также компания предоставила доступ к модели группе математиков, а в ближайшее время планирует начать тестирование версии для API.
Режим Deep Think базируется на модели Gemini 2.5 Pro, но обладает рядом собственных особенностей. Во-первых, это увеличенный вычислительный ресурс рассуждений, что важно для задач, требующих длительного решения. Во-вторых, режим Deep Think включает в себя несколько ИИ-агентов, которые, работая параллельно, пробуют разные подходы к решению задачи. В итоге модуль-критик или выбирает лучшее решение, или комбинирует финальный ответ из нескольких решений.
В Google сравнили работу Gemini 2.5 Deep Think с другими версиями Gemini 2.5 при создании воксельной сцены:
В компании поделились результатами Deep Think в бенчмарках без использования инструментов:
Стоит отметить, что Google не стала включать в таблицы результаты GPT o3 Pro и Grok 4 Heavy, что, вероятно, объясняется разной методикой тестирования — xAI и OpenAI дали своим моделям доступ к инструментам.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.
Источник: habr.com