Одновременно с запуском Gemini 3.0 Pro в Google рассказали про режим Gemini 3.0 Deep Think, который сейчас проходит финальное тестирование. Это экспериментальный режим параллельных глубоких рассуждений, в котором модель специально заточена под самые сложные задачи в математике, программировании и научном анализе. Отметим, что предыдущая версия — Gemini 2.5 Deep Think — смогла показать результат уровня золотой медали в международной математической олимпиаде.
Google держит все подробности режима Deep Think в секрете, но известно, что в нем под капотом работают сразу несколько версий Gemini 3 Pro, которым дано дополнительное время на решение задачи. Каждая модель готовит свой вариант ответа, а в финале отдельная модель собирает из всех вариантов лучший.
Google уже показала, как это отражается на бенчмарках. В Humanity’s Last Exam, который проверяет академическое мышление на 2500 сложных вопросов, Gemini 3 Deep Think набирает 41%, тогда как Gemini 3 Pro — 37,5%, а GPT-5.1 — 26,5 %. В научном тесте GPQA Diamond режим Deep Think выходит на 93,8 % против 91,9% у Gemini 3 Pro и 83,4% у Claude Sonnet 4.5. Наконец, в визуальном бенчмарке ARC-AGI-2, который считается одним из самых жестких тестов на абстрактное мышление, Gemini 3 Deep Think достигает 45,1%, тогда как Gemini 3 Pro ограничивается 31,1%, а GPT-5.1 — 17,6 %. Отметим, что цифры Gemini 3 Pro сами по себе считаются высокими, но режим Deep Think ставит планку еще выше.
Сейчас Google завершает тестирование Gemini 3 Deep Think, а после этот режим планируется включить в тарифный план Google AI Ultra ценой в 250 долларов в месяц.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.
Источник: habr.com